我不知道如何编写BeautifulSoup代码,因此它只给我选定标签中的文本.我得到更多,如其孩子的文字(仁)!
例如:
from bs4 import BeautifulSoup
soup = BeautifulSoup('<div id="left"><ul><li>"I want this text"<a href="someurl.com"> I don\'t want this text</a><p>I don\'t want this either</li><li>"Good"<a href="someurl.com"> Not Good</a><p> Not Good either</li></ul></div>', "html5lib")
x = soup.select('ul > li')
for i in x:
print(i.text)
Run Code Online (Sandbox Code Playgroud)
输出:
"我想要这个文字"我不想要这个文字我也不想要这个
"好"不好也不好
期望的输出:
"我想要这个文字"
"好"
我试图使用javascript获取元素的背景颜色:
网址: https ://mathemagiker.de/
Javascript: document.getElementById('angebot').style.backgroundColor
结果:没什么
但是,此元素具有背景颜色,但它是从css文件应用的.
问题:如何使用javascript获取此颜色?
我发现 Youtube Data API 的响应与使用 xml feed 时得到的响应不同。
也就是说,API 响应缺少视频或更新较晚!我报告了“issuetracker”上的一个错误。
我只需获取公开可用的 xml 数据就可以解决我的问题:
https://www.youtube.com/feeds/videos.xml?channel_id=UC8yH-uI81UUtEMDsowQyx1g
但是,我担心他们会因为太多请求而禁止我,因为我一小时内为我的应用程序发送了多个请求。
有了API的配额,就没有问题,因为我不会超过限制。
我搜索过但找不到任何东西。像这样的东西https://www.youtube.com/feeds/videos.xml?channel_id=UC8yH-uI81UUtEMDsowQyx1g&key=[SECRET KEY]将是一个很好的解决方案。
有什么建议么?
css ×1
html-parsing ×1
http-get ×1
javascript ×1
python ×1
request ×1
web-scraping ×1
xml ×1
youtube ×1
youtube-api ×1