将下面的代码禁用加载火狐硒webdriver的页面上的样式表和图像:
from selenium import webdriver
firefox_profile = webdriver.FirefoxProfile()
firefox_profile.set_preference('permissions.default.stylesheet', 2)
firefox_profile.set_preference('permissions.default.image', 2)
driver = webdriver.Firefox(firefox_profile)
driver.get('http://www.stackoverflow.com/')
driver.close()
Run Code Online (Sandbox Code Playgroud)
它适用于stackoverflow.com,facebook.com,yahoo.com ......但有趣的是不适用于谷歌搜索; 只有Google徽标消失且其样式表仍然存在.
如果您尝试使用以下链接http://google.com/search?q=nelson+mandela,您将获得:

而预期的结果应该是这样的(没有样式表+没有图片):

根据这个答案:
>>> from lxml.html import fromstring
>>> s = """<input type="hidden" name="question" value="1234">"""
>>> doc = fromstring(s)
>>> doc.value
'1234'
>>> doc.name
'question'
Run Code Online (Sandbox Code Playgroud)
我试图从此代码中获取链接和文本:
from lxml.html import fromstring
s = '<a href="http://a.com" rel="bookmark">bla bla bla</a>'
doc = fromstring(s)
print (doc.href)
print (doc.text_content())
Run Code Online (Sandbox Code Playgroud)
它给出了 AttributeError:'HtmlElement' object has no attribute 'href'
我是lxml中的新手。究竟是什么问题?
如何从此代码中同时获得链接(a.com)和文本(bla bla bla)作为字符串?