小编naz*_*aif的帖子

使用Selenium FirefoxDriver在Google搜索上禁用样式

将下面的代码禁用加载火狐硒webdriver的页面上的样式表和图像:

from selenium import webdriver

firefox_profile = webdriver.FirefoxProfile()
firefox_profile.set_preference('permissions.default.stylesheet', 2)
firefox_profile.set_preference('permissions.default.image', 2)

driver = webdriver.Firefox(firefox_profile)
driver.get('http://www.stackoverflow.com/')

driver.close()

Run Code Online (Sandbox Code Playgroud)

它适用于stackoverflow.com,facebook.com,yahoo.com ......但有趣的是不适用于谷歌搜索; 只有Google徽标消失且其样式表仍然存在.

如果您尝试使用以下链接http://google.com/search?q=nelson+mandela,您将获得:

在此输入图像描述

而预期的结果应该是这样的(没有样式表+没有图片):

在此输入图像描述

到底是怎么回事？
我如何解决它？

python firefox selenium google-search selenium-webdriver

naz*_*aif

2017 05-23

7
推荐指数

1
解决办法

1118
查看次数

lxml.html的href属性

根据这个答案：

>>> from lxml.html import fromstring
>>> s = """<input type="hidden" name="question" value="1234">"""
>>> doc = fromstring(s)
>>> doc.value
'1234'
>>> doc.name
'question'

Run Code Online (Sandbox Code Playgroud)

我试图从此代码中获取链接和文本：

from lxml.html import fromstring
s = '<a href="http://a.com" rel="bookmark">bla bla bla</a>'
doc = fromstring(s)
print (doc.href)
print (doc.text_content())

Run Code Online (Sandbox Code Playgroud)

它给出了 AttributeError:'HtmlElement' object has no attribute 'href'

我是lxml中的新手。究竟是什么问题？

如何从此代码中同时获得链接（a.com）和文本（bla bla bla）作为字符串？

lxml.html python-3.4

naz*_*aif

2017 05-23

3
推荐指数

1
解决办法

6462
查看次数