小编naz*_*aif的帖子

使用Selenium FirefoxDriver在Google搜索上禁用样式

下面的代码禁用加载火狐硒webdriver的页面上的样式表和图像:

from selenium import webdriver

firefox_profile = webdriver.FirefoxProfile()
firefox_profile.set_preference('permissions.default.stylesheet', 2)
firefox_profile.set_preference('permissions.default.image', 2)

driver = webdriver.Firefox(firefox_profile)
driver.get('http://www.stackoverflow.com/')

driver.close()
Run Code Online (Sandbox Code Playgroud)

它适用于stackoverflow.com,facebook.com,yahoo.com ......但有趣的是不适用于谷歌搜索; 只有Google徽标消失且其样式表仍然存在.

如果您尝试使用以下链接http://google.com/search?q=nelson+mandela,您将获得:

在此输入图像描述

而预期的结果应该是这样的(没有样式表+没有图片):

在此输入图像描述

  • 到底是怎么回事?
  • 我如何解决它?

python firefox selenium google-search selenium-webdriver

7
推荐指数
1
解决办法
1118
查看次数

lxml.html的href属性

根据这个答案

>>> from lxml.html import fromstring
>>> s = """<input type="hidden" name="question" value="1234">"""
>>> doc = fromstring(s)
>>> doc.value
'1234'
>>> doc.name
'question'
Run Code Online (Sandbox Code Playgroud)

我试图从此代码中获取链接和文本:

from lxml.html import fromstring
s = '<a href="http://a.com" rel="bookmark">bla bla bla</a>'
doc = fromstring(s)
print (doc.href)
print (doc.text_content())
Run Code Online (Sandbox Code Playgroud)

它给出了 AttributeError:'HtmlElement' object has no attribute 'href'

我是lxml中的新手。究竟是什么问题?

如何从此代码中同时获得链接(a.com)和文本(bla bla bla)作为字符串?

lxml.html python-3.4

3
推荐指数
1
解决办法
6462
查看次数