小编Fai*_*sal的帖子

使用selenium和python捕获AJAX响应

我点击Firefox中的链接,网页使用javascript发送请求,然后服务器发送某种包含网站地址的响应.因此,这个新网站将在新窗口中打开.链接后面的html代码是(我省略了初始和最终<span>标记):

> class="taLnk hvrIE6"
> onclick="ta.trackEventOnPage('AttractionContactInfo', 'Website',
> 2316062, 1); ta.util.cookie.setPIDCookie(15190);
> ta.call('ta.util.link.targetBlank', event, this,
> {'aHref':'LqMWJQiMnYQQoqnQQxGEcQQoqnQQWJQzZYUWJQpEcYGII26XombQQoqnQQQQoqnqgoqnQQQQoqnQQQQoqnQQQQoqnqgoqnQQQQoqnQQuuuQQoqnQQQQoqnxioqnQQQQoqnQQJMsVCIpEVMSsVEtHJcSQQoqnQQQQoqnxioqnQQQQoqnQQniaQQoqnQQQQoqnqgoqnQQQQoqnQQWJQzhYmkXHJUokUHnmKTnJXB',
> 'isAsdf':true})">Website
Run Code Online (Sandbox Code Playgroud)

我想捕获服务器响应并使用Python和Selenium提取"新网站".我一直在使用BeautifulSoup进行刮擦,这对Selenium来说还是一个新手.

到目前为止,我能够找到这个元素并使用selenium点击它,这将在新窗口中打开"新网站".我不知道如何从服务器捕获响应.

python selenium web-scraping

13
推荐指数
3
解决办法
1万
查看次数

"NotImplementedError:使用label()访问节点标签"

我需要从网站中提取所有城市名称.我在以前的项目中使用过beautifulSoup和RE,但在这个网站上,城市名称是常规文本的一部分,没有特定的格式.我找到了符合我要求的地理包(https://pypi.python.org/pypi/geograpy/0.3.7).

Geograpy使用nltk包.我安装了nltk的所有模型和软件包,但它不断抛出这个错误:

>>> import geograpy
>>> places = geograpy.get_place_context(url="http://www.state.gov/misc/list/")

Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python27\lib\site-packages\geograpy\__init__.py", line 6, in get_place_context
e.find_entities()
File "C:\Python27\lib\site-packages\geograpy\extraction.py", line 31, in find_entities
if (ne.node == 'GPE' or ne.node == 'PERSON') and ne[0][1] == 'NNP':
File "C:\Python27\lib\site-packages\nltk\tree.py", line 198, in _get_node
raise NotImplementedError("Use label() to access a nod label.")
NotImplementedError: Use label() to access a node label.
Run Code Online (Sandbox Code Playgroud)

任何帮助,将不胜感激

python nltk

7
推荐指数
2
解决办法
6882
查看次数

标签 统计

python ×2

nltk ×1

selenium ×1

web-scraping ×1