小编Ada*_*eon的帖子

如何使用python从内网站点抓取URL数据？

我需要一个 Python Warrior 来帮助我（我是个菜鸟）！我正在尝试使用模块 urllib 从内部网站点抓取某些数据。但是，由于这是我公司的网站，仅供员工查看，而不可供公众查看，我认为这就是我得到此代码的原因：

IOError: ('http 错误', 401, '未经授权',)

我该怎么办？它甚至不会使用 htmlfile.read() 读取网站

获取公共站点的示例代码：

import urllib
import re

htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL")

htmltext = htmlfile.read()

regex = '<span id="yfs_l84_aapl">(.+?)</span>' 

pattern = re.compile(regex)

price = re.findall(pattern,htmltext)

print price

Run Code Online (Sandbox Code Playgroud)

python intranet urllib web-scraping

Ada*_*eon

2015 09-19

3
推荐指数

1
解决办法

6898
查看次数

标签统计

intranet ×1

python ×1

urllib ×1

web-scraping ×1

如何使用python从内网站点抓取URL数据？

标签 统计

小编Ada_eon的帖子

标签统计