我需要一个 Python Warrior 来帮助我(我是个菜鸟)!我正在尝试使用模块 urllib 从内部网站点抓取某些数据。但是,由于这是我公司的网站,仅供员工查看,而不可供公众查看,我认为这就是我得到此代码的原因:
IOError: ('http 错误', 401, '未经授权',)
我该怎么办?它甚至不会使用 htmlfile.read() 读取网站
获取公共站点的示例代码:
import urllib
import re
htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL")
htmltext = htmlfile.read()
regex = '<span id="yfs_l84_aapl">(.+?)</span>'
pattern = re.compile(regex)
price = re.findall(pattern,htmltext)
print price
Run Code Online (Sandbox Code Playgroud)