所以我试图在网站上打开一个网站/网址提取excel文件,编辑它,然后把它放在不同的网站上.我在这个网站上发现了另一条评论,对于如何使用它有很好的建议import pandas.我从python网站下载了pandas(以及其他一些模块),并编写了代码.但是当我尝试运行它时,我收到以下错误
Warning (from warnings module):
File "C:\Python27\lib\site-packages\pandas\io\excel.py", line 626
.format(openpyxl_compat.start_ver, openpyxl_compat.stop_ver))
UserWarning: Installed openpyxl is not supported at this time. Use >=1.6.1 and <2.0.0.
Traceback (most recent call last):
File "C:\Python27\more_url_stuff.py", line 6, in <module>
socket = urllib2.urlopen(link)
File "C:\Python27\lib\urllib2.py", line 127, in urlopen
return _opener.open(url, data, timeout)
File "C:\Python27\lib\urllib2.py", line 410, in open
response = meth(req, response)
File "C:\Python27\lib\urllib2.py", line 523, in http_response
'http', request, response, code, msg, hdrs)
File "C:\Python27\lib\urllib2.py", line 448, in error
return self._call_chain(*args)
File "C:\Python27\lib\urllib2.py", line 382, in _call_chain
result = func(*args)
File "C:\Python27\lib\urllib2.py", line 531, in http_error_default
raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
HTTPError: HTTP Error 401: Unauthorized
Run Code Online (Sandbox Code Playgroud)
到底是怎么回事?
有没有更简单的方法从互联网上下载excel文件?
我上周刚刚开始使用Python进行编码,所以我仍然对一些简单的事情感到困惑.
Jim*_*myK 18
更新:Pandas 0.15.2已经发布,它与最新版本的openpyxl(2.0或更高版本)相得益彰.这个答案已经过时了.
好的,您似乎已经获得了最新版本的pandas(== 0.14.0),而且这个版本需要一些特定版本的Openpyxl.如果您不关心放弃在较新版本中引入的新功能,请尝试卸载现有的openpyxl并安装旧版本.
pip uninstall openpyxl
pip install openpyxl==1.8.6
Run Code Online (Sandbox Code Playgroud)
如果您只是想下载文件并将其保存到本地文件夹,这是一种更简单的方法:
import urllib
URL_to_the_file = "http://real-chart.finance.yahoo.com/table.csv?s=SPY&a=00&b=29&c=1993&d=05&e=13&f=2014&g=d&ignore=.csv"
urllib.urlretrieve (URL_to_the_file, "downloaded.csv")
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3183 次 |
| 最近记录: |