mat*_*mat 2 python urllib readfile
我目前正在尝试从网站上读取txt文件.
到目前为止我的脚本是:
webFile = urllib.urlopen(currURL)
Run Code Online (Sandbox Code Playgroud)
这样,我可以使用该文件.但是,当我尝试存储文件(in webFile
)时,我只获得了一个指向套接字的链接.我尝试的另一个解决方案是使用read()
webFile = urllib.urlopen(currURL).read()
Run Code Online (Sandbox Code Playgroud)
然而,这似乎删除格式化(\n
,\t
等等)都被删除.
如果我打开这样的文件:
webFile = urllib.urlopen(currURL)
Run Code Online (Sandbox Code Playgroud)
我可以逐行阅读:
for line in webFile:
print line
Run Code Online (Sandbox Code Playgroud)
这将导致:
"this"
"is"
"a"
"textfile"
Run Code Online (Sandbox Code Playgroud)
但我得到:
't'
'h'
'i'
...
Run Code Online (Sandbox Code Playgroud)
我希望在我的计算机上获取该文件,但同时保持格式.
小智 6
你应该使用readlines()来读取整行:
response = urllib.urlopen(currURL)
lines = response.readlines()
for line in lines:
.
.
Run Code Online (Sandbox Code Playgroud)
但是,我强烈建议您使用requests
库.链接到这里http://docs.python-requests.org/en/latest/
归档时间: |
|
查看次数: |
14831 次 |
最近记录: |