Ski*_*per 5 python text save web
我想将网页(所有内容)保存为文本文件.(如果您右键单击网页 - >"将页面另存为" - >"另存为文本文件"而不是html文件)
我尝试使用以下代码:
import urllib2
url=''
page = urllib2.urlopen(url)
page_content = page.read()
file = open('file_text.txt', 'w')
f.write(page_content)
f.close()
Run Code Online (Sandbox Code Playgroud)
我的目标是能够在没有HTML代码的情况下保存整个文本.(例如我想读"è"而不是"é")
import urllib2
import html2text
url=''
page = urllib2.urlopen(url)
html_content = page.read()
rendered_content = html2text.html2text(html_content)
file = open('file_text.txt', 'w')
file.write(rendered_content)
file.close()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
11902 次 |
| 最近记录: |