相关疑难解决方法(0)

使用Python将html转换为文本

我试图使用Python将html块转换为文本.

输入:

<div class="body"><p><strong></strong></p>
<p><strong></strong>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa</p>
<p>Consectetuer adipiscing elit. <a href="http://example.com/" target="_blank" class="source">Some Link</a> Aenean commodo ligula eget dolor. Aenean massa</p>
<p>Aenean massa.Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa</p>
<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa</p>
<p>Consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa</p></div>

Run Code Online (Sandbox Code Playgroud)

期望的输出:

Lorem ipsum dolor坐在amet,consectetuer adipiscing …

python beautifulsoup web-scraping

Aar*_*lli

2013 02-05

41
推荐指数

6
解决办法

6万
查看次数

如何将网页保存为文本文件[Python]

我想将网页(所有内容)保存为文本文件.(如果您右键单击网页 - >"将页面另存为" - >"另存为文本文件"而不是html文件)

我尝试使用以下代码:

import urllib2
url=''
page = urllib2.urlopen(url)
page_content = page.read()
file = open('file_text.txt', 'w')
f.write(page_content)
f.close()

Run Code Online (Sandbox Code Playgroud)

我的目标是能够在没有HTML代码的情况下保存整个文本.(例如我想读"è"而不是"é")

python text save web

Ski*_*per

2017 08-22

5
推荐指数

1
解决办法

1万
查看次数

标签统计

python ×2

beautifulsoup ×1

save ×1

text ×1

web ×1

web-scraping ×1

使用Python将html转换为文本

如何将网页保存为文本文件[Python]

标签 统计

标签统计