相关疑难解决方法(0)

在Python字符串中解码HTML实体?

我正在使用Beautiful Soup 3解析一些HTML,但它包含HTML实体,Beautiful Soup 3不会自动为我解码:

>>> from BeautifulSoup import BeautifulSoup

>>> soup = BeautifulSoup("<p>&pound;682m</p>")
>>> text = soup.find("p").string

>>> print text
&pound;682m
Run Code Online (Sandbox Code Playgroud)

我怎样才能解码HTML实体中text获得"£682m",而不是"&pound;682m".

html python html-entities

239
推荐指数
4
解决办法
20万
查看次数

在Python中逃避HTML的最简单方法是什么?

cgi.escape似乎是一种可能的选择.它运作良好吗?有什么东西被认为更好吗?

html python

131
推荐指数
6
解决办法
11万
查看次数

HTML实体代码到文本

有没有人知道在Python中使用HTML实体代码(例如&lt; &amp;)将字符串转换为普通字符串(例如<&)的简单方法?

cgi.escape()将逃脱字符串(很差),但没有unescape().

html python beautifulsoup

13
推荐指数
2
解决办法
1万
查看次数

标签 统计

html ×3

python ×3

beautifulsoup ×1

html-entities ×1