相关疑难解决方法(0)

在Python字符串中解码HTML实体?

我正在使用Beautiful Soup 3解析一些HTML,但它包含HTML实体,Beautiful Soup 3不会自动为我解码:

>>> from BeautifulSoup import BeautifulSoup

>>> soup = BeautifulSoup("<p>&pound;682m</p>")
>>> text = soup.find("p").string

>>> print text
&pound;682m
Run Code Online (Sandbox Code Playgroud)

我怎样才能解码HTML实体中text获得"£682m",而不是"&pound;682m".

html python html-entities

239
推荐指数
4
解决办法
20万
查看次数

在Python中将XML/HTML实体转换为Unicode字符串

我正在做一些网页抓取,网站经常使用HTML实体来表示非ascii字符.Python是否有一个实用程序,它接受带有HTML实体的字符串并返回unicode类型?

例如:

我回来了:

&#x01ce;
Run Code Online (Sandbox Code Playgroud)

代表带有音标的"ǎ".在二进制中,这表示为16位01ce.我想将html实体转换为值 u'\u01ce'

html python entities

69
推荐指数
7
解决办法
6万
查看次数

如何在Python 3.1中以字符串形式隐藏HTML实体?

我已经四处寻找并且只找到了python 2.6及更早版本的解决方案,没有关于如何在python 3.X中执行此操作.(我只能访问Win7盒子.)

我必须能够在3.1中执行此操作,并且最好不使用外部库.目前,我安装了httplib2并访问命令提示符curl(这就是我获取页面源代码的方式).不幸的是,curl不解码html实体,据我所知,我找不到在文档中解码它的命令.

是的,我试图让美丽的汤工作,很多时候没有成功3.X. 如果您可以在MS Windows环境中提供有关如何在python 3中使用它的EXPLICIT说明,我将非常感激.

所以,要清楚,我需要将这样Suzy &amp; John的字符串转换成这样的字符串:"Suzy&John".

html python curl entities python-3.x

59
推荐指数
3
解决办法
6万
查看次数

python:转换为HTML特殊字符

可能重复:
用Python 2.6中相应的utf-8字符替换html实体
什么是在Python中转义HTML的最简单方法?

有一种方法可以轻松地将字符串转换为HTML字符串,例如用<,>替换的字符&lt; &gt; 或者我必须编写自己的转换例程???

html python

3
推荐指数
1
解决办法
9845
查看次数

标签 统计

html ×4

python ×4

entities ×2

curl ×1

html-entities ×1

python-3.x ×1