相关疑难解决方法(0)

用于从字符串中删除HTML标记的Python代码

我有这样的文字:

text = """<div>
<h1>Title</h1>
<p>A long text........ </p>
<a href=""> a link </a>
</div>"""
Run Code Online (Sandbox Code Playgroud)

使用纯Python,没有外部模块我想要这个:

>>> print remove_tags(text)
Title A long text..... a link
Run Code Online (Sandbox Code Playgroud)

我知道我可以使用lxml.html.fromstring(text).text_content()来实现它,但我需要在纯Python中使用内置或std库实现相同的2.6+

我怎样才能做到这一点?

html python xml string parsing

112
推荐指数
4
解决办法
19万
查看次数

如何删除html特殊字符?

我正在为我的应用程序创建一个RSS提要文件,我想在其中删除HTML标记strip_tags.但是strip_tags不删除HTML特殊代码字符:

&nbsp; &amp; &copy; 
Run Code Online (Sandbox Code Playgroud)

等等

请告诉我任何可用于从我的字符串中删除这些特殊代码字符的函数.

php html-encode

54
推荐指数
4
解决办法
20万
查看次数

标签 统计

html ×1

html-encode ×1

parsing ×1

php ×1

python ×1

string ×1

xml ×1