HTML代码处理

Lau*_*ălu 3 python html-parsing

我想处理一些HTML代码并删除标签,如示例中所示:

"<p> <b>这个</ b>是一个非常有趣的段落.</ p>"结果"这是一个非常有趣的段落."

我使用Python作为技术; 你知道我可以用来删除HTML标签的任何框架吗?

谢谢!

Col*_*ell 5

这个问题可能对您有所帮助:从Python中删除字符串中的HTML

无论你选择什么解决方案,我都建议避免使用正则表达式.处理大字符串时它们可能很慢,由于HTML无效,它们可能无法正常工作,并且使用正则表达式剥离HTML并不总是安全或可靠的.