Lau*_*ălu 3 python html-parsing
我想处理一些HTML代码并删除标签,如示例中所示:
"<p> <b>这个</ b>是一个非常有趣的段落.</ p>"结果"这是一个非常有趣的段落."
我使用Python作为技术; 你知道我可以用来删除HTML标签的任何框架吗?
谢谢!
这个问题可能对您有所帮助:从Python中删除字符串中的HTML
无论你选择什么解决方案,我都建议避免使用正则表达式.处理大字符串时它们可能很慢,由于HTML无效,它们可能无法正常工作,并且使用正则表达式剥离HTML并不总是安全或可靠的.