Viv*_*oel 0 c++ html-parsing
我想从文本中删除所有html标记.但我不想使用任何dom库解析整个文档,因为创建一个dom树将是性能的开销,因为我不关心结构.
有没有快速有效的方法将HTML转换为纯文本?
Jim*_*som 6
如果您不需要内存中的DOM树,请使用带有SAX接口的解析器.但请注意,某些真实HTML可能需要容错解析.
归档时间:
14 年,8 月 前
查看次数:
978 次
最近记录:
10 年,7 月 前