DOT NET代码将HTML转换为文本

Arj*_*jun 3 .net html-to-text

我正在创建一些算法来从网站获取文本。然后找到答案(完成后将发布脚本)。

为此,我需要将内部的所有HTML代码都转换为普通可读的英语文本。

我已经手动删除了所有html标记,但是很难删除一些CSS条目。关于如何将html转换为纯英文文本的任何简单想法?

谢谢。

bal*_*dre 5

有些人已经为您完成了所有工作