C#:HtmlAgilityPack提取内部文本

Yan*_*ang 7 c# html-parsing

我正在使用HtmlAgilityPack.是否有一行代码可以获取html的所有内部文本,例如,删除所有html标签和脚本?

SLa*_*aks 16

像这样:

document.DocumentNode.InnerText
Run Code Online (Sandbox Code Playgroud)

请注意,这将返回<script>标签的文本内容.

要解决此问题,您可以删除所有<script>标记,如下所示:

foreach(var script in doc.DocumentNode.Descendants("script").ToArray())
    script.Remove();
foreach(var style in doc.DocumentNode.Descendants("style").ToArray())
    style.Remove();
Run Code Online (Sandbox Code Playgroud)