我正在使用HtmlAgilityPack.是否有一行代码可以获取html的所有内部文本,例如,删除所有html标签和脚本?
SLa*_*aks 16
像这样:
document.DocumentNode.InnerText
Run Code Online (Sandbox Code Playgroud)
请注意,这将返回<script>标签的文本内容.
要解决此问题,您可以删除所有<script>标记,如下所示:
foreach(var script in doc.DocumentNode.Descendants("script").ToArray())
script.Remove();
foreach(var style in doc.DocumentNode.Descendants("style").ToArray())
style.Remove();
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
15771 次 |
| 最近记录: |