Aab*_*ela 5 c# web-scraping html-agility-pack
我正在使用 HtmlAgilityPack 抓取许多网站。问题是它似乎坚持在大多数地方插入 TextNodes,这些地方要么是空的,要么只包含大量的 \n、空格和 \r。
当我计算 childnodes 时,它们往往会给我带来问题,因为 firebug 不会显示它们,但 HtmlAgilityPack 会。
有没有办法告诉 HtmlAgilityPack 停止这样做,或者至少清除这些文本节点?(不过我想保留有用的)。当我们在这里时,Comment 和 Script 标签也是如此。
| 归档时间: |
|
| 查看次数: |
1704 次 |
| 最近记录: |