Abe*_*Abe 11 html c# xpath web-scraping html-agility-pack
我正在抓取一个使用Javascript动态填充Html Agility包网站内容的网站.
基本上,我正在搜索XPATH "\\div[@class='PricingInfo']",但是这个div节点是通过Javascript写入DOM的.
因此,当我通过Html Agility包加载页面时,找不到上面提到的XPATH.
事实证明,在我要解析的特定脚本块之前有一条注释.
<!--Module 328 Buying Options Table-->
<script type="text/javascript" language="JavaScript">
var data = {
price: 30.00
}
</script>
Run Code Online (Sandbox Code Playgroud)
对于这个站点,有许多脚本块,所以我需要通过找到这个自动生成的注释来缩小它,<!--Module 328 Buying Options Table-->并且该节点的兄弟将是正确的脚本块.
有关如何搜索特定注释然后只是获取相邻脚本块的任何想法?
谢谢!
Mat*_*hen 16
htmlDoc.DocumentNode.SelectSingleNode("//comment()[contains(., 'Buying Options')]/following-sibling::script")
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5300 次 |
| 最近记录: |