PFr*_*ise 3 c# xpath parsing html-agility-pack
我对XPATH有点新,并了解大多数基础知识,但我遇到了一些特定查询的问题.
我正在尝试解析一个Motley Fool页面并返回图像的来源以获得股票的大写分数.
例如:如果您查看页面的源代码:http://caps.fool.com/Ticker/SLT.aspx我想要http://g.foolcdn.com/art/ratings/stars/trans的源代码/5stars-trans-lg.png
如果可能的话,我只想要src =之后的内容.
我目前正在与:
xpath = "//div[@class='subtle marginT']"
Run Code Online (Sandbox Code Playgroud)
然而,这没有任何回报.我知道这可能会有很多问题,但如果您想回答,我也非常感谢您快速推理答案,因为我想学习XCAP,而不仅仅是让这个查询起作用.
根据您的网址,这对我有用:
var imageNode = doc.DocumentNode.SelectSingleNode("//table[@id='tickerStats']/tbody/tr/td/img");
string imageText = imageNode.Attributes["src"].Value;
Run Code Online (Sandbox Code Playgroud)
基本上只是抓住具有id的最近元素,然后将树向下移动到你想要的位置.
或者这也可以工作,看起来更干净一些(因为只要只有一个图像,你就不会真正关心表格中的DOM结构):
var statsNode = doc.DocumentNode.SelectSingleNode("//table[@id='tickerStats']");
var imageNode = statsNode.SelectSingleNode(".//img");
string imageText = imageNode.Attributes["src"].Value;
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1513 次 |
| 最近记录: |