需要有关XPATH的帮助,以获取特定Html img标记的src值

Question

需要有关XPATH的帮助,以获取特定Html img标记的src值

PFr*_*ise 3 c# xpath parsing html-agility-pack

我对XPATH有点新,并了解大多数基础知识,但我遇到了一些特定查询的问题.

我正在尝试解析一个Motley Fool页面并返回图像的来源以获得股票的大写分数.

例如:如果您查看页面的源代码:http://caps.fool.com/Ticker/SLT.aspx我想要http://g.foolcdn.com/art/ratings/stars/trans的源代码/5stars-trans-lg.png

如果可能的话,我只想要src =之后的内容.

我目前正在与:

xpath = "//div[@class='subtle marginT']"

Run Code Online (Sandbox Code Playgroud)

然而,这没有任何回报.我知道这可能会有很多问题,但如果您想回答,我也非常感谢您快速推理答案,因为我想学习XCAP,而不仅仅是让这个查询起作用.

Answer 1

Bro*_*ass 6

根据您的网址,这对我有用:

var imageNode = doc.DocumentNode.SelectSingleNode("//table[@id='tickerStats']/tbody/tr/td/img");
string imageText = imageNode.Attributes["src"].Value;

Run Code Online (Sandbox Code Playgroud)

基本上只是抓住具有id的最近元素,然后将树向下移动到你想要的位置.

或者这也可以工作,看起来更干净一些(因为只要只有一个图像,你就不会真正关心表格中的DOM结构):

var statsNode = doc.DocumentNode.SelectSingleNode("//table[@id='tickerStats']");
var imageNode = statsNode.SelectSingleNode(".//img");
string imageText = imageNode.Attributes["src"].Value;

Run Code Online (Sandbox Code Playgroud)

归档时间：	14 年，10 月前
查看次数：	1513 次
最近记录：	14 年，9 月前