HTMLAgilityPack获取带有id属性的td标记的innerText

che*_*man 6 html c# html-table nodes html-agility-pack

我试图用HTMLAgilityPack选择带有id属性的td的内部文本.

Html代码:

<td id="header1">    5    </td>
<td id="header2">    8:39pm    </td>
<td id="header3">    8:58pm    </td>
...
Run Code Online (Sandbox Code Playgroud)

码:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();

doc.LoadHtml(data);

var nodes = doc.DocumentNode.SelectNodes("//td[@id='header1']");

if (nodes != null)
{
    foreach (HtmlAgilityPack.HtmlNode node in nodes)
    {
        MessageBox.Show(node.InnerText);
    }
}
Run Code Online (Sandbox Code Playgroud)

我一直得到空节点,因为我没有正确选择td标签,但无法弄清楚我做错了什么...

编辑:

我在header1和header2中犯了一个错误,但是有5个不同的td标签,标头为1到5.

Tim*_*ter 6

您正在尝试选择,header1但ID是header2.

您也可以GetElementById直接使用:

var td = doc.GetElementbyId("header2");
Run Code Online (Sandbox Code Playgroud)