使用html agility pack获取课堂链接

13 c# html-agility-pack

有一堆与类alt的tr.我想得到所有链接(或最后一个)但我无法弄清楚如何使用html敏捷包.

我试过a的变种,但我只得到所有的链接或没有.它似乎只是在节点中得到一个没有意义的,因为我正在编写n.SelectNodes

html.LoadHtml(page);
var nS = html.DocumentNode.SelectNodes("//tr[@class='alt']");
foreach (var n in nS)
{
  var aS = n.SelectNodes("a");
  ...
}
Run Code Online (Sandbox Code Playgroud)

SLa*_*aks 15

您可以使用LINQ:

var links = html.DocumentNode
           .Descendants("tr")
           .Where(tr => tr.GetAttributeValue("class", "").Contains("alt"))
           .SelectMany(tr => tr.Descendants("a"))
           .ToArray();
Run Code Online (Sandbox Code Playgroud)

请注意,这也将匹配<tr class="Malto">; 你可能想Contains用正则表达式替换这个调用.

你也可以使用Fizzler:

html.DocumentNode.QuerySelectorAll("tr.alt a");
Run Code Online (Sandbox Code Playgroud)

请注意,这两种方法也将返回非链接的锚点.


小智 11

为什么不在单个查询中选择所有链接:

html.LoadHtml(page);
var nS = html.DocumentNode.SelectNodes("//tr[@class='alt']//a");
foreach(HtmlNode linkNode in nS)
{
//do something
}
Run Code Online (Sandbox Code Playgroud)

它对html有效:

<table>
<tr class = "alt">
<td><'a href="link.html">Some Link</a></td>
</tr>
</table>
Run Code Online (Sandbox Code Playgroud)