小编Ste*_*hen的帖子

查找最近的前一个兄弟的 XPath 语句

我在 C# WPF 应用程序中使用 HTMLAgilityPack 来遍历本地 HTML 页面中的一些锚标记并提取 href 属性。这很好用,但我需要在 HTML 文档中找到锚所在的标题(这也是一个锚标记)。这应该很容易用 XPath 完成,但我似乎无法得到适用于所有场景的语句。

这是我的 HTML 示例(我无法控制):

<html>
    <body>
        <table>
            <tr>
                <td><div><a href="#maintitle" class="title">maintitle</a></div></td>
            </tr>
            <tr>
                <td><div><a href="#subtitle1" class="subtitle">subtitle1</a></div></td>
            </tr>
            <tr>
                <td><div><a href="link1.pdf">link1</a></div></td>
            </tr>
            <tr>
                <td><div><a href="link2.pdf">link2</a></div></td>
            </tr>
            <tr>
                <td><div><a href="link3.pdf">link3</a></div></td>
            </tr>
            <tr>
                <td><div><a href="#subtitle2" class="subtitle">subtitle2</a></div></td>
            </tr>
            <tr>
                <td><div><a href="link4.pdf">link4</a></div></td>
            </tr>
            <tr>
                <td><div><a href="link5.pdf">link5</a></div></td>
            </tr>
        </table>
    </body>
</html>
Run Code Online (Sandbox Code Playgroud)

找到link1后,我想找到subtitle1。同样对于 link2 和 link3。但是对于link4和link5,我想找到subtitle2。我正在使用这个 XPath 语句(第一部分只是为了模拟锚标记的选择,我一直在使用在线 XPath 评估器https://www.freeformatter.com/xpath-tester.html) :

//a[@href='link4.pdf']/ancestor::tr/preceding-sibling::tr//a[@class='subtitle']
Run Code Online (Sandbox Code Playgroud)

这适用于链接 1 到链接 3,但对于链接 4 和链接 5,它返回副标题 1 和副标题 2。添加 …

c# xpath html-agility-pack

2
推荐指数
1
解决办法
1835
查看次数

标签 统计

c# ×1

html-agility-pack ×1

xpath ×1