Dav*_*ave 6 .net c# xslt xpath html-agility-pack
我正在使用html敏捷包将我的html文档的内容读成字符串等.完成后,我想删除其内容中的certian元素,但是我遇到了问题.
我的Html看起来像这样:
<div id="wrapper">
<div class="maincolumn" >
<div class="breadCrumbContainer">
<div class="breadCrumbs">
</div>
</div>
<div class="seo_list">
<div class="seo_head">Header</div>
</div>
Content goes here...
</div>
Run Code Online (Sandbox Code Playgroud)
现在,我使用了一个xpath选择器来获取其中的所有内容,并使用了InnerHtml属性,如下所示:
node = doc.DocumentNode.SelectSingleNode("//div[@id='wrapper']");
if (node != null)
{
pageContent = node.InnerHtml;
}
Run Code Online (Sandbox Code Playgroud)
从这一点来说,我想删除带有"breadCrumbContainer"类的div,但是当使用下面的代码时,我收到错误:在集合中找不到"Node""
node = doc.DocumentNode.SelectSingleNode("//div[@id='wrapper']");
node = node.RemoveChild(node.SelectSingleNode("//div[@class='breadCrumbContainer']"));
if (node != null)
{
pageContent = node.InnerHtml;
}
Run Code Online (Sandbox Code Playgroud)
有人可以对此有所了解吗?我对Xpath很新,对HtmlAgility库来说真的很陌生.
谢谢,
戴夫
Sim*_*ier 12
这是因为RemoveChild只能删除一个直接的孩子,而不是一个大孩子.试试这个:
HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class='breadCrumbContainer']");
node.ParentNode.RemoveChild(node);
Run Code Online (Sandbox Code Playgroud)