有没有办法使用 HTMLAgilityPack 用文本节点替换 html 节点?

Art*_*nds 2 html c# dom html-agility-pack

我想使用 HTMLAgility 包用文本节点替换文档中的节点。这样做的目的是删除节点本身周围的标签。目前,我做这样的事情:

//This code fixes redundant HTML formatting tags
//This is a snippet of code
foreach (var hChildNode in hd.DocumentNode.SelectNodes("//b//b | //i//i | //u//u") ?? Enumerable.Empty<HtmlNode>())
    hChildNode.Name = "remove";
StringBuilder sb = new StringBuilder(hd.DocumentNode.WriteTo());
sb.Replace("<remove>", string.Empty);
sb.Replace("</remove>", string.Empty);
Run Code Online (Sandbox Code Playgroud)

有一个更好的方法吗?如果我尝试创建一个新的文本节点,然后执行类似于下面的代码片段的操作,我会收到一个无效的转换错误:

foreach (var hChildNode in hd.DocumentNode.SelectNodes("//b//b | //i//i | //u//u") ?? Enumerable.Empty<HtmlNode>())
{
    HtmlNode hNewNode = hd.CreateTextNode(hChildNode.InnerHtml);
    hChildNode.ParentNode.ReplaceChild(hNewNode, hChildNode);
}
Run Code Online (Sandbox Code Playgroud)

(在指出错字后更新,但问题仍然存在)

我使用的方法有误吗?我应该使用另一种方法来执行这样的功能吗?谢谢。

Ale*_*lex 5

这样做的目的是删除节点本身周围的标签

除了一个错字(我猜),您剪下的第二个代码完全执行标记删除

HtmlNode hNewNode = hd.CreateTextNode(hNewNode.InnerHtml);
Run Code Online (Sandbox Code Playgroud)

您应该替换hNewNode.InnerHtmlhChildNode.InnerHtml否则您的代码甚至无法编译(使用未分配的变量)。

还想提一下,在创建文本节点后,它不会有被替换节点的子节点(相反,它的InnerHtml属性值与替换节点的属性值相同)。