C#中是否有一个允许轻松管理HTML DOM的对象?

Mat*_*att 6 c# dom dom-manipulation html-agility-pack

如果我有一个字符串,其中包含我刚刚从HTTP Post返回的页面中的html,那么如何将其转换为可让我轻松遍历DOM的内容?

我认为HtmlDocument对象有意义,但它没有构造函数.是否有任何类型可以轻松管理HTML DOM?

谢谢,
马特

Sky*_*ers 9

HtmlDocument是已由WebBrowser控件加载的文档的实例.因此没有ctor.

Html Agility Pack是迄今为止我用于此目的的最佳库

codeplex wiki的一个例子

HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href]"))
{
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
}
doc.Save("file.htm");
Run Code Online (Sandbox Code Playgroud)

该示例显示了文件的加载,但是有一些重载可以让您加载字符串或流.