使用 xml.Load 打开 HTML 文档

Vin*_*t S 5 html c# xml document

我想通过以这种方式创建 XMLDocument 来打开一个 HTML 文档(作为从 StreamReader 中检索的字符串):

XmlDocument doc = new XmlDocument

doc.Load(string containing the retrieved document).
Run Code Online (Sandbox Code Playgroud)

但由于 HTML 文档包含这个头:

 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" > 
Run Code Online (Sandbox Code Playgroud)

它告诉我该文档无效...有什么办法可以解决这个问题?

rtp*_*rry 3

正常的 html,即使它是有效的 html,也不是有效的 xml。

有一个名为 HtmlAgilityPack 的库,它是一个流行的第 3 方开源库,您可以使用它来解决此问题: