使用C#读取HTML文件的<body>标记

Ras*_*sen 1 html c#

我需要使用C#获取HTML文件的body标签内的所有内容.有没有好的有效方法呢?

mar*_*c_s 8

查看HTML Agility Pack以执行各种HTML操作

它为您提供了一个类似于XmlDocumentXML处理接口的接口:

 HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");

 HtmlNode bodyNode = doc.DocumentNode.SelectSingleNode("/html/body");

 if(bodyNode != null)
 {
    // do something
 }
Run Code Online (Sandbox Code Playgroud)