使用HtmlAgilityPack解析时删除空格和换行符

mag*_*tic 6 c# asp.net trim html-agility-pack

我尝试使用HtmlAgilityPack以下列方式解析HTML:

HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);
Run Code Online (Sandbox Code Playgroud)

不幸的是,xhtmlString包含不必要的空格和换行符,所以htmlDoc的_text现在看起来像这样:

<html xmlns=\"http://www.w3.org/1999/xhtml\">\n\t<head></head>\n\t<body>\n\n<p>Alle Auktionen<br /></p>\n\n\t</body>\n</html>

在使用身体的子元素时,这对我来说是个问题.

删除这些不必要字符的最简单方法是什么?

HtmlAgilityPack是否提供某种功能来清除新行和标签中的HTML?

m.r*_*fca 2

这是文档缩进,而不是不必要的空格和换行符。
我不明白这怎么可能是一个问题,但你不能只替换特殊字符,例如“\t”、“\n”吗?

进行快速搜索,我发现了这个Html Agility Pack:使代码看起来整洁
也许将某些属性设置为 false 会有所帮助