mag*_*tic 6 c# asp.net trim html-agility-pack
我尝试使用HtmlAgilityPack以下列方式解析HTML:
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);
Run Code Online (Sandbox Code Playgroud)
不幸的是,xhtmlString包含不必要的空格和换行符,所以htmlDoc的_text现在看起来像这样:
<html xmlns=\"http://www.w3.org/1999/xhtml\">\n\t<head></head>\n\t<body>\n\n<p>Alle Auktionen<br /></p>\n\n\t</body>\n</html>
在使用身体的子元素时,这对我来说是个问题.
删除这些不必要字符的最简单方法是什么?
HtmlAgilityPack是否提供某种功能来清除新行和标签中的HTML?
这是文档缩进,而不是不必要的空格和换行符。
我不明白这怎么可能是一个问题,但你不能只替换特殊字符,例如“\t”、“\n”吗?
进行快速搜索,我发现了这个Html Agility Pack:使代码看起来整洁
也许将某些属性设置为 false 会有所帮助
| 归档时间: |
|
| 查看次数: |
5778 次 |
| 最近记录: |