Cri*_*inH 2 html c# vb.net formatting
我必须处理密集格式的HTML中的问题,这些问题实际上是不可读的,所以我想要一个库"漂亮地打印",格式化,美化或者想要在管理这个HTML的.NET应用程序中调用它.
目前我将其复制并粘贴到Visual Studio 2012中并将其格式化,然后将其粘贴回应用程序,但这变得有点单调乏味.
如果它可以有效地扭转过程并在解决问题时去除所有空白区域,那么它也会很方便.
顺便说一下,我知道改变HTML的格式有时会导致意想不到的结果(我正在看着你的IE),但我可以忍受.
从项目页面:
TidyManaged
这是一个托管的.NET/Mono包装器,用于开源的跨平台Tidy库,一个最初由Dave Raggett创建的HTML/XHTML/XML标记解析器和清理器.
样本用法:
using System;
using TidyManaged;
public class Test
{
public static void Main(string[] args)
{
using (Document doc = Document.FromString("<hTml><title>test</tootle><body>asd</body>"))
{
doc.ShowWarnings = false;
doc.Quiet = true;
doc.OutputXhtml = true;
doc.CleanAndRepair();
string parsed = doc.Save();
Console.WriteLine(parsed);
}
}
}
Run Code Online (Sandbox Code Playgroud)
看起来它应该完全满足您的需求.