寻找一个离线库来格式化HTML,我可以使用.NET代码

Cri*_*inH 2 html c# vb.net formatting

我必须处理密集格式的HTML中的问题,这些问题实际上是不可读的,所以我想要一个库"漂亮地打印",格式化,美化或者想要在管理这个HTML的.NET应用程序中调用它.

目前我将其复制并粘贴到Visual Studio 2012中并将其格式化,然后将其粘贴回应用程序,但这变得有点单调乏味.

如果它可以有效地扭转过程并在解决问题时去除所有空白区域,那么它也会很方便.

顺便说一下,我知道改变HTML的格式有时会导致意想不到的结果(我正在看着你的IE),但我可以忍受.

Pau*_*sik 5

查看Html Tidy for .NET/Mono

从项目页面:

TidyManaged

这是一个托管的.NET/Mono包装器,用于开源的跨平台Tidy库,一个最初由Dave Raggett创建的HTML/XHTML/XML标记解析器和清理器.

样本用法:

using System;
using TidyManaged;

public class Test
{
  public static void Main(string[] args)
  {
    using (Document doc = Document.FromString("<hTml><title>test</tootle><body>asd</body>"))
    {
      doc.ShowWarnings = false;
      doc.Quiet = true;
      doc.OutputXhtml = true;
      doc.CleanAndRepair();
      string parsed = doc.Save();
      Console.WriteLine(parsed);
    }
  }
}
Run Code Online (Sandbox Code Playgroud)

看起来它应该完全满足您的需求.