Ruby 1.9中的HTML整理/清理

Chr*_*ian 8 html tidy ruby-1.9

我目前正在使用RubyTidy Ruby绑定来实现HTML整洁,以确保我收到的HTML格式正确.目前这个库是阻止我在Ruby 1.9上获得Rails应用程序的唯一因素.是否有任何替代库可以在Ruby 1.9上整理大量的HTML?

sur*_*ajz 7

http://github.com/libc/tidy_ffi/blob/master/README.rdoc适用于ruby 1.9(最新版本)

如果您正在使用Windows,则需要设置library_path,例如

    require 'tidy_ffi'
    TidyFFI.library_path = 'lib\\tidy\\bin\\tidy.dll'
    tidy = TidyFFI::Tidy.new('test')
    puts tidy.clean
Run Code Online (Sandbox Code Playgroud)

(它使用与整洁相同的dll)以上链接为您提供了更多使用示例.


Lau*_*nas 7

我正在使用Nokogiri来修复无效的html:

  Nokogiri::HTML::DocumentFragment.parse(html).to_html


小智 1

目前,这个库是阻碍我在 Ruby 1.9 上获取 Rails 应用程序的唯一因素。

请注意,Ruby Tidy 绑定存在一些严重的内存泄漏问题。目前它在长时间运行的进程中不可用。(根据记录,我正在使用http://github.com/ak47/tidy

我只需要从生产 Rails 2.3 应用程序中删除它,因为它的泄漏速度约为 1MB/分钟。