Nokogiri vs Hpricot?

ros*_*han 23 ruby hpricot html-parsing nokogiri

你会选哪一个?我的重要属性是(不按顺序):

  1. 支持和未来的增强功能.
  2. 社区和一般知识库(在互联网上).
  3. 全面的(IE,经证明可以解析各种*.*ml页面).
  4. 性能.
  5. 内存占用(运行时,而不是代码库).

Mar*_*une 35

选择Nokogiri,所有积分,特别是第一点:Hpricot 不再维护.

元回答:请参阅ruby-toolbox以了解特定区域中不同工具的受欢迎程度.


Szt*_*upY 8

如果您没有或无法在您正在使用的计算机上安装LibXML,请选择Hpricot.如果情况并非如此,那么选择Nokogiri,它在提到的五个属性中比Hpricot更好.

  • 从字面上几分钟前开始,还有一个纯Java版的Nokogiri.因此,您可以在没有FFI且没有libxml的JRuby上使用Nokogiri.(Google App Engine是无法实现FFI的一个示例.) (7认同)

nil*_*nil 6

我发现Hpricot有用的情况是处理破坏的HTML,你需要在处理后保持破坏.Hpricot很适合仅修改已更新文档的部分.除非需要,否则Nokogiri就是您的选择.