hpricot中的分段错误

use*_*748 2 ruby hpricot segmentation-fault

我正在使用hpricot来阅读HTML.我得到了一个分段错误错误,我用google搜索,有人说升级到最新版本的Ruby.我使用的是rails 2.3.2和ruby 1.8.7.如何解决此错误?

小智 5

我试图解析其中包含许多unicode字符的html页面,Hpricot一直在崩溃.最后,我使用了sanitize中的猴子补丁并将它放在环境中.rb用于我的rails应用程序.自从我添加此补丁以来,没有一次崩溃:

http://github.com/rgrove/sanitize/blob/1e1dc9681de99e32dc166f591343dfa60fc1f648/lib/sanitize/monkeypatch/hpricot.rb