相关疑难解决方法(0)

在Ruby中解析网页的最佳方法是什么?

我一直在rubyforge上查看XML和HTML库,这是一种从网页中提取数据的简单方法.例如,如果我想在stackoverflow上解析用户页面,我该如何将数据转换为可用的格式?

假设我想解析自己的用户页面以获取我当前的信誉评分和徽章列表.我试图将从我的用户页面检索到的源转换为xml,但由于缺少div,转换失败.我知道我可以做一个字符串比较并找到我正在寻找的文本,但必须有一个更好的方法来做到这一点.

我想将它合并到一个简单的脚本中,该脚本在命令行中吐出我的用户数据,并可能将其扩展为GUI应用程序.

html ruby xml screen-scraping

14
推荐指数
3
解决办法
9435
查看次数

标签 统计

html ×1

ruby ×1

screen-scraping ×1

xml ×1