用于维基百科数据提取的Rails + MediaWiki API

Car*_*s F 5 mediawiki ruby-on-rails wikipedia-api mediawiki-api

我试图使用Rails根据搜索词从维基百科中提取数据.

例如,

1)如果我有字符串"美国偶像",我想将其传递给维基百科,并获得与之相关的文章列表.我的目标是获取前3个超链接并在网站上显示.

2)进一步将涉及我从维基百科中提取小块数据 - 比如信息框,或维基百科文章的前几个单词.

有小费吗?

谢谢!

jpa*_*kal 5

你不需要诉诸屏幕抓取,MediaWiki有一个非常全面的API,正是这种事情.请参阅https://github.com/jpatokal/mediawiki-gateway,获取一个方便的Ruby包装器.

或者,如果您只对信息框等数据感兴趣,请参阅DBpedia以获取Wikipedia的数据库版本.