如何从维基百科文章中提取数据?

rob*_*y12 6 xml parsing android wikipedia wikipedia-api

我有一个关于从我的Android应用程序解析维基百科数据的问题.我有一个脚本,可以通过读取源下载XML http://en.wikipedia.org/w/api.php?action=parse&prop=text&format=xml&page=ARTICLE_NAME通过更换(以及JSON format=xmlformat=json.

但我无法弄清楚的是如何只从目录中访问某些部分.我想要的是当页面加载时,用户可以按下一个按钮,弹出窗口显示内容列表中的标题,并允许用户只读取该部分,以方便使用.我对JSON有点不稳定,但有可能做到这一点吗?或者,维基百科是否有API允许开发人员只查看页面的某些部分?

谢谢!

svi*_*ick 9

不幸的是,似乎mediawiki.org文档parse没有告诉你如何做到这一点.但API本身的文档确实:您可以使用section参数.您可以使用prop=sections获取部分列表.

所以,你可以先使用:

http://en.wikipedia.org/w/api.php?format=xml&action=parse&page=Android_%28operating_system%29&prop=sections

获取部分列表然后

http://en.wikipedia.org/w/api.php?format=xml&action=parse&page=Android_%28operating_system%29&prop=text§ion=26

获取某个部分的HTML.