我试图通过api获取维基百科文章的所有单独部分.
我已经知道了 :
如何检索完整的文本:
http://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvlimit=1&titles=house&rvprop=content
如何检索文本的特定部分:
如何通过一个请求单独检索所有部分?(例如JSON数组)
您要求的是解析,因为它需要解释wiki文本源以按页面拆分页面等.所以解决方案在https://www.mediawiki.org/wiki/API:Parsing_wikitext中给出
1)获取部分列表:https://www.mediawiki.org/w/api.php?action = paarse&page = API:Parsing_wikitext&prop = section
2)询问该部分的解析wiki文本:https://www.mediawiki.org/w/api.php?action = paarse&page = API:Parsing_wikitext & section = 1& prop = text
我意识到这个问题是四年前提出的,所以当时可能没有以下内容:
您可以使用此处描述的 REST API:https : //www.mediawiki.org/wiki/REST_API
REST 端点在此处描述/记录:https : //en.wikipedia.org/api/rest_v1/#/
该mobile-sections
端点(用于消费信息的移动设备)为您提供了一个很好的细分与标题,这听起来像你所要求的。
或者,metadata
端点返回包含相同标题细分的 toc(目录)部分。
这是一个示例 URL,获取“埃及金字塔”页面的移动部分:https : //en.wikipedia.org/api/rest_v1/page/mobile-sections/Egyptian_pyramids
优点是响应采用 JSON 格式(这正是您所要求的)。