如何从维基百科页面的最新版本获取内部链接?

che*_*kha 1 mediawiki wikipedia wikipedia-api mediawiki-api

我正试图从维基百科页面中提取内部链接.这是我正在使用的查询

/w/api.php?action=query&prop=links&format=xml&plnamespace=0&pllimit=max&titles=pageTitle
Run Code Online (Sandbox Code Playgroud)

但是,结果并不反映维基页面上的内容.以这里的随机文章为例.此页面上只有十几个链接.但是,当我进行查询时,

/w/api.php?action=query&prop=links&format=xml&plnamespace=0&pllimit=max&titles=Von_Mises%E2%80%93Fisher_distribution
Run Code Online (Sandbox Code Playgroud)

我找回了187个链接.我想API可能有一个数据库,其中包含已添加到页面的所有链接,包括所有修订版本.是这样的吗?如何从最后一次修订中获取链接?

bri*_*yte 5

数据库具有正确的文章版本中的链接列表.您从API获得的所有链接实际上都在文章中.但是,大多数都隐藏在底部的(两次折叠)导航框中(滚动到底部,单击蓝色条上的"显示",然后在您现在看到的其他蓝色条上单击"显示").

请注意,这些链接位于页面上,但未在wiki文本中定义 - 它们来自{{ProbDistributions}}导航模板(以及模板依次包含的模板).

遗憾的是,没有好的方法只列出在页面上直接/显式定义的链接,因为模板替换发生在实际解析wiki语法之前.