我正在尝试从维基百科转储中提取中间语言链接。这些链接似乎已移至 WikiData 项目,并且仅通过 API 提供访问权限。
此分支解释了如何处理该问题并建议切换到 API: 从导出的维基百科文章中检索中间语言链接?
然而,我的研究范围似乎太大,无法使用 Web API(数百万个查询)。有谁知道是否可以从 API 之外的任何地方提取这些链接?解析任意大小的转储比查询 API 更可取。
我使用的维基百科转储: http ://dumps.wikimedia.org/backup-index.html
我使用的维基数据转储: http://dumps.wikimedia.org/wikidatawiki/latest/