如何从维基百科文章的“另请参阅”部分提取链接?

Luc*_*uca 5 wikipedia wikipedia-api

有没有办法通过维基百科 API 仅从维基百科文章中的“另请参阅”部分提取所有链接?

我想知道一种方法,但我找不到。

Ter*_*nja 5

是的,您可以通过使用 Wikipedia API 和action=parse来做到这一点。为了这个目标,我们需要两个属性:sectionslinks。例如,对于维基百科文章芝加哥,我们使用下一个查询来获取名称为“另请参见”的部分的索引:

https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Chicago
Run Code Online (Sandbox Code Playgroud)

从响应中我们看到它是43。然后我们使用该索引仅获取本节中的链接:

https://en.wikipedia.org/w/api.php?action=parse&prop=links&page=Chicago&section=43
Run Code Online (Sandbox Code Playgroud)

注意:最后一个响应还可以包含来自某些模板的链接,如我们的案例Portal:ChicagoPortal:Illinois。如果您愿意,可以在请求中使用命名空间&ns=0来过滤它们。