Luc*_*uca 5 wikipedia wikipedia-api
有没有办法通过维基百科 API 仅从维基百科文章中的“另请参阅”部分提取所有链接?
我想知道一种方法,但我找不到。
是的,您可以通过使用 Wikipedia API 和action=parse来做到这一点。为了这个目标,我们需要两个属性:sections和links。例如,对于维基百科文章芝加哥,我们使用下一个查询来获取名称为“另请参见”的部分的索引:
https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Chicago
Run Code Online (Sandbox Code Playgroud)
从响应中我们看到它是43。然后我们使用该索引仅获取本节中的链接:
https://en.wikipedia.org/w/api.php?action=parse&prop=links&page=Chicago§ion=43
Run Code Online (Sandbox Code Playgroud)
注意:最后一个响应还可以包含来自某些模板的链接,如我们的案例Portal:Chicago和Portal:Illinois。如果您愿意,可以在请求中使用命名空间&ns=0来过滤它们。