维基百科文章名称(无内容)

Boo*_*ean 6 wikipedia web-scraping

我正在做一个项目,我需要知道所有的维基百科文章名称(我不需要内容).有没有我可以下载这些数据的地方.

AJ.*_*AJ. 14

在维基百科上查看此页面 - 可以选择下载包含文章名称的存档.这是下载页面实际路径:

编辑:

您可能会注意到列表中出现的非英文标题(以及一些亵渎 - 被告知)enwiki-latest-all-titles-in-ns0.gz.这是因为默认情况下,大多数人在主要英语维基(语言代码en)上创建内容.如果您要调查其他语言转储,您会发现有不同的文章集.

主下载页面上阅读,有人提到能够使用维基百科API在维基百科上执行某些类型的查询,但我不确定这会解决您的问题(页面的分类似乎不提供区分"英语"内容与"英语维基内容"的简单方法.