如何使用 wget linux 命令镜像维基百科页面?

alm*_*ary 1 linux command-line wget mirror web

我想用 wget Linux 命令镜像维基百科页面我使用了这个命令

wget --mirror -p --convert-links -P ./folder-mirror /https://en.wikipedia.org/wiki/Portal:Contents/A–Z_index
Run Code Online (Sandbox Code Playgroud)

但我只得到这个文件robots.txt

小智 7

不要那样做。它给维基百科网络服务器带来了巨大的负担,你的 IP 将被封锁。

如果您想要维基百科的镜像,请从https://dumps.wikimedia.org/下载其数据库的转储。截至目前,英文维基的最新完整转储可在以下位置获得:

https://dumps.wikimedia.org/enwiki/20160407/

如果您只需要来自特定页面的数据,请考虑使用MediaWiki API