alm*_*ary 1 linux command-line wget mirror web
我想用 wget Linux 命令镜像维基百科页面我使用了这个命令
wget --mirror -p --convert-links -P ./folder-mirror /https://en.wikipedia.org/wiki/Portal:Contents/A–Z_index
Run Code Online (Sandbox Code Playgroud)
但我只得到这个文件robots.txt
小智 7
不要那样做。它给维基百科网络服务器带来了巨大的负担,你的 IP 将被封锁。
如果您想要维基百科的镜像,请从https://dumps.wikimedia.org/下载其数据库的转储。截至目前,英文维基的最新完整转储可在以下位置获得:
https://dumps.wikimedia.org/enwiki/20160407/
如果您只需要来自特定页面的数据,请考虑使用MediaWiki API。