wget WIKI,不要获取差异页面(由正则表达式排除?)

sto*_*nea 5 wiki command-line wget

我正在尝试使用wget下载wiki的静态镜像.我只想要每篇文章的最新版本(不是完整的历史记录或版本之间的差异).稍后下载整个内容并删除不必要的页面会很容易,但这样做会花费太多时间并给服务器带来不必要的压力.

有很多页面我显然不需要,例如:

WhoIsDoingWhat?行动= DIFF和日期= 1184177979

有没有办法告诉wget不要下载并递归其中包含'action = diff'的网址?或者以其他方式排除与某些正则表达式匹配的URL?

cha*_*aos 3

-R '*action=diff*,*action=edit*'
Run Code Online (Sandbox Code Playgroud)

  • 看起来像是 wget 中的一个错误。其他人之前也遇到过这个问题:http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=217243 (2认同)