我正在尝试使用wget下载wiki的静态镜像.我只想要每篇文章的最新版本(不是完整的历史记录或版本之间的差异).稍后下载整个内容并删除不必要的页面会很容易,但这样做会花费太多时间并给服务器带来不必要的压力.
有很多页面我显然不需要,例如:
WhoIsDoingWhat?行动= DIFF和日期= 1184177979
有没有办法告诉wget不要下载并递归其中包含'action = diff'的网址?或者以其他方式排除与某些正则表达式匹配的URL?
有没有办法可以判断stderr是输出到C/C++程序中的文件还是终端?我需要输出不同的错误消息,具体取决于程序是否被调用为:
./程序
或者喜欢:
./program 2 >>文件
从C程序中的文件读取下一个非空白(不是空格/换行符/制表符)字符的最佳(最短)方法是什么?
我意识到我可能会使用get跟随strtok,但似乎必须有更简洁的东西.
如果是这样,请告诉我; 如果没有,请告诉我.
谢谢.