gpt4 book ai didi

command-line - wget WIKI,不要获取差异页面(正则表达式排除?)

转载 作者:行者123 更新时间:2023-12-04 21:00:50 24 4
gpt4 key购买 nike

我正在尝试使用 wget 下载 wiki 的静态镜像。我只想要每篇文章的最新版本(而不是完整的历史或版本之间的差异)。下载整个内容并稍后删除不必要的页面会很容易,但这样做会花费太多时间并对服务器造成不必要的压力。

有很多页面我显然不需要,例如:

WhoIsDoingWhat?action=diff&date=1184177979

有没有办法告诉 wget 不要下载和递归包含“action=diff”的 URL?或者以其他方式排除与某些正则表达式匹配的 URL?

最佳答案

-R '*action=diff*,*action=edit*'

关于command-line - wget WIKI,不要获取差异页面(正则表达式排除?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/935901/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com