gpt4 book ai didi

wget - 如何在使用 wget 镜像站点时跳过选定的 url

转载 作者:行者123 更新时间:2023-12-04 02:18:13 25 4
gpt4 key购买 nike

我有以下问题。我需要镜像受密码保护的站点。听起来很简单:

wget -m -k -K -E --cookies=on --keep-session-cookies --load-cookies=myCookies.txt http://mysite.com

在 myCookies.txt 中,我保留了正确的 session cookie。这一直有效,直到 wget 进入注销页面 - 然后 session 无效,并且实际上,进一步的镜像是无用的。

W 试图添加 --reject 选项,但它只适用于文件类型 - 我只能阻止 html 文件下载或 swf 文件下载,我不能说

--reject http://mysite.com/*.php?type=Logout*

知道如何跳过 wget 中的某些 URL 吗?也许还有其他工具可以完成这项工作(必须在 MS Windows 上工作)。

最佳答案

如果您下载(或者甚至只是触摸)注销页面,然后

wget --no-clobber --your-original-arguments

这应该跳过注销页面,因为它已经下载了

(免责声明:我自己没有尝试过)

关于wget - 如何在使用 wget 镜像站点时跳过选定的 url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10548113/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com