gpt4 book ai didi

linux - wget 如何只保存从目标页面链接到的页面链接到的某些文件类型?

转载 作者:IT王子 更新时间:2023-10-29 00:25:29 28 4
gpt4 key购买 nike

wget 如何只保存从目标页面链接到的页面链接到的特定文件类型,而不考虑特定文件所在的域?

试图加快我必须经常做的任务。

我一直在浏览 wget 文档和谷歌搜索,但似乎没有任何效果。我一直要么只获取目标页面,要么获取没有文件的子页面(甚至使用 -H),所以我显然在这方面做得不好。

因此,基本上,example.com/index1/包含指向 example.com/subpage1/和 example.com/subpage2/的链接,而子页面包含指向 example2.com/file.ext 和 example2.com/file2 的链接。 ext 等。但是,example.com/index1.html 可能会链接到 example.com/index2/,其中包含指向更多我不想要的子页面的链接。

wget 甚至可以做到这一点,如果不能,那么您建议我使用什么?谢谢。

最佳答案

以下命令对我有用。

wget -r --accept "*.ext" --level 2 "example.com/index1/"

需要递归执行,所以应该添加-r

关于linux - wget 如何只保存从目标页面链接到的页面链接到的某些文件类型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6643475/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com