gpt4 book ai didi

http - 使用 httrack 镜像单个页面

转载 作者:可可西里 更新时间:2023-11-01 15:09:07 24 4
gpt4 key购买 nike

我正在尝试使用 httrack ( http://www.httrack.com/ ) 来下载单个页面,而不是整个站点。因此,例如,当使用 httrack 下载 www.google.com 时,它应该只下载在 www.google.com 下找到的 html 以及所有样式表、图像和 javascript,而不是点击任何指向 images.google.com 的链接, labs.google.com 或 www.google.com/subdir/等。

我尝试了 -w 选项,但没有任何区别。

正确的命令是什么?

编辑

我尝试使用 httrack "http://www.google.com/"-O "./www.google.com""http://www.google.com/"-v -s0 - -depth=1 但是它不会复制任何图像。

我基本上想要的只是下载该域的索引文件以及所有 Assets ,而不是任何外部或内部链接的内容。

最佳答案

httrack "http://www.google.com/" -O "./www.google.com" "http://www.google.com/" -v -s0  --depth=1 -n

-n 选项(或 --near)将下载网页上的图像,无论它位于何处。

假设图片位于 google.com/foo/bar/logo.png。因为,你正在使用 s0(留在同一目录),除非你指定 --near

否则它不会下载图像

关于http - 使用 httrack 镜像单个页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1968470/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com