wget - 比较文件大小，如果不同则通过 wget 下载-6ren

wget - 比较文件大小，如果不同则通过 wget 下载

转载作者：行者123 更新时间：2023-12-01 20:27:30

30

4

我正在通过 wget 下载一些 .mp3 文件(全部合法):

wget -r -nc files.myserver.com

有时我必须停止下载，此时文件已部分下载。例如，10 分钟的 record.mp3 文件变成 4 分钟的 record.mp3 文件。播放正确，但不完整。

如果我使用上面相同的命令，因为 record.mp3 文件已经存在于我的本地计算机中，wget 会跳过该文件，尽管它不完整。

我想知道是否有办法检查文件大小，以及远程服务器和本地计算机中的文件大小是否相同重新下载它。 (我了解到 --spider 命令给出了文件大小，但是否有其他命令可以自动检查文件大小并下载或不下载)。

最佳答案

我会选择 wget 的 -N时间戳选项，但请注意，如果您还指定 --no-if-modified-since，wget 将仅比较文件大小选项。如果没有它，不完整的文件确实会在下次运行时被跳过，因为它们收到当前时间的时间戳，该时间戳比服务器上的时间戳新。

原因可能是只有 -N ，针对设置了 If-Modified-Since 字段的文件发送 GET 请求。服务器响应 200 或 304，但 304 不包含文件大小，因此 wget 无法检查它。

与 --no-if-modified-since wget 发送一个 HEAD 请求来获取时间戳和文件大小，并检查两者。

我使用什么来递归下载文件夹:

wget -T 300 -nv -t 1 -r -nd -np -l 1 -N --no-if-modified-since -P $my_folder $my_url

与:

-T 300: Set the network timeout to 300 seconds
-nv: Turn off verbose without being completely quiet
-t 1: Set number of tries to 1
-r: Turn on recursive retrieving
-nd: Do not create a hierarchy of directories when retrieving recursively
-np: Do not ever ascend to the parent directory when retrieving recursively
-l 1: Specify recursion maximum depth 1
-N: Turn on time-stamping
--no-if-modified-since: Do not send If-Modified-Since header in ‘-N’ mode, send preliminary HEAD request instead

关于wget - 比较文件大小，如果不同则通过 wget 下载，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31044763/

30

4

0

文章推荐： java - 在java中通过pdfbox阅读pdf

文章推荐： java - 什么是NumberFormatException，我该如何解决？

文章推荐： go - 在另一个函数中更改golang slice

wget - Wget 中的默认用户代理
如果我从命令行使用 wget 而不指定显式用户代理，我想知道传递的默认用户代理是什么。我有一些基于用户代理更改输出的代码。 wget http://www.google.com -O test.ht
wget - wget 中请求之间的延迟
我想使用 wget 下载网络，但为了使它更像一个真正的用户，我想在请求之间进行小的随机延迟。我正在通过 cmd 执行 wget。最佳答案您可以将以下代码添加到命令行中，这会在服务器请求之间增加
wget - 如何使用 wget 部分重命名下载的文件？
我想从 ftp 服务器下载许多文件(大约 10000 个)。文件名太长。我只想用名称中的日期保存它们。例如:ABCDE201604120000-abcde.nc 我更喜欢20160412.nc可能吗？
wget - 使用 wget 伪造浏览器？
我想抓取一个网站来构建它的站点地图。问题是，该站点使用 htaccess 文件来阻止蜘蛛，因此以下命令仅下载主页(index.html)并停止，尽管它确实包含指向其他页面的链接: wget -mkE
wget - 如何让 wget 以正确的文件名保存
当我去ISC时here要下载 BIND，我的浏览器会自动正确保存下载的文件。例如，如果我点击 9.9.4-P2 的下载按钮，它会弹出一个窗口，如果我点击右侧的“BIND 9.9.4-P2 - tar.
wget - "wget -O"是什么意思？
我的 shell 脚本中有一个像这样的 wget 命令: reponse="`wget -O- http:localhost:8080/app/index.html`" 我不明白 -O- 选项。我被解
wget - 如何使用 Wget 进入登录页面？
我正在尝试使用Wget下载页面，但我无法通过登录屏幕。如何使用登录页面上的发布数据发送用户名/密码，然后以经过身份验证的用户身份下载实际页面？最佳答案基于手册页: # Log in to the
wget - 如何使用 wget 从盒子下载文件？
我创建了指向框中文件的直接链接: 上一个链接是浏览器网络界面，所以我随后分享了一个直接链接: 但是，如果我使用 wget 下载文件，我会收到垃圾。如何使用 wget 下载文件？最佳答案我可以通过
wget - 如何强制 wget 覆盖现有文件而忽略时间戳？
我尝试了“-N”和“--no-clobber”，但我得到的唯一结果是检索现有 example.exe 的新副本，其编号是使用此语法“example.exe.1”添加的数字'。这不是我想要得到的。我只需
wget - 如何使用 wget 而不是保留日期？
当我执行 wget 时，我希望文件系统中保存的文件具有现在的保存日期。不是服务器的日期。当我这样做时: ll -ltr 我首先下载了文件(列表中的最后一个)。以及如何将其设为默认值？什么时候是默认值
centos - 安装 wget 时没有可用的软件包 wget
在我的 CentOS 6.5 中，我想安装 wget: # yum -y install wget 但我收到以下错误: [root@localhost yum.repos.d]# yum -y i
wget - wget 的 -N 选项有问题
我正在尝试使用 wget 抓取网站。这是我的命令: wget -t 3 -N -k -r -x -N 表示“如果服务器版本低于本地版本，则不下载文件”。但这不起作用。当我重新启动上述抓取操作时，会一遍
wget - 使用 wget 覆盖文件但使用临时文件名直到收到完整文件，然后重命名
我在 cron 作业中使用 wget 每分钟将 .jpg 文件提取到 Web 服务器文件夹中(每次使用相同的文件名，覆盖)。此文件夹是“事件的”，因为 Web 服务器也从那里提供该图像。但是，如果有人
wget - 如何在使用 wget 镜像站点时跳过选定的 url
我有以下问题。我需要镜像受密码保护的站点。听起来很简单: wget -m -k -K -E --cookies=on --keep-session-cookies --load-cookies=myC
wget - 我可以使用 wget 来检查，但不能下载
我可以使用 wget 检查 404 错误而不实际下载资源吗？如果是这样怎么办？谢谢最佳答案命令行参数--spider正是用于此目的。在此模式下，wget 不会下载文件，如果找到资源，则返回值为零；
wget - 比较文件大小，如果不同则通过 wget 下载
我正在通过 wget 下载一些 .mp3 文件(全部合法): wget -r -nc files.myserver.com 有时我必须停止下载，此时文件已部分下载。例如，10 分钟的 record.m
wget - 连接到 https 页面时 wget 速度较慢
我正在使用 wget 连接到这样的安全站点: wget -nc -i inputFile 其中 inputeFile 由这样的 URL 组成: https://clientWebsite.com/Th
wget - 将使用 wget 下载的网页的目录索引重命名为 index.html
我目前正在使用一个相当复杂的 wget 命令，但它的本质是 -p 和 -k 标志来下载所有先决条件。如何将主要下载文件重命名为 index.html？比如我下载一个网页 http://myaweso
wget - 如何强制 wget 不进行 URL 编码？
这看起来应该很简单，但我无法弄清楚。我要发wget类似于以下的请求， wget http://www.foo.com/bar.cgi?param=\"p\" 但我不希望它对引号(或其他任何东西)进行
wget - 如何使用 wget 从 SourceForge 下载文件？
我正在编写一个需要从 sourceforge 下载发布文件的脚本。如何获得好的链接？同样的问题及其答案于 2013 年在此处给出，但不再有效。 https://unix.stackexchange.

首页

博学

6Ren·AI

商城

wget - 比较文件大小，如果不同则通过 wget 下载