bash - 如何等待 wget 完成以获取更多资源-6ren

bash - 如何等待 wget 完成以获取更多资源

转载作者：行者123 更新时间：2023-11-29 09:45:50

26

4

我是 bash 新手。

我想并行获取一些资源。

以下代码有什么问题:

for item in $list
do
  if [ $i -le 10 ];then
    wget -b $item
    let "i++"
  else
    wait
    i=1
  fi

当我执行这个 shell 时。抛出错误:

fork: Resource temporarily unavailable

我的问题是如何正确使用 wget。

编辑:

我的问题是大约有四千个 url 要下载，如果我让所有这些工作并行工作， fork: Resource temporary unavailable 将抛出。不知道如何并行控制计数。

最佳答案

使用 jobs|grep 检查后台作业:

#!/bin/bash

urls=('www.cnn.com' 'www.wikipedia.org')  ## input data

for ((i=-1;++i<${#urls[@]};)); do
  curl -L -s ${urls[$i]} >file-$i.html &  ## background jobs
done

until [[ -z `jobs|grep -E -v 'Done|Terminated'` ]]; do
  sleep 0.05; echo -n '.'                 ## do something while waiting
done

echo; ls -l file*\.html                   ## list downloaded files

结果:

............................
-rw-r--r-- 1 xxx xxx 155421 Jan 20 00:50 file-0.html
-rw-r--r-- 1 xxx xxx  74711 Jan 20 00:50 file-1.html

另一个变化，简单并行的任务:

#!/bin/bash

urls=('www.yahoo.com' 'www.hotmail.com' 'stackoverflow.com')

_task1(){                                  ## task 1: download files
  for ((i=-1;++i<${#urls[@]};)); do
    curl -L -s ${urls[$i]} >file-$i.html &
  done; wait
}
_task2(){ echo hello; }                    ## task 2: a fake task
_task3(){ echo hi; }                       ## task 3: a fake task

_task1 & _task2 & _task3 &                 ## run them in parallel
wait                                       ## and wait for them

ls -l file*\.html                          ## list results of all tasks
echo done                                  ## and do something

结果:

hello
hi
-rw-r--r-- 1 xxx xxx 320013 Jan 20 02:19 file-0.html
-rw-r--r-- 1 xxx xxx   3566 Jan 20 02:19 file-1.html
-rw-r--r-- 1 xxx xxx 253348 Jan 20 02:19 file-2.html
done

限制一次并行下载数量的示例(最大=3):

#!/bin/bash

m=3                                            ## max jobs (downloads) at a time
t=4                                            ## retries for each download

_debug(){                                      ## list jobs to see (debug)
  printf ":: jobs running: %s\n" "$(echo `jobs -p`)"
}

## sample input data
## is redirected to filehandle=3
exec 3<<-EOF
www.google.com google.html
www.hotmail.com hotmail.html
www.wikipedia.org wiki.html
www.cisco.com cisco.html
www.cnn.com cnn.html
www.yahoo.com yahoo.html
EOF

## read data from filehandle=3, line by line
while IFS=' ' read -u 3 -r u f || [[ -n "$f" ]]; do
  [[ -z "$f" ]] && continue                  ## ignore empty input line
  while [[ $(jobs -p|wc -l) -ge "$m" ]]; do  ## while $m or more jobs in running
    _debug                                   ## then list jobs to see (debug)
    wait -n                                  ## and wait for some job(s) to finish
  done
  curl --retry $t -Ls "$u" >"$f" &           ## download in background
  printf "job %d: %s => %s\n" $! "$u" "$f"   ## print job info to see (debug)
done

_debug; wait; ls -l *\.html                  ## see final results

输出:

job 22992: www.google.com => google.html
job 22996: www.hotmail.com => hotmail.html
job 23000: www.wikipedia.org => wiki.html
:: jobs running: 22992 22996 23000
job 23022: www.cisco.com => cisco.html
:: jobs running: 22996 23000 23022
job 23034: www.cnn.com => cnn.html
:: jobs running: 23000 23022 23034
job 23052: www.yahoo.com => yahoo.html
:: jobs running: 23000 23034 23052
-rw-r--r-- 1 xxx xxx  61473 Jan 21 01:15 cisco.html
-rw-r--r-- 1 xxx xxx 155055 Jan 21 01:15 cnn.html
-rw-r--r-- 1 xxx xxx  12514 Jan 21 01:15 google.html
-rw-r--r-- 1 xxx xxx   3566 Jan 21 01:15 hotmail.html
-rw-r--r-- 1 xxx xxx  74711 Jan 21 01:15 wiki.html
-rw-r--r-- 1 xxx xxx 319967 Jan 21 01:15 yahoo.html

阅读您更新后的问题后，我认为 lftp 更容易使用, 可以记录和下载(自动follow-link + retry-download + continue-download)；你永远不需要担心作业/fork 资源，因为你只运行几个 lftp 命令。只需将您的下载列表分成一些较小的列表，lftp 就会为您下载:

$ cat downthemall.sh 
#!/bin/bash

## run: lftp -c 'help get'
## to know how to use lftp to download files
## with automatically retry+continue

p=()                                     ## pid list

for l in *\.lst; do
  lftp -f "$l" >/dev/null &              ## run proccesses in parallel
  p+=("--pid=$!")                        ## record pid
done

until [[ -f d.log ]]; do sleep 0.5; done ## wait for the log file
tail -f d.log ${p[@]}                    ## print results when downloading

输出:

$ cat 1.lst 
set xfer:log true
set xfer:log-file d.log
get -c http://www.microsoft.com -o micro.html
get -c http://www.cisco.com     -o cisco.html
get -c http://www.wikipedia.org -o wiki.html

$ cat 2.lst 
set xfer:log true
set xfer:log-file d.log
get -c http://www.google.com    -o google.html
get -c http://www.cnn.com       -o cnn.html
get -c http://www.yahoo.com     -o yahoo.html

$ cat 3.lst 
set xfer:log true
set xfer:log-file d.log
get -c http://www.hp.com        -o hp.html
get -c http://www.ibm.com       -o ibm.html
get -c http://stackoverflow.com -o stack.html

$  rm *log *html;./downthemall.sh
2018-01-22 02:10:13 http://www.google.com.vn/?gfe_rd=cr&dcr=0&ei=leVkWqiOKfLs8AeBvqBA -> /tmp/1/google.html 0-12538 103.1 KiB/s
2018-01-22 02:10:13 http://edition.cnn.com/ -> /tmp/1/cnn.html 0-153601 362.6 KiB/s
2018-01-22 02:10:13 https://www.microsoft.com/vi-vn/ -> /tmp/1/micro.html 0-129791 204.0 KiB/s
2018-01-22 02:10:14 https://www.cisco.com/ -> /tmp/1/cisco.html 0-61473 328.0 KiB/s
2018-01-22 02:10:14 http://www8.hp.com/vn/en/home.html -> /tmp/1/hp.html 0-73136 92.2 KiB/s
2018-01-22 02:10:14 https://www.ibm.com/us-en/ -> /tmp/1/ibm.html 0-32700 131.4 KiB/s
2018-01-22 02:10:15 https://vn.yahoo.com/?p=us -> /tmp/1/yahoo.html 0-318657 208.4 KiB/s
2018-01-22 02:10:15 https://www.wikipedia.org/ -> /tmp/1/wiki.html 0-74711 60.7 KiB/s
2018-01-22 02:10:16 https://stackoverflow.com/ -> /tmp/1/stack.html 0-253033 180.8

关于bash - 如何等待 wget 完成以获取更多资源，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48342517/

26

4

0

文章推荐： bash - 无法捕获 `/bin/sh`的退出码

文章推荐： bash - ed HERELINE 替换模式失败

文章推荐： bash - bash脚本会预先解析语法吗？

ios - 如何使“更多”按钮始终进入“更多 View ”？
我正在开发一个带选项卡栏的 ios 应用程序。我的栏上有超过 5 个按钮，所以在 iphone 上我有更多的按钮。现在，假设我有这个按钮:Button1 Button2 Button3 Button4
ios - 修改 UITabBarController 的“更多”选项卡中显示的选项卡导航栏上的“更多”按钮
我有一个带有 UITabBarController 的应用，其中有超过五个选项卡。当我按更多选项卡时，我会转到moreNavigationController，它是一个UINavigationCon
ios - 当我单击“更多”按钮而不是我离开的 VC 时，如何返回 iOS 中“更多...”按钮的 "Table"
我有一个导航 Controller 。 NAVC->MORE... 按钮，然后在“更多”下有一些额外的 VC。如果我转到“更多...”下的 VC，然后转到不在“更多...”上的 VC，那么当我返回到
c# - (更多)线程二叉树中旋转节点时的高效锁定
因此，我想出了这种方案，用于在多个线程同时具有读写访问权限的二叉树中旋转时锁定节点，这涉及每次旋转锁定四个节点，这似乎是一个很多吗？我想到了一种比我想出的方法更聪明的方法来减少所需的锁定，但谷歌并没有
css - 无法将我的下拉菜单与下拉按钮对齐(更多)
所以我已经尝试了所有方法，但我似乎仍然无法将下拉内容与 dropbtn 对齐。我只希望内容始终位于更多菜单下方。 HTML: `
linux - 期待和——更多——
我正在尝试使用 expect 来自动接受在 --more-- 中提示的 EULA。 #!/usr/bin/expect spawn "./greenplum-perfmon-web-4.1.2.0-b
javascript - 更多/更少的影响
他们如何在下面提供的网站上制作“告诉我更多”效果。我读过 read more/less effect in jQuery，但我发现该站点的有趣之处在于，除非单击该按钮，否则无法滚动页面。 Effect
scala - 更多 Scala 打字问题
现在，Kim Stebel helped me understanding如何使用存在类型键入变量，我需要知道如何在继承中使用它们: 以下代码无法编译: class PagingListModel(s
cygwin - Cygwin不提供“更多”命令吗？
在我的Cygwin中不可用。另一方面，提供了“ less”命令。也许Cygwin的制造商认为“更多”只是多余的。我对此很好奇。最佳答案安装util-linux软件包，您将获得“更多”的信息 ht
Azure:更多 DTU 还是更多分片？
基本上，我想知道是否有人有增加 DTU 与分片的经验。 DTU应该线性地提高性能。因此，如果您有 5 个 DTU，而您改为 10 个 DTU，那么(理论上)您应该获得大约两倍的性能。因此，四个 SQ
javascript - 更多 DOM 元素造成性能问题
我们使用 asp.net mvc、javascript 和 jQuery(托管在本地计算机上)创建了一个应用程序。基本设计是，当用户从一个页面导航到其他页面时，我们通过隐藏和显示 HTML 页面，将所
haskell - 更多 rmonad 库？
我想用 RMonad 做一些基本的事情。有没有办法使用“as monad”功能来有一个身份 rmonad，可以应用 monad 转换器吗？有诸如 StateT 变压器之类的常见东西吗？向现有 m
c - 如何检查数组的元素是否被占用？ +1 更多
我有一个 char*[] 数组。我需要能够为其分配字符串并再次删除它们，但我不知道: 如何检查一个元素中是否已经有一个字符串，这样我就不会覆盖它，如果它已经被占用，则继续处理下一个元素？之后如何将其
Azure:更多 DTU 还是更多分片？
基本上，我想知道是否有人有增加 DTU 与分片的经验。 DTU应该线性地提高性能。因此，如果您有 5 个 DTU，而您改为 10 个 DTU，那么(理论上)您应该获得大约两倍的性能。因此，四个 SQ
unix - 如何仅在错误输出时使用寻呼机(更多/更少)
我有一个程序可以同时吐出标准错误和标准输出，我想在标准错误上少运行寻呼机，但忽略标准输出。我该怎么做？更新: 就是这样......我不想丢失标准输出......只是让它远离寻呼机 program 2
jquery - 如何让段落的其余部分在“更多...”链接上设置动画？
基本上，当单击具有类 "dropdown" 的链接时，我无法获取“更多...”链接来对下一个跨度的高度进行动画处理。它根本就没有动画。仅当更改为 Less... 链接并且单击 Less... 链接以折
javascript - 更多 Javascript 状态图框架
我正在使用 ExtJS，并认为它是一个了不起的框架。但是，它们没有内置的状态图，这使得依赖于状态的应用程序开发非常痛苦。我最近发现了这个: https://github.com/jakesgordo
c - 更多 C 指针问题
我一直在研究数据结构和算法，遗憾的是在C中。我已经单独实现了一个双向链表，它保存整数并且工作正常，但是当节点(或pub)让它正常工作时我遇到了很多麻烦在本例中)保存多个不同类型的值。我可以创建一个列表
c# 使用声明-更多 = 好还是坏？
编辑拼写错误你好，这可能是一个愚蠢的问题，但如果它能帮助我遵循最佳实践，我不在乎:P 假设我想在 System.Data 命名空间...以及 System.Data.SqlClient 命名空间中
javascript - 单击时更改按钮文本(更多/更少)
使用 bootstrap 3 CSS、font awesome CSS 和最新的 jQuery JS 文件。我正在使用 javascript 在单击按钮时在另一个内容 div 之上隐藏/显示一个内容

首页

博学

6Ren·AI

商城

bash - 如何等待 wget 完成以获取更多资源

编辑: