bash - 如何向 GNU Parallel 提供大量命令？-6ren

bash - 如何向 GNU Parallel 提供大量命令？

转载作者：行者123 更新时间：2023-11-29 08:55:14

25

4

我正在评估是否 GNU Parallel可用于并行搜索存储在系统上的文件。系统上一年中的每一天 (doy) 只能有一个文件(因此每年最多 366 个文件)。假设系统上有 3660 个文件(大约 10 年的数据值(value))。该系统可以是多 CPU 多核 Linux 或多 CPU Solaris。

我将要在文件上运行的搜索命令存储在一个数组中(每个文件一个命令)。这就是我现在正在做的事情(使用 bash)，但我无法控制要并行开始多少次搜索(绝对不想一次开始所有 3660 次搜索):

#!/usr/bin/env bash
declare -a cmds
declare -i cmd_ctr=0

while [[ <condition> ]]; do
    if [[ -s $cur_archive_path/log.${doy_ctr} ]]; then
      cmds[$cmd_ctr]="<cmd_to_run>"
      let cmd_ctr++
    fi
done

declare -i arr_len=${#cmds[@]}
for (( i=0; i<${arr_len}; i++ ));
do
  # Get the command and run it in background
  eval ${cmds[$i]} &
done
wait

如果我使用 parallel (它会自动计算出最大 CPU 数/核心数，并仅并行启动这么多搜索)，我怎样才能并行重用数组 cmds 并重写上面的代码？另一种方法是将所有命令写入一个文件，然后执行 cat cmd_file |并行

最佳答案

https://www.gnu.org/software/parallel/man.html#EXAMPLE:-Using-shell-variables说:

parallel echo ::: "${V[@]}"

你不想要 echo ，所以:

parallel ::: "${cmds[@]}"

如果您不需要 $cmds 做任何其他事情，那么使用“sem”(它是并行 --semaphore 的别名)https://www.gnu.org/software/parallel/man.html#EXAMPLE:-Working-as-mutex-and-counting-semaphore

while [[ <condition> ]]; do
  if [[ -s $cur_archive_path/log.${doy_ctr} ]]; then
    sem -j+0 <cmd_to_run>
  fi
done
sem --wait

您没有描述可能是什么。如果您只是简单地做一个类似于 for 循环的事情，您可以将整个脚本替换为:

parallel 'if [ -s {} ] ; then cmd_to_run {}; fi' ::: $cur_archive_path/log.{1..3660}

(基于 https://www.gnu.org/software/parallel/man.html#EXAMPLE:-Composed-commands )。

关于bash - 如何向 GNU Parallel 提供大量命令？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16426845/

25

4

0

文章推荐： command-line - 找不到 NGINX brew install 命令

文章推荐： java - 如何在 Eclipse 上打补丁？

文章推荐： MySql存储过程SET命令——当它出错时

文章推荐： java - Apache Wink 连接到 https 资源

gnu - GNU Parallel中的基本名称
我有数百个文件，命名如下: RG1-t.txt RG1-n.txt RG2-t.txt RG2-n.txt 等等... 我想使用GNU并行在它们上运行脚本，但是我很难获得文件的基本名称，因此RG1，R
gnu-parallel - GNU 并行参数
从例子 seq 1 100 | parallel -I @@ \ > 'mkdir top-@@;seq 1 100 | parallel -X mkdir top-@@/sub-{} 怎么办-X ,
gnu-make - GNU 制作备忘单
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
gnu-make - GNU 做出奇怪的行为
我有一个简单的 Makefile: VAR := aaa include a.inc VAR += bbb 和a.inc some_target: $(VAR) @echo "refe
gnu-smalltalk - GNU Smalltalk 图像保存状态
按照指南制作新类(class)。我可以使用 gst 命令制作新的或加载图像文件 (.im)。我输入代码来创建一个 Account 类，然后可以创建一个新类。问题如何在关闭 gst 窗口之前将类保存到
gnu-screen - 使用现有的运行程序启动 gnu screen
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 10年前关闭。 Improve this
gnu-screen - GNU Screen 终端线路设置
我想使用 GNU screen 来监视这样的串行 USB 端口: $ screen /dev/ttyUSB0 115200 但我需要调整一些终端线路设置。我已经进行了几次尝试，但似乎都没有奏效。例如，
gnu-sort - gnu sort - 默认缓冲区大小
我已阅读全文 documentation对于 gnu 排序和在线搜索，但我找不到 --buffer-size 选项的默认值是什么(它决定了程序在运行时使用多少系统内存)。我猜它是根据系统总内存以某种方
gnu-parallel - 如何在 GNU 并行中打印失败作业的标准输出和标准错误？
我正在使用 parallel --keep-order --line-buffer --halt 2 在一堆命令上并行调用 GNU .每隔一段时间，其中一个命令就会失败，并且 GNU 并行打印: p
gnu-make - gnu make 将许多文件复制到一个位置
这个问题与问题 2543127 的精神相似。 . 我有一个带有头文件列表的 gnu makefile。每个头文件可能位于不同的目录中，例如， HEADERS = $(wildcard *.h) $(w
gnu-make - GNU make 先决条件执行顺序
假设我有以下 GNU make 目标: create_dir: @mkdir objects build_asm: $(ASM_FILES) @echo
gnu - 如何让 GNU Screen 在当前工作目录中启动一个新窗口？
默认情况下，当您在 GNU Screen 中创建新窗口时，它将在调用 Screen 的目录中启动。我想在当前所在窗口的当前工作目录的 GNU Screen 中启动一个新窗口。我该怎么做？最佳答案查
gnu-parallel - GNU Parallel - 多个命令
我想在几个输入上运行几个长时间运行的进程。例如。: solver_a problem_1 solver_b problem_1 ... solver_b problem_18 solver_c pro
gnu-screen - 什么是 GNU screen ？
很难说出这里问的是什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或言辞激烈，无法以目前的形式合理回答。如需帮助澄清此问题以便可以重新打开，visit the help center . 8年前关闭
gnu-parallel - 有没有办法使用 GNU 并行多次运行一个作业？
我可以看到在多个输入上运行并行作业是多么容易，但是有没有其他方法可以通过将命令放入文件并重复多次来并行运行同一作业多次？ parallel -j+0 ::: './dosomejob.sh' 但是告诉
gnu-screen - GNU screen 实际上是如何工作的
所以我一直在尝试寻找一些关于 GNU screen 实际上如何在 high 下工作的信息，而不必真正阅读源代码，但我一直无法这样做。 screen 做了什么，即使在终端 session 关闭时它也能保
gnu - x86-64 GNU 程序集
在调查崩溃时，我遇到了以下代码片段并立即意识到 mov 指令实际上应该是 movq 以获得正确的 64 位寄存器操作。 #elif defined(__x86_64__) unsigned l
c - GNU 代码风格的 GNU 缩进问题
我安装了 indent使用 brew感谢命令 brew install gnu-indent所以现在我有 gnu-indent-2.2.10到目前为止安装在我的 MacOS X 上，非常好。我的问题是
gnu-make - 为什么 gnu make 删除这个文件？
考虑这个Makefile: .PHONY: all all: main.txt main.txt: build/main.txt cp build/main.txt . %/main.txt:
gnu-make - 使用 gnu make 中的一个命令从多个文件制作多个文件
假设目录输入中有 1000 个扩展名为 .xhtml 的文件，并且这些文件的某个子集(输出路径在 $(FILES) 中)需要通过 xslt 转换为目录输出中具有相同名称的文件.一个简单的 make 规

首页

博学

6Ren·AI

商城

bash - 如何向 GNU Parallel 提供大量命令？