bash - Shell 命令对文件中相似文本行的数字求和-6ren

bash - Shell 命令对文件中相似文本行的数字求和

转载作者：行者123 更新时间：2023-12-02 00:16:11

32

4

我有一个包含数千行的文件，每行包含一个数字后跟一行文本。我想将文本相似的行的数字相加。我也希望输出独特的线条。

例如:

25 cup of coffee
75 sign on the dotted
28 take a test
2 take a test
12 cup of coffee

输出将是:

37 cup of coffee
75 sign on the dotted
30 take a test

关于如何在 unix shell 中实现这一点有什么建议吗？

我看了Shell command to sum integers, one per line?但这是关于汇总文件中所有行的一列数字，而不仅仅是相似的文本行。

最佳答案

不需要多个进程和管道。 awk一个人就足以处理整个工作(并且在大文件上会快几个数量级)。与 awk只需附加每个字段 2-NF作为字符串并将其用作索引以对数组中字段 1 中的数字求和。然后在END部分，简单地输出数组的内容，例如假设您的数据存储在 file 中，你可以这样做:

awk '{
    for (i=2; i<=NF; i++)
        str = str " " $i
    a[str] += $1
    str=""
}
END {
    for (i in a) print a[i], i
}' file

以上，第一个for循环简单地附加来自 2-NF 的所有字段在str , a[str] += $1将字段 1 中的值求和到数组 a使用 str作为索引。这确保了相似行的值相加。在END部分，您只需遍历数组的每个元素，输出元素值(总和)，然后是索引(字段 str 的原始 2-NF)。

示例使用/输出

只需选择上面的内容，选择它，然后用鼠标中键将其粘贴到您的 file 所在目录的命令行中。位于(将 file 的名称更改为您的数据文件名)

$ awk '{
>     for (i=2; i<=NF; i++)
>         str = str " " $i
>     a[str] += $1
>     str=""
> }
> END {
>     for (i in a) print a[i], i
> }' file
30  take a test
37  cup of coffee
75  sign on the dotted

如果您希望行以不同的顺序排序，只需添加 | sort [options]在文件名之后将输出通过管道传输到 sort .例如，对于按您显示的顺序输出，您将使用 | sort -k 2输出将是:

37  cup of coffee
75  sign on the dotted
30  take a test

保留字符串的原始顺序

根据您关于如何保留在输入文件中看到的文本行的原始顺序的评论，您可以保留第二个数组，其中字符串按照使用顺序索引的顺序存储在其中命令。例如 o下面使用数组(顺序数组)来存储唯一字符串(字段 2-NF )和变量 n用作计数器。数组上的循环用于检查字符串是否已包含，如果包含，next用于避免存储字符串并跳转到输入的下一条记录。在 END然后循环使用 for (i = 0; i < n; i++)以字符串在原始文件中出现的顺序从两个数组中输出信息的形式，例如

awk -v n=0 '{
    for (i=2; i<=NF; i++)
        str = str " " $i
    a[str] += $1
    for (i = 0; i < n; i++)
        if (o[i] == str) {
            str=""
            next;
        }
    o[n++] = str;
    str=""
}
END {
    for (i = 0; i < n; i++) print a[o[i]], o[i]
}' file

输出

37  cup of coffee
75  sign on the dotted
30  take a test

关于bash - Shell 命令对文件中相似文本行的数字求和，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56884654/

32

4

0

文章推荐： android-ndk - 在 native android 项目中包含 openssl 库

文章推荐： json - 使用jq添加JSON对象时如何防止转义？

文章推荐： Mapbox - 完全禁用聚类

文章推荐： csv - pyspark:spark.read.format ("csv") 与 spark.read.csv 的差异性能

shell - 从子 shell 退出 shell
我相信我在子 shell 中调用 exit 会导致我的程序继续: #!/bin/bash grep str file | while read line do exit 0 done
shell - 从子 shell 退出 shell
我相信我在子 shell 中调用 exit 会导致我的程序继续: #!/bin/bash grep str file | while read line do exit 0 done
shell - 将变量从一个 shell 脚本导出到另一个 shell 脚本
我有几个脚本，它们的第一部分看起来是一样的。这部分的功能是识别脚本在哪台机器上运行并相应地设置几个变量。它看起来像这样: ENV=`echo $LOGNAME | cut -c1-8` if
shell - 从一个 Shell 脚本运行多个 Shell 脚本
这是我正在尝试做的事情。我有 4 个 shell 脚本。脚本 1 需要先运行，然后是 2，然后是 3，然后是 4，并且它们必须按此顺序运行。脚本 1 需要运行(并在后台等待)2 才能正常运行，但是脚本
shell - 捕获从另一个 shell 脚本调用的 shell 脚本的输出
我有一个名为 a.sh 的脚本，其中的内容是: //a.sh: #!/bin/bash temp=0 while [ "$temp" -ne 500 ] do echo `date`
shell - 使用 shell() 执行多个 shell 命令的推荐方法
在snakemake中，使用shell()函数执行多个命令的推荐方式是什么？最佳答案您可以调用shell()多次内run规则块(规则可以指定 run: 而不是 shell: ): rule pro
shell - 将一个 shell 脚本的所有参数传递给另一个 shell 脚本
我有一个 shell 脚本，我向其中传递了一些参数。Test1.sh -a 1 -b 2 -c“一二三” 在 Test1.sh 中，我按以下方式调用另一个 shell 脚本。Test2.sh $* 我
shell - 我可以从另一个 shell 脚本调用一个 shell 脚本的函数吗？
我有 2 个 shell 脚本。第二个shell脚本包含以下函数第二个.sh func1 func2 first.sh 将使用一些参数调用第二个 shell 脚本，将使用特定于该函数的一些其他参数
shell - 从子 shell 运行 shell 命令
我有一个 Unix shell 脚本 test.sh。在脚本中，我想调用另一个 shell，然后从子 shell 执行 shell 脚本中的其余命令并退出说清楚: test.sh #! /bin/b
shell - 在 shell 脚本中更改父 shell 的路径变量
我想在 shell 脚本中更改路径环境变量。路径变量需要在shell脚本执行后修改。最佳答案我知道有两种方法可以做到这一点。第一种是在当前 shell 的上下文中运行脚本: . myscript.
shell - 管道是否保证在任何 POSIX shell 中创建子 shell？
此 shell 脚本按预期运行。 trap 'echo exit' EXIT foo() { exit } echo begin foo echo end 这是输出。 $ sh foo.sh
shell - vim shell 键映射以执行 shell 命令
我正在使用 vimshell在 vim 中执行命令 nnoremap vs :VimShellPop 使用此键映射，我可以打开 vim shell 并执行诸如“捆绑安装”之类的命令，然后输入 exi
linux - shell 内的 shell 脚本 shell
我想连接到不同的 shell(csh、ksh 等)并在每个切换的 shell 中执行命令。下面是反射(reflect)我的意图的示例程序: #!/bin/bash echo $SHELL csh e
shell - shell 运算符的优先级
我目前正在尝试使用 BNF 和 LL 解析器在 C 中重新编写 shell。否则，我需要知道 shell 运算符的优先级是什么| , > , > , & , ; ? 有没有人可以提供给我？谢谢最
shell - 如何使用脚本暂停后台 shell？
不幸的是，我没有suspend 命令(busybox/ash)。但是我可以使用 kill -STOP $$ 从后台 shell (sh &) 返回到父 shell(以及 fg 之后)。但是我不想输入
shell - SWT - 可靠地知道 shell 用户是否切换到另一个 shell 的事件
我需要知道，当用户切换到另一个 shell 时，通过单击它。我试过 shellListener.shellDeactivated()但是当 shell 失去对它自己的控件的焦点时，会触发此事件，这意
shell - (shell) 如何从一个文件中删除可以在另一个文件中找到的字符串？
file1.txt aaaa bbbb cccc dddd eeee file2.txt DDDD cccc aaaa 结果 bbbb eeee 如果能不区分大小写就更好了! 谢谢! 最佳答案 gre
shell - shell 循环可以解压缩目录中的所有文件吗？
我见过解压缩目录中所有 zip 文件的循环。但是，在运行此之前，我宁愿确保我将要运行的内容正常工作: for i in dir; do cd $i; unzip '*.zip'; rm -rf *.z
shell - shell 文本编辑器如何工作？
我对编程还很陌生，但我想知道 vim、emacs、nano 等 shell 文本编辑器如何能够控制命令行窗口。我主要是一名 Windows 程序员，所以可能在 *nix 上有所不同。据我所知，只能将文
shell - 比较文本文件中的日期| shell
我有一个包含第 7 列日期的文件，我的要求是将它与今天的日期进行比较，如果小于它，则删除该完整行。此外，如果第 7 列中提到的任何日期超过 15 天，则将其修改为最多 15 天下面的例子- now

首页

博学

6Ren·AI

商城

bash - Shell 命令对文件中相似文本行的数字求和