gpt4 book ai didi

linux - 使用 uniq 比较 2 个字典

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:49:42 26 4
gpt4 key购买 nike

所以我有两个词典要比较(美式英语和英式英语)。

我如何使用 uniq 命令来计算 (-c) 美式英语或英式英语中有多少个单词?

另外,我如何计算一个词典中出现在不同词典中的单词出现次数?

只是想了解 uniq 如何在更复杂的层面上工作。感谢您的帮助!

最佳答案

代替 uniq,为此使用 comm 命令。它会找到两个文件之间共有的行,或者一个文件或另一个文件所独有的行。

这计算了一个字典中的所有单词,但不是两个

comm -3 american british | wc -l

这计算了两个词典中的单词:

comm -12 american british | wc -l

默认情况下,comm 在第 1 列中显示仅在第一个文件中的行,在第 2 列中显示仅在第二个文件中的行,在第 3 列中显示两个文件中的行. 然后您可以使用 -[123] 选项告诉它省略指定的列。所以 -3 只显示第 1 列和第 2 列(每个文件中的唯一词),而 -12 只显示第 3 列(常用词)。

它要求对文件进行排序,我假设您的字典文件就是这样。

您也可以使用 unique 来做到这一点。它有选项 -u 只显示出现一次的行,-d 只显示重复的行。

sort american british | uniq -u | wc -l # words in just one language
sort american british | uniq -d | wc -l # words in both languages

关于linux - 使用 uniq 比较 2 个字典,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35355232/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com