gpt4 book ai didi

bash - 匹配单词列表中的单词并计算出现次数

转载 作者:行者123 更新时间:2023-11-29 09:09:08 26 4
gpt4 key购买 nike

所以我有一个普通的文本文件,里面有一些文字,它实际上是随机排列的,但我也有一个单词列表,我想将它与之进行比较,并计算出现在文本文件中的每个单词的出现次数单词表。

例如我的单词列表可以由以下组成:

good
bad
cupid
banana
apple

然后我想将这些单独的单词中的每一个与我的文本文件进行比较,它可能是这样的:

有时我会去好的地方旅行,而不会去坏的地方旅行。例如,我想去天堂看看吃苹果的丘比特。也许我会看到神话中的生物吃其他水果,如苹果、香蕉和其他好水果。

我希望我的输出生成所列单词每次出现的次数。我有办法做到这一点是 awkfor-loop 但我真的希望避免 for-loop 因为它会永远因为我的真实单词列表大约有 10000 个单词。

所以在这种情况下,我的输出应该是(我认为)9,因为它计算了该列表中某个单词的总出现次数。

顺便说一句,该段落完全是随机的。

最佳答案

对于中小型文本,您可以结合使用 grepwc:

cat <<EOF > word.list
good
bad
cupid
banana
apple
EOF

cat <<EOF > input.txt
Sometimes I travel to the good places that are good, and never the bad places that are bad. For example I want to visit the heavens and meet a cupid eating an apple. Perhaps I will see mythological creatures eating other fruits like apples, bananas, and other good fruits.
EOF

while read search ; do
echo "$search: $(grep -o $search input.txt | wc -l)"
done < word.list | awk '{total += $2; print}END{printf "total: %s\n", total}'

输出:

good: 3
bad: 2
cupid: 1
banan: 1
apple: 2
total: 9

关于bash - 匹配单词列表中的单词并计算出现次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20445379/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com