gpt4 book ai didi

linux - 按同一行中引用的次数对文本中的单词进行排序

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:14:15 25 4
gpt4 key购买 nike

寻找文本中出现次数最多的单词,按每个数字在同一行打印的数字排序

    grep -oE '[[:alpha:]]' file.txt | sort | uniq -c | sort -nr

它给

3 linux
3 fedora
2 ubuntu
2 mandriva

我在寻找

3 linux fedora
2 ubuntu mandriva


grep -oE '[[:alpha:]]' file.txt | sort | uniq -c | sort -nr

结果

 3 linux
3 fedora
2 ubuntu
2 mandriva

我在找

 3 linux fedora
2 ubuntu mandriva

最佳答案

我无法在 bash oneliner 中完成此操作,但如果适合您,我会在简短的 python 脚本中提供它。

import os

preMergedList = os.popen("grep -o -E '\w+' file.txt | sort | uniq -c | sort -nr").readlines()

countDict = {}
for line in preMergedList:
count, word = line.split(None)
count = int( count.strip() )
word = word.strip()
if not countDict.has_key( count ):
countDict[count] = ""
countDict[count] += word + " "

for count, wordString in sorted( countDict.iteritems(), reverse=True ):
print count, wordString

关于linux - 按同一行中引用的次数对文本中的单词进行排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55642935/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com