gpt4 book ai didi

Python 求和文件中的频率

转载 作者:太空狗 更新时间:2023-10-30 02:49:54 24 4
gpt4 key购买 nike

我有一个大文件 (950MB),其中包含如下单词和频率,每行一个:

word1 54

词2 1

word3 12

word4 3

word1 99

word4 147

word1 4

word2 6

等...

我需要对单词的频率求和,例如 word1 = 54 + 99 + 4 = 157,并将其输出到列表/文件。在 Python 中执行此操作的最有效方法是什么?

我试图做的是创建一个列表,每一行都是这个列表中的一个元组,从那里总结,这让我的笔记本电脑崩溃了......

最佳答案

下一步试试:

from collections import defaultdict

d = defaultdict(int)

with open('file') as fh:
for line in fh:
word, count = line.split()
d[word] += count

关于Python 求和文件中的频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5921832/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com