gpt4 book ai didi

python - 使用外部 csv 文件计算 Python 列中单词的频率

转载 作者:太空宇宙 更新时间:2023-11-04 00:57:26 25 4
gpt4 key购买 nike

user907629 之前曾问过这个问题, 和 Maria Zverina回答了问题,但她没有从外部 csv 文件导入数据。

我的文件包含超过 800000 条记录,我想导入一个外部 csv 文件。这个frequency count应该做哪些改动代码?

最佳答案

您可以在不存储任何中间列表的情况下执行此操作:

import csv
from collections import Counter
from itertools import imap
from operator import itemgetter

with open('yourcsv') as f:
next(f) # skip the header
cn = Counter(imap(itemgetter(2), csv.reader(f)))

for t in cn.iteritems():
print("{} appears {} times".format(*t))

除非您计划使用列表,否则没有理由将数据存储在列表中,itemgetter 将仅从每一行中提取第三列值。您需要传递要计算的任何列,并将分隔符设置为分隔数据的任何内容。

关于python - 使用外部 csv 文件计算 Python 列中单词的频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34463263/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com