gpt4 book ai didi

python - Python中的词频分析返回字母频率

转载 作者:行者123 更新时间:2023-11-30 23:25:48 25 4
gpt4 key购买 nike

按照其他 Stackoverflow 帖子中与 Python 中的词频分析相关的示例,我的程序返回字母频率分析,而不是实际的单词。

我目前正在从文本文件中读取我的语料库,如下面的代码所示。

from collections import Counter
def word_frequency_counter():
contents = ""

with open("file.txt") as f:
contents += str(f.readlines())

commonWords = Counter(contents)#= Counter(str(contents.lower())).most_common()

print "The top three words are: ", str(commonWords.most_common(3))

输出是这样的:

The top three words are:  [(' ', 1126), ("'", 538), ('n', 528)]

我想要的输出是实际的单词,同时还有一组被忽略的单词,例如空格字符和引号。

最佳答案

Counter(contents.split())

应该使用文字......

关于python - Python中的词频分析返回字母频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22797721/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com