gpt4 book ai didi

python - 获取句子列表的词频,但不组合。 (Python)

转载 作者:太空宇宙 更新时间:2023-11-04 00:29:07 24 4
gpt4 key购买 nike

def getWordFreq(corpus):

wordFreq = []
for sent in corpus:
for word in sent:
wordFreq.append((word, sent.count(word)))
return wordFreq

编写此函数以获取语料库中每个单词的频率。

为了测试它,我写了

cc = [ ['hi','ho'], ['hee','ho']]
getWordFreq(cc)

但这又回来了

[('hi', 1), ('ho', 1), ('hee', 1), ('ho', 1)]

而不是 ('ho', 2)。

我错过了什么?

最佳答案

希望这个最简单的方法对您有所帮助。这里我们使用 for

Try this code snippet here

def getWordFreq(corpus):
result = {}
for data in corpus:
for word in data:
if word in result:
result[word] += 1 #adding result in the dictionary
else:
result[word] = 1

return result.items() #returning items

cc = [['hi', 'ho'], ['hee', 'ho']]
print(getWordFreq(cc))

输出: [('hee', 1), ('hi', 1), ('ho', 2)]

关于python - 获取句子列表的词频,但不组合。 (Python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46440434/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com