gpt4 book ai didi

Python 顶级二元组

转载 作者:行者123 更新时间:2023-12-01 04:52:22 25 4
gpt4 key购买 nike

import nltk
from nltk.collocations import *

tokens = ['a','b','c','d','b','c','a','b','c']
tokens2 = [['a','b','c','d'],['b','c','a','b','c']]
bigrams = nltk.bigrams(tokens)

fdist = nltk.FreqDist(bigrams)
for i,j in fdist.items():
print i,j``

print fdist.most_common(2)

上面的代码适用于像 token 这样的输入,但当我使用 tokens2 时它会抛出错误。最终,当给定一组标记时,我应该让它返回前 2 个二元组。非常感谢您的帮助。

最佳答案

如果您有 token 列表列表(例如 token2),

import collections
cnt = collections.Counter()

for toks in token2:
cnt.update(nltk.bigrams(toks))

print(cnt.most_common(2))

可以。如果您拥有的完全不同,例如像tokens这样的单个列表,或者您提到的set,一切都可能会改变 - 但我们无法读懂您的想法,所以您最好编辑您的 Q 来准确解释您的需求!

关于Python 顶级二元组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28145169/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com