gpt4 book ai didi

python - 如何在 NLTK 中实现按 fileids 排序的类型标记比字典?

转载 作者:行者123 更新时间:2023-11-28 17:38:07 26 4
gpt4 key购买 nike

所以我正在编写一个程序,它将帮助我找到所有总统就职演说的类型与标记的比率,并将其保存在字典 ttr 中。但是为了比较,我需要最后创建的字典按年份顺序排列,这样我就可以用它来绘制图表,找出词汇丰富度是增加还是减少,我该怎么做? for pres in president 部分似乎弄乱了 fileids 的顺序。

from nltk.corpus import inaugural 

ttr = {}
president = inaugural.fileids()

for pres in president:
tokens = inaugural.words(pres)
numtokens = len(tokens)
types = sorted(set(tokens))
numtypes = len(types)
ttr[pres] = float(numtypes)/numtokens

print ttr

最佳答案

我不完全理解你的问题,但是:

I need the dictionary created at the end to go in the order of the year,

字典没有顺序。它们代表一对带有键的值。但是,您可以控制处理条目的顺序。例如:

d = { ... }
for key, value in sorted(d.items()):
print (key, value)

这里我使用函数sorted()对字典的条目进行排序并按顺序处理它们。

关于python - 如何在 NLTK 中实现按 fileids 排序的类型标记比字典?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28375453/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com