gpt4 book ai didi

python - 按用法对单词排序

转载 作者:太空狗 更新时间:2023-10-30 02:05:55 26 4
gpt4 key购买 nike

我有一个英语单词列表(大约 10000 个),我想根据它们在文学、报纸、博客等中的用法对它们进行排序。我可以用 Python 或其他语言对它们进行排序吗?我听说过 NLTK,这是我所知道的可以提供帮助的最近的图书馆。或者这是其他工具的任务?

谢谢

最佳答案

Python 和 NLTK 是对单词列表进行排序的完美工具,因为 NLTK 带有一些英语语料库,您可以从中提取频率信息。

下面的代码将按照棕色语料库中词频的顺序打印给定的wordlist:

import nltk
from nltk.corpus import brown

wordlist = ["corpus","house","the","Peter","asdf"]
# collect frequency information from brown corpus, might take a few seconds
freqs = nltk.FreqDist([w.lower() for w in brown.words()])
# sort wordlist by word frequency
wordlist_sorted = sorted(wordlist, key=lambda x: freqs[x.lower()], reverse=True)
# print the sorted list
for w in wordlist_sorted:
print w

输出:

>>> 
the
house
Peter
corpus
asdf

如果您想使用不同的语料库或获取更多信息,您应该查看 chapter 2 of the nltk book .

关于python - 按用法对单词排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7764229/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com