gpt4 book ai didi

python - Nltk 的 wordnet lemmatizer 未对所有单词进行词形还原

转载 作者:行者123 更新时间:2023-12-01 02:44:18 24 4
gpt4 key购买 nike

我正在尝试对文本中的单词进行词形还原。例如“pickled”应该变成“pickle”,“ran”应该变成“run”,“raisins”应该变成“raisin”等等。

我正在使用 nltk 的 WordNet Lemmatizer,如下所示:

from nltk.stem import WordNetLemmatizer
>>>
>>> lem = WordNetLemmatizer()
>>> print(lem.lemmatize("cats"))
cat
>>> print(lem.lemmatize("pickled"))
pickled
>>> print(lem.lemmatize("ran"))
ran

因此,正如您在 'pickled''ran' 中看到的那样,输出并未按预期进行。如何获取这些内容的 'pickle''run',而不必为单词指定 'v'(动词)等。

最佳答案

您可以通过传递 'v''n' 参数并且不传递任何内容。

不是直接的方法,但您可以尝试以下代码来获取名词或动词的基本形式:

def most_common(lst):
return max(set(lst), key=lst.count)
words = ['ran','pickled','cats',"crying","died","raisins","had"]
for word in words:
checkList=[WordNetLemmatizer().lemmatize(word,'v'),WordNetLemmatizer().lemmatize(word,'n'),WordNetLemmatizer().lemmatize(word,'n')]
print most_common(checkList)

您将获得基本表单:

ran
pickled
cat
cry
died
raisin
had

关于python - Nltk 的 wordnet lemmatizer 未对所有单词进行词形还原,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45384311/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com