gpt4 book ai didi

nlp - 形态 :Tool to get the root word and suffix for a given english word

转载 作者:行者123 更新时间:2023-12-01 12:39:51 28 4
gpt4 key购买 nike

我正在尝试在 POS 标记中进行变形分析。

当我们通过传递一个英语单词作为参数来调用它时,是否有任何工具(我可以从 python 或 java 脚本中调用)返回 Root 形式及其后缀。

例如:

如果我给出 input:'liked' ,我想得到 output:like,ed

为了获得给定英语单词的词根形式,我尝试使用 porter stemmer 和 snowball stemmer(在 python 脚本中),但它并不总是给出有效的词根,因为它只是去掉了后缀。

from nltk.stem.porter import *
porter_stemmer = PorterStemmer()
print(porter_stemmer.stem("ladies"))
print(porter_stemmer.stem("went"))

输出

ladi   
went

例如:我以“女士们”的身份输入但它以词根形式返回 'ladi',它甚至不是英文单词。

有时词干提取器只按原样返回输入词。例如,我输入“went”,这些词干提取器以根形式返回“went”而不是“go”。

请建议我可以使用哪个工具来获取词根形式和后缀。

最佳答案

from nltk.stem.wordnet import WordNetLemmatizer
WNL = WordNetLemmatizer()
WNL.lemmatize('ladies')
WNL.lemmatize('went')

(我想在这里找点别的东西说,但我认为代码是不言自明的?)

关于nlp - 形态 :Tool to get the root word and suffix for a given english word,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25898179/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com