gpt4 book ai didi

python - NLTK : what is the correct lemma for "boss"? 中的 WordNet 词形还原器

转载 作者:太空宇宙 更新时间:2023-11-03 11:26:47 25 4
gpt4 key购买 nike

我使用 nltk 3.0.4 并注意到单词 bossbosses 的词元不同。

from nltk.stem.wordnet import WordNetLemmatizer

wnl = WordNetLemmatizer()

print wnl.lemmatize("boss", "n")
# returns "bos"

print wnl.lemmatize("bosses", "n")
# returns "boss"

在我看来,这是一种奇怪的行为,尤其是 boss 是一个 known word在 WordNet 中有一个 rule保持ss

有没有人有解释或者这只是一个错误?我该如何处理?

最佳答案

  1. 检查 code 后(_morphy()) 为给定的单词生成可能的分析,我发现没有包含保持 ss 的规则。
  2. Bos也是wordnet中的一种基本形式。

替换规则:

MORPHOLOGICAL_SUBSTITUTIONS = {
NOUN: [('s', ''), ('ses', 's'), ('ves', 'f'), ('xes', 'x'),
('zes', 'z'), ('ches', 'ch'), ('shes', 'sh'),
('men', 'man'), ('ies', 'y')],
VERB: [('s', ''), ('ies', 'y'), ('es', 'e'), ('es', ''),
('ed', 'e'), ('ed', ''), ('ing', 'e'), ('ing', '')],
ADJ: [('er', ''), ('est', ''), ('er', 'e'), ('est', 'e')],
ADV: []}

调用 print wnl.lemmatize("boss", "n"):

由于在应用替换规则时可以找到合适的基本形式(Bos),因此将其返回。如果这没有包含在 wordnet 中,boss 的引理将是 boss,因为找不到更短的形式。

关于python - NLTK : what is the correct lemma for "boss"? 中的 WordNet 词形还原器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32123188/

25 4 0
文章推荐: php - SQL记录检索
文章推荐: c# - 重绘图像 WPF
文章推荐: Android忽略滚动条大小
文章推荐: c# - 动态添加 DropDownList
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com