gpt4 book ai didi

python - R 或 python 中的 Lemmatizer(am,are,is -> be?)

转载 作者:行者123 更新时间:2023-11-28 21:20:20 25 4
gpt4 key购买 nike

<分区>

我不是[计算]语言专家,所以请原谅我在这个话题上的愚蠢。

根据维基百科,词形还原定义为:

Lemmatisation (or lemmatization) in linguistics, is the process of grouping together the different inflected forms of a word so they can be analysed as a single item.

现在我的问题是,集合 {am, is, are} 的任何成员的词形还原版本都应该是“be”吗?如果不是,为什么不呢?

第二个问题:如何在 R 或 Python 中获取它?我试过类似 this 的方法链接,但没有一个给出"is"给出"is"。我想至少为了对文本文档进行分类,这是有道理的。

我也无法使用任何给定的演示来做到这一点 here .

我在做什么/假设错了什么?

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com