python - NLTK WordNet 词形还原器 : Shouldn't it lemmatize all inflections of a word?-6ren

python - NLTK WordNet 词形还原器 : Shouldn't it lemmatize all inflections of a word?

转载作者：太空宇宙更新时间：2023-11-03 20:41:34

27

4

我将 NLTK WordNet Lemmatizer 用于词性标记项目，首先将训练语料库中的每个单词修改为其词干(就地修改)，然后仅在新语料库上进行训练。但是，我发现词形还原器没有按我的预期运行。

例如，单词 loves词形还原为 love这是正确的，但是这个词loving仍然loving即使在词形还原之后。这里loving就像“我很喜欢它”这句话一样。

不是 love变形词的词干 loving ？同样，许多其他“ing”形式在词形还原后仍保持原样。这是正确的行为吗？

还有哪些其他准确的词形还原器？ (不需要在 NLTK 中)是否有形态分析器或词形还原器在决定词干时也考虑单词的词性标记？例如，单词 killing应该有kill作为词干 if killing用作动词，但应该有 killing如果用作名词，则作为词干(如 the killing was done by xyz )。

最佳答案

WordNet 词形还原器确实考虑了 POS 标记，但它并没有神奇地确定它:

>>> nltk.stem.WordNetLemmatizer().lemmatize('loving')
'loving'
>>> nltk.stem.WordNetLemmatizer().lemmatize('loving', 'v')
u'love'

如果没有 POS 标签，它会假设您提供的所有内容都是名词。所以在这里它认为你正在向它传递名词“love”(如“sweetlove”)。

关于python - NLTK WordNet 词形还原器 : Shouldn't it lemmatize all inflections of a word?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56833835/

27

4

0

文章推荐： php - 伪造文件扩展名

文章推荐： python - 如何从模板中的 ModelAdmin 访问函数？

wordnet - WOLF(Wordnet Libre du Français，免费法语 Wordnet)规范
我正在尝试为 WOLF(Wordnet Libre du Français，免费法语 Wordnet)创建一个界面。目标是为阿拉伯语 Wordnet (http://www.talp.upc.edu/
wordnet - WordNet 3.1 和 WordNet 3.0 synsetId 之间是否存在映射？
我正在尝试将 Wordnet 3.0 同义词集映射到 Wordnet 3.1例如:purl.org/vocabularies/princeton/wn30/synset-embrace-verb-2
wordnet - 我如何开始为土耳其语构建 wordnet 以用于情感分析
虽然我拥有 EE 背景，但我没有机会参加自然语言处理类(class)。我想为土耳其语构建情感分析工具。我认为最好创建一个土耳其语 wordnet 数据库，而不是将文本翻译成英语，然后使用提供的工具用
wordnet - 有关 WordNet 数据文件格式的帮助
我对 WordNet 数据文件格式有疑问。 wndb(5) 手册页部分内容如下: The source/target field distinguishes lexical and semantic
wordnet - 基于 WordNet 相似度的最高分
一些相似度得分介于 0 和 1 之间，例如最短路径和 WuP。因此汽车与汽车之间的相似度将为 1，但 LCh 等其他度量将为 lch( car, automobile ) = 3.6889 我想知道这
wordnet - 将 wordnet 映射到其他本体
是否有可用于 wordnet 3.0 同义词集到其他本体的映射，如 Cyc , YAGO和 EuroWordNet喜欢SUMO ？最佳答案 Yago 是 linked to Wordnet , 以及
wordnet - 在 Mac 上安装 WordNet
我正在尝试在 OSX 10.8 的 Mac 上安装 Wordnet 3.0。我已经配置好了，但是当我尝试 make 时，我收到一堆错误... ..... /usr/include/tkDecls.
nlp - WordNet 词典编纂器文件究竟是什么？了解 WordNet 的工作原理
想了解WordNet的文件格式，主要文档是WNDB和 WNINPUT .正如我在 WNDB 中所了解的，有名为 index.something 的文件和 data.something ，这里somet
java - 如何使用 WordNet 或与 wordnet 相关的实现基于类别的文本标记？
如何使用 wordnet 按单词类别标记文本(java 作为接口(interface))？示例考虑以下句子: 1) 计算机需要键盘、显示器、CPU 才能工作。 2)汽车使用齿轮和离合器。现在我的
java - 将 WordNet Affect 与 WordNet 集成
我在java中使用wordnet，使用一些已知的api(JAWS、JWNL)。我想使用相同类型的 API 在 Wordnet Affect (WNA) 中进行搜索，但 Internet 上没有关于 W
java - 如何将 "WordNet Domains"集成到 WordNet 数据库中？
我正在使用 WordNet 2.1 工具并通过 JAWSpro-grammatically 访问它(Java用于 WordNet 搜索的 API)。今天我遇到了一个名为 WordNet 域的新事
Wordnet Morphmaps : Why does WordNet 3. 0 的 morphmap 数量有限
我一直在分析 WordNet 3.0 MySql 数据库文件，我从以下位置下载了这些文件: http://www.princeton.edu/wordnet/download/current-vers
python - 注意使用 NLTK 和 Wordnet 进行程序不起作用，错误消息显示这是因为 wordnet
我正在尝试用 python 编写一个程序，它将记录我输入的段落。它将对该段落的第一句和最后一句以及带有日期和数字的句子进行排序。然后它会用同义词替换一些单词，并去掉无用的形容词。我知道 python
javascript - wordnet.lookup 是异步函数吗？尝试使用 wordnet 和 natural 为句子中的每个单词构建同义词数组
因此，我第一次尝试使用 wordnet 为我正在开发的基于小型文本的冒险游戏项目构建文本识别脚本。现在，我有这段代码来尝试构建一个对象，该对象由每个单词作为键以及该单词的每个同义词作为附加到该键的数组
php - 从 php 调用 wordnet(Wordnet 类或 PHP 的 API)
我正在尝试编写一个程序来查找两个文档之间的相似性，并且由于我只使用英语，所以我决定使用 wordnet，但是我找不到将 wordnet 与 php 链接的方法，我找不到任何 wordnet api P
java - 如何从 Android 调用 WordNet？ [适用于 Android 的 Wordnet API]
我用了rita使用 Java 框架 WordNet .它工作正常，但我如何在 android 中使用它？是否有任何框架/API 可以从 android 访问 WordNet？ JAWS 要求安装 Wo
java - 如何在任何 Java WordNet 接口(interface)中访问 WordNet 中的 "frequency count"
我一直在寻找一些 Java 库，它可以提供有关同义词集“频率计数”的信息。我检查了 JWNL 和 JWI，他们不提供此类信息。有人知道其他 Java WordNet API 吗？最佳答案我相信这也
python - 我有一个印地文 wordnet 数据库和 API。我想从 NLTK python 访问这个 wordnet。有没有办法将我们自己的wordnet添加到NLTK中？
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为
java - 麻省理工学院 Java WordNet 接口(interface) : Getting WordNet lexicographer classes or super-senses
我有一个项目，我需要获得一个单词的词汇含义。我正在考虑使用 WordNet，因为它有自己的词典编纂者类，也称为超感官。我刚刚下载了 MIT JWI 并试图查看这个 JWI 是否支持它。该手册没有说明返
wordnet - 给定单词相似性推断句子相似性
假设我有两个句子中每对单词的单词相似度分数，根据这些分数确定整体句子相似度的合适方法是什么？单词分数是使用代表每个单词的向量的余弦相似度计算的。既然我有了单词得分，那么把单词得分加起来除以两个句子

首页

博学

6Ren·AI

商城

python - NLTK WordNet 词形还原器 : Shouldn't it lemmatize all inflections of a word?