python - 从词干词中获取最接近的名词-6ren

python - 从词干词中获取最接近的名词

转载作者：行者123 更新时间：2023-12-01 05:42:46

简短版本:
如果我有一个词干词:
说“计算”表示“计算”，或者说“糖”表示“糖”
有没有办法构造它最接近的名词形式？
分别是“计算机”或“糖”

<小时/>

更长的版本:
我正在使用 python 和 NLTK、Wordnet 对一堆单词执行一些语义相似性任务。
我注意到大多数 sem-sim 分数仅适用于名词，而形容词和动词则没有给出任何结果。
了解所涉及的不准确之处后，我想将单词从动词/形容词形式转换为名词形式，这样我就可以估计它们的相似性(而不是通常与形容词一起返回的“NONE”)。

我认为做到这一点的一种方法是使用词干分析器来获取词根，然后尝试构建该词根最接近的名词形式。
George-Bogdan Ivanov 的算法来自 here效果很好。我想尝试其他方法。有没有更好的方法将单词从形容词/动词形式转换为名词形式？

最佳答案

您可能想看看这个示例:

>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> WordNetLemmatizer().lemmatize('having','v')
'have'

(来自 this SO answer )看看它是否将您引向正确的方向。

关于python - 从词干词中获取最接近的名词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17083442/

文章推荐： javascript - 如何使 selectize.js 选择框需要一个值？

文章推荐： java - 使用 .net 和 java 中的 jUddi v3

文章推荐： python - 如何构建我的 Python 包？

java - 检查java中的单词变体(词干)
我想搜索一个单词及其在句子中的变体。例如，单词“happy”的变体是“happiest”、“happier”。有java库支持吗？最佳答案您可以使用Porter stemming algorith
python - 如何使用 NLTK 词干
愚蠢的，但我无法访问 NLTK 中的主干函数。我打电话 import nltk nltk.stem.porter.step1ab() 但我被告知该对象没有 step1ab 属性。我想我以某种方式没有
python - 在 pandas 列/索引上应用 NLTK 词干
我想将 DataFrame 的列和索引限制为这样的内容 ps = PorterStemmer() df_dic = pd.read_csv('inquirerbasic_clean.csv', sep
Python 词干+请求 : Not switching circut/changing IP address when using a session
查看以下脚本tortest.py，它反复切换TOR电路并检查IP地址是否已更改: #!/usr/bin/env python2.7 # -*- coding: utf-8 -*- import jso

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 从词干词中获取最接近的名词