- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
简短版本:
如果我有一个词干词:说“计算”表示“计算”,或者说“糖”表示“糖”
有没有办法构造它最接近的名词形式?分别是“计算机”或“糖”
更长的版本:
我正在使用 python 和 NLTK、Wordnet 对一堆单词执行一些语义相似性任务。
我注意到大多数 sem-sim 分数仅适用于名词,而形容词和动词则没有给出任何结果。
了解所涉及的不准确之处后,我想将单词从动词/形容词形式转换为名词形式,这样我就可以估计它们的相似性(而不是通常与形容词一起返回的“NONE”)。
我认为做到这一点的一种方法是使用词干分析器来获取词根,然后尝试构建该词根最接近的名词形式。
George-Bogdan Ivanov 的算法来自 here效果很好。我想尝试其他方法。有没有更好的方法将单词从形容词/动词形式转换为名词形式?
最佳答案
您可能想看看这个示例:
>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> WordNetLemmatizer().lemmatize('having','v')
'have'
(来自 this SO answer )看看它是否将您引向正确的方向。
关于python - 从词干词中获取最接近的名词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17083442/
我想搜索一个单词及其在句子中的变体。例如,单词“happy”的变体是“happiest”、“happier”。有java库支持吗? 最佳答案 您可以使用Porter stemming algorith
愚蠢的,但我无法访问 NLTK 中的主干函数。 我打电话 import nltk nltk.stem.porter.step1ab() 但我被告知该对象没有 step1ab 属性。我想我以某种方式没有
我想将 DataFrame 的列和索引限制为这样的内容 ps = PorterStemmer() df_dic = pd.read_csv('inquirerbasic_clean.csv', sep
查看以下脚本tortest.py,它反复切换TOR电路并检查IP地址是否已更改: #!/usr/bin/env python2.7 # -*- coding: utf-8 -*- import jso
我是一名优秀的程序员,十分优秀!