- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要使用 nltk 对文本进行词形还原。为了做到这一点,我申请 nltk.pos_tag
到每个句子,然后将生成的 Penn Treebank 标签 (http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html) 转换为 WordNet 标签。我需要这样做,因为 WordNetLemmatizer.lemmatize()
期望单词及其正确的 pos_tag 作为参数,否则它只会假设一切都是动词。
我刚刚发现 WordNet 中定义了五个不同的标签:
最佳答案
WordNetLemmatizer
在 NLTK
不区分卫星形容词和普通形容词。 nltk.stem.WordNetLemmatizer.lemmatize
是使用 "WordNet’s built-in morphy function. Returns the input word unchanged if it cannot be found in WordNet."
在 WordNet 中,卫星形容词——更广泛地称为卫星同义词集——更像是 WordNet 其他地方使用的语义标签,而不是 nltk 中的特殊词性。
来自wordnet glossary :
Satellite Synset: Synset in an adjective cluster representing a concept that is similar in meaning to the concept represented by its head synset .
tripleee
积分
out in this question下列:
adjectives are subcategorized into 'head' and 'satellite' synsets within an adjective clutser
nltk
documentation为
nltk.stem.WordNetLemmatizer.lemmatize
假定默认词性是名词而不是动词,除非另有说明。
关于python - WordNetLemmatizer : Different handling of wn. ADJ 和 wn.ADJ_SAT?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51634328/
我需要使用 nltk 对文本进行词形还原。为了做到这一点,我申请 nltk.pos_tag到每个句子,然后将生成的 Penn Treebank 标签 (http://www.ling.upenn.ed
所以我对此比较陌生,我需要一些帮助。 所以我试图让 nltk 中的 Wordnet 使用开放式多语言 WordNet。这是我访问的页面,显示了如何执行此操作 http://www.nltk.org/h
我下载了WN-Affect .但是,我不确定如何使用它来检测句子的情绪。例如,如果我有一个字符串“我讨厌足球”。我希望能够检测情绪是否不好,情绪是否是恐惧。 WN-Affect 没有关于如何操作的教程
我下载了WN-Affect .但是,我不确定如何使用它来检测句子的情绪。例如,如果我有一个字符串“我讨厌足球”。我希望能够检测情绪是否不好,情绪是否是恐惧。 WN-Affect 没有关于如何操作的教程
print(wn.synset('whale.n.01')) 此代码打印: Synset('giant.n.04') 我有 from nltk.corpus import wordnet as wn。
我知道 wordnet 有一个 "adverb synset" type .我知道那是在 nltk 中的 synset 类型枚举中 from nltk.corpus import wordnet as
我为问题编码: What percentage of noun synsets have no hyponyms? You can get all noun synsets using wn.all_
我正在尝试对心电图信号使用带通滤波器,这是代码: from scipy.signal import butter def bandpass_filter(self, data, lowcut, hig
我需要在基于 Java 的应用程序中使用 Wordnet。我想: 搜索同义词集 找到同义词集之间的相似性/相关性 我的应用程序使用 RDF 图,我知道 Wordnet 有 SPARQL 端点,但我想最
我试图让它运行起来,但不知道我做错了什么。我已经创建了一个 Debian.img(带有虚拟设备管理器的原始格式的磁盘 - 我猜是 libvirt 的 gui)并顺利安装了 debian。现在我想让它运
我是一名优秀的程序员,十分优秀!