gpt4 book ai didi

python - 使用 NLTK 对 POS 标记词进行词形还原?

转载 作者:IT老高 更新时间:2023-10-28 21:17:57 33 4
gpt4 key购买 nike

我已经用 nltk.pos_tag() 对一些词进行了 POS 标记,因此它们被赋予了树库标记。我想使用已知的 POS 标签对这些词进行词形还原,但我不确定如何。我正在查看 Wordnet lemmatizer,但我不确定如何将 treebank POS 标签转换为 lemmatizer 接受的标签。我怎样才能简单地执行这种转换,或者是否有使用树库标签的词形还原器?

最佳答案

wordnet lemmatizer 只知道四个词性(ADJ、ADV、NOUN 和 VERB),并且只有 NOUN 和 VERB 规则可以做任何特别有趣的事情。树库标签集中的名词词性均以NN开头,动词标签均以VB开头,形容词标签以JJ开头,副词标签以RB开头。因此,从一组标签转换为另一组标签非常简单,例如:

from nltk.corpus import wordnet

morphy_tag = {'NN':wordnet.NOUN,'JJ':wordnet.ADJ,'VB':wordnet.VERB,'RB':wordnet.ADV}[penn_tag[:2]]

关于python - 使用 NLTK 对 POS 标记词进行词形还原?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5364493/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com