- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我是 NLP 和 NLTK 的初学者。
我无法理解 wordnet 中引理和同义词集之间的确切区别,因为两者产生的输出几乎相同。例如,对于单词 cake,它会产生此输出。
lemmas : [Lemma('cake.n.01.cake'), Lemma('patty.n.01.cake'), Lemma('cake.n.03.cake'), Lemma('coat.v.03.cake')]
synsets : [Synset('cake.n.01'), Synset('patty.n.01'), Synset('cake.n.03'), Synset('coat.v.03')]
请帮助我理解这个概念。
谢谢。
最佳答案
这些术语基于“引理”和“同义词”这两个词的一般含义。
词条 是词典中词条的 wordnet 版本:规范形式的词,具有单一含义。例如,如果你想在字典中查找“banks”,规范形式将是“bank”,对于意思是“financial institution”和“side of the river”的名词会有单独的词条,一个单独的词条表示动词“to bank (on)”等
术语synset 代表“同义词集”。一组同义词是一组具有相似含义的词,例如ship、skiff、canoe、kayak 可能都是 boat 的同义词。在 nltk 中,一个 synset
实际上是一组具有相关含义的 lemmas。以您的示例(wn.synsets("cake")
和 wn.lemmas("cake")
的结果),我们还可以这样写:
>>> synsets[0]
Synset('cake.n.01')
>>> synsets[0].lemmas()
[Lemma('cake.n.01.cake'), Lemma('cake.n.01.bar')]
这些是构成“蛋糕”的第一个同义词集的词条。
Wordnet 提供了许多方法,可让您探索上位词/下位词、使用域等关系。有关更多信息,您应该直接查看 Wordnet 文档; nltk 只是为它提供了一个接口(interface)。这是 Wordnet glossary .
关于python - wordnet中的lemma和synset有什么联系或区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42038337/
我正在学习问题中引理之间的区别。我能找到的每个引用资料都使用以下示例: {(a^i)(b^j)(c^k)(d^l) : i = 0 or j = k = l} 以显示两者之间的差异。我可以找到一个使用
也许这是一个愚蠢的问题。这是来自 the Hasochism paper 的引用: One approach to resolving this issue is to encode lemmas,
L = { w | w in {0,1}* and w has equal number of 0s and 1s } 令 n 为抽水引理的数量。 我选择 s = 0n 1n 和 y = 0t 其中
在逻辑章节中介绍了反向列表函数的尾递归版本。我们需要证明它工作正常: Fixpoint rev_append {X} (l1 l2 : list X) : list X := match l1 w
我有一个相当大的术语foo。当我打字时 value "foo" 然后 Isabelle 将 foo 计算为一个值,比如 foo_value。我现在想证明以下引理。 lemma "foo = foo_v
我有一个相当大的术语foo。当我打字时 value "foo" 然后 Isabelle 将 foo 计算为一个值,比如 foo_value。我现在想证明以下引理。 lemma "foo = foo_v
因此,这与抽水引理及其工作原理无关,而与先决条件有关。 在网络上的任何地方,您都可以阅读到常规语言必须通过激进的引理,但是现在任何人都在谈论有限语言,而有限语言实际上是常规语言的一部分。 因此,我们可
我正在遵循书中第 2 章中的一个示例:Yuli Vasiliev 2020 使用 Python 和 spaCy 进行自然语言处理 该示例假设生成词形还原输出: ['我','我','飞行','到','弗
我使用 nltk 3.0.4 并注意到单词 boss 和 bosses 的词元不同。 from nltk.stem.wordnet import WordNetLemmatizer wnl = Wor
tl;dr 如何将词根和词性标记组合成一个完全修饰的词? 例如: getText('easy', 'adjective', 'superlative') --> '最简单' getText('eat'
如果我让字符串 w是a^mb^m然后我们知道 y将仅包含 a是因为规则 |xy| 对于任何 m >= 1 你有 aa[aa...]。因此,当您的对手选择 y = aa 时,他们会强制您将 L 中的字
我是一名优秀的程序员,十分优秀!