gpt4 book ai didi

python - 将 Wordnet 的输出简化为一种含义

转载 作者:太空宇宙 更新时间:2023-11-03 14:53:17 25 4
gpt4 key购买 nike

首先,让我向您介绍一下我的问题:对于一个项目,我必须对 8000 个问题进行分类,并将它们分为 7 个类别(宪法、体育、地理、历史、科学、教育和技术)。因为问题很短,SVM 没有多大意义,所以我只是为每个类别创建了一个单词列表。为了提高准确性,我必须扩展这些列表,以便可以将未标记的字符串放入类别中。在互联网上,我听说 WordNet 可以获取单词的同义词(这对我来说很有意义,因为我需要尽可能多的单词同义词)。但问题来了:WordNet 显示在

from nltk.corpus import wordnet as wn
for synset in wn.synsets(word):
for lemma in synset.lemmas():
print(lemma.name())

所有相关的单词。一个例子是单词 capital:我只是指一个国家的首都意义上的资本,但 WordNet 返回单词 capital、working、capital letter、upper case、upper-case 、大写字母和首都华盛顿。显然,我不需要在地理词袋中使用大写这个词。所以我问你是否有可能将 WordNet 简化为只有一种含义,或者是否有任何我可以使用的替代方案。

此致,詹姆斯

最佳答案

您需要找到特定引理的同义词(规范词典条目;具有单一定义的单词)。我将简单地包括 link我在评论里发了,祝你好运。

关于python - 将 Wordnet 的输出简化为一种含义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45775028/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com