gpt4 book ai didi

python - 在 python 中使用阿拉伯语 WordNet 作为同义词?

转载 作者:行者123 更新时间:2023-11-28 18:33:33 24 4
gpt4 key购买 nike

我正在尝试获取句子中阿拉伯语单词的同义词

如果这个单词是英文的,它就可以完美地工作,并且结果以阿拉伯语显示,我想知道是否可以立即获得阿拉伯语单词的同义词而不用先用英语写它。

我试过了,但没有用,我更喜欢没有 tashkeel انتظار 而不是 اِцْتِظار

from nltk.corpus import wordnet as omw
jan = omw.synsets('انتظار ')[0]
print(jan)
print(jan.lemma_names(lang='arb'))

最佳答案

nltk 中使用的 Wordnet 不支持阿拉伯语。如果您正在寻找 Arabic Wordnet所以这是完全不同的事情。

对于阿拉伯语 wordnet,下载:

你运行它:

$ python AWNDatabaseManagement.py -i upc_db.xml

现在获取类似 wn.synset('إنتظار') 的内容。 Arabic Wordnet 有一个函数 wn.get_synsets_from_word(word),但它给出了偏移量。它还只接受数据库中发出的单词。例如,您应该为 ìميل 使用 ♬َمِيل:

>> wn.get_synsets_from_word(u"جَمِيل")
[(u'a', u'300218842')]

300218842 是 ♬ synset 的偏移量。

我检查了 إنتظار 这个词,它似乎不存在于 AWN 中。

有关使用 AWN 获取同义词的更多详细信息 here .

关于python - 在 python 中使用阿拉伯语 WordNet 作为同义词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34620627/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com