gpt4 book ai didi

nltk - 如何将 plwordnet (Słowosieć) 3.0 加载到 NLTK

转载 作者:行者123 更新时间:2023-12-02 04:40:08 25 4
gpt4 key购买 nike

PlWordNet 3.0 版自带两个 .xml文件。第一个文件是 plwordnet-3.0.xml (在 Princeton WordNet format 中),第二个文件是 plwordnet-3.0-visdisc.xml (在 VizDic format 中)。这个项目的自述文件似乎有些晦涩,因为建议的将数据加载到 NLTK 的方法不起作用。 PlWordNet 可从官方 project site 下载.

我正在尝试将此 wordnet 加载到 NLTK,以便我可以遍历同义词集。我已经尝试了两种方法,但它们都不起作用。

a) 将 xml 文件复制到 (...)\nltk_data\corpora\omw\pol(...)\nltk_data\corpora\wordnet .测试结果的代码:

from nltk.corpus import wordnet as wn
wn.synsets('Politechnika')

不幸的是返回空列表

b) 使用 nltk 包中的 XMLCorpusReader(如 How to use the Spanish Wordnet in NLTK? 中所述)加载 xml 文件。测试代码:
from nltk.corpus.reader import XMLCorpusReader
reader = XMLCorpusReader(dir, 'plwordnet-3.0.xml')

但是当我运行 reader.words() 时,它只返回一个 id 列表(unicode 对象,仅代表数字)。此外,我没有看到获取同义词集之间关系的方法。

有人使用过普林斯顿 Wordnet 3.1 或 PlWordNet (Słowosieć) 3.0 吗?

我设法使用了 python 的 xml.etree手动获取同义词列表及其描述,但我不明白如何获取 关系 它们之间。

谢谢!

最佳答案

NLTK 不再支持 PlWordNet 3.0。

我会写我自己的解析器。

关于nltk - 如何将 plwordnet (Słowosieć) 3.0 加载到 NLTK,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38203417/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com