gpt4 book ai didi

python - NLTK 数据已过时 - Python 3.4

转载 作者:太空狗 更新时间:2023-10-29 21:23:53 28 4
gpt4 key购买 nike

我正在尝试为 Python 3.4 安装 NLTK。实际的 NLTK 模块似乎安装正常。然后我跑了

import nltk

nltk.download()

并选择下载所有内容。然而,完成后,窗口只显示“过时”。我尝试刷新和下载,但它仍然“过时”,如下所示:NLTK Window 1

我在网上查看并尝试了各种修复方法,但还没有找到任何对我的案例有帮助的方法。

我也尝试过手动查找缺失的部分,结果是'Open Multilingual Wordnet'和'Wordnet'。以下是我如何找到缺少的部分:Open Multilingual Wordnet .

我该怎么办?我应该卸载并重新安装 NLTK 吗?我还没有真正找到删除包的方法(手动删除包除外)。

编辑:关于解决方案 2 和解决方案 3:有关解决方案 2 问题的更多说明:

如果下载成功,输出如下:

>>> nltk.download('subjectivity')
[nltk_data] Downloading package subjectivity to
[nltk_data] C:\Users\Shane\AppData\Roaming\nltk_data...
[nltk_data] Package subjectivity is already up-to-date!
True

但是,对于“wordnet”和“omw”,这是我重新下载时发生的情况:

>>> nltk.download('omw')
[nltk_data] Downloading package omw to
[nltk_data] C:\Users\Shane\AppData\Roaming\nltk_data...
[nltk_data] Unzipping corpora\omw.zip.
True

最佳答案

简而言之:

不要使用 GUI,在 python 解释器中添加所有包。

$ python3
>>> import nltk
>>> nltk.download('all')

长:

这可能是因为最近添加了 Open Multilingual WordNet 并且 NLTK 下载 GUI 界面和索引无法正常工作。

解决方案一:

只需使用 nltk.download() GUI 并下载这两个包,而无需全选。 (可能行不通但值得一试)

解决方案 2:

通过 python 解释器单独安装包:

>>> import nltk
>>> nltk.download('wordnet')
>>> nltk.download('omw') # Open Multilingual WordNet

解决方案 3:

nltk.download('all') 检查其索引中的所有包,如果它们不可用则下载它们。

>>> import nltk
>>> nltk.downlad('all')

注意:如果任何文件可能由于互联网连接中断而损坏,只需找到存储 NLTK 数据的目录,然后继续解决方案 3。

要找到 nltk_data 的存储位置,nltk.data.path 存储可能的位置:

>>> import nltk
>>> nltk.data.path
['/home/alvas/nltk_data', '/usr/share/nltk_data', '/usr/local/share/nltk_data', '/usr/lib/nltk_data', '/usr/local/lib/nltk_data']

由于数据下载的目的是使用它们,要知道您没有缺少所需的组件,如果是 wordnetomw,您可以试试这个:

>>> from nltk.corpus import wordnet as wn
>>> wn.synsets('bank')[0]
Synset('bank.n.01')
>>> wn.synsets('bank')[0].lemma_names('spa')
['margen', 'orilla', 'vera']
>>> wn.synsets('bank')[0].lemma_names('fre')
['rive', 'banque']

不必担心 GUI 上显示的内容。一旦 nltk.download('all') 完成且没有错误,这意味着您拥有 NLTK 支持的所有语料库和模型。

但作为一种好的做法,请在 https://github.com/nltk/nltk_data/issues 中提出问题以便开发人员可以检查问题是否可以重现。显示更多错误的打印屏幕。在建议的解决方案之前和之后 =)

关于python - NLTK 数据已过时 - Python 3.4,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33183618/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com