gpt4 book ai didi

python-3.x - NLTK - 类型错误 : tagged_words() got an unexpected keyword argument 'simplify_tags'

转载 作者:行者123 更新时间:2023-12-03 23:48:15 25 4
gpt4 key购买 nike

我只是在关注 NLTK 书的第 5 章,并且 tagged_words() 中的“simplify_tags”参数似乎出乎意料。我使用 Python 3.4、PyCharm 和标准 NLTK 包。

In[4]: nltk.corpus.brown.tagged_words()
Out[4]: [('The', 'AT'), ('Fulton', 'NP-TL'), ...]
In[5]: nltk.corpus.brown.tagged_words(simplify_tags = True)
Traceback (most recent call last):
File "C:\Python34\lib\site-packages\IPython\core\interactiveshell.py", line 2883, in run_code
exec(code_obj, self.user_global_ns, self.user_ns)
File "<ipython-input-5-c4f914e3e846>", line 1, in <module>
nltk.corpus.brown.tagged_words(simplify_tags = True)
TypeError: tagged_words() got an unexpected keyword argument 'simplify_tags'

在没有simple_tags的情况下运行这个函数是没有问题的。我感谢任何建议或意见。谢谢!

最佳答案

是的,正如所指出的,最新版本的简化标签是将它们映射到通用标签集 ( https://code.google.com/p/universal-pos-tags/ )。

>>> from nltk.corpus import brown
>>> brown.tagged_words(tagset='universal')
[(u'The', u'DET'), (u'Fulton', u'NOUN'), ...]
>>> brown.tagged_words(tagset='universal')[:10]
[(u'The', u'DET'), (u'Fulton', u'NOUN'), (u'County', u'NOUN'), (u'Grand', u'ADJ'), (u'Jury', u'NOUN'), (u'said', u'VERB'), (u'Friday', u'NOUN'), (u'an', u'DET'), (u'investigation', u'NOUN'), (u'of', u'ADP')]

但是请注意,仍然有一个语料库阅读器具有 simplify_tags参数,见 https://github.com/nltk/nltk/blob/develop/nltk/corpus/reader/ipipan.py#L23

可能 ipipan 语料库阅读器正在准备迁移到通用标记集。

另外,请注意,并非所有的语料库阅读器都能够映射到通用标签集,有些在 TODO 列表中,例如 https://github.com/nltk/nltk/blob/develop/nltk/corpus/reader/tagged.py#L260

关于python-3.x - NLTK - 类型错误 : tagged_words() got an unexpected keyword argument 'simplify_tags' ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29419379/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com