gpt4 book ai didi

python - 使用 NLTK 对德语文本进行 Pos 标记

转载 作者:太空狗 更新时间:2023-10-30 01:08:38 28 4
gpt4 key购买 nike

我想使用 NLTK 对德语文本进行 POS 标记。我在网上找到了一些引用资料,但大部分都已过时。一些引用例如“EUROPARL”词库,但看起来只有“EUROPARL_raw”仍然可用。那个没有 POS 标记。我还发现了一些关于使用 TIGER 语料库的引用资料,但最新版本似乎是我无法用开箱即用的 NLTK 解析的格式。

我知道有一些非 NTLT 替代方案,但我更愿意使用 NLTK。有人可以提供一个基于德语语料库的词性标注的简单示例吗?

最佳答案

我无法找到用于 NLTK 的标记语料库。如果您需要预先标记的语料库,您可能不适合使用 NLTK。这个问题有一个 Unresolved 问题单,但没有任何进展(Reading Negra Corpus Files)

您可以使用 NLTK Trainer 标记您自己的语料库和 Negra Corpus .它需要德语语法知识,但不需要编码。查看 NLTK-Trainer 的演示.

关于python - 使用 NLTK 对德语文本进行 Pos 标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20332762/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com