gpt4 book ai didi

parsing - 俄语的现代依存解析器

转载 作者:行者123 更新时间:2023-12-02 10:49:18 24 4
gpt4 key购买 nike

是否有适用于俄语的现代词性标注器 + 依存解析器?我需要一个能够处理纯文本和输出的工具或服务:

  • 分成句子
  • 划分为代币
  • 词性标签(欢迎使用细粒度 MSD 标签)
  • 引理(基本形式)
  • 依赖角色标签

我需要该工具用于商业目的。它可以是一个开源项目,具有经过训练的统计模型,可用于商业目的(如果需要,可以购买),也可以是一个 Web API。最终它可能是一个具有专有模型的专有闭源二进制文件。我在网上找到的俄语解析模型都需要使用 TreeTagger,它 1)有一个非常不友好的许可证,2)已经超过 20 年了。

最佳答案

为了构建一个(好的)依赖解析器,您需要一个依赖树库。所有构建依赖解析器的团队都可以访问此类树库,但不允许他们传递数据。因此,您可以获得解析器,但通常不能获得预训练模型。

这就是为什么你必须自己训练模型。对于俄语,存在依赖关系树库 (SynTagRus)。我不知道你是否能够将其用于商业目的。也许这些网站会对您有所帮助:

https://github.com/UniversalDependencies/UD_Russian-SynTagRus
https://habrahabr.ru/post/148124/
http://www.ruscorpora.ru/index.html

如果您设法获取数据,训练您自己的模型是一项非常简单的任务。要么再次在这里询问,要么您肯定会在互联网上找到足够的指南(无论是俄语还是任何其他语言,训练解析器都是相同的)

关于parsing - 俄语的现代依存解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42271363/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com