gpt4 book ai didi

java - 如何在 OpenNLP 中进行嵌套命名实体识别?

转载 作者:行者123 更新时间:2023-11-30 08:57:42 27 4
gpt4 key购买 nike

我目前正在从事一个 java 网络服务器项目,该项目需要使用自然语言处理,特别是命名实体识别 (NER)。

我使用的是 OpenNLP for java,因为添加自定义训练数据很容易。它工作得很好。

但是,我还需要能够提取实体内部的实体(嵌套命名实体识别)。我尝试在 OpenNLP 中执行此操作,但出现解析错误。所以我的猜测是,遗憾的是 OpenNLP 不支持嵌套实体。

这是我需要解析的示例:

提醒我[START:reminder][START:contact]约翰[END][ START:contact]查理[END][END]

如果这不能通过 OpenNLP 实现,是否有任何其他 Java NLP 库可以做到这一点。如果根本没有 Java 库,是否有任何其他语言的 NLP 库可以做到这一点?

请帮忙。谢谢!

最佳答案

简短的回答是:

  1. 这不能使用只适用于连续实体的 openNLP NER 来实现,因为它使用 BIO标记方案。
  2. 我不知道有任何语言的图书馆能够做到这一点。

我认为你过度扩展了实体的概念,它习惯性地与人、地点、组织、基因名称等联系在一起。但不能识别文本中的复杂结构。

为此,您需要考虑更详细的解决方案,同时考虑句子的语法结构,这可以使用像 OpenNLP 中的解析器一样的语法结构来获得。 ,并可能将其与 NER 过程的输出相结合。

关于java - 如何在 OpenNLP 中进行嵌套命名实体识别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28011129/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com