gpt4 book ai didi

nlp - 使用 OpenNLP 链接多个名称查找器实体

转载 作者:行者123 更新时间:2023-12-04 22:35:19 24 4
gpt4 key购买 nike

首先是一点上下文:我试图在文档语料库中识别街道地址,我们决定明显的解决方案是使用 NLP(在这种情况下是 Apache OpenNLP)工具来实现这一点,到目前为止一切虽然我们仍然需要用大量文档训练模型,但看起来不错,但这并不是真正的问题。我们通过使用 USAddress 添加额外的地址验证步骤来改进解决方案。来自 Datamade 的解析器。我最大的问题是,如果地址旁边没有位置,地址本身就什么都不是,有时在文本中指定了位置,我们会假设这种情况经常发生。

我的问题来了:有没有办法使用共指来关联文本中的实体?或者更好的是,有没有办法在文本中注释任意单词并将它们识别为一个实体?

我一直在查看 Apache OpenNLP 文档,但是......它非常薄,我认为它仍然需要一些工作。

最佳答案

如果你想对这个问题使用coreference,你可以看看这个blog

但更简单的解决方案是使用句子检测器+ RegEx 或位置 NER+ 句子检测器(假设地址在一行中)

我认为可以使用正则表达式识别美国地址,一旦正则表达式匹配,您就可以使用 opennlp 的句子检测器来打印整个地址行。

同样,您可以使用 opennlp 提供的 NER 模型来查找位置并打印您想要的句子。

希望这可以帮助!

编辑

Github Repo使我们变得简单。一探究竟!

关于nlp - 使用 OpenNLP 链接多个名称查找器实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38132983/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com