gpt4 book ai didi

nlp - 聚焦命名实体识别(NER)?

转载 作者:行者123 更新时间:2023-11-30 08:35:28 33 4
gpt4 key购买 nike

我想识别特定领域(例如棒球)中的命名实体。我知道有一些可用的工具,如斯坦福NER、LingPipe、AlchemyAPI,我已经用它们做了一些测试。但正如我之前提到的,我希望它们是针对特定领域的。这怎么可能?

最佳答案

一种方法可能是

  1. 使用通用(非特定领域)工具检测人员姓名

  2. 使用主题分类器过滤掉不在域中的文本

如果数据集的总规模足够大,并且提取器和分类器的准确性足够好,您可以使用结果来获取与领域密切相关的人名列表有问题的(例如,通过将结果限制为在特定领域的文本中比在其他文本中更频繁地提及的结果)。

就棒球而言,这应该是获取与棒球相关的人员列表的相当好的方法。。然而,这并不是仅获取棒球运动员列表的好方法。对于后者,有必要分析提到这些名字的确切上下文以及有关它们的说法;但也许这不是必需的。

编辑:主题分类器我的意思与其他人可能简单称为分类文档分类域分类或类似内容。即用型工具的示例包括 Python-NLTK 中的分类器(请参阅 here 中的示例)和 LingPipe 中的分类器(请参阅 here )。

关于nlp - 聚焦命名实体识别(NER)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10043293/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com