gpt4 book ai didi

algorithm - 使用自然语言处理识别项目列表

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:08:49 26 4
gpt4 key购买 nike

有没有办法让 NLP 解析器识别列表?
例如,"a tiger, a lion and a gorilla" 应该被识别为一个列表
(我不需要将其标识为动物列表;只需一个列表就足够了)。

我的最终目标是将一个常用动词/词链接到列表中的所有项目。例如,考虑句子“他找到了一支笔、一本书和一个手电筒”。此处,“找到” 动词应链接到所有 3 个项目。

另一个例子,“他的癌症、贫血和糖尿病检测结果为阴性”。在这里,“阴性” 一词应该与这三种疾病联系在一起。

是否可以使用任何开源 NLP 软件包(例如 OpenNLP 或 Stanford CoreNLP)?还有其他解决方案吗?


编辑:
就像其中一个答案中提到的,我最初的想法是手动解析列表并通过查看逗号等位置来查找项目。

但后来我发现了 Stanford NLP 的 OpenIE 模型。这似乎做得很好。
例如,"He has a pen and a book"给出了两个关系(He;has;a pen)(He;has ;一本书)

该模型的问题在于它不适用于不完整的句子,例如“有笔和书”
(据我了解,这是因为OpenIE只能提取三元组)
当涉及否定时,它也会失败。例如,“他没有笔”

这些问题有解决办法吗?目前可用于信息提取的最佳解决方案有哪些?

最佳答案

恐怕完整的答案可以填满博士论文的大部分:)

没有通用工具可以满足您的需求。你需要自己写。如果你看this例如,您可以看到可以通过从标记 或逗号开始然后遍历它周围的图形来构建列表来提取列表。在这种特殊情况下,您可以查看链接较小名词短语的 conjappos 关系。

您还可以查看 POS 标记模式,例如 (N*N*CC , N*) -- 这是一个 hack,但如果您想要快速的结果并且愿意错过召回,这可能是您的最佳方法。

至于您要求包含诸如否定之类的修饰符——这是一个单独的任务,应该在您确定列表之后进行。

关于algorithm - 使用自然语言处理识别项目列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44112675/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com