gpt4 book ai didi

python - 代词解析向后

转载 作者:IT老高 更新时间:2023-10-28 20:29:17 24 4
gpt4 key购买 nike

通常的共指解析工作方式如下:

提供

The man likes math. He really does.

发现

he 

指的是

the man.

有很多工具可以做到这一点。

但是,有没有办法倒退?

例如,

给定

The man likes math. The man really does.

我想“向后”做代词解析

这样我就能得到类似的输出

The man likes math. He really does.

我的输入文本大多是 3~10 句话,我正在使用 python。

最佳答案

这可能不是一个真正令人高兴的答案,但我认为答案是任何地方都没有内置这样的功能,尽管您可以自己编写代码而不会有太多困难。概述我将如何使用 CoreNLP:

  1. 仍在运行 coref。这将告诉您“男人”和“男人”是共同指代的,因此您可以将第二个替换为代词。

  2. 从 CoreNLP 运行 gender 注释器。这是一个记录不充分、宣传效果更差的注释器,它试图将性别附加到句子中的标记上。

  3. 以某种方式找出复数。大多数时候你可以使用词性标签:复数名词得到标签 NNS 或 NNPS,但有一些复杂性,所以你可能还需要考虑(1)先行词中是否存在连词; (2) 词的引理与其文本不同; (3) 尤其是与 2 结合,以 's' 或 'es' 结尾的词 -- 这可以区分去除复数的词形还原和去除时态等的词形还原。

  4. 这足以找出正确的代词。现在只需将句子切分并重新组合即可。如果你在 CoreNLP 中这样做会有点痛苦——代码只是没有设置为更改句子的文本——但在最坏的情况下,你总是可以重新注释一个新的表面形式。

希望这会有所帮助!

关于python - 代词解析向后,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34628224/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com