gpt4 book ai didi

java - 斯坦福 CoreNLP : Get CharacterOffset Annotation from Parse Tree

转载 作者:行者123 更新时间:2023-12-01 23:49:36 24 4
gpt4 key购买 nike

使用另一个解析器的解析器输出,我为一个句子创建了解析树。现在,我需要找到解析中出现的每个名词短语的字符偏移量。

我该怎么做呢?

最佳答案

取一个对应于名词短语的子树。获取这棵树的叶子:

List<Tree> leaves = tree.getLeaves();

然后获取第一个叶子的起点(CharacterOffsetBeginAnnotation 值)和最后一个叶子的终点(CharacterOffsetEndAnnotation)。得到的间隔是 NP 的偏移量。

要获取偏移值,请获取叶子的标签并将其转换为 HasOffset:

Label label = firstLeaf.label();
HasOffset ofs = (HasOffset) label;
int start = ofs.beginPosition();

这适用于斯坦福 CoreNLP 3.2.0。

关于java - 斯坦福 CoreNLP : Get CharacterOffset Annotation from Parse Tree,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16502378/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com