gpt4 book ai didi

java - 斯坦福自然语言处理(StanfordNLP)检测带有介词的复合实体

转载 作者:行者123 更新时间:2023-12-02 06:50:35 24 4
gpt4 key购买 nike

基本上,在句子中:

<Lord of the bracelets> is a fantasy movie.

我想检测化合物Lord of the bracelets作为一个实体(也可以在实体链接注释器中链接)。这意味着检测具有类似 NNP 形式的 POS 标签的结构。 DT NNPNN IN DT NNP .

CoreNLP 可以做到这一点吗?

我当前的设置无法检测到它们,而且我也找不到方法来做到这一点。


public NamedEntityRecognition() {
Properties props = new Properties();
props.setProperty("annotators", "tokenize,ssplit,pos,lemma,ner,entitylink");
props.setProperty("tokenize.options", "untokenizable=noneDelete");

pipeline = new StanfordCoreNLP(props);
}


public CoreDocument recogniseEntities(String text) {
CoreDocument doc = new CoreDocument(text);
pipeline.annotate(doc);
return doc;
}

谢谢!

最佳答案

您可以使用 TokensRegex 来做到这一点(可能是 RegexNER,尽管我不这么认为)。您可以在规则中指定要将某些词性标记模式标记为实体。

此处提供了 TokensRegex 的完整描述:

https://stanfordnlp.github.io/CoreNLP/tokensregex.html

关于java - 斯坦福自然语言处理(StanfordNLP)检测带有介词的复合实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59767325/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com