gpt4 book ai didi

java - 如何从 Stanford Core NLP 包中获取短语级情绪

转载 作者:搜寻专家 更新时间:2023-11-01 02:45:00 26 4
gpt4 key购买 nike

对于这个社区来说,这可能不是一个非常相关的问题。但我认为这会让我接触到更广泛的计算机科学社区并获得帮助。

我正在使用 Stanford Core NLP 包,更具体地说是 Sentiment module它的。我通过使用以下命令获得句子级别的情绪。

java -cp stanford-corenlp-3.4.jar:stanford-corenlp-3.4-models.jar:xom.jar:joda-time.jar:jollyday.jar:ejml-0.23.jar -mx2g edu.stanford.nlp.sentiment.SentimentPipeline -stdin < input.txt

但我需要短语级别的情绪,就像我们在 online demo 中看到的那样.我不知道该怎么做。

编辑:

查看源代码后,我发现只需在上述命令中添加另一个参数,就可以获得句子的解析树表示的每个节点的情感分数。然而,这只给出了一个数字情绪分数,而不是积极/消极的情绪。但我认为将这个分数转化为二元的正面/负面情绪是相当微不足道的。命令是:

java -cp stanford-corenlp-3.4.jar:stanford-corenlp-3.4-models.jar:xom.jar:joda-time.jar:jollyday.jar:ejml-0.23.jar -mx2g edu.stanford.nlp.sentiment.SentimentPipeline -stdin -output PENNTREES < input.txt

最佳答案

您可以使用 BuildBinarizedDataset (stanford-corenlp 3.4) 作为示例,了解如何将句子解析为带有情感注释的 PTB 树。目前 BuildBinarizedDataset 接受如下输入:

0   I hate demo
2 I
1 hate
2 demo
0 I hate

其中第一行是一个句子,下一行是句子的情感,但这用于训练模型以生成带有情感注释的 PTB 树,而不是给出单独短语的值。

(0 (2 I) (0 (1 hate) (2 demo)))

但是,如果您只提供句子,它将生成一个具有整体句子情感值的树:

(0 (0 I) (0 (0 hate) (0 demo)))

也许您可以修改 BuildBinarizedDataset 的代码,而不是将标签从定义的值分配到使用情感注释管道进行评估。

希望这能为您指明正确的方向。如果您知道怎么做,请分享。

关于java - 如何从 Stanford Core NLP 包中获取短语级情绪,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24723984/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com