java - 使用 Stanford NLP 找出描述名词的形容词-6ren

java - 使用 Stanford NLP 找出描述名词的形容词

转载作者：塔克拉玛干更新时间：2023-11-02 07:49:39

24

4

我需要编写一段代码，将几行关于产品的评论作为输入，并根据评论中描述产品的形容词对产品进行评级。我刚刚使用词性标注器来标注每条评论的词性。现在，我必须挑选出描述名词的形容词，如果一个名词似乎与产品相关，我需要考虑相应的形容词。这是我用于 POS 标记的代码。它工作正常。

import java.io.*;
import edu.stanford.nlp.tagger.maxent.MaxentTagger;
public class Tagg {
public static void main(String[] args) throws IOException,
ClassNotFoundException {

String tagged;

// Initialize the tagger
MaxentTagger tagger = new MaxentTagger("edu/stanford/nlp/models/pos-tagger/wsj-        left3words/wsj-0-18-left3words-distsim.tagger");
FileInputStream fstream = new FileInputStream("src/input.txt");
BufferedReader br = new BufferedReader(new InputStreamReader(fstream));
FileWriter q = new FileWriter("src/output.txt",true);
BufferedWriter out =new BufferedWriter(q);
String sample;
//we will now pick up sentences line by line from the file input.txt and store it in the string sample
while((sample = br.readLine())!=null)
{
//tag the string
tagged = tagger.tagString(sample);
System.out.print(tagged+"\n");
//write it to the file output.txt
out.write(tagged);
out.newLine();
}
out.close();
}
}

我需要一种方法来继续。 .

最佳答案

一个简单的解决方案会让你走得更远，那就是使用依赖解析器，它包含在 Stanford CoreNLP 中。算法是这样的:

PoS 标签和 Dependency 解析你的句子
确定您对哪些名词感兴趣。如果您要处理产品评论，一种简单的方法是将文本中的所有名词与已知产品名称列表进行匹配。
在依赖解析器的输出中查找包含您感兴趣的名词的 amod 关系。

使用 online Stanford demo 的示例:

输入:

I own a tall glass and just bought a big red car.

amod 依赖:

amod(glass-5, tall-4)
amod(car-12, big-10)
amod(car-12, red-11)

假设评论是关于汽车的。最后两个依赖项包含目标名词 car，因此您要查找的形容词是 big 和 red。

警告:这是一个高精度搜索算法，而不是高召回率。您的关键字列表永远不会详尽无遗，因此您很可能会漏掉一些形容词。此外，解析器并不完美，有时会出错。此外，amod 关系是形容词描述名词的多种方式之一。例如，"The car is red" 解析为

det(car-2, The-1)
nsubj(red-4, car-2)
nsubj(black-6, car-2)
cop(red-4, is-3)
root(ROOT-0, red-4)
conj_and(red-4, black-6)

如您所见，这里没有amod 关系，只有系词和连词。您可以尝试制定更复杂的规则来提取 car is red 和 car is black 这一事实。是否要这样做取决于您。在当前形式下，当此算法返回形容词时，您可以有理由相信它确实在描述名词。在我看来，这是一个很好的特性，但这完全取决于您的用例。

OP评论后编辑:

是的，I bought a new car. 和 It is awesome. 是两个独立的句子，将分别进行解析。此问题称为 coreference (anaphora) resolution .事实证明，斯坦福大学也支持这一点——参见 their webpage .还有a system by CMU ，这也是在 Java 中。我没有使用过这两个系统，但后者有一个非常有用的在线演示。把上面两句话放进去，就得到了

[I] bought [a new car]2 .
[It]2 is awesome .

关于java - 使用 Stanford NLP 找出描述名词的形容词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17251156/

24

4

0

文章推荐：安卓磨损 : geofence - ApiException: 1000

文章推荐： c# - Java中扩展方法的实际用途是什么？

stanford-nlp - Stanford Parser的标签
我刚开始使用Stanford Parser，但我不太了解这些标签。这可能是一个愚蠢的问题，但是谁能告诉我SBARQ和SQ标签代表什么，在哪里可以找到它们的完整列表？我知道Penn Treebank的样
stanford-nlp - nltk stanford ner tagger 和 stanford ner tagger 在线演示之间的不一致
我正在使用 python 的内置库 nltk 来获取 stanford ner tagger api 设置，但我发现此 api 的单词标记与 stanford 的 ner tagger 网站上的在线演
stanford-nlp - 初始堆错误太小 - stanford parser
我正在尝试使用斯坦福依赖解析器。我尝试从 Windows 上的命令行运行解析器以使用以下命令提取依赖项: java -mx100m -cp "stanford-parser.jar" edu.stan
stanford-nlp - Stanford CoreNLP BasicPipelineExample 不起作用
我正在尝试开始使用 Stanford CoreNLP，甚至无法通过这里的第一个简单示例。 https://stanfordnlp.github.io/CoreNLP/api.html 这是我的代码:
stanford-nlp - 用 stanford-nlp 分块一些文本
我正在使用 stanford 核心 NLP，并使用这一行来加载一些模块来处理我的文本: props.put("annotators", "tokenize, ssplit, pos, lemma, n
stanford-nlp - Stanford Core NLP 是否支持德语词形还原？
我找到了与 Stanford Core NLP 兼容的德语解析和 pos-tag 模型。但是我无法使德语词形还原工作。有办法吗？最佳答案抱歉，据我所知，Stanford CoreNLP 不存在德语
stanford-nlp - 是否可以选择从 Stanford Parser 获取每个句子的处理时间？
我目前正在使用以下命令解析阿拉伯文本: java -mx1500m edu.stanford.nlp.parser.lexparser.LexicalizedParser \ -cp "$scri
stanford-nlp - 为什么 stanford corenlp 性别识别是不确定的？
我有以下结果，如您所见，爱德华这个名字有不同的结果(null 和 male)。这发生在几个名字上。 edward, Gender: null james, Gender: MALE karla, Ge
stanford-nlp - 如何基于 stanford-nlp 条件随机场模型训练法国 NER？
我发现了 stanford-NLP 的工具，发现它真的很有趣。我是一名法国数据挖掘者/数据科学家，喜欢文本分析，并且很想使用您的工具，但是 NER 在法语中不可用，这让我感到非常困惑。我很想制作我
c++ - linux 上的 Stanford Stanford C++ 库
我正在使用 Suse Linux 13.1 并自学斯坦福大学的 CS 106b 类(class)。我在这里找到了压缩库 http://www.stanford.edu/class/cs106b/hom
nlp - 如何使用 Stanford Parser 或 Stanford CoreNLP 找到名词短语的语法关系
我正在使用 stanford CoreNLP 来尝试查找名词短语的语法关系。这是一个例子: 给定“The fitness room was dirty”这句话。我成功地将“The fitness
stanford-nlp - 格式化 Stanford Corenlp 的 NER 输出
我正在使用 Stanford CoreNLP 并将其用于 NER。但是当我提取组织名称时，我看到每个词都标有注释。因此，如果实体是“纽约时报”，那么它将被记录为三个不同的实体:“NEW”、“YORK”
stanford-nlp - stanford corenlp 3.3.1 语言支持
我开始使用 coreNLP 库 3.3.1 来分析意大利文本文档。有没有人尝试过使用英语以外的语言？您是否找到了训练算法所需的模型？谢谢卡罗最佳答案目前，除了英语，我们只为中文打包模型(见 h
stanford-nlp - 使用 Core NLP 和 Stanford Parser 执行词性标注的结果不同？
斯坦福解析器和斯坦福 CoreNlp 的词性 (POS) 模型用途不同，这就是为什么通过 Stanford Parser 和 CoreNlp 执行的 POS 标记的输出存在差异。在线核心 NLP 输
java - Stanford-CoreNLP 和 Stanford-Parser 中的 Maven 类名冲突
我的 (maven) 项目依赖于 stanford-CoreNLP 和 stanford-Parser，显然每个依赖项的(词汇化)解析器产生不同的输出，它们并不相同。我的问题是如何确定应该从哪个包加
c# - Stanford CoreNLP 创建 edu.stanford.nlp.time.TimeExpressionExtractorImpl 时出错
我正在尝试学习 Stanford CoreNLP 库。我在发布的示例 ( https://sergeytihon.wordpress.com/2013/10/26/stanford-corenlp-i
java - 无法在 .\stanford-corenlp-4.0.0 找到 stanford-parser\.jar jar 文件
我是 nltk 的新手，似乎正在遵循过时的教程来开始使用 nltk 中的 StanleyDependencyParser。我已经从https://stanfordnlp.github.io/安装了S
java - Stanford Core NLP ner 4.0.0错误: Could not find or load main class stanford-ner.jar;lib.*
我正在尝试使用Stanford CoreNLP训练NER模型，但是找不到主类。我已经在我的CLASSPATH中包含了jar文件的路径，但仍然找不到它们。有什么办法解决这个问题吗？ C:\ Users
scala - 类型不匹配;找到 : edu. stanford.nlp.util.CoreMap => 需要单位 : java. util.function.Consumer[_> : edu. stanford.nlp.util.CoreMap]
我不明白它要我做什么。分配给 sentence正在工作: val sentences : java.util.List[CoreMap] = document.get(classOf[Sentence
stanford-nlp - 斯坦福NLP训练情感模型
我正在参加 Rotten Tomatoes NLP 预测的 kaggle 竞赛。训练集格式解析如下: PhraseId SentenceId Phrase Sentiment 1 1 A serie

首页

博学

6Ren·AI

商城

java - 使用 Stanford NLP 找出描述名词的形容词