gpt4 book ai didi

java - 加快 CoreNLP 情感中的注释时间

转载 作者:行者123 更新时间:2023-11-30 06:14:34 26 4
gpt4 key购买 nike

在我的数据集中,我有 100,000 个文本文件,我正在尝试使用 CoreNLP 处理它们。期望的结果是 100,000 个完成的文本文件结果,其中将每个句子分类为具有积极、消极或中性情绪。为了从一个文本文件到另一个文本文件,我使用 CoreNLP jar 文件,该文件从下面的命令行使用。

 java -cp "*" -mx5g edu.stanford.nlp.sentiment.SentimentPipeline -fileList list.txt

执行此操作需要很长时间,因为我无法让模型获取文件列表中的每个文件,但它会将单个路径行作为模型的输入。

我还尝试实现此链接中的一些其他方法,但我无法从这些方法中获得所需的结果。 https://stanfordnlp.github.io/CoreNLP/cmdline.html#classpath

是否有更好更快的方法来完成此操作并加快进程?

最佳答案

尝试这个命令:

java -Xmx14g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,parse,sentiment -parse.model edu/stanford/nlp/models/srparser/englishSR.ser.gz -outputFormat text -filelist list.txt 

它将使用更快的移位归约解析器。这将运行 list.txt 中的每个文件(每行 1 个文件)并对其进行处理。

关于java - 加快 CoreNLP 情感中的注释时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49513178/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com