gpt4 book ai didi

multithreading - stanford-corenlp 中的默认线程数是多少

转载 作者:行者123 更新时间:2023-12-03 12:45:28 44 4
gpt4 key购买 nike

stanford-corenlp 中的默认线程数是多少?具体来说,命名实体提取器,然后是信息提取器。另外,我希望两者都使用单个线程进行调试,我该如何设置?

谢谢!

最佳答案

默认为 1 个线程。

有两种方法可以在多线程模式下运行 Stanford CoreNLP。

1.) 每个线程处理一个单独的文档

2.) 每个线程处理一个单独的句子

假设您有 4 个核心。

如果您希望每个线程处理单独的文档,请使用 -threads 4选项(假设您要使用 4)。

所以你可以运行这个命令:

java -Xmx14g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,depparse,coref,kbp -threads 4 -fileList sample-files.txt -outputFormat text

多个注释器可以并行处理句子。这是将命名实体处理器设置为使用多个线程的示例。
java -Xmx14g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,depparse,coref,kbp -ner.nthreads 4 -fileList sample-filelist-16.txt -outputFormat text

以下注释器可以同时处理多个句子:
name       example configuration

depparse -depparse.nthreads 4
ner -ner.nthreads 4
parse -parse.nthreads 4

请注意,虽然 ner注释器可以在多线程模式下运行,它使用了几个不能的子注释器。所以你实际上只是让统计模型并行运行。模式匹配规则模块不在多线程模式下运行。

关于multithreading - stanford-corenlp 中的默认线程数是多少,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51636158/

44 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com