gpt4 book ai didi

java - 斯坦福 CoreNLP 的去标记化

转载 作者:行者123 更新时间:2023-11-30 05:30:57 25 4
gpt4 key购买 nike

我使用了 stanford coreNLP 的 tokenizer 将句子标记为标记。现在我需要对已经标记化的单词进行去标记(即我需要standford coreNLP的反向标记器。)standfordcoreNLP或java/python API中是否有我们可以使用的JAVA类?

I/P:

I ca n't use this pen .
I have ( 5 ) points to explain .
I have discuss the 1,2,3 etc. ..

O/P:

I can't use this pen.
I have (5) points to explain.
I have discuss the 1,2,3 etc...

最佳答案

Sentence来自 Simple API 的类,具有多个构造函数,one of which需要 List<String>论证。

所以你可以这样做:

List<String> words = new Sentence("I can't use this pen.").words();
Sentence output = new Sentence(words);

关于java - 斯坦福 CoreNLP 的去标记化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57571211/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com