gpt4 book ai didi

machine-learning - 如何获取OpenNLP模型的训练数据集?

转载 作者:行者123 更新时间:2023-11-30 08:37:14 25 4
gpt4 key购买 nike

我正在使用以下 OpenNLP 模型:

en-parser-chunking.bin
en-ner-person.bin
en-ner-location.bin
en-ner-organization.bin

我想将我的数据附加到训练这些模型的训练数据集中。那么请告诉我从哪里可以获得原始数据集?

最佳答案

official OpenNLP manual分块训练部分提到了用于训练 EN 语言模型文件的原始数据的引用:

The training data can be converted to the OpenNLP chunker training format, that is based on CoNLL2000.

您还可以找到其他引用资料,例如,第 12 章语料库,涉及 OpenNLP 中使用的外部资源。

此外,CoNLL2003 语料库可能令人感兴趣:

The English data is the Reuters Corpus, which is a collection of news wire articles. The Reuters Corpus can be obtained free of charges from the NIST for research purposes: http://trec.nist.gov/data/reuters/reuters.html

希望有帮助。

关于machine-learning - 如何获取OpenNLP模型的训练数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42003560/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com