gpt4 book ai didi

mahout - 创建 mahout 模型时出错

转载 作者:行者123 更新时间:2023-12-01 06:36:40 28 4
gpt4 key购买 nike

我正在为我的数据训练 mahout 分类器,
按照我发出的创建 mahout 模型的命令

./bin/mahout seqdirectory -i /tmp/mahout-work-root/MyData-all -o /tmp/mahout-work-root/MyData-seq

./bin/mahout seq2sparse -i /tmp/mahout-work-root/MyData-seq -o /tmp/mahout-work-root/MyData-vectors -lnorm -nv -wt tfidf

./bin/mahout split -i /tmp/mahout-work-root/MyData-vectors/tfidf-vectors --trainingOutput /tmp/mahout-work-root/MyData-train-vectors --testOutput /tmp/mahout-work-root/MyData-test-vectors --randomSelectionPct 40 --overwrite --sequenceFiles -xm sequential

./bin/mahout trainnb -i /tmp/mahout-work-root/Mydata-train-vectors -el -o /tmp/mahout-work-root/model -li /tmp/mahout-work-root/labelindex -ow

当我尝试使用 trainnb 命令创建模型时,出现以下异常:
Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 1 at org.apache.mahout.classifier.naivebayes.BayesUtils.writeLabelIndex(BayesUtils.java:119) at org.apache.mahout.classifier.naivebayes.training.TrainNaiveBayesJob.createLabelIndex(TrainNaiveBayesJob.java:152)
这里可能有什么问题?

注意:提到的原始示例 here工作正常。

最佳答案

我认为这可能是你如何放置训练文件的问题。
文件应按如下方式组织:

MyData-All

\类A

 -file1
-file2
-...

\classB
 -filex

....

关于mahout - 创建 mahout 模型时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14151877/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com