gpt4 book ai didi

weka - 在分类之后但在评估之前添加 weka 实例?

转载 作者:行者123 更新时间:2023-12-04 13:00:07 28 4
gpt4 key购买 nike

假设 X是原始的、标记的(即带有训练标签的)数据集,并且 Process(X)返回一组 Y实例
已用属性编码并转换为像 Y.arff 这样的对 Weka 友好的文件。

还假设Process()有一些“泄漏”:
一些实例 Leak = X-Y无法一致编码,需要
获取默认分类 FOO .训练标签也以泄漏集而闻名。

我的问题是如何最好地将 Leak 中的实例引入到
weka 评估流在一些分类器被应用到
子集Y , 折叠 Leak具有默认值的实例
分类标签,在对整个集合进行评估之前 X ?在代码中:

DataSource LeakSrc = new DataSource("leak.arff");
Instances Leak = LeakSrc.getDataSet();
DataSource Ysrc = new DataSource("Y.arff");
Instances Y = Ysrc.getDataSet();
classfr.buildClassifer(Y)
// YunionLeak = ??
eval.crossValidateModel(classfr, YunionLeak);

也许这是将结果折叠在一起的具体示例
来自多个分类器?

最佳答案

赏金即将结束,但马克·霍尔在另一个论坛上(
http://list.waikato.ac.nz/pipermail/wekalist/2015-November/065348.html ) 应该算作当前的答案:

您需要为交叉验证构建分类器
在你的代码中。您仍然可以使用评估对象来计算统计数据
你修改后的测试折叠了,因为它计算的统计数据都是
添加剂。 Instances.trainCV() 和 Instances.testCV() 可用于创建
褶皱:

http://weka.sourceforge.net/doc.stable/weka/core/Instances.html#trainCV(int,%20int,%20java.util.Random)

然后你可以调用 buildClassifier() 来处理每个训练折叠,修改
测试折叠到你的心内容,然后迭代实例
在测试折叠中同时使用 Evaluation.evaluateModelOnce()
或 Evaluation.evaluateModelOnceAndRecordPrediction()。后面的版本是
如果您需要曲线汇总指标下的面积(因为这些
需要保留预测)。

http://weka.sourceforge.net/doc.stable/weka/classifiers/Evaluation.html#evaluateModelOnce(weka.classifiers.Classifier,%20weka.core.Instance)

http://weka.sourceforge.net/doc.stable/weka/classifiers/Evaluation.html#evaluateModelOnceAndRecordPrediction(weka.classifiers.Classifier,%20weka.core.Instance)

关于weka - 在分类之后但在评估之前添加 weka 实例?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33402003/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com