gpt4 book ai didi

validation - Weka 是否在具有 10CV 的单独保留集上测试结果?

转载 作者:行者123 更新时间:2023-11-30 09:38:21 25 4
gpt4 key购买 nike

我在 Weka 中使用了 10 倍交叉验证。

我知道这通常意味着数据分为 10 个部分,90% 进行训练,10% 进行测试,并且交替 10 次。

我想知道 Weka 是如何计算得出的 AUC 的。是所有 10 个测试集的平均值吗?或者(我希望这是真的),它是否使用了保留测试集?我在 weka 书中似乎找不到对此的描述。

最佳答案

Weka 对测试结果进行平均。这是一个比坚持集更好的方法,我不明白你为什么希望采用这种方法。如果您保留测试集(多大大小?),您的测试不会具有统计显着性,它只会说,对于训练数据上的最佳选择参数,您在任意一小部分数据上取得了一些分数。交叉验证(作为评估技术)的要点是轮流使用所有数据作为训练和测试,因此得到的指标是真实评估措施的预期值的近似值。如果您使用保留测试,它不会收敛到预期值(至少不会在合理的时间内),更重要的是 - 您必须选择另一个常数(保留集有多大)为什么?)并减少用于训练的样本数量(由于训练和测试数据集较小的问题,开发了交叉验证)。

关于validation - Weka 是否在具有 10CV 的单独保留集上测试结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19098277/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com