gpt4 book ai didi

validation - Weka 中的交叉验证

转载 作者:行者123 更新时间:2023-12-03 09:41:38 29 4
gpt4 key购买 nike

我一直认为从我读到的交叉验证是这样执行的:

In k-fold cross-validation, the original sample is randomly partitioned into k subsamples. Of the k subsamples, a single subsample is retained as the validation data for testing the model, and the remaining k − 1 subsamples are used as training data. The cross-validation process is then repeated k times (the folds), with each of the k subsamples used exactly once as the validation data. The k results from the folds then can be averaged (or otherwise combined) to produce a single estimation



因此构建了 k 个模型,最后一个是这些模型的平均值。
在 Weka 指南中写道,每个模型始终使用所有数据集构建。那么 Weka 中的交叉验证是如何工作的呢?模型是从所有数据构建的,“交叉验证”意味着创建了 k 个折叠,然后对其进行评估,最终输出结果只是折叠的平均结果?

最佳答案

所以,这又是一个场景:你有 100 个标记数据

使用训练集

  • weka 将取 100 个标记数据
  • 它将应用一种算法从这 100 个数据中构建分类器
  • 它再次应用该分类器
    这100条数据
  • 它为您提供了
    分类器(应用于与它相同的 100 个数据)
    开发)

  • 使用10折简历
  • Weka 取 100 个标记数据
  • 它产生 10 个相同大小的集合。每组分为两组:90 个标记数据用于训练,10 个标记数据用于测试。
  • 它使用 90 个标记数据的算法生成分类器,并将其应用于集合 1 的 10 个测试数据。
  • 它对集合 2 到 10 执行相同的操作并产生 9 个以上的分类器
  • 它平均了从 10 个相同大小(90 个训练和 10 个测试)集产生的 10 个分类器的性能

  • 如果这能回答您的问题,请告诉我。

    关于validation - Weka 中的交叉验证,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10437677/

    29 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com