gpt4 book ai didi

machine-learning - SMOTE 过采样和交叉验证

转载 作者:行者123 更新时间:2023-11-30 08:27:20 28 4
gpt4 key购买 nike

我正在 Weka 中研究一个二元分类问题,数据集高度不平衡(一个类别 90%,另一个类别 10%)。我首先将 SMOTE ( http://www.cs.cmu.edu/afs/cs/project/jair/pub/volume16/chawla02a-html/node6.html ) 应用于整个数据集以均匀类别,然后对新获得的数据执行 10 倍交叉验证。我发现(过于?)F1 的乐观结果约为 90%。

这是由于过采样吗?对应用 SMOTE 的数据执行交叉验证是一种不好的做法吗?有什么办法可以解决这个问题吗?

最佳答案

我认为你应该首先将测试和训练的数据分开,然后仅在训练部分执行SMOTE,然后在没有合成示例的数据集部分测试算法,这会给你一个更好地了解算法的性能。

关于machine-learning - SMOTE 过采样和交叉验证,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31856326/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com