gpt4 book ai didi

r - 种子值会影响 R 中训练数据的结果吗?

转载 作者:行者123 更新时间:2023-11-30 09:01:08 25 4
gpt4 key购买 nike

我正在尝试创建一个模型,将我的数据分为训练(70%)、验证(15%)和测试(15%)集。运行模型后,我得到了一些准确性(ROC)和一些值(value)我的混淆矩阵。但是每次我不断改变种子值,它都会影响我的输出。我该如何解决这个问题?这是预期的行为吗?如果是这样,我怎样才能得出选择哪个值作为最终输出的结论?

最佳答案

set.seed() 定义生成随机值的起点。使用相同的种子运行分析应该返回相同的结果。使用不同的种子可能会导致不同的输出。在您的情况下,可能是因为训练、验证和测试的划分不同。

如果差异很小,可以接受,那么您的模型对于训练、测试和验证中的不同分割来说是稳健的。如果差异很大,则您的模型不稳健,不值得信任。您将必须更改数据的分割方式(分层可能会有所帮助)或修改模型。

关于r - 种子值会影响 R 中训练数据的结果吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36174185/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com