gpt4 book ai didi

python - 分类结果取决于random_state?

转载 作者:行者123 更新时间:2023-11-30 09:25:42 26 4
gpt4 key购买 nike

我想使用 scikit-learn (sklearn) 实现 AdaBoost 模型。我的问题类似于another question但并不完全相同。据我了解, documentation 中描述的 random_state 变量用于根据之前的链接随机分割训练集和测试集。那么如果我理解正确的话,我的分类结果不应该依赖于种子,对吗?如果我的分类结果依赖于 random_state 变量,我是否应该担心?

最佳答案

您的分类分数将取决于random_state。正如 @Ujjwal 所说,它用于将数据分为训练和测试。不仅如此,scikit-learn 中的很多算法都使用 random_state 来选择特征子集、样本子集以及确定初始权重等。

例如。

  • 基于树的估计器将使用 random_state 随机选择特征和样本(例如 DecisionTreeClassifier、RandomForestClassifier)。

  • 在聚类估计器中,如 Kmeansrandom_state用于初始化簇中心。

  • SVM 使用它进行初始概率估计

  • 一些特征选择算法也使用它进行初始选择
  • 还有更多...

它在 documentation 中提到过那:

If your code relies on a random number generator, it should never use functions like numpy.random.random or numpy.random.normal. This approach can lead to repeatability issues in tests. Instead, a numpy.random.RandomState object should be used, which is built from a random_state argument passed to the class or function.

请阅读以下问题和答案以更好地理解:

关于python - 分类结果取决于random_state?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42476032/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com