gpt4 book ai didi

python - 如何在 clf.predict_proba(X_test) 中获得更多小数?

转载 作者:行者123 更新时间:2023-11-28 19:05:06 24 4
gpt4 key购买 nike

我有一个 pandas 数据框,用于二元分类案例(类别 A 和类别 B)。为了获得 X_train、X_test、y_train、y_test,我按 70:30 拆分,如下所示:

from sklearn.model_selection import train_test_split
target = pd.DataFrame(data['good'])
features = data.drop('good', axis=1)
X_train, X_test, y_train, y_test = train_test_split(features,
target,
test_size = 0.3,
random_state = 0)

然后我用这段代码做了 RandomForest 分类器

from sklearn.ensemble import RandomForestClassifier
clf = RandomForestClassifier(n_jobs=2, random_state=0)
model = clf.fit(X_train, y_train)

像往常一样,您可以通过执行 clf.predict(X_test) 来获得预测。它给出这样的 numpy.ndarray 对象

array(['0', '0', '1', '0', '0', '1', '0', '1', '1', '1'], dtype=object)

然后,我想通过clf.predict_proba(X_test)计算预测概率,结果是

array([[ 0.7  ,  0.3  ],
[ 0.8 , 0.2 ],
[ 0.4 , 0.6 ],
[ 0.8 , 0.2 ],
[ 0.5 , 0.5 ],
[ 0.1 , 0.9 ],
[ 0.5 , 0.5 ],
[ 0.3 , 0.7 ],
[ 0.3 , 0.7 ],
[ 0.5 , 0.5 ]])

我想在 clf.predict_proba(X_test) 输出中获得更多小数。 (我预计 3 位小数)例如,

array([[ 0.712  ,  0.288  ],
[ 0.845 , 0.155 ... etc

如果答案也将 clf.predict(X_test)clf.predict_proba(X_test) 转换并合并到 pandas dataframe 会更好,因为我会继续计算GINI指数。提前致谢

最佳答案

增加模型参数中的“n_estimators”(好像您已将其设置为默认值 10)。

关于python - 如何在 clf.predict_proba(X_test) 中获得更多小数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47940731/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com