- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想知道 GridSearchCV
返回的分数与按如下方式计算的 R2
指标之间的差异。在其他情况下,我收到的网格搜索分数非常负(同样适用于 cross_val_score
),我将不胜感激解释它是什么。
from sklearn import datasets
from sklearn.model_selection import (cross_val_score, GridSearchCV)
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import accuracy_score, r2_score
from sklearn import tree
diabetes = datasets.load_diabetes()
X = diabetes.data[:150]
y = diabetes.target[:150]
X = pd.DataFrame(X)
parameters = {'splitter':('best','random'),
'max_depth':np.arange(1,10),
'min_samples_split':np.arange(2,10),
'min_samples_leaf':np.arange(1,5)}
regressor = GridSearchCV(DecisionTreeRegressor(), parameters, scoring = 'r2', cv = 5)
regressor.fit(X, y)
print('Best score: ', regressor.best_score_)
best = regressor.best_estimator_
print('R2: ', r2_score(y_pred = best.predict(X), y_true = y))
最佳答案
regressor.best_score_
是最佳参数组合的遗漏测试折叠的 r2 分数的平均值。
在您的示例中,cv=5,因此数据将分为训练和测试折叠 5 次。该模型将安装在火车上并在测试中评分。这5个考试成绩取平均得到分数。请看documentation :
"best_score_: Mean cross-validated score of the best_estimator"
对所有参数组合重复上述过程。并将其中最好的平均分分配给 best_score_
。
可以看看at my other answer完成 GridSearchCV 的工作
找到最佳参数后,模型在完整数据上进行训练。
r2_score(y_pred = best.predict(X), y_true = y)
与训练模型的数据相同,因此在大多数情况下,它会更高。
关于python - 解读 sklearns 的 GridSearchCV 最好成绩,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50232599/
我正在尝试在 JavaScript 中创建一个正则表达式搜索,它会接受以下等级中的一个:A、B+、B、C+、C、D、F、AF 或 WF。 我有以下正则表达式:^A-?|[BCD][+-]?|[AW]?
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。它不符合 Stack Overflow guidelines 。它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题
我正在制作一个学生数据库,其中包含类(class) ID、类(class)名称、每门类(class)的学分、通过/失败声明和成绩。我的目标是让按钮显示总和(成绩)/总和(学分) 这是我编写的代码,它给
我正在努力弄清楚如何实现这个计数。模型是用户、测试、等级 用户 has_many 测试,测试 has_many 成绩。 每个等级都有一个计算分数(strong_pass、pass、fail、stron
我是一名优秀的程序员,十分优秀!