gpt4 book ai didi

python - Scikit-learn 自定义评分函数需要来自 X 和 y 以外的数据集的值

转载 作者:太空狗 更新时间:2023-10-30 00:10:42 26 4
gpt4 key购买 nike

我正在尝试根据其在历史体育博彩中的表现来评估模型。

我有一个包含以下列的数据集:

feature1 | ... | featureX | oddsPlayerA | oddsPlayerB | winner

模型将进行回归,其中输出是玩家 A 赢得比赛的几率

据我了解,我可以使用自定义评分函数返回模型在每次条件为真时下注时本应赚到的“钱”,并使用该值来衡量模型的适用性。条件类似于:

if prediction_player_A_win_odds < oddsPlayerA
money += bet_playerA(oddsPlayerA, winner)
if inverse_odd(prediction_player_A_win_odds) < oddsPlayerB
money += bet_playerB(oddsPlayerB, winner)

在自定义评分函数中,我需要接收常用参数,例如“ground_truth, predictions”(其中 ground_truth 是获胜者[],预测是 prediction_player_A_win_odds[])还有字段“oddsPlayerA”和“oddsPlayerB”来自数据集(这就是问题所在!)。

如果使用与原始数据集完全相同的顺序调用自定义评分函数,则从数据集中检索所需的额外数据将是微不足道的。但实际上,当使用交叉验证方法时,它获得的数据都是混合的(与原始数据相比)。

我尝试了最明显的方法,即使用 [oddsA, oddsB, winner](维度 [n, 3])传递 y 变量,但 scikit 不允许这样做。

那么,我怎样才能从数据集中获取既不是 X 也不是 y 但仍以相同顺序“捆绑在一起”的自定义评分函数?

最佳答案

抱歉,目前无法实际执行此操作。您可以在交叉验证折叠上编写自己的循环,这应该不会太难。您不能使用 GridSearchCVcross_val_score

执行此操作

关于python - Scikit-learn 自定义评分函数需要来自 X 和 y 以外的数据集的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26706314/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com