gpt4 book ai didi

python - 是否有 R 的 h2o.stack 的 python 等价物?

转载 作者:太空宇宙 更新时间:2023-11-04 02:46:16 25 4
gpt4 key购买 nike

我正在与堆叠学习者一起工作。根据 H2OStackedEnsembleEstimator 的文档h2o 的 python 实现允许您轻松构建集成模型。然而,这仅限于使用相同的基础训练数据构建基础分类器。我有基于时间的功能,其最短日期因数据源而异。每个数据样本都是一个时间点。为了尽可能多地利用数据,我将特征分成两组(取决于相关性和最短日期)并训练两个单独的模型。我想结合这些模型,但 H2OStackedEnsembleEstimator 要求功能相同。

根据 this post关于 R 的堆叠集成实现,有一个选项可以只执行元学习步骤,这应该只需要每个基本模型和真实目标值的 k 折交叉验证预测。

万一有人想到了...对于我的特定问题,我意识到我将在元学习步骤中遇到一个问题,因为最小日期不匹配,我有办法避免这个问题。

最佳答案

对于Super Learner算法(堆叠这样你就可以使用基础学习者的交叉验证预测值作为元学习者的训练数据),唯一的要求是基础学习者必须在相同的行上进行训练——列可以不同。堆叠有一种变体,我们称之为"Holdout Stacking" ,您可以在 holdout 数据集上对基本模型进行评分,然后使用这些预测来训练元学习器。在这种情况下,您可以为基础学习器使用完全不同的训练框架。

当前Stacked Ensembles H2O 中的实现有一个限制,即整个训练框架(行和列)对于基础学习者必须相同,但我们 will relax that requirement将来(因为它不是真正需要的)。

在我们将 Stacked Ensembles 移至 H2O 的 Java 后端之前,我仅使用 h2o Python 模块在 Python 中编写了一个简单的引用实现。目前,您可能可以相当轻松地修改该代码以获得您正在寻找的 Stacked Ensemble 类型。这是要点 here .

关于python - 是否有 R 的 h2o.stack 的 python 等价物?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45061890/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com