gpt4 book ai didi

machine-learning - Azure ML - 在数据集的各个部分上训练模型

转载 作者:行者123 更新时间:2023-11-30 09:15:44 24 4
gpt4 key购买 nike

我真的需要一些帮助!

我工作的公司由 52 个截然不同的业务组成,因此我无法在公司层面进行预测,而是需要逐个业务进行预测,然后汇总结果以提供全公司范围的预测。

我在 studio.azureml.net 中编写了一个 ML 模型它在 0.947 的决定系数下效果很好,但这适用于其中 1 个企业。我现在需要为其他 51 个训练模型。

有没有办法在单个 ML 模型中实现此目的,而不必创建 52 个非常相似的模型?

任何帮助将不胜感激!!!

亲切的问候马丁

最佳答案

您可以使用集成,组合多个模型来改进预测。最直接的是当所有模型的输出都在整个数据集上训练时进行堆叠。我认为最适合您的问题的方法是装袋(引导聚合)。您需要将训练集划分为不同的子集(每个子集对应某个业务),然后在每个子集上训练不同的模型,并合并每个分类器的结果。另一种方法是 boosting,但在 Azure ML 中很难实现。您可以在 Azure ML Gallery 中查看示例。 。

引自书中:

Stacking and bagging can be easily implemented in Azure Machine Learning, but other ensemble methods are more difficult. Also, it turns out to be very tedious to implement in Azure Machine Learning an ensemble of, say, more than five models. The experiment is filled with modules and is quite difficult to maintain. Sometimes it is worthwhile to use any ensemble method available in R or Python. Adding more models to an ensemble written in a script can be as trivial as changing a number in the code, instead of copying and pasting modules into the experiment.

您还可以查看sklearn (Python)和插入符 (R) 文档以获取更多详细信息。

关于machine-learning - Azure ML - 在数据集的各个部分上训练模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56364828/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com