gpt4 book ai didi

machine-learning - 特征分布接近正态 : what does that imply for my ML model?

转载 作者:行者123 更新时间:2023-11-30 08:42:24 24 4
gpt4 key购买 nike

我的练习的陈述是这样的:feature_3 的分布暗示了数据是如何生成的。我尝试了解我应该从中推断出我的 ETL 或 ML 模型的其余部分。

我已经绘制了该特征的 Q-Q 图。分布看起来相当正常。对于我的 ETL 或 ML 模型的其余部分,我可以从这些信息中推断出什么?

最佳答案

大多数机器学习模型都假设有一个基础数据分布,以便它们能够正常运行。

所以,回到你的问题,有一些ML技术假设输入它们的数据是正态(或高斯)分布的。这些是高斯朴素贝叶斯、基于最小二乘(回归)模型、LDA、QDA。因此,您所指的陈述意味着您的数据是使用此类算法生成的并且呈正态分布。请参阅,here对此的简要视觉解释和 here了解正态分布在机器学习中的重要性。

此外,请注意还有其他算法(例如用于回归/分类的SVM随机森林决策树梯度提升树等)不假设任何类型的底层数据分布。

关于machine-learning - 特征分布接近正态 : what does that imply for my ML model?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54071893/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com