gpt4 book ai didi

machine-learning - 分类:添加一个新变量并计算改变类输出的概率

转载 作者:行者123 更新时间:2023-11-30 09:11:42 29 4
gpt4 key购买 nike

我有 2 个基于多个数字特征(例如 v1….v20)的输出类别(好和差)。

如果 v1、v2、v3 和 v4 为“高”,则该类别为“差”。如果 v1、v2、v3 和 v4 为“低”,则该类别为“好”

我能够使用 ROC 获得良好的准确性,并使用随机森林获得最小分类误差。但是,我想添加一个新变量 v21。我从经验中知道,如果这个变量(v21)的值很高,即使v1、v2、v3和v4很高,这个类也可能不是“差”。当变量 v21 较高时,获得“差”类别的概率较低(尽管变量 v1、v2、v3 和 v4 较高)。

1)如何在分类中利用我对 v21 的了解来提高准确性?哪种分类技术合适?2)由于我有符合我理解的真实数据,无论如何,我可以计算出当v21的值较高以及v1、v2、v3和v4的值较高时获得“差”类的概率吗?

最佳答案

贝叶斯概率允许通过选择先验分布来合并您的先验信念和知识。

https://en.wikipedia.org/wiki/Prior_probability

这样,您的实际数据将与先前的信念合并,形成最终的后验分布。

因此,在这种情况下,您的先前分发应包含以下信息:

P(myclass =poor|v1,v2,v3,v4) is high
P(myclass =poor|v21) is low

关于machine-learning - 分类:添加一个新变量并计算改变类输出的概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34817055/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com