gpt4 book ai didi

machine-learning - 如何利用机器学习模型来处理新数据?

转载 作者:行者123 更新时间:2023-11-30 09:39:34 25 4
gpt4 key购买 nike

我是这个数据科学领域的新手。我有一个将随机森林应用于新数据的问题。

我有这张 table 。

Y prop_A prop_B
A 0.8 0.2
A 0.7 0.3
B 0.5 0.5
B 0.4 0.6
B 0.1 0.9

我认为如果该组的比例很高,那么它在该组中的可能性就很高。我使用随机森林构建了一个模型,并使用验证集(8/2 分割)对其进行测试。

我认为上述模型可以用于新数据。这是数据的一个例子。数据结构和变量含义相同,但变量个数不同。

Y prop_C prop_D prop_E prop_F
- 0.8 0.1 0.05 0.05
- 0.6 0.3 0.05 0.05
- 0.5 0.4 0.05 0.05
- 0.4 0.2 0.4 0
- 0.1 0.5 0.4 0.4

新数据未标记,因此我想使用我与以前的数据一起使用的随机森林来制作标签。标记新数据的方法正确吗?

在模型中,它不起作用(由于自变量不同)。

我应该如何根据使用不同标记数据的模型来标记新数据?

最佳答案

自变量和变量的个数应该相同。如果你想尝试一下,只需省略(prop_E和Prop_F)并将(prop_C和Prop_D)重命名为(prop_A和Prop_B),它就会起作用

关于machine-learning - 如何利用机器学习模型来处理新数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59623813/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com