gpt4 book ai didi

machine-learning - 如果我没有所有数据,如何创建特征向量?

转载 作者:行者123 更新时间:2023-11-30 09:31:16 26 4
gpt4 key购买 nike

因此,对于我要分类的每件“事物”,我有:{房屋、公寓、平房、电加热、燃气加热、... }

这将被制成特征向量:{1,0,0,1,0,...} 这意味着房子是用电供暖的。

对于我的训练数据,我将拥有所有这些数据 - 但对于我想要分类的实际事物,我可能只有它是什么样的房子,以及其他一些东西 - 不是所有数据,即。{1,0,0,?,?,...}

那么我该如何表示呢?

我想找出新元素被燃气加热的概率。

我将使用 SVM 线性分类器 - 我没有任何核心可展示,因为目前这纯粹是理论上的。任何帮助将不胜感激:)

最佳答案

当我读到这个问题时,您似乎对功能和标签感到困惑。

你说你想预测一个新项目是否是“gasHeated”,那么“gasHeated”应该是一个标签而不是一个特征。

顺便说一句,处理缺失值的最常见方法之一是将其设置为“零”(或一些未使用的值,例如-1)。但通常情况下,您应该在训练数据和测试数据中都存在缺失值,以使此技巧有效。如果这种情况只发生在你的测试数据中,而没有发生在你的训练数据中,则说明你的训练数据和测试数据不是来自同一个分布,这基本上违反了机器学习的基本假设。

关于machine-learning - 如果我没有所有数据,如何创建特征向量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56994794/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com