gpt4 book ai didi

python - float 分类器

转载 作者:行者123 更新时间:2023-11-30 09:47:05 24 4
gpt4 key购买 nike

我的数据集包含 1 个特征和 N 个样本。我试图从“功能”列预测下面的“目标”列。所有值都是 1 到 4 之间的 float :例如 1.2、2.2 等

target     feature    
0.0 0.0
6.0 8.0
7.2 1.0
2.3 2.0
1.1 5.0
5.0 1.0
0.0 0.0
0.0 1.0
0.0 0.0

我正在使用 scikit-learn。我得到的错误是(使用 DecisionTreeClassifier 或 RandomForest):

ValueError("Unknown label type: %r" % y_type)
ValueError: Unknown label type: 'continuous'

我无法让任何分类器来处理这些数据,除非我将它们转换为字符串或整数。​但是,我需要能够预测这些小数点​,所以这不是一个选项。

​我是机器学习的初学者,想确保我在这个过程中不会犯任何愚蠢的错误。

  • 首先:将这些 float 转换为字符串并简单地对这些字符串运行分类器是否正确? (例如,随机森林...)此方法有哪些注意事项?
  • 我可以在 float 上运行哪些分类器?
  • 我应该使用回归器吗?

​谢谢!​

最佳答案

我相信您将分类问题误认为是回归问题。如果您想要预测的最终标签也是浮点值,那么我猜您将回归问题误认为是分类问题。

此外,您不能简单地将 float 转换为字符串,因为

  • 将它们转换为字符串会将它们转换为分类值,这是完全错误的,因为底层数据模式只会丢失。

  • 此外,浮点值是数值,应该属于某种序列。将它们更改为字符串必然会导致在转换过程中丢失此信息。

  • 此外,大多数分类器将分类变量转换为某种编码(例如 one-hot 编码)。将浮点值转换为字符串,然后转换为另一种编码会引入不必要的噪音(除了算法错误之外)

几乎所有分类器都可以处理 float 数据。但是,它们可能不适用于您的情况,因为这是一个回归问题而不是分类问题。以下是 K-means 的实现, SVCRandom forest在具有 float 数据的 iris 数据集上,但这是一个分类问题。

尝试使用任何回归器,你会发现你的问题取得了一些成功

关于python - float 分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51226450/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com