gpt4 book ai didi

python - 机器学习分类数据集设置

转载 作者:太空宇宙 更新时间:2023-11-03 15:49:37 24 4
gpt4 key购买 nike

如果这个问题违反了SO的问题指南,我感到非常抱歉,但我被困住了,我找不到其他地方可以问此类问题。假设我有一个数据集,其中包含在三种不同条件(热、冷、舒适)下获得的三个实验数据。数据在由 4 列(时间、冷、舒适和热)组成的 pandas 数据框 中按三列排列。当我绘制数据时,我可以直观地看到三个实验的分离,但我想通过机器学习自动完成。x 轴代表时间,y 轴代表数据的幅度。我读过有关不同机器学习的文章 classification techniques但我不明白如何设置我的数据,以便我可以将其“输入”到分类算法中。也就是说,我的问题是:

  1. 这在编程上可行吗?
  2. 如何设置(排列我的数据)以便可以轻松地将其输入分类算法? From what I read so far看来,为了让算法发挥作用,数据必须按一定的顺序排列(例如,参见iris dataset,其中数据被很好地标记了。我如何自定义算法以满足我的需求?注意:理想情况下,我希望程序在给定一个幅度值的情况下,将该值分类热、舒适或冷。时间序列与我的情况没有多大相关性

最佳答案

当然这是可行的。

从原始帖子中尚不完全清楚您的模型可以使用哪些变量/功能,但这里有一些一般指导。所有这些机器学习问题,从分类到回归,都依赖于相同的核心假设,即您试图根据一堆输入来预测某些结果。通常这种关系的建模如下:y ~ X1 + X2 + X3 ...,其中 y 是结果(“因”)变量,X1 X2 等是特征(“解释”变量)。更简单地说,我们可以说,使用整个特征集矩阵 X (即包含所有 x 变量的矩阵),我们可以使用以下方法预测某些结果变量 y各种机器学习技术。

因此,就您的情况而言,您会尝试根据时间<来预测是舒适还是/。这实际上更像是一个预测问题,而不是一个机器学习问题,因为您有一个时间组件,它看起来是数据集中最重要(如果不是唯一)的特征之一。您可能想看看一些更简单的时间序列预测方法(例如 ARIMA)而不是 ML 算法,因为某些时间序列 ML 方法可能不太适合初学者。

无论如何,我认为这应该让您开始。

关于python - 机器学习分类数据集设置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41428972/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com