gpt4 book ai didi

machine-learning - 通过创建自己的标签进行监督学习

转载 作者:行者123 更新时间:2023-11-30 09:42:40 24 4
gpt4 key购买 nike

场景 - 我的数据没有标签,但我可以创建一个函数来根据行为标记数据并部署模型,这样我就不必继续标记数据。这算不算机器学习?

目标:根据高、中、低标签对交易量峰值的帐户进行分类,以部署在大数据(数万亿行数据)上

数据:我拥有的数据包括以下属性:帐户、时间、日期、交易量。

方法:

  1. 创建一个名为“spike”的新特征列,并创建一个 pandas 函数来 ID 大于 5 的尖峰。这是特征工程吗?

  2. 接下来,我创建标签列并将其分类为低、中或高尖峰。

  3. 接下来,我训练一个机器学习分类器,并将其部署为在大数据中使用类似模式标记 future 的帐户。

对这个过程有什么想法吗?这种方法对于机器学习是否正确?

最佳答案

第一个问题:如果您的算法根据您拥有的样本集做出决定,即在样本中添加标签,我会说它是机器学习算法。但如果你设计的代码考虑了你对数据的经验,我认为它不是机器学习方法。简而言之,机器学习会查看数据以从中获取模式和见解。我不知道你为什么要这样做,但它需要是一个机器学习算法吗?有时您可以通过非常简单的方式解决问题,而无需使用机器学习。

第二个问题:恐怕不是。选择您的数据属性(例如:帐户、时间、日期、交易量),检查它们的相关性,尝试找出您是否具有主导属性等。此过程是机器学习之前的过程。特征工程将选择向我们的算法呈现的最佳特征,以便执行分类(根据您的情况)

第三个问题:我认为开始使用一些机器学习算法是足够公平的,例如 KNN、SVM、NN、决策树等。

关于machine-learning - 通过创建自己的标签进行监督学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56782289/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com