gpt4 book ai didi

machine-learning - k-最近邻算法

转载 作者:行者123 更新时间:2023-11-30 09:13:29 25 4
gpt4 key购买 nike

我正在我的智能设备上实现 k-最近邻算法,以便从识别数据中识别人类事件。我将解释我将如何实现它。你们能否对我正在采取的步骤提出任何改进建议,并回答我在途中可能提出的任何问题?

步骤如下:

  1. 我下载了 labelled dataset它由加速度计的三轴加速度以及描述事件的标签组成。我将仅选择此数据集中的一些我希望识别的事件数据(在我的例子中行走、坐着、站立)。
  2. 然后,我将从加速度计数据的每个窗口(即包含 128 个加速度计数据读数的数据集中的每个记录)中提取特征(在我的例子中,加速度计的平均值、最小值、最大值、标准偏差)我将把这些特征与窗口标签(作为一条记录)一起以 JSON 格式存储在设备上的文本文件中。因此,训练数据集中的一个记录/样本将包含:平均值、最小值、最大值、标准差和标签
  3. 在分类步骤中,从收集的数据中,我还将获得一个加速度计数据窗口,我可以从中提取上述 4 个特征。因此我需要将收集数据的 4 个特征与训练数据中的每个样本进行比较。由于一条记录包含 4 个特征,我该如何找到它们之间的相似性?

作为第(3)点问题的解决方案,我正在考虑通过计算每个特征之间的差异来获取每个特征的k-最近邻,然后从每个特征中挑选出大多数特征。请问您觉得怎么样?您能提出一些优化建议吗?谢谢:)

最佳答案

非常有趣的应用程序! ;-)

嗯,问题之一当然是知道何时开始和停止计算这些功能,但我想您已经对此有了一些解决方案(固定时间窗口或按钮......)。你当然可以使用 knn 分类器来做到这一点,但这肯定不是我的第一选择,因为它对异常值非常敏感(如果你的测量在一次训练中搞砸了,它将永远影响你的下一个分类) 。所以我宁愿选择高斯模型:

  1. 为每个事件记录大约 10 到 20 个示例(即 4 个值的向量)
  2. 计算每个事件的均值向量和对角协方差矩阵
  3. 在测试时,您计算新观察到的向量由三个高斯模型之一生成的高斯似然,并选择具有最大似然的事件。

关于machine-learning - k-最近邻算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15566423/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com