gpt4 book ai didi

machine-learning - 使用机器学习来估计给定数据流中偶数发生的可能性

转载 作者:行者123 更新时间:2023-11-30 09:11:21 25 4
gpt4 key购买 nike

我有一个由系统生成的数据流(例如 3D 位置),如下所示:

(pos1, time1) (Pos2, time2) (pos3, time3) ...

我想使用机器学习技术来估计(或检测)给定数据流中特定事件的可能性。我做了什么:

  1. 如果事件发生在该帧,我会在每一帧用 YES 标记我的数据,否则将其设置为 NO。

(pos1, time1, NO) (Pos2, time2, Yes) (pos3, time3, NO) ...(posK, timeK, Yes)...

  • 设置像L这样的窗口长度,通过给出L个连续帧来训练模型,并且相应的标签由该窗口上最后一个元素的标签设置:<
  • (位置1,位置2,位置3,否)(位置 2、位置 3、位置 4、否)(位置 3、位置 4、位置 5、否)...(posK-2、PosK-1、posK、是)...

  • 最后,我用这套方法训练了我的模型。
  • 为了测试,我连接 L 个连续帧,并要求模型找到这组数据的相应标签(例如"is"或“否”)。
  • 我意识到“NO”的出现频率比“YES”要高得多。原因很简单,因为系统大部分时间都处于空闲状态,我没有任何事件。所以会影响训练。

    你能给我一些提示吗:1)什么类型的机器学习模型最适合这个问题。2)目前我正在对输出进行"is"或“否”分类,但我希望了解该事件随时发生的概率。您建议使用哪种型号?

    谢谢

    最佳答案

    我认为这里实际上有两个问题:如何构建数据集以及使用哪个预测器。

    为了构建数据集,在某个时间点i,请确保选择i之前发生的实例i em> (您问题中的措辞让人觉得您正在选择包含 i 的选项)。不过,结果的标签应该是 i 处的标签。毕竟,您试图根据现在来预测 future ,不是吗?根据现在来预测现在是相当容易的。

    还有一点就是如何选择,甚至是否选择单个。请注意,如果您选择多个不同的 值,那么您将得到一个多元模型。

    最后,您直接问的问题是使用哪个预测器。如果不知道你的数据集(并使用它),这个问题太宽泛了,无法回答。您可能想了解 bias-variance tradeoff了解为什么某些问题没有“最佳”预测器。

    话虽如此,我建议您从 logistic regression 开始这是一个简单而强大的分类器,还输出概率(如您所要求的)。

    关于machine-learning - 使用机器学习来估计给定数据流中偶数发生的可能性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36238343/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com