gpt4 book ai didi

tensorflow - 多个经过训练的模型与多个特征和一个模型

转载 作者:行者123 更新时间:2023-11-30 09:17:09 25 4
gpt4 key购买 nike

我正在尝试使用 tensorflow 构建基于回归的 M/L 模型。

我尝试根据以下内容估计对象的预计到达时间:

  • 与目标的距离
  • 距目标的距离(X 分量)
  • 距目标的距离(Y 分量)
  • 速度

物体在特定的旅程中移动。这可以表示为从 A->B 或从 A->C 或从 D->F(点 1 -> 点 2)。有 500 个特定旅程(一组点之间)。这些旅程并不完全是直线,并且每次旅程都是不同的(即所采取路线的形状)。

我有两种方法来解决这个问题:

  1. 我可以拥有 500 个不同的模型,具有 4 个特征和一个标签(训练 ETA 数据)。
  2. 我可以拥有 1 个包含 5 个功能和 1 个标签的模型。

我的困境是,如果我使用选项 1,这会增加复杂性,但会更加准确,因为每个模型都针对每个旅程。

如果我使用选项 2,模型将非常简单,但我不知道它是否能正常工作。我要添加的新功能是 originCode+ destinationCode。不幸的是,这些无法量化以产生任何数字意义或模式 - 它们只是定义旅程的文本(旅程 A->B,并且特征将是“AB”)。

是否有某种方法可以使用一个模型,并对功能进行分类,以便一个功能只是“分组”功能(以便将训练数据与旅程分开。

最佳答案

在机器学习中,我认为选项 2通常是更好的选择。我们更喜欢通用模型,而不是针对特定任务定制许多模型,因为这会危险地接近硬编码,而这正是我们试图通过使用 ML 来避免的!

我认为,根据可用的训练数据和模型大小,可以使用 one-hot 向量来描述模型的起点/终点。例如,假设我们有 5 个点(ABCDE),并且我们要从位置 B 到位置 C,这可以用向量表示:

0100000100

例如,前五个值对应于出发点,而后五个值对应于目的地。如果您想将输入特征空间减少到:

,也可以将它们组合起来:

01100

正如斯科特在评论中所说,还有其他事情需要考虑:

  • 您有多少数据?也许这样功能空间会太大,我不能确定。如果您有足够的数据,那么模型将直观地学习数据点之间的一般距离(不是实际距离,而是数据本身的距离)。如果您有足够的数据,您甚至可以在没有数据的两点之间进行准确预测!
  • 如果确实是因为没有足够的数据,那么寻找旅程的代表性特征就会派上用场,即。旅程的长度、旅程的形状、行驶的海拔等。此外,起点出发的距离度量也可能很有用。

祝你好运!

关于tensorflow - 多个经过训练的模型与多个特征和一个模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52728620/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com