gpt4 book ai didi

machine-learning - 如果我的分类变量数量不固定,则无法为我的模型准备训练数据

转载 作者:行者123 更新时间:2023-11-30 08:39:33 25 4
gpt4 key购买 nike

我正在尝试解决工厂合并订单中包含的产品的回归问题。

我有合并工厂合并一个订单所花费的总时间。现在问题来了。

当两种不同2数量的产品合并在一起时,它们需要一定的时间才能合并。但有时一个订单中有两种以上不同2数量的产品,合并工厂正在合并该订单。

我有工厂合并的每个订单所花费的总时间。合并中心要合并的产品数量可以是1到n中的任意一个。

如何为我的模型准备训练数据来理解这一点?

 ProductCode ProdQty  x1           1                x2           4                

上面的示例花费了 143 小时

 ProductCode ProdQty  x1           1                x2           4     x3           7           

上面的示例现在花费了 200 小时。

现在,在第一个示例中,合并中心花费了 143 小时,其中有两种不同数量的产品,而在第二个示例中,有 3 个产品参与,花费了 200 小时。

如何准备训练数据,以便我的模型能够理解它,并且我可以预测工厂需要多长时间?

我还有很多其他功能,但这是特定于订单的,但我知道如何处理。

最佳答案

像这样:

x1 x2 x3 x4 ... xn y
1 4 0 0 0 143
1 4 7 0 0 200

这里,因变量 y(每个包组合在一起所需的时间)是进入该包的所有 x 数量的函数。您的目标是回归单个数量的包装时间。在训练数据的第一行中,x3x4 等值均为零,因为它们不按顺序出现,需要 143 小时准备。在第二行中,x4x5 等值均为零,因为它们不是按顺序出现的,而准备时间为 200 小时。

您现在可以对所有 x 值运行 y 回归,当有人说“我有一个 10 x5 的新订单时、 2 x3 和 7 x7,您只需将这三个数字代入估计方程即可得出所需的预测 y

希望能够解答您的数据问题。如果您需要对此结构进行任何澄清或修改,请发表评论。

<小时/>

添加:

如果您有影响打包时间的额外变量,您也可以将它们添加为列。假设您想使用温度、收到订单的时间、 worker 数量以及仓库经理是谁(刚刚化妆)来预测包装时间。你可以这样做:

x1 x2 x3 x4 ... xn temp orderTime workers manager y
1 4 0 0 0 20 5AM 5 John 143
1 4 7 0 0 30 11AM 3 George 200

当然,其中一些新功能需要模型化、分类等;而您的原始 x 数量只是连续变量。

关于machine-learning - 如果我的分类变量数量不固定,则无法为我的模型准备训练数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54811408/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com