gpt4 book ai didi

python - 预测建模 - 使用分组 ID 和移动平均值进行回归(python)

转载 作者:太空宇宙 更新时间:2023-11-04 05:21:14 24 4
gpt4 key购买 nike

我遇到了预测建模问题。希望有人有时间可以帮助我。起始位置如下图所示。 S1-S2 是传感器测量值,RUL 是我的目标值。

数据结构:

id period s1       s2       s3        RUL
1 1 510.23 643.43 1585.29 6
1 2 512.34 644.89 1586.12 5
1 3 514.65 645.11 1587.99 4
1 4 512.98 647.59 1588.45 3
1 5 516.34 649.04 1590.65 2
1 6 518.12 652.62 1593.09 1
2 1 509.77 640.61 1584.91 9
2 2 510.26 642.06 1586.00 8
2 3 511.95 643.62 1588.09 7
2 4 513.51 646.51 1589.45 6
2 5 512.17 648.06 1589.54 5
2 6 515.56 646.11 1586.22 4
2 7 518.78 649.34 1586.96 3
2 8 519.90 650.30 1588.95 2
2 9 521.05 651.39 1591.34 1
3 1 501.11 653.99 1580.45 8
3 2 511.45 643.23 1584.09 7
3 3 505.45 643.78 1586.11 6
3 4 504.45 643.43 1588.34 5
3 5 506.45 643.71 1589.89 4
3 6 511.45 643.33 1591.21 3
3 7 516.45 643.61 1592.42 2
3 8 518.45 643.05 1596.77 1

目标:

我的目标是预测未见数据的剩余有用实时 (RUL)。在这种情况下,我只有一种具有不同 ID 的机器(这意味着 1 种类型和 3 种不同的物理系统)。对于预测,id 并不重要,因为它是同一台机器。此外,我想添加新功能。 s1 s2 和 s3 的移动平均线。所以我必须添加三个新列,名称分别为 a1、a2 和 a3。

例如,a1 应该是这样的:

a1
NaN
NaN
512.41
513.32
514.66
515.81
NaN
NaN
510.66
511.91
512.54
513.75
515.50
518.08
519.91
NaN
NaN
506.00
507.12
505.45
507.45
511.45
515.45

下一个问题是,我无法使用 NaN,因为它是一个字符串。对于 a1、a2 和 a3,我如何忽略/使用它?

下一个问题是:如何使用 RandomForest 和 Bagged Decision Trees 等回归模型和 train_test_split 来预测看不见的新数据的 RUL? (当然我需要更多数据,这个例子只给出了结构。)[s1]、[s2]、[s3] 是我的输入,RUL 是输出。此外,我想用平均绝对误差、均方误差和 R² 评估模型。

最后想用gridsearch的方法进行调优

谢谢:

提前致谢。我知道我想做什么,但我无法用 python 实现它。完整的代码将是完美的。

最佳答案

解决这个问题的标准方法是通过插补。 SciKitLearn 有一个内置的插补包。文档在这里:http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.Imputer.html

有 3 种替换 NaN 的策略:
1) 用列的平均值替换它
2)用列的模式替换它
3) 用列的中位数替换它

用法示例如下所示:

from sklearn.preprocessing import Imputer
imp = Imputer(strategy = 'mean', axis = 1)
a1 = Imputer.fit_transform(a1, strategy = 'mean')

此处还有使用示例:http://scikit-learn.org/stable/modules/preprocessing.html#imputation

关于python - 预测建模 - 使用分组 ID 和移动平均值进行回归(python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40221646/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com