gpt4 book ai didi

machine-learning - 在一组相关变量中,如何推断出哪个变量子集最能描述其余变量?

转载 作者:行者123 更新时间:2023-11-30 08:46:38 25 4
gpt4 key购买 nike

我有一个包含 60 个传感器的数据集,可进行 1684 次测量。我希望减少实验过程中使用的传感器数量,并使用剩余的传感器数据来预测(使用机器学习)移除的传感器。

我查看了数据(参见 image )并发现了传感器之间的几个强相关性,这应该使得可以移除 X 传感器并使用剩余的传感器来预测它们的行为。

如何对哪组传感器 (X) 最好地预测剩余组 (60-X) 进行“评分”?

最佳答案

您熟悉主成分分析(PCA)吗?它是方差分析 (ANOVA) 的子项。 降维是描述此过程的另一个术语。

这些通常针对预测单个输出的一组输入,而不是一组对等测量。为了使您的案例适应这些方法,我认为您需要首先考虑 60 个传感器中的每一个,依次将其视为“基本事实”,看看哪些传感器可以由其余传感器最可靠地驱动。删除这些并重复该过程,直到达到所需的相关性阈值。

我还建议采用遗传方法来进行筛选;也许随机森林在这个阶段会有所帮助。

关于machine-learning - 在一组相关变量中,如何推断出哪个变量子集最能描述其余变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41450727/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com