gpt4 book ai didi

python - PCA训练模型然后回到原始特征空间

转载 作者:太空宇宙 更新时间:2023-11-03 13:57:55 24 4
gpt4 key购买 nike

我尝试用智能手机预测特殊运动。因此,我开发了一个应用程序,用于创建包含加速度、陀螺仪、磁场等的数据集。问题是,我真的不知道哪些是好的功能这就是我尝试使用 PCA 的原因

到目前为止没有问题

from sklearn.decomposition import PCA
pca = PCA(0.95) # i don't want to lose too much information

.. split recorded data in train and test samples

pc_test = pca.fit_transform(data_test)
pc_train = pca.fit_transform(data_train)

并将数据拟合到随机森林或岭回归等...

但现在我遇到的问题是,我所有经过训练的分类器都只能处理 PCA 转换后的数据。这意味着我必须在手机上进行 PCA 才能进行预期的预测。这是正确的方法还是我错过了什么?

我认为 PCA 就像一次性分析工具

最佳答案

首先,我不认为从一开始就设置静态方差比 0.95 总是一个好主意。保存尽可能多的信息(最多可达您最初拥有的所有维度)有时不会导致最好的结果/模型,因为您在这里尝试 PCA。我会尝试一系列方差比,例如:

import numpy as np
n_s = np.linspace(0.65, 0.85, num=21)
for n in n_s:
pca = PCA(n_components=n)
#...

并查看结果然后您可以将方差/分量数量(这会在模型中产生最高的准确度)设置为标量。这是机器学习中的一个重要点。对于你的问题:很可能你不会在手机上进行 PCA 甚至建模,你只会在最后使用生成的模型。只要您的计算硬件允许,您会希望训练数据集尽可能大(这会带来更好的准确性)。那个“高级”硬件不可能是你的手机。

关于python - PCA训练模型然后回到原始特征空间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49466213/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com