gpt4 book ai didi

machine-learning - 云标签影响测试准确性百分比?

转载 作者:行者123 更新时间:2023-11-30 09:06:07 26 4
gpt4 key购买 nike

我有 96 个特征,标签由 1 和 -1 表示,用于输入深度学习模型。

1-主成分分析

这里的 3 轴代表 3 个第一主成分。蓝色云代表标签 1,红色云代表标签 -1。

enter image description here

即使我们可以通过视觉识别两朵不同的云,它们也粘在一起。我认为因此我们在训练阶段可能会遇到问题。

2-t-SNE

对于与 t-SNE 相同的特征和标签,我们仍然可以区分两朵云,但它们又粘在一起了。

enter image description here enter image description here

问题:

1- 两团点云粘在一起是否会影响训练和测试阶段的准确率百分比?

2- 当我们去除红色和蓝色时,不知何故我们只剩下一朵大云。有没有办法解决两朵云“粘”在一起的问题?

最佳答案

您所说的粘在一起,意味着在这个空间中,您的数据不是线性可分离的。它似乎也不是非线性可分的。我希望使用这些组件,您的准确性肯定会很差。

解决该问题的方法是使用更多或不同的数据。您有一些选择。

1) 包含更多主成分怎么样?也许 4、5、10 个组件就能解决您的问题。根据您的数据集,这可能不起作用,但这是最明显的首先尝试的事情。

2) 您可以尝试其他矩阵分解技术。 PCA 并不是唯一的一种。有 NMF、内核 PCA、LSA 等等。哪一种最适合您从根本上取决于您的数据分布。

3) 使用任何其他类型的特征选择。坦率地说,96 个并不算多。你打算做深度学习吗?您通常不会将所有 96 个特征放入深度学习模型中吗?如果需要的话,除了矩阵分解之外,还有许多其他方法可以进行特征选择。

祝你好运。

关于machine-learning - 云标签影响测试准确性百分比?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51392438/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com