gpt4 book ai didi

machine-learning - 评估类可分离性

转载 作者:行者123 更新时间:2023-11-30 09:24:02 25 4
gpt4 key购买 nike

我想评估 3 个类的特征的可分离性,并对其他 2 组特征进行相同的操作,最终表明我的特征提供了最佳的可分离性。为了更清楚地说明这一点,我想衡量不同类别的距离以及每个类别的紧凑程度。我发现散点矩阵是一个不错的选择。

我的问题是:

  1. 当数据不可线性分离/数据分布未知或不是高斯分布时,可以使用它们吗(我在某处读到,当数据线性可分离或高斯分布时,散点矩阵很有用)。

  2. 这只会给我数字,是否存在图形方式来说明可分离性。我的特征是256维,有409个数据实例。

最佳答案

为了评估簇的距离,您可以做一个简单的测试:计算每个簇的平均点并查看这些点之间的距离。这不会告诉您数据是否可分离,或者数据点在簇内的分散程度,但它会给您一些关于正在发生的情况的指示。

关于散布矩阵,它是协方差矩阵的近似:协方差矩阵(通常您会查看其特征值/向量)描述数据点集。您在这里要问的问题是:好的,最大化数据方差并因此携带最多能量的方向是什么。它不关心数据是否线性可分,也不关心数据的分布是什么。

我认为没有一种很好的方式来描绘 256 维的数据!但您可以绘制边距等图表。

希望这有帮助,亚历克斯

关于machine-learning - 评估类可分离性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16955516/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com