gpt4 book ai didi

python - 散点图中两个特征之间的比例

转载 作者:行者123 更新时间:2023-11-30 09:05:19 27 4
gpt4 key购买 nike

我有一个数据集:

  • 近 45K 个样本
  • 8 个功能
  • 4 节课

每个类别的样本百分比不同。我想绘制每个组合对的所有散点图,也就是说,28 个图表并考虑所有数据集。

所以最后,对于每个图表,我都会得到一个散点图,我可以在其中看到按类别分布的样本。 因为我在一本书中看到了一个例子,他们通过考虑每个类别相同数量的样本来绘制这些散点图。

例如:100 个样本 class0、100 个样本 class1、100 个样本 class2、100 个样本 class3。

问题:我想知道考虑每个类别具有不同百分比的所有数据集是否正确?

注意:我想了解这些特征是否成对地线性可分。

最佳答案

This sounds like Feature Analysis or Feature selection

  1. 如果您想从图中找出您的特征是否可线性分离,我会选择该类的所有样本。否则,随机选择一组(例如 100 个样本)将使您的绘图结果和解释不明确
  2. 当试图理解特征时,图上的单纯定性“外观”不应该是管道的终点。而是转向一些不错的特征选择策略和方法,例如:递归特征消除、相关矩阵等(这里是 R 中的一些 examples 作为开始)
  3. 当尝试理解一组特征时,可以使用 Elbow 方法等方法。

关于python - 散点图中两个特征之间的比例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53334543/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com