gpt4 book ai didi

statistics - 如何标准化雷达图的统计数据

转载 作者:行者123 更新时间:2023-12-02 10:51:12 28 4
gpt4 key购买 nike

我正在使用 raphaelJS 绘制“雷达图”来显示统计数据。对于每个轴,它应该接受 0 到 10 之间的值。

例如,中心点位于图表中心的多边形的值 [10,10,10,10,10]。简单...

但是,数据可能如下所示:

[26, 14, 48, 18, 1],
[ 3, 14, 8, 9, 5],
[10, 6, 4, 16, 3]

这导致了这一点(显示其中心点位于图表左下角的多边形):

radar off scale

如果我根据数据的最大值(在本例中为 48)对数据进行标准化,则所有其他中心点都将太靠近图表中心,并且其信息值将在 0 左右。

<小时/>

相同的数据根据​​其最大值进行标准化:

[5.42, 2.92, 10,   3.75, 0.21],
[0.63, 2.92, 1.67, 1.88, 1.04],
[2.08, 1.25, 0.83, 3.34, 0.63]

radar normalized

所以现在所有其他中心点都聚集在图表的中心,并且失去了所有解释力......如果中心点超过 3 个,它们很可能会相互重叠。

centered

我正在考虑一种相对方式来显示每个多边形,如果可能的话,不会丢失每个多边形之间的太多关系......

有什么想法可以做到这一点,或者可能有另一种方法来规范化?

最佳答案

根据@daroczig的建议,数据的日志转换是可行的方法。我只是想补充一点,您可以执行多种类型的转换。

也许一个例子可能会有所帮助。我将使用 Parallel Coordinates可视化来说明该示例,但相同的概念应该适用于 Radar Chart 。所有实验均在 MATLAB 中进行。

考虑Fisher Iris dataset ,它包含 150 个实例,其中每个点都有 4 个维度。如果我们在正常值范围之外添加一个离群点,我们会得到:

org-vs-outlier

正如预期的那样,绘图会缩放以适应新点,但结果是我们失去了之前的详细 View 。

答案是通过应用某种转换来标准化数据。下面展示了四种不同转换的比较:

  • 最小/最大归一化:

    x_new = (x-min)/(max-min) ,这样 x_new in [0,1]

  • z 标准化:

    x_new = (x-mean)/std ,其中x_new ~ N(0,1)

  • 使用逻辑 sigmoid 进行 softmax 标准化:

    x_new = 1/(1+exp(-(x-mean)/std)) ,和x_new in [0,1]

  • 能量标准化:

    x_new = x / ||x|| ,这样 x_new in [0,1] (使每个点成为单位向量)

minmax-standarize-softmax-energy

关于statistics - 如何标准化雷达图的统计数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4883874/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com