gpt4 book ai didi

python - 每个 bin 中数据的 "label fraction"的 2D 直方图颜色

转载 作者:太空宇宙 更新时间:2023-11-04 00:05:51 26 4
gpt4 key购买 nike

从此处找到的帖子开始:2D histogram coloured by standard deviation in each bin

我想根据标签值低于 Python 中特定阈值的点的分数为 2D 网格中的每个 bin 着色。

请注意,在此数据集中,每个点都有一个介于 0-1 之间的连续标签值。

例如,这是我制作的直方图,其中颜色表示每个 bin 中所有点的标签值的标准差:

enter image description here

这样做的方法是使用

scipy.stats.binned_statistic_2d()

(参见:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.binned_statistic_2d.html)

..并将统计参数设置为“std”

但有没有一种方法可以改变这种绘图,例如,颜色代表每个 bin 中标签值低于 0.5 的点的分数?

可能做到这一点的唯一方法是明确定义某种网格并计算分数,但我不确定这样做的最佳方法,因此非常感谢对此事的任何帮助!

也许使用 scipy.stats.binned_statistic_2d 或 numpy.histogram2d 并能够将每个 bin 中的原始数据值作为多维数组返回,将有助于快速明确地计算分数。

最佳答案

数组中元素低于阈值的分数可以计算为

fraction = lambda a, threshold: len(a[a<threshold])/len(a)

因此你可以调用

scipy.stats.binned_statistic_2d(x, y, values, statistic=lambda a: fraction(a, 0.5)) 

关于python - 每个 bin 中数据的 "label fraction"的 2D 直方图颜色,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54108143/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com