gpt4 book ai didi

python - matplotlib 散点图对于大量数据是否慢?

转载 作者:太空狗 更新时间:2023-10-29 21:04:55 25 4
gpt4 key购买 nike

我有一个包含属性 x、y 的数据集,它们可以绘制在 x-y 表面上。

本来我是用代码

df.plot(kind='scatter', x='x', y='y', alpha=0.10, s=2)
plt.gca().set_aspect('equal')

代码非常快,数据大小约为 50000。

最近,我使用了一个较新的数据集,大小约为 2500000。散点图变得更慢。

我想知道,这是否是预期的行为,我是否可以做些什么来提高绘图速度?

最佳答案

是的,是的。原因是超过一千个点的散点图意义不大,所以没有人费心去优化它。您最好使用其他一些表示方式来表示您的数据:

  • 如果您的点分布在各处,则为热图。使热图单元格非常小
  • 绘制某种近似分布的曲线,也许将您的 y 与您的 x 相关联。请务必提供一些置信度值或以其他方式描述分布;例如,对我来说,为每个 x(或 x 的范围)构建一个 y 的盒子,并将它们放在相同的网格通常效果很好。
  • 缩减数据集。 @sascha 在评论中建议随机抽样,这绝对是个好主意。根据您的数据,也许有更好的方法来选择代表点。

关于python - matplotlib 散点图对于大量数据是否慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42639129/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com