gpt4 book ai didi

python - Seaborn – 如何解释分布图中 x 轴的值?

转载 作者:行者123 更新时间:2023-11-30 22:39:40 26 4
gpt4 key购买 nike

我有一个数据框,其中每一行代表一个日期,其中多个事件记录在数据库中。

每个事件都有一个相关的日期,例如,2017-02-03 记录的事件可能属于 2017-02-02(意味着它是在事件发生后的第二天记录的)。

Screenshot of the dataframe head

我正在尝试可视化分布图中每列的分布,以了解记录事件的时间与其所涉及的日期之间的距离(“人们是否在同一天、同一天记录事件之后,甚至更晚?”)。

到目前为止,我已经创建了一个函数,可以迭代每一列并将其绘制到 seaborn distplot 中。

def plot(dates):
plt.figure(figsize=(45,25))
for date in dates:
sns.distplot(df[date], kde=False, bins=len(dates))
return

情节如下所示: this

但是,我无法理解如何解释 x 轴上的值。

它显示的范围是 0 - 3500,这是什么意思?

还有其他更好的方法来可视化这一点吗?

最佳答案

在当前的脚本中,您循环数据并将所有输出绘制在同一个图中。在您提供的示例图中,x 轴显示 2017 年 2 月 28 日发生的事件,我假设这是数据集中的最后一个日期。但是,不同的颜色表示其他日期的数据,这些数据绘制在循环内的同一图中。关于该图的解释: x 轴显示每天的事件数:在图的右侧,您可以看到通常只有一天记录大量(> 1000 左右)事件。从图的左侧可以看出,大约有 50 天只记录了一个事件。简单的条形图可能更容易解释:它将在 x 轴上显示日期,在 y 轴上显示记录的事件数。您可以通过修改函数来为每个日期绘制并保存单独的条形图,如下所示:

def plot(dates):
for date in dates:
plt.figure()
plt.bar(np.arange(0,len(dates)),df[date], width=1.0)
ax=plt.gca()
ax.set_xticks(np.arange(0,len(dates)),)+0.5)
ax.set_xticklabels(dates)
plt.savefig('barchart_'+date+'.png')
return

可能有比这更优雅的方法来研究您的数据,但我希望这可以帮助您取得进步。

关于python - Seaborn – 如何解释分布图中 x 轴的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43087981/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com