gpt4 book ai didi

python - 如何使用 sns.catplot 可视化数据集的变化

转载 作者:行者123 更新时间:2023-12-01 08:27:48 24 4
gpt4 key购买 nike

我有一个数据集,它的均值和方差会随着时间的推移而变化,但仍处于相同的 y 值范围内。我想要可视化数据的变化。这是包含我正在寻找的功能的图: enter image description here

不幸的是我不知道如何创造这样的美。我尝试了 seaborn.catplot() 函数,但缺少可视化各个数据点的平均值和连接的选项。

import numpy as np
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt

dist_1 = np.random.beta(2.,2.,250)
dist_2 = np.random.beta(3.,4.,250)
data = {"dist 1": dist_1, "dist 2": dist_2}
df = pd.DataFrame(data=data)
sns.catplot(data=df, s=3.)
plt.show()

结果会是这样的:

enter image description here

有什么想法可以添加缺少的功能吗?

最佳答案

要获得分类图,您需要创建一个包含分类列的数据框。我对您的代码对列名进行了轻微修改 - 将 numpy 导入为 np 将seaborn导入为sns 将 pandas 导入为 pd 将 matplotlib.pyplot 导入为 plt

dist_1 = np.random.beta(2.,2.,250)
dist_2 = np.random.beta(3.,4.,250)
data = {"dist1": dist_1, "dist2": dist_2}
df = pd.DataFrame(data=data)
df['id'] = df.index

我为每行的索引添加了一列,以便我可以使用它将此宽数据帧转换为长数据帧。

long_df = pd.wide_to_long(df, 'dist', 'id', 'cat').reset_index()
long_df.head()
# id cat dist
#0 0 1 0.558567
#1 1 1 0.265868
#2 2 1 0.076470
#3 3 1 0.891855
#4 4 1 0.215208

现在我想在 catplot 的 x 轴上使用 cat 列,在 y 轴上使用 dist 并创建一个 point plot对于原始数据框中的每一行。

sns.catplot(x="cat", y="dist", hue='id', kind="point", data=long_df, legend=False)
plt.show()

这将为您提供以下情节 -

Catplot

<小时/>

奖励:您还可以使用 line plot 执行相同的操作并添加平均值标记。

mean_df = long_df.groupby('cat')['dist'].mean().reset_index()
mean_df
# cat dist
#0 1 0.535771
#1 2 0.399939
fig = plt.figure()
ax1 = fig.add_subplot(111)
sns.lineplot(x='cat', y='dist', hue='id', data=long_df, legend=False, ax=ax1)
ax1.plot(mean_df['cat'], mean_df['dist'], 'x')
plt.show()

这给了你 -

Line plot with mean added

每个类别上的“X”代表平均值。希望有帮助!

关于python - 如何使用 sns.catplot 可视化数据集的变化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54110182/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com