gpt4 book ai didi

python - 如何加入 pandas dataframe 以便 seaborn boxplot 或 violinplot 可以使用列作为色调?

转载 作者:太空宇宙 更新时间:2023-11-03 10:54:18 25 4
gpt4 key购买 nike

我有一个包含多列的数据框,我可以轻松地使用 seaborn 将其绘制在箱线图(或 fiddle 图等)中,如下所示:

data1 = {'p0':[1.,2.,5,0.], 'p1':[2., 1.,1,3], 'p2':[3., 3.,2., 4.]}
df1 = pd.DataFrame.from_dict(data1)
sns.boxplot(data=df1)

enter image description here

我现在需要的是将这个数据框与另一个数据框合并,这样我就可以将它们绘制在一个箱线图中,就像这里所做的那样:http://seaborn.pydata.org/examples/grouped_boxplot.html

我尝试添加一列并连接。结果好像还可以

data1 = {'p0':[1.,2.,5,0.], 'p1':[2., 1.,1,3], 'p2':[3., 3.,2., 4.]}
data2 = {'p0':[3.,1.,5,1.], 'p1':[3., 2.,3,3], 'p2':[1., 2.,2., 5.]}
df1 = pd.DataFrame.from_dict(data1)
df1['method'] = 'A'
df2 = pd.DataFrame.from_dict(data2)
df2['method'] = 'B'
df_all = pd.concat([df1,df2])
sns.boxplot(data=df_all)

这行得通,但它将来自方法 A 和 B 的数据绘制在一起。但是这失败了:

sns.boxplot(data=df_all, hue='method')

因为我需要指定 x 和 y。如果我将 x 指定为 x=['p0', 'p1', 'p2'],则对 3 列进行平均。所以我想我可以用不同的方式合并数据帧,这样它的表示在 seaborn 中就很简单。

最佳答案

我认为这里需要的是一个像这样的数据框:

value method p

1.0 A p0

2.1 A p0

3.0 A p1

1.3 B p0

4.3 B p1

然后你可以用 sns.boxplot(data=df, hue='method', x='p', y='value') 得到你想要的东西

我正在研究如何将 df1 和 df2 轻松合并到像这样的数据框中,但我并不是真正的 Pandas 专家。

编辑:想通了,需要使用melt方法:

df3 = pd.concat([df1.melt(id_vars='method', var_name='p'),
df2.melt(id_vars='method', var_name='p')],
ignore_index=True)
sns.boxplot(x='p', y='value', hue='method', data=df3)

enter image description here

关于python - 如何加入 pandas dataframe 以便 seaborn boxplot 或 violinplot 可以使用列作为色调?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44162416/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com