gpt4 book ai didi

python - 我可以通过另一个变量中的值为 seaborn distplot 着色吗?

转载 作者:太空宇宙 更新时间:2023-11-04 09:53:50 27 4
gpt4 key购买 nike

我想用数据框中的另一个变量为 seaborn.distplot 着色。

这是一个抽象的例子:

import numpy
import pandas
import seaborn
A = numpy.random.choice(100, size=1000)
B = numpy.random.choice(1000, size=1000)
df = pandas.DataFrame([A, B], index=['A', 'B']).transpose()
df = df.sort_values(by='B')
plt.figure()
seaborn.distplot(df['A'], bins=50)
plt.show()

产生: enter image description here

现在是否可以根据df['B'] 中的值为该图着色?


编辑

为了澄清,假设A 是人们年龄的分布,B 是他们的体重。我想要一种颜色渐变,如果老年人也很重,直方图的条形颜色(比如说)绿色。请注意,我并不期待一个很好的频谱——“有趣的数据”很可能出现在情节的中间。对我来说,有趣的数据是 AB 较低。

我希望一切都清楚了。

最佳答案

我建议将数据聚合和可视化分开。这主要允许将问题分成几个部分,以便更容易找到解决方案。

在这种情况下,我想这个想法是根据输入数据创建一个这样的表

              0     weight  density
age
(0, 10] 140.0 54.388877 0.0140
(10, 20] 269.0 71.422041 0.0269
(20, 30] 273.0 78.842196 0.0273
(30, 40] 188.0 79.433658 0.0188
(40, 50] 92.0 76.108056 0.0092
(50, 60] 28.0 69.800159 0.0028
(60, 70] 7.0 61.524235 0.0007
(70, 80] 3.0 52.942435 0.0003
(80, 90] NaN NaN NaN

我们将人数、他们的平均体重和密度作为列,将分箱的年龄作为行。

然后可以轻松绘制这样的表格。

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np; np.random.seed(46)
import seaborn as sns

# create data
a = np.random.rayleigh(20, size=1000)
b = 80*np.sin(np.sqrt((a+1)/20.*np.pi/2.))
df = pd.DataFrame({"age" : a, "weight" : b})

# calculate age density and mean weight
bins = np.arange(0,100,10)
groups = df.groupby([pd.cut(df.age, bins),'weight' ])
df2 = groups.size().reset_index(["age","weight"])

df3 = df2.groupby("age")[0].sum()
df4 = df2.groupby("age")["weight"].mean()

df6 = pd.concat([df3,df4], axis=1)
df6["density"] = df6[0]/np.sum(df6[0].fillna(0).values*np.diff(bins))

# prepare colors
norm=plt.Normalize(np.nanmin(df6["weight"].values),
np.nanmax(df6["weight"].values))
colors = plt.cm.plasma(norm(df6["weight"].fillna(0).values))

# create figure and axes
fig, ax = plt.subplots()
# bar plot
ax.bar(bins[:-1],df6.fillna(0)["density"], width=10, color=colors, align="edge")
# KDE plot
sns.kdeplot(df["age"], ax=ax, color="k", lw=2)

#create colorbar
sm = plt.cm.ScalarMappable(cmap="plasma", norm=norm)
sm.set_array([])
fig.colorbar(sm, ax=ax, label="weight")

#annotate axes
ax.set_ylabel("density")
ax.set_xlabel("age")
plt.show()

enter image description here

关于python - 我可以通过另一个变量中的值为 seaborn distplot 着色吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46728818/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com