- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我想用数据框中的另一个变量为 seaborn.distplot
着色。
这是一个抽象的例子:
import numpy
import pandas
import seaborn
A = numpy.random.choice(100, size=1000)
B = numpy.random.choice(1000, size=1000)
df = pandas.DataFrame([A, B], index=['A', 'B']).transpose()
df = df.sort_values(by='B')
plt.figure()
seaborn.distplot(df['A'], bins=50)
plt.show()
现在是否可以根据df['B']
中的值为该图着色?
为了澄清,假设A
是人们年龄的分布,B
是他们的体重。我想要一种颜色渐变,如果老年人也很重,直方图的条形颜色(比如说)绿色。请注意,我并不期待一个很好的频谱——“有趣的数据”很可能出现在情节的中间。对我来说,有趣的数据是 A
的 B
较低。
我希望一切都清楚了。
最佳答案
我建议将数据聚合和可视化分开。这主要允许将问题分成几个部分,以便更容易找到解决方案。
在这种情况下,我想这个想法是根据输入数据创建一个这样的表
0 weight density
age
(0, 10] 140.0 54.388877 0.0140
(10, 20] 269.0 71.422041 0.0269
(20, 30] 273.0 78.842196 0.0273
(30, 40] 188.0 79.433658 0.0188
(40, 50] 92.0 76.108056 0.0092
(50, 60] 28.0 69.800159 0.0028
(60, 70] 7.0 61.524235 0.0007
(70, 80] 3.0 52.942435 0.0003
(80, 90] NaN NaN NaN
我们将人数、他们的平均体重和密度作为列,将分箱的年龄作为行。
然后可以轻松绘制这样的表格。
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np; np.random.seed(46)
import seaborn as sns
# create data
a = np.random.rayleigh(20, size=1000)
b = 80*np.sin(np.sqrt((a+1)/20.*np.pi/2.))
df = pd.DataFrame({"age" : a, "weight" : b})
# calculate age density and mean weight
bins = np.arange(0,100,10)
groups = df.groupby([pd.cut(df.age, bins),'weight' ])
df2 = groups.size().reset_index(["age","weight"])
df3 = df2.groupby("age")[0].sum()
df4 = df2.groupby("age")["weight"].mean()
df6 = pd.concat([df3,df4], axis=1)
df6["density"] = df6[0]/np.sum(df6[0].fillna(0).values*np.diff(bins))
# prepare colors
norm=plt.Normalize(np.nanmin(df6["weight"].values),
np.nanmax(df6["weight"].values))
colors = plt.cm.plasma(norm(df6["weight"].fillna(0).values))
# create figure and axes
fig, ax = plt.subplots()
# bar plot
ax.bar(bins[:-1],df6.fillna(0)["density"], width=10, color=colors, align="edge")
# KDE plot
sns.kdeplot(df["age"], ax=ax, color="k", lw=2)
#create colorbar
sm = plt.cm.ScalarMappable(cmap="plasma", norm=norm)
sm.set_array([])
fig.colorbar(sm, ax=ax, label="weight")
#annotate axes
ax.set_ylabel("density")
ax.set_xlabel("age")
plt.show()
关于python - 我可以通过另一个变量中的值为 seaborn distplot 着色吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46728818/
如何从 seaborn 生成的热图中隐藏颜色条 import numpy as np; np.random.seed(0) import seaborn as sns; sns.set_theme()
我正在尝试使用 seaborn 制作热图,但被困在更改特定值的颜色。假设值 0 应该是白色,值 1 应该是灰色,然后使用 cmap 提供的调色板。 试图使用面具,但感到困惑。 import matpl
我想改变散点的大小。 这些都不起作用: sns.relplot(x='columnx', y='columny', hue='cluster', data=df) sns.relplot(x='col
这个问题在这里已经有了答案: What is y axis in seaborn distplot? (3 个答案) 关闭 3 年前。 我正在使用以下语句绘制分布图: a = sns.distplo
我注意到 sns.barplot 使用标准错误作为误差条默认 1 。有办法把它改成SD吗? ax = sns.barplot(x="day", y="tip", data=tips, ci=???)
向 seaborn FacetGrid 中的每个直方图添加表示平均值(或其他集中趋势度量)的点和可变性度量(例如,标准偏差或置信区间)的最佳方法是什么? 结果应该类似于显示的图 here ,但在每个
我正在尝试使用 sns.histplot() 而不是 sns.distplot() 因为我在 colab 中收到以下消息: FutureWarning: distplot is a deprecate
我想绘制 3 个水平条形图,标签作为 y 轴,数据作为 x 轴,我希望每个图都是不同的颜色,并有某种类型的注释,例如星号,这取决于关于数据中某列所表示的重要性,例如: dat = pd.DataFra
根据 seaborn 文档 here seaborn.distplot()已被弃用,向前支持的图是:seaborn.displot()和 seaborn.histplot() . 但是,当我尝试使用
为了使 seaborn.pairplot() 正常工作,在 jupyter notebook 中执行了以下步骤。 /usr/local/lib/python2.7/site-packages/matp
使用 pandas 数据框绘制混淆矩阵时 y 轴两端被切一半? 这就是我得到的: 我使用了这里的代码How can I plot a confusion matrix?使用 pandas 数据框: i
您好,我刚刚为 seaborn 热图创建了自定义 cmap,但是当我想使用它时,它没有显示正确的颜色。我已经一步一步完成了: import seaborn as sns import numpy as
亲爱的,我正在尝试将 kaggle 教程代码应用于 Iris 数据集。 不幸的是,当我执行图表的代码时,我只能看到这个输出而看不到任何图表: matplotlib.axes._subplots.Axe
这个问题在这里已经有了答案: Seaborn plots in a loop (6 个答案) How to plot in multiple subplots (12 个答案) 关闭 1 年前。 我
我正在尝试在 python 中使用 seaborn 绘制直方图。但它给我的只是一个空白数字。 这是我专栏的describe(): 代码: plt.subplots(figsize=(7,7)) sns
如何在seaborn.lineplot中分别设置标记和线条的透明度? 我有一组点,我想画一条连接所有点的线图。我希望线条比标记更透明。如何做到这一点? 这是我的目标: 这是我的代码: import m
我正在使用 seaborn 库在 python 中绘制热图。数据框包含一些缺失值 (NaN)。我希望与这些字段对应的热图单元格是白色的(默认情况下)并且还用字符串 NA 进行注释。但是,如果我看对了,
如何对这个图进行排序以从大到小显示?我尝试使用 sort_values 但不起作用 plt.figure(figsize=(15,8)) sns.countplot(x='arrival_date_m
我的目标是在使用 seaborn 绘制的图上的 y = 0 上绘制一条水平红线:sns.lmplot由 col= 分割或 row= . import numpy as np, seaborn as s
我正在使用seaborn pairplot绘制我的数据点不同维度的散点图。但是,我希望数据点的标记具有与数据点的维度之一相对应的大小。我有以下代码: markersize = 1000* my_dat
我是一名优秀的程序员,十分优秀!