gpt4 book ai didi

python - 箱线图 X 值出现多次

转载 作者:行者123 更新时间:2023-11-30 21:51:23 25 4
gpt4 key购买 nike

所以我有这个数据框 df:

 Author | Score
A | 10
B | 4
C | 8
A | 9
B | 7
C | 6
D | 4
E | 3

我希望能够制作 x = 作者和 y = 分数的箱线图,其中作者数量大于 1。因此图表将仅显示作者 A、B 和 C。我想要的原因设置此限制是因为我正在使用的实际数据框包含相当多的作者,并且箱线图最终看起来非常困惑并且无法阅读。有办法做到这一点吗?

最佳答案

您可以使用 groupby + transform('size') 创建一个掩码,将您的 DataFrame 限制为具有超过 1 行的作者。然后 boxplot 这个子集。

m = df.groupby('Author')['Score'].transform('size').gt(1)
df.loc[m].boxplot(by='Author', column='Score')

enter image description here

<小时/>

该方法允许您轻松概括为任意数量的行作为阈值。在这种超过 1 行的特殊情况下,您还可以使用 duplicated 对原始数据进行切片:

df[df.duplicated('Author', keep=False)].boxplot(by='Author', column='Score')

关于python - 箱线图 X 值出现多次,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60118706/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com