gpt4 book ai didi

python - Pandas 显示错误的百分位数吗?

转载 作者:太空狗 更新时间:2023-10-30 02:37:48 25 4
gpt4 key购买 nike

我正在使用这个 WNBA 数据集 here .我正在分析 Height 变量,下表显示了记录的每个高度值的频率、累积百分比和累积频率:

img

从表中我可以很容易地得出结论,第一个四分位数(第 25 个百分位数)不能大于 175。

但是,当我使用 Series.describe() 时,我被告知第 25 个百分位数是 176.5。为什么会这样?

wnba.Height.describe()
count 143.000000
mean 184.566434
std 8.685068
min 165.000000
25% 176.500000
50% 185.000000
75% 191.000000
max 206.000000
Name: Height, dtype: float64

最佳答案

有多种方法可以估计分位数。
175.0 与 176.5 涉及两种不同的方法:

  1. 包括 Q1(这给出 176.5)和
  2. 不包括 Q1(给出 175.0)。

估计有如下不同

#1
h = (N − 1)*p + 1 #p being 0.25 in your case
Est_Quantile = x⌊h⌋ + (h − ⌊h⌋)*(x⌊h⌋ + 1 − x⌊h⌋)

#2
h = (N + 1)*p
x⌊h⌋ + (h − ⌊h⌋)*(x⌊h⌋ + 1 − x⌊h⌋)

关于python - Pandas 显示错误的百分位数吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49025162/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com