gpt4 book ai didi

python - 一个数据点上的 Pandas 箱线图错误

转载 作者:行者123 更新时间:2023-11-28 21:02:56 24 4
gpt4 key购买 nike

我正在使用 pandas 绘制箱线图。

我的 DataFrame 看起来像这样

Year                 2013      2014      2015      2016      2017
dfMin 1.091603 0.973346 1.040000 0.855209 1.079500
dfLowerQuartile 1.727191 1.684009 1.275601 1.136703 2.262654
dfUpperQuartile 2.225000 2.000000 1.857570 2.120644 2.435724
dfMax 2.687323 2.350000 2.105000 2.250000 2.566467

我的图表代码是这样的

chartDF.boxplot(grid=False, figsize=(9,4))

导致一个看起来像这样的情节 enter image description here

我对 2017 年的较低值(value)感到困惑。

有谁知道如何解决这个问题?

最佳答案

这是预期的行为。 2017 年的最小值比提供的四个数据点的第一个四分位数低 1.5 IQR 以上,在这种情况下,最小值显示为异常值(一个点)。

来自 the docs对于 boxplot 中的 whis(强调我的):

whis : float, sequence, or string (default = 1.5)

As a float, determines the reach of the whiskers to the beyond the first and third quartiles. In other words, where IQR is the interquartile range (Q3-Q1), the upper whisker will extend to last datum less than Q3 + whis*IQR). Similarly, the lower whisker will extend to the first datum greater than Q1 - whis*IQR. Beyond the whiskers, data are considered outliers and are plotted as individual points. Set this to an unreasonably high value to force the whiskers to show the min and max values. Alternatively, set this to an ascending sequence of percentile (e.g., [5, 95]) to set the whiskers at specific percentiles of the data. Finally, whis can be the string 'range' to force the whiskers to the min and max of the data.

所以如果你想让 mustache 一直延伸,

df.boxplot(grid=False, figsize=(9, 4), whis='range')

enter image description here

关于python - 一个数据点上的 Pandas 箱线图错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47309730/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com