gpt4 book ai didi

python - 用 Pandas 进行数据分析?

转载 作者:行者123 更新时间:2023-11-28 18:48:23 25 4
gpt4 key购买 nike

我有一个数据文件,其中包含我从某人那里收到的以逗号分隔的字段。我必须系统地浏览每一列以了解通常的描述性统计数据:-敏-最大限度-意思是-25%-50%-75%

或者如果是文本:-不同值的数量

但我还需要找到- 空值或缺失值的数量-零的数量

有时,一个特征的奇怪之处意味着某种意义,即包含信息。我可能需要与客户讨论我发现的奇怪之处。或者,如果我要替换值,我必须确保我没有鲁莽地覆盖某些东西。

所以我的问题是:python 中是否有一个包可以在我不预先假定数据类型的情况下为我找到它?如果它真的存在, Pandas 会是它的好家吗?

我看到 pandas 可以轻松替换值,但一开始我只是想看看。

最佳答案

您可以使用 describe方法:

In [1]: df = pd.DataFrame(randn(10, 3), columns=list('ABC'))

In [2]: df
Out[2]:
A B C
0 1.389738 -0.205485 -0.775810
1 -1.166596 -0.898761 -1.805333
2 -1.016509 -0.816037 0.169265
3 -0.440860 -1.147164 1.558606
4 0.763012 1.068694 -0.711795
5 0.075961 -0.597715 0.699023
6 3.006095 -0.354879 -0.718440
7 -1.249588 -0.372235 1.611717
8 0.518770 -0.742766 1.956372
9 1.304080 -0.803262 -0.609970

In [3]: df.describe()
Out[3]:
A B C
count 10.000000 10.000000 10.000000
mean 0.318410 -0.486961 0.137363
std 1.360633 0.616566 1.266616
min -1.249588 -1.147164 -1.805333
25% -0.872596 -0.812843 -0.716779
50% 0.297366 -0.670240 -0.220352
75% 1.168813 -0.359218 1.343710
max 3.006095 1.068694 1.956372

它有一个 percentile_width 参数,默认为 50。

关于python - 用 Pandas 进行数据分析?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17120460/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com