gpt4 book ai didi

pandas计数 value_counts()的使用

转载 作者:qq735679552 更新时间:2022-09-28 22:32:09 35 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章pandas计数 value_counts()的使用由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

在pandas里面常用value_counts确认数据出现的频率.

1. Series 情况下:

pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序.

?
1
2
3
4
5
import pandas as pd
df = pd.DataFrame({ '区域' : [ '西安' , '太原' , '西安' , '太原' , '郑州' , '太原' ],
          '10月份销售' : [ '0.477468' , '0.195046' , '0.015964' , '0.259654' , '0.856412' , '0.259644' ],
          '9月份销售' : [ '0.347705' , '0.151220' , '0.895599' , '0236547' , '0.569841' , '0.254784' ]})
print (df)

统计每个区域出现多少次:

?
1
print (df[ '区域' ].value_counts())

pandas计数 value_counts()的使用

每个区域都被计数,并且默认从高到低排序.

如果想升序排列,设置参数 ascending = True:

?
1
print (df[ '区域' ].value_counts(ascending = True ))

pandas计数 value_counts()的使用

如果想得出计数占比,可以加参数 normalize=True 。

?
1
print (df[ '区域' ].value_counts(normalize = True ))

pandas计数 value_counts()的使用

注:空值默认剔除掉的。value_counts()返回的结果是一个Series数组,可以跟别的数组进行计算.

2. DataFrame 情况下:

?
1
2
3
4
import pandas as pd
df = pd.DataFrame({ '区域1' : [ '西安' , '太原' , '西安' , '太原' , '郑州' , '太原' ],
           '区域2' : [ '太原' , '太原' , '西安' , '西安' , '西安' , '太原' ]})
print (df. apply (pd.value_counts))

pandas计数 value_counts()的使用

区域2中没有郑州,所以是NaN.

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我.

原文链接:https://www.cnblogs.com/keye/p/9664414.html 。

最后此篇关于pandas计数 value_counts()的使用的文章就讲到这里了,如果你想了解更多关于pandas计数 value_counts()的使用的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com