- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章秒懂!图解四个实用的Pandas函数!由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
在用Python进行机器学习或者日常的数据处理中,Pandas是最常用的Python库之一,熟练掌握pandas是每一个数据科学家的必备技能,本文将用代码+图片详解Pandas中的四个实用函数.
shift() 。
假设我们有一组股票数据,需要对所有的行进行移动,或者获得前一天的股价,又或是计算最近三天的平均股价.
面对这样的需求我们可以选择自己写一个函数完成,但是使用pandas中的shift()可能是最好的选择,它可以将数据按照指定方式进行移动.
下面我们用代码进行演示,首先导入相关库并创建示例DataFrame 。
import pandas as pd 。
import numpy as np 。
df = pd.DataFrame({'DATE': [1, 2, 3, 4, 5], 。
'VOLUME': [100, 200, 300,400,500], 。
'PRICE': [214, 234, 253,272,291]}) 。
现在,当我们执行df.shift(1,fill_value=0)即可将数据往下移动一行,并用0填充空值 。
现在,如果我们需要将前一天的股价作为新的列,则可以使用下面的代码 。
我们可以如下轻松地计算最近三天的平均股价,并创建一个新的列 。
向前移动数据也是很轻松的,使用-1即可 。
更多有关shift函数可以查阅官方文档,总之在涉及到数据移动时,你需要想到shift.
value_counts() 。
pandas中的value_counts()用于统计dataframe或series中不同数或字符串出现的次数,并可以通过降序或升序对结果对象进行排序,下图可以方便理解.
现在让我们用代码示例,首先是Index对象 。
下面是Series对象 。
同时可以对bin参数将结果划分为区间 。
更多的细节与参数设置,可以阅读pandas官方文档.
mask() 。
pandas中的mask方法比较冷门,和np.where比较类似,将对cond条件进行判断,如果cond为False,请保留原始值。如果为True,则用other中的相应值替换.
现在我们看下面的DataFrame,在这里我们要更改所有可以被二整除的元素的符号,就可以使用mask 。
下面是代码实现过程 。
nlargest() 。
在很多情况下,我们会遇到需要查找Series或DataFrame的前3名或后5名值的情况,例如,总得分最高的3名学生,或选举中获得的总票数的3名最低候选人 。
pandas中的nlargest()和nsmallest()是满足此类数据处理要求的最佳答案,下面就是从10个观测值中取最大的三个图解 。
下面是代码实现过程 。
但如果有相等的情况出现,那么可以使用first,last,all来进行保留 。
了解了nlargest()的使用方法后,nsmallest()就显得十分简单,本文就不再赘述,如果还有疑问可以查阅官方文档.
原文地址:https://mp.weixin.qq.com/s?__biz=MzI1MTUyMjc1Mg==&mid=2247506837&idx=1&sn=3ac5ce8c3664f9b3e06b7ae5a1c75b60&chksm=e9f3203ade84a92cb56f6c5835ceb13a7ff9033978c42c136cd0b1a8cd50ea2fc6f4826ef564&mpshare=1&s 。
最后此篇关于秒懂!图解四个实用的Pandas函数!的文章就讲到这里了,如果你想了解更多关于秒懂!图解四个实用的Pandas函数!的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我是一名优秀的程序员,十分优秀!