- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章Pandas||过滤缺失数据||pd.dropna()函数的用法说明由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
看代码吧~ 。
DataFrame.dropna(axis=0, how="any", thresh=None, subset=None, inplace=False)Remove missing values.
pd.dropna()函数(官方文档)用于过滤数据中的缺失数据. 。
import pandas as pdimport numpy as npdf = pd.DataFrame(np.random.randn(5, 3), index = list("abcde"), columns = ["one", "two", "three"]) # 随机产生5行3列的数据 df.ix[1, :-1] = np.nan # 将指定数据定义为缺失df.ix[1:-1, 2] = np.nanprint(df)
df.dropna() #删除所有带缺失数据的行
parameters | 详解 |
---|---|
axis | default 0指行,1为列 |
how | {‘any", ‘all"}, default ‘any"指带缺失值的所有行;"all"指清除全是缺失值的行 |
thresh | int,保留含有int个非空值的行 |
subset | 对特定的列进行缺失值删除处理 |
inplace | 这个很常见,True表示就地更改 |
补充:Python-pandas的dropna()方法-丢弃含空值的行、列 。
dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回.
函数形式:dropna(axis=0, how="any", thresh=None, subset=None, inplace=False) 。
参数:
axis:轴。0或"index",表示按行删除;1或"columns",表示按列删除.
how:筛选方式。‘any",表示该行/列只要有一个以上的空值,就删除该行/列;‘all",表示该行/列全部都为空值,就删除该行/列.
thresh:非空元素最低数量。int型,默认为None。如果该行/列中,非空元素数量小于这个值,就删除该行/列.
subset:子集。列表,元素为行或者列的索引。如果axis=0或者‘index",subset中元素为列的索引;如果axis=1或者‘column",subset中元素为行的索引。由subset限制的子区域,是判断是否删除该行/列的条件判断区域.
inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None.
创建DataFrame数据:
import numpy as npimport pandas as pd a = np.ones((11,10))for i in range(len(a)): a[i,:i] = np.nan d = pd.DataFrame(data=a)print(d)
按行删除:存在空值,即删除该行 。
# 按行删除:存在空值,即删除该行print(d.dropna(axis=0, how="any"))
按行删除:所有数据都为空值,即删除该行 。
# 按行删除:所有数据都为空值,即删除该行print(d.dropna(axis=0, how="all"))
按列删除:该列非空元素小于5个的,即删除该列 。
# 按列删除:该列非空元素小于5个的,即删除该列print(d.dropna(axis="columns", thresh=5))
设置子集:删除第0、5、6、7列都为空的行 。
# 设置子集:删除第0、5、6、7列都为空的行print(d.dropna(axis="index", how="all", subset=[0,5,6,7]))
设置子集:删除第5、6、7行存在空值的列 。
# 设置子集:删除第5、6、7行存在空值的列print(d.dropna(axis=1, how="any", subset=[5,6,7]))
原地修改 。
# 原地修改print(d.dropna(axis=0, how="any", inplace=True))print("==============================")print(d)
以上为个人经验,希望能给大家一个参考,也希望大家多多支持我.
原文链接:https://blog.csdn.net/The_Time_Runner/article/details/84324064 。
最后此篇关于Pandas||过滤缺失数据||pd.dropna()函数的用法说明的文章就讲到这里了,如果你想了解更多关于Pandas||过滤缺失数据||pd.dropna()函数的用法说明的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
C语言sscanf()函数:从字符串中读取指定格式的数据 头文件: ?
最近,我有一个关于工作预评估的问题,即使查询了每个功能的工作原理,我也不知道如何解决。这是一个伪代码。 下面是一个名为foo()的函数,该函数将被传递一个值并返回一个值。如果将以下值传递给foo函数,
CStr 函数 返回表达式,该表达式已被转换为 String 子类型的 Variant。 CStr(expression) expression 参数是任意有效的表达式。 说明 通常,可以
CSng 函数 返回表达式,该表达式已被转换为 Single 子类型的 Variant。 CSng(expression) expression 参数是任意有效的表达式。 说明 通常,可
CreateObject 函数 创建并返回对 Automation 对象的引用。 CreateObject(servername.typename [, location]) 参数 serv
Cos 函数 返回某个角的余弦值。 Cos(number) number 参数可以是任何将某个角表示为弧度的有效数值表达式。 说明 Cos 函数取某个角并返回直角三角形两边的比值。此比值是
CLng 函数 返回表达式,此表达式已被转换为 Long 子类型的 Variant。 CLng(expression) expression 参数是任意有效的表达式。 说明 通常,您可以使
CInt 函数 返回表达式,此表达式已被转换为 Integer 子类型的 Variant。 CInt(expression) expression 参数是任意有效的表达式。 说明 通常,可
Chr 函数 返回与指定的 ANSI 字符代码相对应的字符。 Chr(charcode) charcode 参数是可以标识字符的数字。 说明 从 0 到 31 的数字表示标准的不可打印的
CDbl 函数 返回表达式,此表达式已被转换为 Double 子类型的 Variant。 CDbl(expression) expression 参数是任意有效的表达式。 说明 通常,您可
CDate 函数 返回表达式,此表达式已被转换为 Date 子类型的 Variant。 CDate(date) date 参数是任意有效的日期表达式。 说明 IsDate 函数用于判断 d
CCur 函数 返回表达式,此表达式已被转换为 Currency 子类型的 Variant。 CCur(expression) expression 参数是任意有效的表达式。 说明 通常,
CByte 函数 返回表达式,此表达式已被转换为 Byte 子类型的 Variant。 CByte(expression) expression 参数是任意有效的表达式。 说明 通常,可以
CBool 函数 返回表达式,此表达式已转换为 Boolean 子类型的 Variant。 CBool(expression) expression 是任意有效的表达式。 说明 如果 ex
Atn 函数 返回数值的反正切值。 Atn(number) number 参数可以是任意有效的数值表达式。 说明 Atn 函数计算直角三角形两个边的比值 (number) 并返回对应角的弧
Asc 函数 返回与字符串的第一个字母对应的 ANSI 字符代码。 Asc(string) string 参数是任意有效的字符串表达式。如果 string 参数未包含字符,则将发生运行时错误。
Array 函数 返回包含数组的 Variant。 Array(arglist) arglist 参数是赋给包含在 Variant 中的数组元素的值的列表(用逗号分隔)。如果没有指定此参数,则
Abs 函数 返回数字的绝对值。 Abs(number) number 参数可以是任意有效的数值表达式。如果 number 包含 Null,则返回 Null;如果是未初始化变量,则返回 0。
FormatPercent 函数 返回表达式,此表达式已被格式化为尾随有 % 符号的百分比(乘以 100 )。 FormatPercent(expression[,NumDigitsAfterD
FormatNumber 函数 返回表达式,此表达式已被格式化为数值。 FormatNumber( expression [,NumDigitsAfterDecimal [,Inc
我是一名优秀的程序员,十分优秀!