- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章pandas || df.dropna() 缺失值删除操作由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
df.dropna()函数用于删除dataframe数据中的缺失数据,即 删除nan数据. 。
官方函数说明:
1
2
3
4
5
6
7
|
dataframe.dropna(axis
=
0
, how
=
'any'
, thresh
=
none, subset
=
none, inplace
=
false)
remove missing values.
see the user guide
for
more on which values are considered missing,
and
how to work with missing data.
returns
dataframe
dataframe with na entries dropped
from
it.
|
参数说明:
parameters | 说明 |
---|---|
axis | 0为行 1为列,default 0,数据删除维度 |
how | {‘any', ‘all'}, default ‘any',any:删除带有nan的行;all:删除全为nan的行 |
thresh | int,保留至少 int 个非nan行 |
subset | list,在特定列缺失值处理 |
inplace | bool,是否修改源文件 |
测试:
1
2
3
4
|
>>>df
=
pd.dataframe({
"name"
: [
'alfred'
,
'batman'
,
'catwoman'
],
"toy"
: [np.nan,
'batmobile'
,
'bullwhip'
],
"born"
: [pd.nat, pd.timestamp(
"1940-04-25"
),
pd.nat]})
|
1
2
3
4
5
|
>>>df
name toy born
0
alfred nan nat
1
batman batmobile
1940
-
04
-
25
2
catwoman bullwhip nat
|
删除至少缺少一个元素的行:
1
2
3
|
>>>df.dropna()
name toy born
1
batman batmobile
1940
-
04
-
25
|
删除至少缺少一个元素的列:
1
2
3
4
5
|
>>>df.dropna(axis
=
1
)
name
0
alfred
1
batman
2
catwoman
|
删除所有元素丢失的行:
1
2
3
4
5
|
>>>df.dropna(how
=
'all'
)
name toy born
0
alfred nan nat
1
batman batmobile
1940
-
04
-
25
2
catwoman bullwhip nat
|
只保留至少2个非na值的行:
1
2
3
4
|
>>>df.dropna(thresh
=
2
)
name toy born
1
batman batmobile
1940
-
04
-
25
2
catwoman bullwhip nat
|
从特定列中查找缺少的值:
1
2
3
|
>>>df.dropna(subset
=
[
'name'
,
'born'
])
name toy born
1
batman batmobile
1940
-
04
-
25
|
修改原数据:
1
2
3
4
|
>>>df.dropna(inplace
=
true)
>>>df
name toy born
1
batman batmobile
1940
-
04
-
25
|
以上.
补充:pandas 之dropna滤除缺失数据 。
约定:
1
2
3
|
import
pandas as pd
import
numpy as np
from
numpy
import
nan as nan
|
滤除缺失数据 。
pandas的设计目标之一就是使得处理缺失数据的任务更加轻松些。pandas使用nan作为缺失数据的标记.
使用dropna使得滤除缺失数据更加得心应手.
通过**dropna()**滤除缺失数据:
1
2
3
|
se1
=
pd.series([
4
,nan,
8
,nan,
5
])
print
(se1)
se1.dropna()
|
代码结果:
1
2
3
4
5
6
7
8
9
10
|
0
4.0
1
nan
2
8.0
3
nan
4
5.0
dtype: float64
0
4.0
2
8.0
4
5.0
dtype: float64
|
通过布尔序列也能滤除:
1
|
se1[se1.notnull()]
|
代码结果:
1
2
3
4
|
0
4.0
2
8.0
4
5.0
dtype: float64
|
处理dataframe对象比较复杂,因为你可能需要丢弃所有的nan或部分nan.
1
2
|
df1
=
pd.dataframe([[
1
,
2
,
3
],[nan,nan,
2
],[nan,nan,nan],[
8
,
8
,nan]])
df1
|
代码结果:
0 | 1 | 2 | |
---|---|---|---|
0 | 1.0 | 2.0 | 3.0 |
1 | nan | nan | 2.0 |
2 | nan | nan | nan |
3 | 8.0 | 8.0 | nan |
默认滤除所有包含nan:
1
|
df1.dropna()
|
代码结果:
0 | 1 | 2 | |
---|---|---|---|
0 | 1.0 | 2.0 | 3.0 |
传入**how=‘all'**滤除全为nan的行:
1
|
df1.dropna(how
=
'all'
)
|
代码结果:
0 | 1 | 2 | |
---|---|---|---|
0 | 1.0 | 2.0 | 3.0 |
1 | nan | nan | 2.0 |
3 | 8.0 | 8.0 | nan |
传入axis=1滤除列:
1
2
|
df1[
3
]
=
nan
df1
|
代码结果:
0 | 1 | 2 | 3 | |
---|---|---|---|---|
0 | 1.0 | 2.0 | 3.0 | nan |
1 | nan | nan | 2.0 | nan |
2 | nan | nan | nan | nan |
3 | 8.0 | 8.0 | nan | nan |
1
|
df1.dropna(axis
=
1
,how
=
"all"
)
|
代码结果:
0 | 1 | 2 | |
---|---|---|---|
0 | 1.0 | 2.0 | 3.0 |
1 | nan | nan | 2.0 |
2 | nan | nan | nan |
3 | 8.0 | 8.0 | nan |
传入thresh=n保留至少有n个非nan数据的行:
1
|
df1.dropna(thresh
=
1
)
|
代码结果:
0 | 1 | 2 | 3 | |
---|---|---|---|---|
0 | 1.0 | 2.0 | 3.0 | nan |
1 | nan | nan | 2.0 | nan |
3 | 8.0 | 8.0 | nan | nan |
1
|
df1.dropna(thresh
=
3
)
|
代码结果:
0 | 1 | 2 | 3 | |
---|---|---|---|---|
0 | 1.0 | 2.0 | 3.0 | nan |
以上为个人经验,希望能给大家一个参考,也希望大家多多支持我。如有错误或未考虑完全的地方,望不吝赐教.
原文链接:https://blog.csdn.net/qq_43188358/article/details/108335776 。
最后此篇关于pandas || df.dropna() 缺失值删除操作的文章就讲到这里了,如果你想了解更多关于pandas || df.dropna() 缺失值删除操作的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我正在努力做到这一点 在我的操作中从数据库获取对象列表(确定) 在 JSP 上打印(确定) 此列表作为 JSP 中的可编辑表出现。我想修改然后将其提交回同一操作以将其保存在我的数据库中(失败。当我使用
我有以下形式的 Linq to Entities 查询: var x = from a in SomeData where ... some conditions ... select
我有以下查询。 var query = Repository.Query() .Where(p => !p.IsDeleted && p.Article.ArticleSections.Cou
我正在编写一个应用程序包,其中包含一个主类,其中主方法与GUI类分开,GUI类包含一个带有jtabbedpane的jframe,它有两个选项卡,第一个选项卡包含一个jtable,称为jtable1,第
以下代码产生错误 The nested query is not supported. Operation1='Case' Operation2='Collect' 问题是我做错了什么?我该如何解决?
我已经为 HA redis 集群(2 个副本、1 个主节点、3 个哨兵)设置了本地 docker 环境。只有哨兵暴露端口(10021、10022、10023)。 我使用的是 stackexchange
我正在 Desk.com 中构建一个“集成 URL”,它使用 Shopify Liquid 模板过滤器语法。对于开始日期为 7 天前而结束日期为现在的查询,此 URL 需要包含“开始日期”和“结束日期
你一定想过。然而情况却不理想,python中只能使用类似于 i++/i--等操作。 python中的自增操作 下面代码几乎是所有程序员在python中进行自增(减)操作的常用
我需要在每个使用 github 操作的手动构建中显示分支。例如:https://gyazo.com/2131bf83b0df1e2157480e5be842d4fb 我应该显示分支而不是一个。 最佳答
我有一个关于 Perl qr 运算符的问题: #!/usr/bin/perl -w &mysplit("a:b:c", /:/); sub mysplit { my($str, $patt
我已经使用 ArgoUML 创建了一个 ERD(实体关系图),我希望在一个类中创建两个操作,它们都具有 void 返回类型。但是,我只能创建一个返回 void 类型的操作。 例如: 我能够将 book
Github 操作仍处于测试阶段并且很新,但我希望有人可以提供帮助。我认为可以在主分支和拉取请求上运行 github 操作,如下所示: on: pull_request push: b
我正在尝试创建一个 Twilio 工作流来调用电话并记录用户所说的内容。为此,我正在使用 Record,但我不确定要在 action 参数中放置什么。 尽管我知道 Twilio 会发送有关调用该 UR
我不确定这是否可行,但值得一试。我正在使用模板缓冲区来减少使用此算法的延迟渲染器中光体积的过度绘制(当相机位于体积之外时): 使用廉价的着色器,将深度测试设置为 LEQUAL 绘制背面,将它们标记在模
有没有聪明的方法来复制 和 重命名 文件通过 GitHub 操作? 我想将一些自述文件复制到 /docs文件夹(:= 同一个 repo,不是远程的!),它们将根据它们的 frontmatter 重命名
我有一个 .csv 文件,其中第一列包含用户名。它们采用 FirstName LastName 的形式。我想获取 FirstName 并将 LastName 的第一个字符添加到它上面,然后删除空格。然
Sitecore 根据 Sitecore 树中定义的项目名称生成 URL, http://samplewebsite/Pages/Sample Page 但我们的客户有兴趣降低所有 URL(页面/示例
我正在尝试进行一些计算,但是一旦我输入金额,它就会完成。我只是希望通过单击按钮而不是自动发生这种情况。 到目前为止我做了什么: Angular JS - programming-fr
我的公司创建了一种在环境之间移动文件的复杂方法,现在我们希望将某些构建的 JS 文件(已转换和缩小)从一个 github 存储库移动到另一个。使用 github 操作可以实现这一点吗? 最佳答案 最简
在我的代码中,我创建了一个 JSONArray 对象。并向 JSONArray 对象添加了两个 JSONObject。我使用的是 json-simple-1.1.jar。我的代码是 package j
我是一名优秀的程序员,十分优秀!