python Pandas : Check if all columns in rows value is NaN-6ren

python Pandas : Check if all columns in rows value is NaN

转载作者：太空狗更新时间：2023-10-30 02:02:43

24

4

如果我的问题已经得到解答，请接受我的道歉。我试图找到一个解决方案，但我能找到的只是为数据框中的所有 NaN 删除解决方案。我的问题是我有一个包含 6 列和 500 行的数据框。我需要检查任何特定行中的所有值是否都是 NaN，以便我可以将它们从我的数据集中删除。下面的示例第 2、6 和 7 行包含从 col1 到 col6 的所有 Nan:

    Col1    Col2    Col3    Col4    Col5    Col6
    12      25      02      78      88      90
    Nan     Nan     Nan     Nan     Nan     Nan
    Nan     35      03      11      65      53
    Nan     Nan     Nan     Nan     22      21
    Nan     15      93      111     165     153
    Nan     Nan     Nan     Nan     Nan     Nan
    Nan     Nan     Nan     Nan     Nan     Nan
    141     121     Nan     Nan     Nan     Nan

请注意，顶行只是标题，从第 2 行开始我的数据。如果有人能在正确的方向上帮助我解决这个难题，我将不胜感激。

还有我的第二个问题是，在删除所有列中的所有 Nan 之后，如果我想删除缺少 4 或 5 列数据的行，那么最好的解决方案是什么。

最后一个问题是，是否可以在删除 Nan 最多的行之后如何在剩余的行(例如 450 行)上创建箱线图？

我们将不胜感激。

问候，

最佳答案

对于那些搜索因为想知道问题标题的人:

Check if all columns in rows value is NaN

一个简单的方法是:

df[[list_of_cols_to_check]].isnull().apply(lambda x: all(x), axis=1)

import pandas as pd
import numpy as np


df = pd.DataFrame({'movie': [np.nan, 'thg', 'mol', 'mol', 'lob', 'lob'],
                  'rating': [np.nan, 4., 5., np.nan, np.nan, np.nan],
                  'name':   ['John', np.nan, 'N/A', 'Graham', np.nan, np.nan]}) 
df.head()

检查所有列是否为 NaN:

cols_to_check = df.columns
df['is_na'] = df[cols_to_check].isnull().apply(lambda x: all(x), axis=1) 
df.head()

检查“name”、“rating”列是否为 NaN:

cols_to_check = ['name', 'rating']
df['is_na'] = df[cols_to_check].isnull().apply(lambda x: all(x), axis=1) 
df.head()

关于 python Pandas : Check if all columns in rows value is NaN，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39298372/

24

4

0

文章推荐： python - 使用 PyEZ 在 Juniper 路由器中执行 vty 命令

文章推荐： python - 有效使用 numpy.random.choice 与重复数字和备选方案

文章推荐： python - for 循环以提取 pandas 中数据帧的 header

文章推荐： python - 使用 scipy.interpolate.interpn 对 N 维数组进行插值

Column headers not rendering as expected after refactoring (重构后列标题未按预期呈现)
这正确地呈现了标题，因为我可以看到一个列带有“Product ID”标题的表：。我正试图重构它，这样我就可以重用它，因为它们在整个应用程序中几乎是相同的：。在这种情况下，头不会呈现...检查页面元素中
python - 避免在执行 df ['column' ] = df ['column' ] 时写两次 df ['column' ]
我什至不知道如何表达这一点，但在 Python 中有没有一种方法可以引用等号之前的文本，而无需实际再次编写？ ** 编辑 - 我在 Jupyter 中使用 python3 我似乎用了半辈子的时间来写作
python : group by columns with columns values that are grouped by occurs only once and retain all other columns
假设我有一个包含以下列的字典 dict_ = [ {'key1': 'value1', 'key2': 'value2', 'key3': 'value3', '
python : group by columns with columns values that are grouped by occurs only once and retain all other columns
假设我有一个包含以下列的字典 dict_ = [ {'key1': 'value1', 'key2': 'value2', 'key3': 'value3', '
MySql 当 table.column = table.column 时选择 table.column
假设我的数据库中有一张地铁 map ，其中每条线路的每个站点都是一行。如果我想知道我的线路在哪里互连: mysql> SELECT LineA.stop_id FROM LineA, LineB WH
hadoop - hive QL : split column into 2 columns and rank each column
代码 select c1,c2,c3,c4,c5,c6 from table where c5 in ('a', 'b') 从这里开始，我想将 c5 列拆分为两列，然后根据它们对 c
MySQL : search two columns : one column first then second column
我正在尝试搜索表格中的两列，即标题和描述。但我想先搜索标题，然后再搜索描述。所以匹配标题的所有行排在第一位，所有匹配描述的行排在第二位我可以使用单个 SQL 查询来实现吗？最佳答案您还可以使用
Python数据框: Create New Column Based on Values in a String Column and a Float Column
下面有以下 Python 数据框。 “标志”字段是我想要用代码创建的所需列。我想要执行以下操作: 如果“分配类型”是预测的并且“Activities_Counter”大于 10，我想创建一个名为“F
mysql - 为什么 `WHERE column` 给出的结果与 `WHERE column IS NOT NULL AND column <> ' '` 不同？
我有两列，area 和 block，其中 area 是一个 int 类型，block 是一个 varchar。现在我正在写两个查询: select * from table where area a
mysql - Slick 2 将 (Column[A], Column[B]) 转换为 Column[(A,B)]
使用 Slick 2，我试图生成一个带有元组 IN 子句的查询: select * from my_table where (a, b) IN ((1, 87)); 给定: val seq: Seq[
php - Mysql Where Column A = X and Column B = Y and or Column B = Z
我正在尝试从数据透视表中获取一组值，其中 A 列等于值数组，例如 ID 12 的 attribute_value_id 等于 3 和 9。这可以做到吗？我已经走了这么远... ID | post_id
Python-数据帧 : Multiply multiple columns by another column and save in new columns
我找不到这样做的有效方法。我在 Python 中有以下 DataFrame，列从 A 到 Z A B C ... Z 0 2.0 8.0 1.0 ... 5.0 1
python Pandas : Merge Columns of Data Frame with column name into one column
我的数据框中有以下格式的数据: >>> df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD')) >>> df
mysql - 如果 'table a' .'column b' 匹配 'table b' .'column b'，如何将 'table a' .'column b' 替换为 'table b' .'column a'
我有多个与我公司销售的产品相关的表被新产品取代，随着时间的推移，这导致了多个表的出现。我一遍又一遍地使用以下查询，直到最终表中只剩下 2 个产品... CREATE TABLE mar15a
mysql - 如何用 'table a' .'column b' 替换 'table b' .'column b' 如果 'table a' .'column a' 匹配 'table b' .'column a'
我有如下 2 个表:- 表A ------------------------------- | product_id | price | --------------------
mysql - 一个表中的 COLUMN NAME 和 COLUMN COMMENT 以及另一个表中的 COLUMN VALUE。如何？
我有一个名为 tbl_mainsheet7 的表，创建方式如下: pk_mainsheet client_id project_id mainsheet_id project_cat EA_
html - CSS 问题 : Fixed column + Auto column with a nested Auto column inside
我得到了以下 HTML 结构: ... ... 我的 CSS: #main-container { width:80%; margin:20px auto;
r - R : Replace a column value with a value from same column after matching two other columns values 中的数据表
对于我的以下要求，我无法获得解决方案。如果 data.table(如下)在 Col1 和 Col3 中有匹配的值。替换 Col2 值(旧的 New-Val)。 Col1 Col2 Col3
c# - SQL : Select Distinct rows by all columns but omit one column (say ID column)
我正在通过连接几个表来构建一个 View ，以通过 Entity Framework 提取数据。由于此 View 没有唯一列，EntityFramework 无法检索正确的结果集(即第一列重复)。为
python - Pandas 中的数据操作 : create a boolean column from values on column then fill with value from yet another column
好的，我已经尝试了太久了，是时候寻求帮助了。我有一个看起来有点像这样的数据框: person fruit quantity all_fruits 0 p1 grapes 2

首页

博学

6Ren·AI

商城

python Pandas : Check if all columns in rows value is NaN