gpt4 book ai didi

python - 计算 csv 中 "NaN"(不是零或空白)的数量

转载 作者:太空狗 更新时间:2023-10-30 02:26:00 25 4
gpt4 key购买 nike

是否可以让 Python 计算 csv 文件中“NaN”(作为字符串/文本)的数量?尝试使用 pandas 的 read_csv,但一些有空白的列也被读取为 NaN。我知道的唯一可行方法是使用 excel find 'NaN' 作为值。

有人知道其他方法吗?提前致谢!

最佳答案

您可以使用 pd.read_csv,但您需要两个参数:na_valueskeep_default_na

  1. na_values:

Additional strings to recognize as NA/NaN. If dict passed, specific per-column NA values. By default the following values are interpreted as NaN: ‘’, ‘#N/A’, ‘#N/A N/A’, ‘#NA’, ‘-1.#IND’, ‘-1.#QNAN’, ‘-NaN’, ‘-nan’, ‘1.#IND’, ‘1.#QNAN’, ‘N/A’, ‘NA’, ‘NULL’, ‘NaN’, ‘nan’`.

  1. keep_default_na:

If na_values are specified and keep_default_na is False the default NaN values are overridden, otherwise they’re appended to.

所以在你的情况下:

pd.read_csv('path/to/file.csv', na_values='NaN', keep_default_na=False)

如果您想变得更“自由”一点,那么您可能需要像 na_values=['nan', 'NaN'] 这样的东西——重点是这些将被非常严格地解释。

举个例子——假设您有以下 CSV 文件,其中包含 1 个文字 NaN 和两个空格:

enter image description here

import pandas as pd
import numpy as np
df = pd.read_csv('input/sample.csv', na_values='NaN', keep_default_na=False)
print(np.count_nonzero(df.isnull().values))
# 1

关于python - 计算 csv 中 "NaN"(不是零或空白)的数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46612576/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com