gpt4 book ai didi

python - Pandas Dtypewarning : How do I find the dtype of different cells in a column?

转载 作者:太空宇宙 更新时间:2023-11-03 14:03:44 24 4
gpt4 key购买 nike

当我在 pandas 中导入一个 csv 文件时,我得到一个 DtypeWarning:

第 (3) 列具有混合类型。在导入时指定 dtype 选项或设置 low_memory=False。

  1. 如何找出每个单元格的数据类型?我认为数据可能存在一些问题,这就是警告出现的原因,但它是一个包含约 500 万行的文件,很难确定罪魁祸首?
  2. 在导入时指定 dtype 是一种好的做法吗?援助如果这样做,是否会导致数据“丢失”?

最佳答案

我同意 piRSquared。只是添加到他的评论中,我遇到了类似的问题。我的列应该有字符串值,但其中一个值是浮点值(具有 NaN 值)。

您可以做一些事情来帮助您进行分析。假设您的数据框是 df。您可以检查每列的类型:

df.dtypes

对于“object”类型的每一列,您可以通过创建单元格类型来检查更多内容:

df['type'] = df['mycolumn'].apply(lambda x: type(x).__name__)

如果您的列应该是字符串值,您可以检查哪些单元格不是字符串:

df[df.type != 'str']

关于python - Pandas Dtypewarning : How do I find the dtype of different cells in a column?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45988544/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com