gpt4 book ai didi

python - 为 pandas.read_csv 指定正确的 dtypes 以获取日期时间和 bool 值

转载 作者:IT老高 更新时间:2023-10-28 21:04:19 26 4
gpt4 key购买 nike

我正在将 csv 文件加载到 Pandas DataFrame 中。对于每一列,如何使用 dtype 参数指定它包含的数据类型?

  • 我可以使用 numeric 数据(代码在底部)...
  • 但是如何指定时间数据...
  • 分类数据,例如因子或 bool 值?我试过 np.bool_pd.tslib.Timestamp 没有运气。

代码:

import pandas as pd
import numpy as np
df = pd.read_csv(<file-name>, dtype={'A': np.int64, 'B': np.float64})

最佳答案

read_csv 有很多选项可以处理您提到的所有情况。您可能想尝试 dtype={'A': datetime.datetime},但通常您不需要 dtypes,因为 pandas 可以推断类型。

对于日期,则需要指定 parse_date 选项:

parse_dates : boolean, list of ints or names, list of lists, or dict
keep_date_col : boolean, default False
date_parser : function

一般来说,要转换 bool 值,您需要指定:

true_values  : list  Values to consider as True
false_values : list Values to consider as False

这会将列表中的任何值转换为 bool 值 true/false。对于更一般的转换,您很可能需要

转换器:字典。用于转换某些列中的值的可选函数字典。键可以是整数或列标签

虽然很密集,但请在此处查看完整列表:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html

关于python - 为 pandas.read_csv 指定正确的 dtypes 以获取日期时间和 bool 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20095983/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com