gpt4 book ai didi

python - 使用定义的数据类型初始化 pandas DataFrame

转载 作者:太空狗 更新时间:2023-10-29 20:47:11 25 4
gpt4 key购买 nike

pd.DataFrame 文档字符串为整个数据帧指定了一个标量参数:

dtype : dtype, 默认无
要强制的数据类型,否则推断

看起来它确实是一个标量,因为下面会导致错误:

dfbinseq = pd.DataFrame([],
columns = ["chr", "centre", "seq_binary"],
dtype = ["O", pd.np.int64, "O"])

dfbinseq = pd.DataFrame([],
columns = ["chr", "centre", "seq_binary"],
dtype = [pd.np.object, pd.np.int64, pd.np.object])

对我来说,创建一个空数据框(我需要将其放入 HDF5 存储中以便进一步 append)的唯一解决方法是

dfbinseq.centre.dtype = np.int64

有没有办法一次设置dtypes参数?

最佳答案

您可以将dtype设置为Series:

import pandas as pd

df = pd.DataFrame({'A':pd.Series([], dtype='str'),
'B':pd.Series([], dtype='int'),
'C':pd.Series([], dtype='float')})

print (df)
Empty DataFrame
Columns: [A, B, C]
Index: []

print (df.dtypes)
A object
B int32
C float64
dtype: object

有数据:

df = pd.DataFrame({'A':pd.Series([1,2,3], dtype='str'),
'B':pd.Series([4,5,6], dtype='int'),
'C':pd.Series([7,8,9], dtype='float')})

print (df)
A B C
0 1 4 7.0
1 2 5 8.0
2 3 6 9.0

print (df.dtypes)
A object
B int32
C float64
dtype: object

关于python - 使用定义的数据类型初始化 pandas DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38235992/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com