gpt4 book ai didi

python - 保存后数据帧类型丢失

转载 作者:行者123 更新时间:2023-12-01 06:46:14 24 4
gpt4 key购买 nike

我将数据框更改为类别类型。但保存并加载后类型返回为 float64

data = pd.DataFrame(barray, columns=['line 1', 'line 2', 'line 3', 'line 4', 'piece to move', 'place to occupy'])
data['possibility of win'] = y
for col in ['line 1', 'line 2', 'line 3', 'line 4', 'piece to move', 'place to occupy']:
data[col] = data[col].astype('category')

data['line 1'].dtype

输出:CategoricalDtype(类别=['2000', '2001', '2002', '2010', '2011', '2012', '2020', “2021”、“2100”、“2101”、“2102”、“2110”、“2112”、“2120”、 “2121”、“2200”、“2201”、“2202”、“2210”、“2211”、“2212”、 '2220','2221'], 订购=假)

data.to_csv('data.csv')
data = pd.read_csv("data.csv")
data['line 1'].dtype

输出:dtype('int64')

最佳答案

这是预期的,因为在 csv 中,所有数据都像文本一样保存。

解决方案是在read_csv中添加参数dtype :

#all columns set to categoricals
data = pd.read_csv("data.csv", dtype='category')

如果只想指定某些列,请使用字典:

cols = ['line 1', 'line 2', 'line 3', 'line 4']
d = dict.fromkeys(cols, 'category')
data = pd.read_csv("data.csv", dtype=d)

关于python - 保存后数据帧类型丢失,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59212561/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com