gpt4 book ai didi

pandas - 如何将包含 bins 的 pandas 数据框写入文件以便将其读回 pandas?

转载 作者:行者123 更新时间:2023-12-05 05:06:40 30 4
gpt4 key购买 nike

我有一个以下格式的 Pandas 数据框:

    df = pd.DataFrame({'a' : [0,1,2,3,4,5,6], 'b' : [-0.5, 0.0, 1.0, 1.2, 1.4, 1.3, 1.1]})
df['aBins'] = pd.cut(df['a'], bins = np.arange(0,10,2), include_lowest = True)

其中每个 bin 是一个间隔:

    type(df['aBins'].iloc[0])

pandas._libs.interval.Interval

系列将它们存储为分类数据:

    df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 3 columns):
a 7 non-null int64
b 7 non-null float64
aBins 7 non-null category
dtypes: category(1), float64(1), int64(1)
memory usage: 263.0 bytes

我正在尝试将此数据框另存为文件,以便可以轻松将其读回数据框。我尝试使用 .to_csv() 将它保存为 .csv 文件,但是当我将它读回 pandas 时,'aBins' 被作为字符串读入。

    df.to_csv('test.csv', index = False)
df_reread = pd.read_csv('test.csv')
df_reread.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 3 columns):
a 7 non-null int64
b 7 non-null float64
aBins 7 non-null object
dtypes: float64(1), int64(1), object(1)
memory usage: 248.0+ bytes

是否有保存和重新读取此数据帧的好方法,以便可以将其读回相同状态的 Pandas ?

最佳答案

您可能想查看 pandas.DataFrame.to_picklepandas.read_pickle :

>>> df.to_pickle("./test.pkl")
...
...
>>> df = pd.read_pickle("./test.pkl")
>>> type(df['aBins'].iloc[0])
pandas._libs.interval.Interval

关于pandas - 如何将包含 bins 的 pandas 数据框写入文件以便将其读回 pandas?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59718829/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com