gpt4 book ai didi

python - 混合模式下的 Pandas 数据帧无法序列化为 hdf5?

转载 作者:行者123 更新时间:2023-11-28 16:49:22 25 4
gpt4 key购买 nike

在 Pandas 中,我似乎无法存储混合类型的数据框:

store = HDFStore('play.h5')
df = DataFrame([{'a': 1, 'b': 'hello'}, {'a': 5, 'b': 'world'}])
store.put('df', df, table=True, compression='zlib')

这给出了一个Exception: Cannot currently store mixed-type DataFrame objects in Table format

这是由于 Pandas 的某些固有限制还是只是 future 的美好选择?似乎 HDFStore 在这个限制下不会很有用,因为许多数据帧都是混合类型的。

最佳答案

表格格式以记录形式存储所有数据,即所有值都存储在单个列中。有一种可以使用的替代表格式(每个 DataFrame 列一列),但我还没有实现它。基本上表格格式是为了支持查询而设计的

不过,如果您执行 table=False,则可以存储混合类型的 DataFrame。欢迎在这些功能上做更多的工作。

关于python - 混合模式下的 Pandas 数据帧无法序列化为 hdf5?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9647656/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com