gpt4 book ai didi

python - 如何 dill ( pickle )归档?

转载 作者:太空狗 更新时间:2023-10-29 21:30:42 24 4
gpt4 key购买 nike

这个问题可能看起来有点基础,但无法在互联网上找到我理解的任何内容。如何储存用 dill pickle 的东西?

我走到这一步是为了保存我的构造(pandas DataFrame,它也包含自定义类):

import dill
dill_file = open("data/2017-02-10_21:43_resultstatsDF", "wb")
dill_file.write(dill.dumps(resultstatsDF))
dill_file.close()

和阅读

dill_file = open("data/2017-02-10_21:43_resultstatsDF", "rb")
resultstatsDF_out = dill.load(dill_file.read())
dill_file.close()

但是我在阅读时遇到了错误

TypeError: file must have 'read' and 'readline' attributes

我该怎么做?


为 future 的读者编辑:在使用这种方法(来 pickle 我的 DataFrame)一段时间后,现在我不再这样做了。事实证明,不同的程序版本(包括可能存储在 dill 文件中的对象)可能会导致无法恢复 pickled 文件。现在我确保我想要保存的所有内容都可以表示为一个字符串(尽可能高效)——实际上是一个人类可读的字符串。现在,我将数据存储为 CSV。 CSV 单元格中的对象可以用 JSON 格式表示。这样我就可以确保我的文件在未来的几个月和几年内都是可读的。即使代码发生变化,我也能够通过解析字符串来重写编码器,并且能够通过手动检查来理解 CSV。

最佳答案

只给它没有read的文件:

resultstatsDF_out = dill.load(dill_file)

你也可以像这样去归档:

with open("data/2017-02-10_21:43_resultstatsDF", "wb") as dill_file:
dill.dump(resultstatsDF, dill_file)

所以:

dill.dump(obj, open_file)

直接写入文件。鉴于:

dill.dumps(obj) 

序列化obj,你可以自己写到文件中。

同样:

dill.load(open_file)

从文件中读取,并且:

dill.loads(serialized_obj)

从序列化对象构造一个对象,您可以从文件中读取它。

建议使用with语句打开文件。

这里:

with open(path) as fobj:
# do somdthing with fobj

与以下效果相同:

fobj = open(path)
try:
# do somdthing with fobj
finally:
fobj.close()

一旦您离开 with 语句的缩进,文件将立即关闭,即使在出现异常的情况下也是如此。

关于python - 如何 dill ( pickle )归档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42168420/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com