gpt4 book ai didi

pandas - 打印可重现示例的 pandas 数据框(相当于 R 中的 dput)

转载 作者:行者123 更新时间:2023-12-04 00:58:03 26 4
gpt4 key购买 nike

最近我经常发现自己在 Pandas 中提问。这取决于我正在使用的数据,到目前为止,我需要很长时间才能创建一个与我的数据相似的数据框(可重现的数据框),以便 SO 用户可以轻松地将其复制到他们的机器上。

我希望找到一种方便的方法,这样我就可以在我的问题中打印我的小 DF,其他用户可以轻松地收集它,从而以最小的努力创建它。

R我习惯于在 dput 中打印一小部分数据样本。在控制台中运行,然后在我的问题中打印输出(示例):
Getting the error "level sets of factors are different" when running a for loop

我注意到了这个解释,但我认为它不适合为其他 SO 用户打印数据样本:
Python's equivalent for R's dput() function

Pandas 中是否有等效的方法可以做到这一点?

提前致谢!

最佳答案

如果二进制数据适合您,您可以使用 pickle图书馆。它通常允许序列化和反序列化任意对象(前提是提供了它们的类定义,如果安装了 pandas,这对于数据帧来说是正确的)。

如果您需要一种人类可读的格式,您可以使用 df_dict = df.to_dict() 从您的数据框创建一个 Python 字典。 , 并打印此字典(查看它并可能复制粘贴),或将其转储为 JSON 字符串。

当您想将字典转换回 Pandas 时,请使用 df = pd.DataFrame.from_dict(df_dict) .

解码和编码的最小示例:

import pandas as pd
df = pd.DataFrame.from_dict({'a': {0: 1, 1: 2}, 'b': {0: 3, 1: 3}})
print(df.to_dict())

这导致 {'a': {0: 1, 1: 2}, 'b': {0: 3, 1: 3}}可复制的对象。

关于pandas - 打印可重现示例的 pandas 数据框(相当于 R 中的 dput),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47450931/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com