gpt4 book ai didi

python - 多行 jsons 的 pandas read_json 返回 JSONReader 而不是数据帧

转载 作者:行者123 更新时间:2023-12-01 09:26:04 30 4
gpt4 key购买 nike



我想将此文件加载到 pandas 数据框中,所以这就是我所做的:

df = pd.read_json('../Dataset/file1.json', orient='columns', lines=True, chunksize=10)

但这不是返回数据帧而是返回 JSONReader。

[IN]: df
[OUT]: < at 0x7f873465bd30>

这正常吗,还是我做错了什么?如果这就是当单个 json 文件中有多个字典(没有任何逗号分隔)并且每个字典在单独的行中时 read_json() 应该如何表现,那么我如何才能最好地将它们放入数据帧中?

编辑:如果我从 read_json() 中删除 chunksize 参数,这就是我得到的:

[IN]: df = pd.read_json('../Dataset/file1.json', orient='columns', lines=True)
[OUT]: ValueError: Expected object or value


the docs解释一下,这正是 chunksize 参数的要点:

chunksize: integer, default None

Return JsonReader object for iteration. See the line-delimted json docs for more information on chunksize. This can only be passed if lines=True. If this is None, the file will be read into memory all at once.


For line-delimited json files, pandas can also return an iterator which reads in chunksize lines at a time. This can be useful for large files or to read from a stream.



关于python - 多行 jsons 的 pandas read_json 返回 JSONReader 而不是数据帧,我们在Stack Overflow上找到一个类似的问题:

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号