gpt4 book ai didi

python - 使用python将一个 Parquet 文件分成3个 Parquet 文件

转载 作者:行者123 更新时间:2023-12-05 02:15:46 25 4
gpt4 key购买 nike

有没有办法将一个巨大的 parquet 文件分成较小的文件(使用 Python)?保留所有列并划分行?谢谢

最佳答案

你可以用 dask 来做.

import dask.dataframe as dd

ddf = dd.read_parquet('my_file.parquet')
ddf.repartition(3).to_parquet('my_files/')

编辑:您需要安装 fastparquetpyarrow

关于python - 使用python将一个 Parquet 文件分成3个 Parquet 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51282714/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com