gpt4 book ai didi

python - 是否有可能从 python/pandas 并行写入 Parquet?

转载 作者:太空宇宙 更新时间:2023-11-03 15:35:05 25 4
gpt4 key购买 nike

Parquet 文件格式允许数据分区。还有一个最近的项目 fastparquet 提供了 python 实现。问题是,如果我在两个单独的 python 进程中有两个具有相同模式的数据帧,是否有可能将它们并行存储在 parquet 文件的两个单独分区中?

最佳答案

有。

  • 可以用 fastparquet 来做仅(使用 merge() 函数读取单独写入的数据帧)。
  • 也可以使用 dask to_parquet() 在底层使用 fastparquet。

关于python - 是否有可能从 python/pandas 并行写入 Parquet?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42589740/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com