gpt4 book ai didi

python - 如何在 dask 数据框中设置(计算)分区?

转载 作者:太空宇宙 更新时间:2023-11-04 04:10:03 24 4
gpt4 key购买 nike

从 parquet 或 csv 文件加载数据时,有 NONE 分区。DASK 文档没有关于如何设置和计算这个的信息....

如何正确设置和计算DASK dataframe的划分?

最佳答案

如果您从 parquet 读取数据,您可以像本例中那样使用 infer_divisions=True

import dask.dataframe as dd
df = dd.read_parquet("file.parq", infer_divisions=True)

如果你需要,你可以在阅读时直接设置索引

df = dd.read_parquet("file.parq", index="my_col",
infer_divisions=True)

关于python - 如何在 dask 数据框中设置(计算)分区?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56462357/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com