gpt4 book ai didi

dask - 替换 dask 数据框分区

转载 作者:行者123 更新时间:2023-12-03 09:00:19 24 4
gpt4 key购买 nike

我可以将一个 dask 数据帧分区替换为我单独创建的另一个具有相同行数和相同结构的 dask 数据帧分区吗?如果是,怎么办?

是否可以使用不同的行数?

最佳答案

您可以使用 dd.concat 函数将分区添加到 Dask 数据帧的开头或结尾。

您可以通过切换到延迟对象,将延迟对象插入列表,然后切换回 dask 数据帧,在数据帧中的任何位置插入新分区

list_of_delayed = dask_df.to_delayed()
new_partition = dask.delayed(pd.read_csv)(filename)
list_of_delayed[i] = new_partition
new_dask_df = dd.from_delayed(list_of_delayed, meta=dask_df._meta)

它可以具有不同的行数,但必须具有相同的列和数据类型

关于dask - 替换 dask 数据框分区,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51100606/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com