gpt4 book ai didi

python - 将 Pandas 数据帧转换为 Dask 数据帧

转载 作者:IT老高 更新时间:2023-10-28 21:09:42 26 4
gpt4 key购买 nike

假设我有 pandas 数据框:

df=pd.DataFrame({'a':[1,2,3],'b':[4,5,6]})

当我将其转换为 dask 数据帧时,namedivisions 参数应由什么组成:

from dask import dataframe as dd 
sd=dd.DataFrame(df.to_dict(),divisions=1,meta=pd.DataFrame(columns=df.columns,index=df.index))

TypeError: init() missing 1 required positional argument: 'name'

编辑:假设我创建了一个 pandas 数据框,例如:

pd.DataFrame({'a':[1,2,3],'b':[4,5,6]})

同样如何创建 dask 数据帧,因为它需要三个附加参数,即 name,divisionsmeta

sd=dd.Dataframe({'a':[1,2,3],'b':[4,5,6]},name=,meta=,divisions=)

感谢您的回复。

最佳答案

我认为你可以使用 dask.dataframe.from_pandas :

from dask import dataframe as dd 
sd = dd.from_pandas(df, npartitions=3)
print (sd)
dd.DataFrame<from_pa..., npartitions=2, divisions=(0, 1, 2)>

编辑:

我找到 solution :

import pandas as pd
import dask.dataframe as dd
from dask.dataframe.utils import make_meta

df=pd.DataFrame({'a':[1,2,3],'b':[4,5,6]})

dsk = {('x', 0): df}

meta = make_meta({'a': 'i8', 'b': 'i8'}, index=pd.Index([], 'i8'))
d = dd.DataFrame(dsk, name='x', meta=meta, divisions=[0, 1, 2])
print (d)
dd.DataFrame<x, npartitions=2, divisions=(0, 1, 2)>

关于python - 将 Pandas 数据帧转换为 Dask 数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39721800/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com