gpt4 book ai didi

python - 来自 python 元组列表的 dask 数据框

转载 作者:行者123 更新时间:2023-12-01 01:31:19 25 4
gpt4 key购买 nike

我对 dask 真的很陌生。我想从 python 元组列表创建 dask 数据框。在 pandas 中,您可以使用 DataFrame.from_records 将元组列表转换为数据帧。什么函数可以在 dask 中为我提供相同的功能。我的数据看起来有点像这样

[(21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262, 'booking', ''), (21262, 'booking', 'NULL')]

我现在正在使用此代码来执行任务。这是正确的做法吗?

import pandas as pd
import dask
import dask.dataframe as dd

names = ['id', 'status', 'reg_entry']
dfs = dask.delayed(pd.DataFrame.from_records)(cursor.fetchall(), columns=names)

df = dd.from_delayed(dfs)

最佳答案

您可以尝试从现有的 pandas 数据帧创建 dask 数据帧(以便能够使用所有 pandas 构造函数):

df = pd.DataFrame([(21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262, 'booking', ''), (21262, 'booking', 'NULL')])
ddf = dd.from_pandas(df, npartitions=2)

关于python - 来自 python 元组列表的 dask 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52829932/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com