gpt4 book ai didi

python - dask 数据帧 head() 返回空 df

转载 作者:行者123 更新时间:2023-12-02 06:50:38 25 4
gpt4 key购买 nike

我有一个 dask 数据框,其中一列上有索引。问题是如果我执行 df.head() 它总是返回一个空的 df,而 df.tail 总是返回正确的 df。我检查过 df.head 总是检查第一个分区中的前 n 个条目。因此,如果我执行 df.reset_index(),它应该可以工作,但事实并非如此

下面是重现此问题的代码:

import dask.dataframe as dd
import pandas as pd

data = pd.DataFrame({
'i64': np.arange(1000, dtype=np.int64),
'Ii32': np.arange(1000, dtype=np.int32),
'bhello': np.random.choice(['hello', 'Yo', 'people'], size=1000).astype("O")
})

daskDf = dd.from_pandas(data, chunksize=3)
daskDf = daskDf.set_index('bhello')
print(daskDf.head())

最佳答案

尝试使用npartitions=-1调用head,以使用所有分区(默认情况下,仅使用第一个,并且可能没有足够的元素来返回)。

daskDf.head(npartitions=-1)

关于python - dask 数据帧 head() 返回空 df,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50524050/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com