gpt4 book ai didi

dask - 无法使用 dask 删除列或切片数据框?

转载 作者:行者123 更新时间:2023-12-04 11:22:46 30 4
gpt4 key购买 nike

我正在尝试使用 dask 而不是 Pandas,因为我有 2.6gb csv 文件。
我加载它,我想删除一列。但似乎无论是 drop 方法
df.drop('column') 或切片 df[ : , :-1]

尚未实现。是这种情况还是我只是遗漏了什么?

最佳答案

我们实现了 drop this PR 中的方法.这从 dask 0.7.0 开始可用。

In [1]: import pandas as pd

In [2]: df = pd.DataFrame({'x': [1, 2, 3], 'y': [3, 2, 1]})

In [3]: import dask.dataframe as dd

In [4]: ddf = dd.from_pandas(df, npartitions=2)

In [5]: ddf.drop('y', axis=1).compute()
Out[5]:
x
0 1
1 2
2 3

以前也可以使用列名切片;当然,如果您有很多列,这可能不那么有吸引力。
In [6]: ddf[['x']].compute()
Out[6]:
x
0 1
1 2
2 3

关于dask - 无法使用 dask 删除列或切片数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31867983/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com