gpt4 book ai didi

python - 当我将 isin 与 Dask 数据帧一起使用时,会引发 NotImplementedError

转载 作者:行者123 更新时间:2023-12-02 11:34:11 24 4
gpt4 key购买 nike

假设我有两个 dask 数据框:

import dask.dataframe as dd 
import pandas as pd

dd_1 = dd.from_pandas(pd.DataFrame({'a': [1, 2,3], 'b': [6, 7, 8]}), npartitions=1)

dd_2 = dd.from_pandas(pd.DataFrame({'a': [1, 2, 5], 'b': [3, 7, 1]}), npartitions=1)

现在我想使用第二个列中的值来过滤第一个列:

dd_1[dd_1.a.isin(dd_2.a)]

当我尝试执行此操作时,会引发以下错误:

NotImplementedError                       Traceback (most recent call last)
<ipython-input-38-850f035e0842> in <module>
----> 1 dd_1[dd_1.a.isin(dd_2.a)]

/usr/local/lib/python3.7/site-packages/dask/dataframe/core.py in isin(self, values)
2113 @derived_from(pd.Series)
2114 def isin(self, values):
-> 2115 return elemwise(M.isin, self, list(values))
2116
2117 @insert_meta_param_description(pad=12)

/usr/local/lib/python3.7/site-packages/dask/dataframe/core.py in __getitem__(self, key)
2045 graph = HighLevelGraph.from_collections(name, dsk, dependencies=[self, key])
2046 return Series(graph, name, self._meta, self.divisions)
-> 2047 raise NotImplementedError()
2048
2049 @derived_from(pd.DataFrame)

NotImplementedError:

有什么建议吗?

最佳答案

使用最新版本的dask (2.9.1),我个人的解决方法是将第二个系列(在您的情况下是dd_2.a)转换为pandas

关于python - 当我将 isin 与 Dask 数据帧一起使用时,会引发 NotImplementedError,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55247264/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com