gpt4 book ai didi

pandas - 如何在 Dask Dataframe 上估算列值?

转载 作者:行者123 更新时间:2023-12-03 03:38:11 28 4
gpt4 key购买 nike

我想用 pandas 来估算 Dask Dataframe 的负值,我使用以下代码:

df.loc[(df.column_name < 0),'column_name'] = 0

最佳答案

我认为需要dask.dataframe.Series.clip_lower :

ddf['B'] = ddf['B'].clip_lower(0)

示例:

import pandas as pd

df = pd.DataFrame({'F':list('abcdef'),
'B':[-4,5,4,-5,5,4],
'A':list('aaabbb')})

print (df)
A B F
0 a -4 a
1 a 5 b
2 a 4 c
3 b -5 d
4 b 5 e
5 b 4 f

from dask import dataframe as dd
ddf = dd.from_pandas(df, npartitions=3)
#print (ddf)

ddf['B'] = ddf['B'].clip_lower(0)
print (ddf.compute())
A B F
0 a 0 a
1 a 5 b
2 a 4 c
3 b 0 d
4 b 5 e
5 b 4 f

对于更通用的解决方案,请使用 dask.dataframe.Series.mask `:

ddf['B'] = ddf['B'].mask(ddf['B'] > 0, 3)
print (ddf.compute())
A B F
0 a -4 a
1 a 3 b
2 a 3 c
3 b -5 d
4 b 3 e
5 b 3 f

关于pandas - 如何在 Dask Dataframe 上估算列值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49477393/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com