gpt4 book ai didi

python - 如何将系列或序列分配给 dask 数据框列?

转载 作者:太空宇宙 更新时间:2023-11-04 05:25:00 25 4
gpt4 key购买 nike

我的 dask dataframe 如下:

In [65]: df.head()
Out[65]:
id_orig id_cliente id_cartao inicio_processo fim_processo score \
0 1.0 1.0 1.0 1.0 1.0 1.0
1 1.0 1.0 1.0 1.0 1.0 1.0
2 1.0 1.0 1.0 1.0 1.0 1.0
3 1.0 1.0 1.0 1.0 1.0 1.0
4 1.0 1.0 1.0 1.0 1.0 1.0

automatico canal aceito motivo_recusa variante
0 1.0 1.0 1.0 1.0 1.0
1 1.0 1.0 1.0 1.0 1.0
2 1.0 1.0 1.0 1.0 1.0
3 1.0 1.0 1.0 1.0 1.0
4 1.0 1.0 1.0 1.0 1.0

分配一个整数有效:

In [92]: df = df.assign(id_cliente=999)

In [93]: df.head()
Out[93]:
id_orig id_cliente id_cartao inicio_processo fim_processo score \
0 1.0 999 1.0 1.0 1.0 1.0
1 1.0 999 1.0 1.0 1.0 1.0
2 1.0 999 1.0 1.0 1.0 1.0
3 1.0 999 1.0 1.0 1.0 1.0
4 1.0 999 1.0 1.0 1.0 1.0

automatico canal aceito motivo_recusa variante
0 1.0 1.0 1.0 1.0 1.0
1 1.0 1.0 1.0 1.0 1.0
2 1.0 1.0 1.0 1.0 1.0
3 1.0 1.0 1.0 1.0 1.0
4 1.0 1.0 1.0 1.0 1.0

但是,在现有列中分配 Series 或任何其他可迭代对象的其他方法均无效。

我怎样才能做到这一点?

最佳答案

DataFrame.assign 接受任何标量或任何 dd.Series

df = df.assign(a=1)  # accepts scalars
df = df.assign(z=df.x + df.y) # accepts dd.Series objects

如果您尝试分配一个 NumPy 数组或 Python 列表,那么您的数据可能足够小以适合 RAM,因此 Pandas 可能比 Dask.dataframe 更适合。

您也可以使用简单的 setitem 语法

df['a'] = 1
df['z'] = df.x + df.y

关于python - 如何将系列或序列分配给 dask 数据框列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39109855/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com