gpt4 book ai didi

python - 大数据多列计算的内存错误

转载 作者:太空宇宙 更新时间:2023-11-03 19:47:18 24 4
gpt4 key购买 nike

我想计算现有列并创建一个新列。

df = dd.from_pandas(ddf, npartitions=100)

df['new_column'] = df[['column']].apply(lambda dpan_india_df: dpan_india_df['column']*8000, axis = 1, meta=('object'))

如何有效利用内存?供您引用,此文件是 800M 文件。

  File "Sectorize3.py", line 55, in <lambda>
df['new_column'] = df[['column']].apply(lambda ddf: ddf['column']*8000, axis = 1, meta=('object'))
MemoryError: occurred at index 1512070

最佳答案

你可以这样做。

df['new_column']=df['column']*8000

关于python - 大数据多列计算的内存错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60051006/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com