gpt4 book ai didi

python - Pandas 中 bool 索引导致内存爆炸

转载 作者:行者123 更新时间:2023-11-30 09:02:05 25 4
gpt4 key购买 nike

我正在 Pandas 12.0 中处理非常大的 float 数据系列。我想做的是将极端异常值设置为本系列中的 NaN,它表示标准化特征向量(平均值为 0,标准差为 1)。

我可以毫不费力地制作特征向量的 bool 掩码来查找极端异常值:

mask = feature_series > 10 | feature_series < 10

这需要最少的资源。然而,当我尝试实际使用这个掩码时,我遇到了内存爆炸,并且必须在崩溃发生之前强制退出。这种情况发生在:

feature_series[mask] = np.nan

也不限于此操作。我还遇到了内存爆炸:

mask.any()

是什么导致了这种情况发生?我觉得这可能是一个错误,但我对 Pandas 还比较陌生,不能确定。

最佳答案

可能你需要一些括号

mask = (feature_series > 10) | (feature_series < 10)

关于python - Pandas 中 bool 索引导致内存爆炸,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20461004/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com