gpt4 book ai didi

python - 如何替换数据框列中大于特定值的值?

转载 作者:行者123 更新时间:2023-12-02 19:06:44 26 4
gpt4 key购买 nike

我有一个数据集,其中年龄字段中有一些异常值,这是我排序的数据的唯一值

unique = df_csv['AGE'].unique()
print (sorted(unique))

[21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 79, 126, 140, 149, 152, 228, 235, 267]

如何用“年龄”列的平均值或中位数替换任何大于 80 的值?

最佳答案

由于您想要使用数据框中的列,因此您应该解析为 loc:

 # replace `median` with `mean` if you want
df_csv.loc[df_csv['AGE']>80,'AGE'] = df_csv['AGE'].median()

关于python - 如何替换数据框列中大于特定值的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64938416/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com