gpt4 book ai didi

python - 如何处理分类变量列中的 0 值?

转载 作者:行者123 更新时间:2023-11-30 10:00:16 24 4
gpt4 key购买 nike

我在合成数据框中有一列“性别”,其 value_counts 如下所示:

df['Gender'].value_counts()

male 42758
female 27170
other 27060
unknown 6849
0 724
Name: Gender, dtype: int64

我正在预处理此数据集以进行线性回归。由于“男性”是最常出现的值,因此将“0”和“未知”组合在一起并用“男性”替换它们的出现是否有意义?

最佳答案

  • 您可以删除这些行,因为与此列的其他级别相比,它们的计数非常低。
  • 另一种解决方案是删除 then 值并使用其他行的中值、众数或最接近的值来填充。

关于python - 如何处理分类变量列中的 0 值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59306928/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com