gpt4 book ai didi

python - scikit-learn:通过随机采样填充缺失值

转载 作者:行者123 更新时间:2023-11-30 08:49:31 25 4
gpt4 key购买 nike

令我惊讶的是sklearn.preprocessing.Imputer不提供以下填充缺失值的策略:对于任何缺失值,从给定值中均匀随机采样一个值并替换。

我认为这是比用平均值、最常见的值或中值替换更好的策略,因为它不会在值的分布中产生人为的峰值。

我需要自己编写一个转换器来执行此操作吗?

ps。在更元层面的讨论中,当我在像 scikit-learn 这样的库中找不到我认为简单、几乎标准的操作作为组件时,我总是有点困惑。让我想知道:这个库是否还没有完成,或者我是否正在尝试做一些违反最佳实践的事情?有什么建议吗?

最佳答案

对于离散数字系列,从现有值中随机采样可能比使用均值或中位数更好,后者会将所有缺失值替换为单个数字,并且肯定会给分布带来人为尖峰。

关于python - scikit-learn:通过随机采样填充缺失值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42858677/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com