gpt4 book ai didi

machine-learning - 适应给定输入数据(无论是否给定)的机器学习算法?

转载 作者:行者123 更新时间:2023-11-30 09:14:55 26 4
gpt4 key购买 nike

我正在寻找一种机器学习算法,可以处理缺少参数的输入数据。

示例:使用包含 10 个输入参数的数据训练模型。 10 个参数中有 2 个值为 NaN 的数据用于进行预测。

是否有任何机器学习算法可以利用这些数据进行预测,或者我是否必须首先以任何方式处理 NaN 值?是否有一种机器学习算法具有处理 NaN 值的内置函数?

<小时/>

也许我的问题不够详细。我确实拥有训练模型所需的所有数据,并且我确实知道如何在训练之前处理缺失值的数据。我的问题的意思不同。一旦我训练了模型,并且我将在生产、实时数据中使用该模型,例如,仅获得我训练模型所用的 10 个特征中的 8 个特征的值,是否有一种算法仍然可以进行预测?我的第一个想法是为这 10 个值中的每一个设置一个默认值,并在我收到 Nan 值时设置该值,但我希望有一个能够自行处理此问题的算法。这样模型就能够用最合适的替换值(平均值、回填或其他)替换 Nan 值

最佳答案

是的,机器学习算法仍然可以利用可用数据进行预测,但您应该考虑处理丢失的数据,以便模型更好地训练。

在训练模型之前,有多种方法可以处理数据中的缺失值。您可以尝试的一些方法是

  1. 忽略数据行
  2. 回填或前向填充以传播下一个或上一个值分别:
    • 用于回填 dataframe.fillna(method='bfill',inplace=True)
    • 用于前向填充 dataframe.fillna(method='ffill',inplace=True)
  3. 替换为固定值范围之外的某个常量-999,-1等等
  4. 替换为平均值、中值
  5. Isnull feature 添加新功能 isnull 指示哪些行具有此功能缺少值。通过这样做,基于树它现在可以理解存在缺失值的方法。这缺点是我们将功能数量增加了一倍。

关于machine-learning - 适应给定输入数据(无论是否给定)的机器学习算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58500162/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com