gpt4 book ai didi

r - 如何使用缺失值执行 RMSE?

转载 作者:行者123 更新时间:2023-12-04 01:39:55 27 4
gpt4 key购买 nike

我有一个巨大的数据集,有 679 行和 16 列,其中有 30% 的缺失值。所以我决定用来自包 impute 的函数 impute.knn 来估算这个缺失值,我得到了一个包含 679 行和 16 列但没有缺失值的数据集。

但现在我想使用 RMSE 检查准确性,我尝试了 2 个选项:

  • 加载包裹 hydroGOF并申请 rmse功能
  • sqrt(mean (obs-sim)^2), na.rm=TRUE)

  • 在两种情况下,我都会遇到错误: errors in sim .obs: non numeric argument to binary operator.
    发生这种情况是因为原始数据集包含 NA值(缺少某些值)。

    如果删除缺失值,如何计算 RMSE?然后 obssim会有不同的尺寸。

    最佳答案

    怎么简单...

    sqrt( sum( (df$model - df$measure)^2 , na.rm = TRUE ) / nrow(df) )

    显然假设你的数据帧被称为 df你必须决定你的 电话 (即 nrow(df) 包括缺少数据的两行;你想从 N 观察中排除这些吗?我猜是的,所以不是 nrow(df) 你可能想使用 sum( !is.na(df$measure) ) )或者,只关注@Joshua
    sqrt( mean( (df$model-df$measure)^2 , na.rm = TRUE ) )

    关于r - 如何使用缺失值执行 RMSE?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17703037/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com