r - 如何使用缺失值执行 RMSE？-6ren

r - 如何使用缺失值执行 RMSE？

转载作者：行者123 更新时间：2023-12-04 01:39:55

27

4

我有一个巨大的数据集，有 679 行和 16 列，其中有 30% 的缺失值。所以我决定用来自包 impute 的函数 impute.knn 来估算这个缺失值，我得到了一个包含 679 行和 16 列但没有缺失值的数据集。

但现在我想使用 RMSE 检查准确性，我尝试了 2 个选项:

加载包裹 hydroGOF并申请 rmse功能

sqrt(mean (obs-sim)^2), na.rm=TRUE)

在两种情况下，我都会遇到错误: errors in sim .obs: non numeric argument to binary operator.
发生这种情况是因为原始数据集包含 NA值(缺少某些值)。

如果删除缺失值，如何计算 RMSE？然后 obs和 sim会有不同的尺寸。

最佳答案

怎么简单...

sqrt( sum( (df$model - df$measure)^2 , na.rm = TRUE ) / nrow(df) )

显然假设你的数据帧被称为 df你必须决定你的电话 (即 nrow(df) 包括缺少数据的两行；你想从 N 观察中排除这些吗？我猜是的，所以不是 nrow(df) 你可能想使用 sum( !is.na(df$measure) ) )或者，只关注@Joshua

sqrt( mean( (df$model-df$measure)^2 , na.rm = TRUE ) )

关于r - 如何使用缺失值执行 RMSE？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17703037/

27

4

0

文章推荐： scala - Akka 在不访问流的情况下组合汇

文章推荐： amazon-s3 - 将持久化的 keras 模型写入 s3

文章推荐： Laravel 4 迁移错误 - 创建两个 auto_increment 主键字段

python - Tensorflow Keras RMSE 指标返回的结果与我自己构建的 RMSE 损失函数不同
这是一个回归问题我的自定义 RMSE 损失: def root_mean_squared_error_loss(y_true, y_pred): return tf.keras.backen
r - 如何使用缺失值执行 RMSE？
我有一个巨大的数据集，有 679 行和 16 列，其中有 30% 的缺失值。所以我决定用来自包 impute 的函数 impute.knn 来估算这个缺失值，我得到了一个包含 679 行和 16 列但
python - 声音特征属性错误 : 'rmse'
在使用 librosa.feature.rmse 进行声音特征提取时，我有以下几点: import librosa import numpy as np wav_file = "C://TEM//te
python - 因变量进行对数变换时的回归 RMSE
我想预测一次旅行所需的时间。为此，我将因变量(以秒为单位的行程时间)转换为对数转换。当我使用其他一些特征对该变量进行回归时，我明白了: The score on held out data is:
随机森林模型的 RMSE 误差
我正在尝试训练随机森林模型，但出现以下错误。我需要对分类模型使用不同的设置来解决 RMSE 问题吗？我尝试将“好”转换为一个因素，但这引发了一个新错误。错误: Error in train.defa
image - RMSE Landsat8 AVHRR
我想在Landsat8 NDVI IMG和AVHRR NDVI IMG之间进行空间验证两个IMG具有相同的投影，范围和像素大小为此，我想确定RMSE。但是，我收到错误消息: 在行: error
R 指标 RMSE 不适用于分类模型
我正在尝试使用 R 和 xgboost 来研究我的模型。训练模型总体上效果很好，但对于插入符来说，度量存在一些问题。我尝试为类列设置一个因子，但仍然没有结果。我的数据 ID var1var2TA
使用 R 表示波士顿住房数据的均方根误差 (RMSE) :
我感谢您对此提出的任何形式的想法或帮助。我提交了一份包含波士顿住房数据的作业。目标是使用随机森林进行预测。要优化的数量是 RMSE。我对如何进行 RMSE 感到困惑。请大家帮忙谢谢我尝试遵循
machine-learning - 朴素贝叶斯分类器中的 RMSE
我有一个关于在 NB 分类场景中计算 RMSE 的非常基本的问题。我的训练数据 X 有大约 1000 多条评论，评级在 [1,5] 中，这是类别标签 Y。所以我正在做的是这样的: model = nb
python - 哪些因素会导致回归模型中的 RMSE 值极高？
我试图建立一个回归模型来预测电影票房。该数据集是从 Kaggle-TMDB 5000 电影数据集获取的，另一个数据集包含一些社交媒体相关属性。经过合并和清理后，最终数据集包含 183 个观测值和 5
python - python中是否有用于均方根误差(RMSE)的库函数？
我知道我可以像这样实现一个均方根误差函数: def rmse(predictions, targets): return np.sqrt(((predictions - targets) **
python - PyTorch 中多输出回归问题的 RMSE 损失
我正在训练一个 CNN 架构来使用 PyTorch 解决回归问题，其中我的输出是一个 20 个值的张量。我计划使用 RMSE 作为模型的损失函数，并尝试使用 PyTorch 的 nn.MSELoss(
scala - 计算 ALS 模型中的 RMSE
我想计算 ALS 模型中的 RMSE，我找到这样的代码: val ratings = data.map(_.split(',') match { case Array(user,i
sql - 直接从表中获取数据时获取 RMSE 分数。为此编写一个查询
我在数据库中有一个表，其中有许多特征，每个特征都有自己的实际值和预测值，我们还有两列，即 Id_partner 和 Id_accounts。我的主要目标是获得每个特征的 RMSE 分数对于每个合作伙伴
r - 分组数据上的 yardstick::rmse 返回错误和不正确的结果
我想评估几个回归模型的性能，并使用 yardstick 包来计算 RMSE。这是一些示例数据 model obs pred 1 A 1 1 2 B 1 2 3
sql - 直接从表中获取数据时获取 RMSE 分数。为此编写一个查询
我在数据库中有一个表，其中有许多特征，每个特征都有自己的实际值和预测值，我们还有两列，即 Id_partner 和 Id_accounts。我的主要目标是获得每个特征的 RMSE 分数对于每个合作伙伴
r - 如何通过在 R 中使用循环来查找 RMSE
如果我有一个包含 3 个变量的数据框: origdata <- data.frame( age <- c(22, 45, 50, 80, 55, 45, 60, 24, 18, 15),
r - 分组数据上的 yardstick::rmse 返回错误和不正确的结果
我想评估几个回归模型的性能，并使用 yardstick 包来计算 RMSE。这是一些示例数据 model obs pred 1 A 1 1 2 B 1 2 3
imagemagick compare -metric rmse 结果解释
我做了以下事情来获得两个 png 文件之间的差异: compare -metric rmse a.png b.png null: 我得到的结果是: 3374.35 (0.0514893) 我在 W
machine-learning - 机器学习中的损失函数和 RMSE 有什么区别？
有人可以解释一下机器学习中损失函数和 RMSE(均方根误差)之间的区别吗？最佳答案损失函数代表学习系统的输出和您想要最小化的“基本事实”的函数。对于回归问题，一个合理的损失函数是 RMSE。对

首页

博学

6Ren·AI

商城

r - 如何使用缺失值执行 RMSE？