r - 插入符号中使用预处理的数据插补返回的观察结果少于预期-6ren

r - 插入符号中使用预处理的数据插补返回的观察结果少于预期

转载作者：行者123 更新时间：2023-12-01 18:32:20

26

4

我想知道为什么 preProcess用于估算数据集缺失值的 R 插入符包中的函数返回的观察结果少于原始数据集中的观察结果？
例如:

library(caret)

t <- data.frame(seq_len(100000),seq_len(100000))

for (i in 1:100000) 
{
if (i %% 10 == 0) t[i,1] <- NA; 
if (i %% 100 == 0) t[i,2] <- NA 
}

preProcValues <- preProcess(t, method = c("knnImpute"))

preProcValues 将仅包含 2 个变量的 90000 个观测值，而预期为 100000 个。

最佳答案

来自文档:

The function preProcess estimates the required parameters for each operation and predict.preProcess is used to apply them to specific data sets.

这里，preProcValues 不是插补后的t，它包含使用predict 对t 执行插补所需的参数。预处理。

您不应该期望 preProcValues 中有 100K 个观察值

提示:看看source code使用 NA 值查看引擎盖下发生了什么

使用您的示例(修改为使用 method = "medianImpute" - 请参阅此 question(以及上述源代码)了解您尝试执行的操作为何不起作用“knnImpute”)

preProcValues <- preProcess(t, method = "medianImpute") 
> preProcValues$dim[1]
#[1] 90000

这里我们用中位数(50K)替换t中的NA值

t2 <- predict(preProcValues, t)
> dim(t2)[1]
#[1] 100000

关于r - 插入符号中使用预处理的数据插补返回的观察结果少于预期，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33317287/

26

4

0

文章推荐： iphone - 为什么我的文件没有保存？

文章推荐： iphone - 将 subview 添加到不滚动的 tableview

文章推荐： ios - 如果在 Ipad/Iphone 上激活链接，则为灰色背景

sorting - 如何在SAS中不进行排序的情况下删除重复的记录\观察？
我想知道是否有一种方法可以重复记录而不进行排序？有时候，我想保持原始顺序，只想删除重复的记录。是否可以？顺便说一句，以下是我所知道的有关重复记录的信息，这些记录最终会进行排序。 1。 proc s
java - 观察 for 循环内的实时数据
我想更新我的 Activity 中依赖于另一个列表的数据的列表。这两个数据列表都是从我的 View 模型的 Activity 中观察到的。从第一个列表获取数据后，我需要在此列表上运行 for 循环以获
javascript - 在函数内等待/观察
我无法理解这个问题。我怎样才能等待 i==2 完成然后再继续其他 i 的操作？ class Observable { constructor() { this.observer
javascript - 观察 @each 时了解哪个项目触发事件
我正在观察这样的 Ember Data RecordArray: myArray: function() { return MyRecord.find(); }.property(), isDir
ios - 观察 'strokeEnd'层动画事件
我想在动画开始时观察 strokeEnd 键路径。但是它不起作用，我哪里出错了？ - (void)addAnimation { // do animation CABasicAnima
javascript - 观察 Algorand 上的交易
是否可以在 Algorand 中观看某个交易，就像在以太坊中观看某个事件一样？最佳答案官方 algod 和 indexer API 目前不支持在 Algorand 上观看交易/事件。您可以通过使
swiftui - 观察 SwiftUI 中的框架变化
我有一个可以拖放到其他 View 之上的 View (可以说是类别)。为了检测我在哪个类别 View 之上，我将它们的帧存储在一个帧数组中，这发生在它们不可见叠加层的 onAppear 中。 (这基于
jquery - 观察 jQuery 中的显示变化
是否可以将观察者添加到可见性更改(即调用 show() 和 hide())时触发的 DOM 元素？谢谢! 最佳答案如果您想观察任何对 .show() 或 .hide() 的调用，并且可以访问 jQu
iphone - 观察 NSUserDefaults 键的值更改
我对保存在 NSUserdefaults 中的特定键的值变化感兴趣。然而，我所拥有的并不适合我。 observeValueForKeyPath 不会被触发。更新:我想我已经发现了这个问题。如果我使用
iphone - 观察 UITableView 中的捏合多点触控手势
我正在寻找在 UITableView 顶部实现捏入/捏出，我已经研究了几种方法，包括这个: Similar question 但是，虽然我可以创建一个 UIViewTouch 对象并将其覆盖到我的 U
cocoa - 观察 NSMutableArray - 仅使用数组访问器
我有一个在界面中公开的可变数组。我还公开了数组访问器来修改数组。如果数组内发生任何修改，我将不得不使用 KVO 重置并重新计算一些数据。为了支持 KVO，我使用 array accessors如下图:
iphone - 观察 NSPopupButton 的变化
当 NSPopupButton 发生变化时如何获得方法调用？谢谢! 最佳答案您只需添加一个操作方法，就像使用 NSButton 或任何其他控件一样。关于iphone - 观察 NSPopupBut
cocoa - 观察 Cocoa 中的键值对多关系
我正在尝试让键值观察适用于 NSMutableArray。下面是被观察类 MyObservee 的 .h 文件: @interface MyObservee : NSObject { @pri
javascript - 观察 NodeJS 集群是否退出
我很难理解让 Node.js 进程(异步)运行但仍然触发“退出”状态，以便在 CPU 处理完成后我可以做更多事情。例如，我有一个 Google 地方信息抓取工具，可以在所有可用的 CPU 上高效地分
go - 观察 pod 状态的所有变化
我正在尝试编写行为类似于kubectl get pods --watch . 这样，每次 pod 的状态发生变化时，我都会被触发。我创建了一个 go项目(在集群中运行)并添加以下代码: podsWa
javascript - 观察 div 何时隐藏或显示
我有这个代码: 当时我需要触发Javascript方法或具有给定 id 的 div 隐藏或显示，这将在屏幕调整大小期间发生(因此 u k-hidden-small )，这可以
couchbase - 观察 Couchbase 文档更改的推荐方法是什么？
我想使用 Couchbase，但我想在一些类似于 RethinkDB 的方式实现更改跟踪。似乎有很多方法可以将更改从 Couchbase 服务器推送给我。 DCP 点击 XDCR 哪一个是正确的选择
javascript - 观察 HTMLElements 上的隐式大小变化
虽然 MutationObserver 允许监视 HTMLElement 属性的显式大小更改，但它似乎没有一种方法/配置允许我监视其大小的隐式更改，这些更改是由浏览器。这是一个例子: const o
AngularJS 观察 DOM 变化
我有一个 auto-carousel 指令，它循环访问链接元素的子元素。但是，子级尚未加载到 DOM 中，因为它们的 ng-if 表达式尚未解析。如何确保父指令知道其 DOM 树已发生更改？
javascript - 观察 AngularJS 指令中函数的值
有没有办法观察 AngularJS 指令中函数表达式的值变化？我有以下 HTML 和 JavaScript，模板中 {{editable()}} 的插值显示该值计算为 true，而检查 Chrome

首页

博学

6Ren·AI

商城

r - 插入符号中使用预处理的数据插补返回的观察结果少于预期