r - 如何解决引导回归中的 "number of items to replace is not a multiple of replacement length"错误？

转载作者：行者123 更新时间：2023-12-05 01:16:39

29

4

我正在尝试使用 Andy Field 的教科书 Discovering Statistics Using R 中的代码进行自举回归模型。

我正在努力解释运行 boot() 函数时收到的错误消息。通过阅读其他论坛帖子，我了解到它告诉我两个对象之间的项目数量不平衡，但我不明白这在我的上下文中意味着什么以及如何解决它。

您可以下载我的数据here (Airbnb 列表上的公开数据集)并在下面找到我的代码和完整的错误消息。我使用因子虚拟变量和连续变量的混合作为预测变量。提前感谢您的帮助!

代码:

bootReg <- function (formula, data, i)
{
d <- data [i,]
fit <- lm(formula, data = d)
return(coef(fit))
}

bootResults <- boot(statistic = bootReg, formula = review_scores_rating ~ instant_bookable + cancellation_policy + 
                  host_since_cat + host_location_cat + host_response_time + 
                  host_is_superhost + host_listings_cat + property_type + room_type + 
                  accommodates + bedrooms + beds + price + security_deposit + 
                  cleaning_fee + extra_people + minimum_nights + amenityBreakfast + 
                  amenityAC + amenityElevator + amenityKitchen + amenityHostGreeting + 
                  amenitySmoking + amenityPets + amenityWifi + amenityTV,
                  data = listingsRating, R = 2000)

错误:

Error in t.star[r, ] <- res[[r]] : 
number of items to replace is not a multiple of replacement length
In addition: Warning message:
In doTryCatch(return(expr), name, parentenv, handler) :
restarting interrupted promise evaluation

最佳答案

问题

问题是你的因子变量。当您对数据的子集执行 lm() 时(在 boot::boot() 中反复执行)，您只会获得存在的因子水平。然后每个系数绘制可以具有不同的长度。如果你这样做，这可以被复制

debug(boot)
set.seed(123)
bootResults <- boot(statistic = bootReg, formula = review_scores_rating ~ instant_bookable + cancellation_policy + 
                        host_since_cat + host_location_cat + host_response_time + 
                        host_is_superhost + host_listings_cat + property_type + room_type + 
                        accommodates + bedrooms + beds + price + security_deposit + 
                        cleaning_fee + extra_people + minimum_nights + amenityBreakfast + 
                        amenityAC + amenityElevator + amenityKitchen + amenityHostGreeting + 
                        amenitySmoking + amenityPets + amenityWifi + amenityTV,
                    data = listingsRating, R = 2)

这将允许您一次一行地通过函数调用。运行该行后

res <- if (ncpus > 1L && (have_mc || have_snow)) {
    if (have_mc) {
        parallel::mclapply(seq_len(RR), fn, mc.cores = ncpus)
    }
    else if (have_snow) {
        list(...)
        if (is.null(cl)) {
            cl <- parallel::makePSOCKcluster(rep("localhost", 
                ncpus))
            if (RNGkind()[1L] == "L'Ecuyer-CMRG") 
                parallel::clusterSetRNGStream(cl)
            res <- parallel::parLapply(cl, seq_len(RR), fn)
            parallel::stopCluster(cl)
            res
        }
        else parallel::parLapply(cl, seq_len(RR), fn)
    }
} else lapply(seq_len(RR), fn)

然后试试

setdiff(names(res[[1]]), names(res[[2]]))
# [1] "property_typeBarn"         "property_typeNature lodge"

第一个子集中存在两个因子水平，第二个子集中不存在。这导致了您的问题。

解决方案

事先使用 model.matrix() 扩展您的因子(在 this Stack Overflow post 之后):

df2 <- model.matrix( ~ review_scores_rating + instant_bookable + cancellation_policy + 
                        host_since_cat + host_location_cat + host_response_time + 
                        host_is_superhost + host_listings_cat + property_type + room_type + 
                        accommodates + bedrooms + beds + price + security_deposit + 
                        cleaning_fee + extra_people + minimum_nights + amenityBreakfast + 
                        amenityAC + amenityElevator + amenityKitchen + amenityHostGreeting + 
                        amenitySmoking + amenityPets + amenityWifi + amenityTV - 1, data = listingsRating)
undebug(boot)

set.seed(123)
bootResults <- boot(statistic = bootReg, formula = review_scores_rating ~ .,
                    data = as.data.frame(df2), R = 2)

(请注意，在整个过程中，我将 R 减少到 2 只是为了在调试期间更快地运行)。

关于r - 如何解决引导回归中的 "number of items to replace is not a multiple of replacement length"错误？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53023472/

29

4

0

文章推荐： opengl-es - GLSL 优化 : check if variable is within range

文章推荐： echarts - 自定义颜色 gridLine echarts

解决@Cacheable在同一个类中方法调用不起作用的问题
@Cacheable在同一类中方法调用无效上述图片中，同一个类中genLiveBullets()方法调用同类中的queryLiveByRoom()方法，这样即便标识了Cacheable标签，
解决@Transaction注解导致动态切换更改数据库失效问题
目录 @Transaction注解导致动态切换更改数据库失效使用场景遇到问题解决 @Transaction
解决@RequestBody使用不能class类型匹配的问题
@RequestBody不能class类型匹配在首次第一次尝试使用@RequestBody注解开始加载字符串使用post提交（貌似只能post），加Json数据格式传输的时候，
解决@Autowired注入static接口的问题
目录 @Autowired注入static接口问题 @Autowired自动注入普通service很方便但是如果注入static修饰的serv
解决@RequestBody部分属性丢失的问题
目录 @RequestBody部分属性丢失问题描述 JavaBean实现 Controller实现
解决@PathVariable参数接收不完整的问题
目录解决@PathVariable参数接收不完整的问题今天遇到的问题是：解决办法： @PathVariable接受的参
解决@Transactional注解事务不回滚不起作用的问题
这几天在项目里面发现我使用@Transactional注解事务之后，抛了异常居然不回滚。后来终于找到了原因。如果你也出现了这种情况，可以从下面开始排查。 1、特性先来了解一下@Trans
解决@PathVariable对于特殊字符截断的问题
概述： ? 1
解决@Around对静态方法不生效的问题
场景：在处理定时任务时，由于这几个方法都是静态方法，在aop的切面中使用@Around注解，进行监控方法调用是否有异常。发现aop没有生效。代码如下：
解决.net项目中上传的图片或者文件太大无法上传问题
最近做项目的时候用户提出要上传大图片一张图片有可能十几兆本来用的第三方的上传控件有限制图片上传大小的设置以前设置的是2M&nb
azure - 解决 SystemForCrossDomainIdentityManagementBadResponse
我已经实现了这个SCIM reference code在我们的应用程序中。我实现的代码确实通过了此postman link中存在的所有用户测试集合。。我的 SCIM Api 也被 Azure 接受
javascript - 等待 ".then"解决
我一直对“然后”不被等待的行为感到困扰，我明白其原因。然而，我仍然需要绕过它。这是我的用例。 doWork(family) { return doWork1(family)
javascript - 解决 promise
我正在尝试查找 channel 中的消息是否仍然存在，但是，我不确定如何解决 promise ，查看其他答案和文档，我可以看到它可能是通过函数实现的，但我是不完全确定如何去做。我希望能在这方面获得一些
java - 解决 IllegalAccessError
我有以下情况: 同一工作区中的 2 个 Eclipse 项目:Apa 和 Bepa(为简洁起见，使用化名)。 Apa 项目引用(包括)Bepa 项目。我在 Bepa 有一个类 X，具有公共(publ
java - 解决 NoClassDefFoundError
这个问题已经有答案了: Why am I getting a NoClassDefFoundError in Java? (31 个回答) 已关闭 6 年前。我正在努力学习 spring。所以我输入
java - 解决 ConcurrentModificationException
我正在写一个小游戏，屏幕上有许多圆圈在移动。我在两个线程中管理圈子，如下所示: public void run() { int stepCount = 0; int dx;
python - 解决()执行中止
我在使用 Sympy 求解方程时遇到问题。当我运行代码时，例如: 打印(校正(10)) 我希望它打印一个数字 f。相反，它给我错误:执行中止。 def correction(r): from
css - div布局问题。解决
好吧，我制作的每个页面都有这个问题。我不确定我做错了什么，但我所有的页面都不适用于所有分辨率。可能是因为我使用的是宽屏？大声笑我不确定，但在小于宽屏分辨率的情况下，它永远不会看起来正确。它的某些部分你
c# - 解决 ||检查字符串时的运算符
我正在尝试像这样进行一个非常简单的文化 srting 检查 if(culture.ToUpper() == "ES-ES" || "IT-IT") { //do something } else
linux - 解决.bashrc的最佳方法是什么？
Closed. This question is off-topic. It is not currently accepting answers. Learn more。想改进这个问题吗？Upda

首页

博学

6Ren·AI

商城

r - 如何解决引导回归中的 "number of items to replace is not a multiple of replacement length"错误？

问题

解决方案