gpt4 book ai didi

r - 尝试在测试数据集上使用 model.matrix 函数

转载 作者:行者123 更新时间:2023-11-30 09:59:02 24 4
gpt4 key购买 nike

我正在参加 Kaggle 竞赛(房价:高级回归技术)。我一直在尝试对数据运行岭模型。我首先将测试数据和训练数据结合起来,并进行了一些数据清理,然后将它们分开,并使用训练集提出将其应用到测试数据上的函数。

traintest=rbind(train,test)

#Converting all chars into factors

library(dplyr)
traintest = traintest %>% mutate_if(is.character, as.factor)

去掉一些变量后,我分离了两个数据集。

train <- traintest[is.na(traintest$SalePrice) == "FALSE",]
test <- traintest[is.na(traintest$SalePrice) == "TRUE",]

当我在训练数据上使用 model.matrix 函数时,它会返回矩阵。但是当我在测试数据上尝试它时,它给了我一个包含所有变量的空行。

x <- model.matrix(SalePrice~., train)[,-1]
x.test <- model.matrix(SalePrice~.,test)[,-1]

测试数据有一列我试图预测的 NA。

最佳答案

问题在于 test$SalePrice 只是 NA,您需要为 model.matrix 使用不同的列。

或者您可以不使用 SalePrice 作为

model.matrix(~变量1 + 变量2, 测试)

model.matrix(~ ., test[-1])

关于r - 尝试在测试数据集上使用 model.matrix 函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59794360/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com