gpt4 book ai didi

r - 将数据分区创建为训练、测试和验证 - 在 R 中拆分

转载 作者:行者123 更新时间:2023-11-30 08:33:03 25 4
gpt4 key购买 nike

我想将训练数据分为 70% 训练、15% 测试和 15% 验证。我正在使用插入符包的 createDataPartition() 函数。我将其拆分如下

train <- read.csv("Train.csv")
test <- read.csv("Test.csv")

split=0.70
trainIndex <- createDataPartition(train$age, p=split, list=FALSE)
data_train <- train[ trainIndex,]
data_test <- train[-trainIndex,]

是否有任何方法可以像下面的 H2o 方法一样使用 createDataPartition() 分为训练、测试和验证?

data.hex <- h2o.importFile("Train.csv")
splits <- h2o.splitFrame(data.hex, c(0.7,0.15), destination_frames = c("train","valid","test"))
train.hex <- splits[[1]]
valid.hex <- splits[[2]]
test.hex <- splits[[3]]

最佳答案

在基础 R 中使用 sample() 函数的方法是

splitSample <- sample(1:3, size=nrow(data.hex), prob=c(0.7,0.15,0.15), replace = TRUE)
train.hex <- data.hex[splitSample==1,]
valid.hex <- data.hex[splitSample==2,]
test.hex <- data.hex[splitSample==3,]

关于r - 将数据分区创建为训练、测试和验证 - 在 R 中拆分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36482475/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com