gpt4 book ai didi

R Caret 的时间片 - 窗口和地平线不清楚

转载 作者:行者123 更新时间:2023-12-01 22:26:09 25 4
gpt4 key购买 nike

使用插入符中的时间片及其参数,如何将数据拆分为 xyz 行,每行的长度为 12?

理想情况下,还要考虑 60-20-20 的训练-测试-验证比率。

我应该这样设置吗:

initialWindow=12, horizo​​n=12, fixedWindow=TRUE?

我已经阅读了文档,但我仍然不清楚。

最佳答案

您可以尝试使用像 1:100 这样的示例向量会发生什么.如果你设置 window = 12fixedWindow = T训练集总是有 12 行。 horizon指定将包含在测试集中的后续观察的大小。如果它设置为 12 并且您不希望多次预测任何行 skip必须设置为 (horizo​​n - 1)。

例如通过设置 initialWindow 可以实现 60-20-20 的分区到前 60% 的大小并首先在 slices 的前半部分运行您的模型并使用 slices 的后半部分作为最后的 20%。

我不知道您是否尝试在插入符号的 train 中使用时间片功能已经。在任何情况下,您都可以使用 createTimeSlices() 试验不同的设置。功能:

library(caret)
dat <- 1:100

slices <- createTimeSlices(dat, initialWindow = 12, horizon = 1,
skip = 0, fixedWindow = T)
slices # 88 test and train sets
# [...]

slices <- createTimeSlices(y = dat, initialWindow = 12, horizon = 12,
skip = 11, fixedWindow = T)
slices
# 7 test and train sets, observations 97 - 100 not in any test set

$train
$train$Training01
[1] 1 2 3 4 5 6 7 8 9 10 11 12

$train$Training13
[1] 13 14 15 16 17 18 19 20 21 22 23 24

$train$Training25
[1] 25 26 27 28 29 30 31 32 33 34 35 36

$train$Training37
[1] 37 38 39 40 41 42 43 44 45 46 47 48

$train$Training49
[1] 49 50 51 52 53 54 55 56 57 58 59 60

$train$Training61
[1] 61 62 63 64 65 66 67 68 69 70 71 72

$train$Training73
[1] 73 74 75 76 77 78 79 80 81 82 83 84


$test
$test$Testing01
[1] 13 14 15 16 17 18 19 20 21 22 23 24

$test$Testing13
[1] 25 26 27 28 29 30 31 32 33 34 35 36

$test$Testing25
[1] 37 38 39 40 41 42 43 44 45 46 47 48

$test$Testing37
[1] 49 50 51 52 53 54 55 56 57 58 59 60

$test$Testing49
[1] 61 62 63 64 65 66 67 68 69 70 71 72

$test$Testing61
[1] 73 74 75 76 77 78 79 80 81 82 83 84

$test$Testing73
[1] 85 86 87 88 89 90 91 92 93 94 95 96

关于R Caret 的时间片 - 窗口和地平线不清楚,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34142580/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com