gpt4 book ai didi

python - scikit-learn python 中带 Bootstrap 的随机森林 = False

转载 作者:太空狗 更新时间:2023-10-29 21:30:48 24 4
gpt4 key购买 nike

如果我们选择 bootstrap = False,RandomForestClassifier() 会做什么?

根据这个链接中的定义

http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html#sklearn.ensemble.RandomForestClassifier

bootstrap : boolean, optional (default=True) Whether bootstrap samples are used when building trees.

问这个是因为我想对时间序列使用随机森林方法,所以使用大小为 (t-n) 的滚动窗口进行训练并预测日期 (t+k) 并且想知道如果我们这样做是否会发生这种情况选择对或错:

1) 如果Bootstrap = True,那么当训练样本可以是任意一天和任意数量的特征时。因此,例如可以从第 (t-15) 天、第 (t-19) 天和第 (t-35) 天获取样本,每个样本都具有随机选择的特征,然后预测日期 (t+1) 的输出。

2) 如果 Bootstrap = False,它将使用从日期 (t-n) 到 t 的所有样本和所有特征进行训练,因此它实际上将遵守日期顺序(意思是它将使用 t-35、t-34、t-33 等,直到 t-1)。然后将预测日期 (t+1) 的输出。

如果这就是 Bootstrap 的工作方式,我会倾向于使用 Boostrap = False,如果不是的话,忽略连续几天的返回并从第 t-39 天跳到第 t 天会有点奇怪(想想金融系列) -19 然后到第 t-15 天预测第 t+1 天。我们会错过那些日子之间的所有信息。

那么...这就是 Bootstrap 的工作方式吗?

最佳答案

我没有资格发表评论。所以我只会在这里发表我的意见。 scikit-learn 文档说,子样本大小始终与原始输入样本大小相同,但如果 bootstrap=True(默认),则抽取样本并进行替换。因此,如果 bootstrap = FALSE,我认为每个子样本都与原始输入样本相同。

关于python - scikit-learn python 中带 Bootstrap 的随机森林 = False,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40131893/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com