gpt4 book ai didi

r - 实现AdaBoost算法的问题

转载 作者:行者123 更新时间:2023-11-30 08:29:03 27 4
gpt4 key购买 nike

我正在尝试实现 AdaBoost 算法,有两个问题。

1) 在每次迭代时,必须根据概率分布对训练数据进行重新采样。重新采样的数据集的大小是否应该与原始数据集的大小相同。2)如果我根据概率分布对训练数据集重新采样,我很可能可以获得单个数据点的多个副本。我是否应该在每次迭代时训练弱分类器时保留所有这些冗余副本。

最佳答案

1)您不需要实际重新采样数据集,只需权衡分类器训练中的数据点就足够了,即弱分类器的目标函数应该进行加权。

如果数据集的大小足够大,您也可以使用采样,并且采样的数据集的大小本身并不重要。

2) 如果您确实使用采样并获得冗余副本,则绝对应该保留它们,否则弱分类器的目标函数将正确。

关于r - 实现AdaBoost算法的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13747611/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com