gpt4 book ai didi

machine-learning - Vowpal Wabbit 是否会在多个在线 channel 中对数据进行混洗?

转载 作者:行者123 更新时间:2023-11-30 08:27:01 24 4
gpt4 key购买 nike

Vowpal Wabbit 是否会在每个 epoch/pass 后自动洗牌其数据?我希望创建的缓存文件将包含在线算法(例如 VW 的默认在线 SGD 方法)所需的改组元数据。例如

vw -d train.txt -c --passes 50 -f train.model

如果没有,我有一个备份脚本,可以在每次传递时手动调整数据

# Create the initial regressor file
vw -d train.txt -f train.model
# For the next 49 passes, shuffle and then update the regressor file
for i in {0..49}
do
<some script: train.txt --> shuffled_data.txt>
vw -d shuffled_data.txt -i train.model -f train.model
done

如果 VW 不自动洗牌,那么是否有更有效的方法来执行上述代码块?不幸的是,大众汽车的维基百科对此并不清楚。谢谢。

最佳答案

不,它不会随机播放。我敢打赌也不值得重新整理数据。洗牌是 I/O 密集型的。虽然使用不同的洗牌顺序进行两次传递可能比不进行洗牌的两次传递更好,但就收敛性而言,其成本可能与不进行洗牌的 10 次传递一样昂贵。

关于machine-learning - Vowpal Wabbit 是否会在多个在线 channel 中对数据进行混洗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20941180/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com