gpt4 book ai didi

r - Vowpal Wabbit 输入需要多少预处理?

转载 作者:行者123 更新时间:2023-11-30 08:58:49 30 4
gpt4 key购买 nike

我知道大众汽车可以处理非常原始的数据(例如原始文本),但例如,在将数据输入大众汽车之前是否应该考虑缩放数字特征?考虑以下行:

1 |n 年龄:80.0 高度:180.0 |c 伦敦男 |d the:1 猫:2 去了:3 出去:4

假设典型的年龄范围为 1 到 100,高度(以厘米为单位)范围可能为 140 到 220,那么转换/缩放年龄高度是否更好所以他们有一个共同的范围?我认为许多算法可能需要对其输入数据进行这种预处理,例如线性回归。

最佳答案

vw SGD 与普通 SGD 相比得到了高度增强,因此不需要预缩放。

如果您的实例很少(小数据集),预缩放可能会有所帮助。

vw 通过记住每个特征的范围来自动进行缩放标准化,因此很少需要预缩放即可获得良好的结果。

默认情况下应用规模、稀有性和重要性的标准化。相关的 vw 选项是:

--normalized
--adaptive
--invariant

如果其中任何一个出现在命令行上,则其他的不会应用。默认情况下,所有三个都会应用。

另请参阅: this stackoverflow answer

解释vw中增强型SGD算法的论文是:

Online Importance Weight Aware Updates - Nikos Karampatziakis & John Langford

关于r - Vowpal Wabbit 输入需要多少预处理?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48687328/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com