gpt4 book ai didi

julia - 在训练和测试向量数据集中保持相同的分箱

转载 作者:行者123 更新时间:2023-12-04 01:11:14 24 4
gpt4 key购买 nike

我有一个数字向量 train我在模型的训练数据集中使用的。假设我想把它切成 5 个箱子。我知道我可以使用 cut(x, 5) 做到这一点来自 CategoricalArrays.jl。如何在 test 中设置相同的 binning来自模型测试数据集的向量?

最佳答案

也许有更好的解决方案,但这会起作用:

using CategoricalArrays, Statistics

nbins = 5
breaks = Statistics.quantile(train, (1:nbins-1)/nbins)

cat_train = cut(train, breaks;extend=true,labels=string.("BIN_",1:5))

cat_test = cut(test, breaks;extend=true,labels=string.("BIN_",1:5))

关于julia - 在训练和测试向量数据集中保持相同的分箱,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64795628/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com