gpt4 book ai didi

r - 如何调整 xgboost 为变量分配更多权重?

转载 作者:行者123 更新时间:2023-12-01 04:54:12 24 4
gpt4 key购买 nike

我有大约 10k 客户 3 个月的历史购买数据,我想使用这些数据来预测他们在 future 3 个月的购买情况。我使用客户 ID 作为输入变量,因为我希望 xgboost 学习不同类别之间的个人支出。有没有办法调整,所以重点是根据每个人的购买了解更多?或者更好的方法来解决这个问题?

最佳答案

您可以使用可以传入 weight 的权重向量xgboost 中的参数;大小等于 nrow(trainingData) 的向量.然而,这通常用于惩罚分类错误中的错误(想想那些只销售一个月左右的项目的稀疏数据;你想了解销售额,那么你需要给销售实例更多的权重,否则所有的预测都将是零)。显然你正在尝试 tweak我不能很好理解的自变量的权重。

学习因变量的行为(在你的例子中是销售额)是机器学习模型所做的,你应该让它完成它的工作。您不应该调整它以强制仅从某些功能中学习。对于学习购买行为聚类类型的无监督技术将更有用。

要包含用户特定的行为,首先需要进行聚类并为每个用户识别索引不足和索引过度的类别。然后您可以使用这些标志创建一些分类特征。

PS:一些数据来解释你的问题可以帮助别人更好地帮助你。

关于r - 如何调整 xgboost 为变量分配更多权重?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38694457/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com