gpt4 book ai didi

machine-learning - 无反例时的客户行为预测

转载 作者:行者123 更新时间:2023-11-30 08:46:14 25 4
gpt4 key购买 nike

假设您拥有一家邮政服务公司,并且想要优化您的业务流程。您有以下形式的订单历史记录(按日期排序):

# date   user_id   from      to               weight-in-grams
Jan-2014 "Alice" "London" "New York" 50
Jan-2014 "Bob" "Madrid" "Beijing" 100
...
Oct-2017 "Zoya" "Moscow" "St.Petersburg" 30

大多数记录(约 95%)在“重量克”字段中包含正数,但也有一些记录的权重为零(可能是这些消息被取消或丢失)。

是否可以从历史文件中预测用户(Alice、Bob 等)是否会在 2017 年 11 月使用该服务?我应该使用什么机器学习方法?

我尝试使用简单的逻辑回归和决策树,但它们显然为任何用户提供了积极的结果,因为训练集中的负面例子很少。我还尝试应用 Pareto/NBD 模型(R 中的 BTYD 库),但对于大型数据集来说似乎非常慢,而且我的数据集包含超过 500 000 条记录。

我还有另一个问题:如果我估算负面示例(考虑到在某个月份没有发送信件的用户是本月的负面示例),数据集将从 30 Mb 增长到 10 Gb。

最佳答案

答案是肯定的,您可以尝试预测。

您可以将其视为时间序列并运行 RNN:在你的数据集上训练你的 RNN,这样每个用户都是一个样本。

您还可以通过聚合每个用户的数据来透视您的集合,以便每个用户都是一行(观察)。然后运行多元逻辑回归。这样您会丢失信息,但可能会更简单。您可以添加与时间相关的列,例如“订单之间的平均延迟”、“每年的平均订单”等。

您可以使用贝叶斯方法来估计用户返回的概率。

关于machine-learning - 无反例时的客户行为预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46961093/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com