gpt4 book ai didi

r - 极高的存活概率 BTYD R

转载 作者:行者123 更新时间:2023-12-04 12:27:43 27 4
gpt4 key购买 nike

我正在研究 BTYD R 包,问题是客户在校准结束时还活着的概率值非常高。即使在校准期间只有一笔交易的观测值也有大约 0.9999 的概率。我知道在这个计算中使用了参数“s”(由包估计)。我的 gamma 非常低(几乎为 0)。当我尝试手动更改它以获得更高的值时,概率下降了。知道如何处理这个问题吗?我在下面附上我的代码。

   elog <- dc.MergeTransactionsOnSameDate(elog)
end.of.cal.period <- min(elog$date)+as.numeric((max(elog$date)-min(elog$date))/2)

data <- dc.ElogToCbsCbt(elog, per="week",
T.cal=end.of.cal.period,
merge.same.date=TRUE,
statistic = "freq")

cal2.cbs <- as.matrix(data[[1]][[1]])

## prameters estimation
params2 <- pnbd.EstimateParameters(cal2.cbs)

## log likehood
(LL <- pnbd.cbs.LL(params2, cal2.cbs))

p.matrix <- c(params2, LL)
for (i in 1:20) {
params2 <- pnbd.EstimateParameters(cal2.cbs, params2)
LL <- pnbd.cbs.LL(params2, cal2.cbs)
p.matrix.row <- c(params2, LL)
p.matrix <- rbind(p.matrix, p.matrix.row)
}

(params2 <- p.matrix[dim(p.matrix)[1],1:4])

# set up parameter names for a more descriptive result
param.names <- c("r", "alpha", "s", "beta")

LL <- pnbd.cbs.LL(params2, cal2.cbs)

# PROBABILITY A CUSTOMER IS ALIVE AT END OF CALIBRATION / TRAINING
x <- cal2.cbs["123", "x"] # x is frequency
t.x <- cal2.cbs["123", "t.x"] # t.x is recency, ie time of last transactions
T.cal <- 26 # week of end of cal, i.e. present
pnbd.PAlive(params2, x, t.x, T.cal)

最佳答案

没有估计“ Gamma ”参数——“s”和“β”定义了辍学率异质性的 Gamma 分布。我建议编辑您的帖子以包含参数以及输出

pnbd.PlotDropoutRateHeterogeneity(params2)

如果没有看到您的参数估计或不知道数据的上下文,则至少有两种(不相互排斥)的可能性。

首先,您的辍学率可能非常低(例如,零)。如果是这样,您仍然可以拟合交易率的普通 NBD 模型,并假设辍学率为零。

其次,您可能会看到“频率增加悖论”。来自 Peter Fader/Bruce Hardie 之一的第 17-19 页 papers :

For low frequency customers, there is an almost linear relationship between recency and [expected transactions]. However, this relationship becomes highly nonlinear for high frequency customers. In other words, for customers who have made a relatively large number of transactions in the past, recency plays a much bigger role in determining [value] than for an infrequent past purchaser.



根据作者的说法,像您所描述的这样的客户很少(甚至只有一次)交易获得“活着”的可能性很高,对新近度的依赖性较小。这是因为根据定义,低频客户在购买之间可能有很长的“间隔”。因此,即使频率较低的客户已经有一段时间没有进行交易,我们也应该为他们分配较少的风险。将此与高频客户进行比较 - 我们没有看到交易的时间越长,我们就越快得出客户“已死”的结论,因为我们知道他们通常会进行很多交易。

关于r - 极高的存活概率 BTYD R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31674940/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com