gpt4 book ai didi

math - 我应该如何订购这些 "helpful"分数?

转载 作者:行者123 更新时间:2023-12-04 13:55:17 27 4
gpt4 key购买 nike

在我网站上用户生成的帖子下,我有一个类似亚马逊的评级系统:

   Was this review helpful to you: Yes | No

如果有投票,我会在该行上方显示结果,如下所示:
   5 of 8 people found this reply helpful.

我想根据这些排名对帖子进行排序。如果您按照最有帮助到最无帮助进行排名,您会如何对以下帖子进行排序?
   a) 1/1 = 100% helpful
b) 2/2 = 100% helpful
c) 999/1000 = 99.9% helpful
b) 3/4 = 75% helpful
e) 299/400 = 74.8% helpful

显然,仅根据有帮助的百分比进行排序是不对的,不知何故应该考虑总票数。是否有标准的方法来做到这一点?

更新:

使用 Charles 的公式计算 Agresti-Coull 下限并对其进行排序,这就是上述示例的排序方式:
   1) 999/1000 (99.9%) = 95% likely to fall in 'helpfulness' range of 99.2% to 100%
2) 299/400 (74.8%) = 95% likely to fall in 'helpfulness' range of 69.6% to 79.3%
3) 3/4 (75%) = 95% likely to fall in 'helpfulness' range of 24.7% to 97.5%
4) 2/2 (100%) = 95% likely to fall in 'helpfulness' range of 23.7% to 100%
5) 1/1 (100%) = 95% likely to fall in 'helpfulness' range of 13.3% to 100%

直觉上,这感觉是对的。

更新 2 :

从应用程序的角度来看,我不想每次拉出帖子列表时都运行这些计算。我想我要么更新和存储 Agresti-Coull 下限,要么定期,cron 驱动的时间表(只更新自上次运行以来收到投票的帖子),要么在收到新投票时更新它.

最佳答案

对于每个帖子,请确定您期望它有多大帮助的界限。我更喜欢使用 Agresti-Coull 区间。伪代码:

float AgrestiCoullLower(int n, int k) {
//float conf = 0.05; // 95% confidence interval
float kappa = 2.24140273; // In general, kappa = ierfc(conf/2)*sqrt(2)
float kest=k+kappa^2/2;
float nest=n+kappa^2;
float pest=kest/nest;
float radius=kappa*sqrt(pest*(1-pest)/nest);
return max(0,pest-radius); // Lower bound
// Upper bound is min(1,pest+radius)
}

然后取估计的下限并对此进行排序。因此,2/2(由 Agresti-Coull 提供)有 95% 的可能性落在 23.7% 到 100% 的“有用”范围内,因此它在 999/1000 范围内排序低于 99.2% 到 100%(因为 .237 < .992)。

编辑:由于有些人似乎发现这很有帮助(哈哈),让我注意可以根据您想要的自信/规避风险程度来调整算法。您需要的信心越少,您就越愿意放弃“经过验证”(高票数)的评论,转而选择未经测试但得分高的评论。 90% 的置信区间给出 kappa = 1.95996398,85% 的置信区间给出 1.78046434,75% 的置信区间给出 1.53412054,而完全谨慎的 50% 置信区间给出 1.15034938。

50% 置信区间给出
1) 999/1000 (99.7%) = 50% likely to fall in 'helpfulness' range of 99.7% to 100%
2) 299/400 (72.2%) = 50% likely to fall in 'helpfulness' range of 72.2% to 77.2%
3) 2/2 (54.9%) = 50% likely to fall in 'helpfulness' range of 54.9% to 100%
4) 3/4 (45.7%) = 50% likely to fall in 'helpfulness' range of 45.7% to 91.9%
5) 1/1 (37.5%) = 50% likely to fall in 'helpfulness' range of 37.5% to 100%

总体而言并没有什么不同,但它确实更喜欢 2/2 而不是 3/4 的安全性。

关于math - 我应该如何订购这些 "helpful"分数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3749125/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com