gpt4 book ai didi

php - 汇总百分比所需的算法帮助

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:07:45 25 4
gpt4 key购买 nike

我正在尝试找出如何构建一个特定的算法(最终用 PHP 实现,但这不太重要),但我很难找到进行数学运算的最佳方法。我将在这里使用一个疯狂的比喻,而不是定义一个复杂的特定于行业的过程(数学很重要)。想象一下,您正在尝试根据商店内出售的商品确定特定品牌汽车停在商店 parking 场的可能性百分比。首先,您对 100,000 个商店 parking 场进行实地调查,记录在外面发现的每辆独特的汽车、商店内销售的每件独特商品,以及该商品与商店的固定百分比相关性(例如:木材与商店有 89% 的相关性) Home Depot,但铅笔与沃尔玛的相关性仅为 23%)。

我要解决的问题有两个部分。首先,我试图找出将这些数据汇总到特定项目的最佳方法,同时尊重每个相关百分比和已确认观察的数量(因此一个发现不等于 100% 的机会,类似于 http://www.evanmiller.org/how-not-to-sort-by-average-rating.html ) .换句话说,如果一家全新的、前所未见的商店正在销售 Waterford 眼镜和羊绒衫,根据这些商品,我们可以预测有 89% 的可能性一辆奔驰停在 parking 场。

总结一下:每件商品在商店中被浏览了特定次数。对于每一次,都有不同的产品/商店相关百分比和 parking 场中所有汽车制造商的列表。我如何最好地根据其中的元素以数学方式计算特定品牌出现在全新商店 parking 场的可能性百分比?

现在,第二部分通过添加另一层抽象变得更加复杂。如果一个人访问了 50 家商店,并且我们汇总了所有这些商店中的所有商品,我们就可以预测他们开的是什么类型的汽车(例如:很多露营和远足商店,所以他们有 67% 的机会开吉普车) .然后,如果他们访问一家新商店并接触到我们没有数据的全新商品,我需要将 67% 的吉普车应用到新商品上(仍然尊重该商品与商店的相关性)。然后使用该项目不太确定的 Jeep 统计数据来影响我们对包含该新项目(从未直接测量)的 parking 场的预测。也许这需要我们添加某种置信区间?或者,如果我们分析的数百万个项目中的每一个项目最终平均都不会达到 50%,我们如何才能表示这种不确定性?

非常感谢您对此提供的帮助!

最佳答案

我想,你需要建立互相关矩阵,其中线是 cargo ,列是车型。每个单元格包含归一化系数,如何一些good(即钻戒)与车型(Geo 或 Mercedes)有关。

详情看这里:

http://en.wikipedia.org/wiki/Cross-correlation

关于php - 汇总百分比所需的算法帮助,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25427894/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com