gpt4 book ai didi

市场排名算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:06:41 24 4
gpt4 key购买 nike

我有一个包含市场信息的数据集。该数据集包含以下内容:市场容量​​、购买数量、所有天的平均购买量、所有天数和所有市场的平均购买量,以及该市场与所有市场相比便宜的平均百分比。

数据看起来像这样:

market volume  numPurchases   transDate  avgDailyPurchases  AvgDailyPurchasesAll  
JFK 500 32 20190102 50 75
JFK 500 60 20190103 50 75
ATL 450 40 20190102 40 75

avgPercentCheaperThanAll
.22
.22
.75

我想做的是对市场进行排名。顶级市场的定义是,avgDailyPurhcases 相对于其交易量较高且 avgPercentCheaperThanAll 也较高。所以在上面的数据中,ATL 将是一个比 JFK 更好的市场,即使 JFK 有更多的 avgDailyPurchases,ATL 比所有市场便宜得多。

我尝试使用 IMDB 公式对电影进行排名,但我使用了我自己的变量表示,例如:

weighted rating (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C 
v = volume of market
m = minimum volume required to be in the list
R = avgDailyPurchases
C = AvgDailyPurchasesAll

这给了我一个几乎不错的列表,但它缺少一个主要因素:avgPercentCheaperThanAll。如何将其添加到等式中以获得更好的结果?

最佳答案

在设计评级方程或任何方程之前应考虑的几点是。

  1. 识别输入变量:可以这样理解。

    avgDailyPurhcases, AvgDailyPurchasesAll, avgPercentCheaperThanAll, volume, a minimum threshold for volume

  2. 标准化输入变量:根据以上数据,可以推断出成交量以 100 为单位,平均每日购买量以 10 为单位,而您的较便宜变量以小数形式运行。如果您尝试在不进行归一化的情况下直接在单个方程中使用这些变量,那么您的评分将有偏差并且主要由体积因素驱动。因此,您应该考虑对它们进行规范化,使用此链接了解更多信息 Normalize Data .

  3. 分配权重:您希望 avgPercentCheaperThanAll 的偏好高于 avgDailyPurchases变量,这将通过为变量分配适当的权重来实现。
  4. 定义关系:您应该考虑定义变量之间的关系,无论它们与您的评级直接相关还是间接相关。
  5. 推导方程式:最后一步是推导方程式。从上面的步骤中,这将非常简单,只需组合所有关系,然后您将得到一个方程式:

    Rating = [weight of variable 1]*[normalized variable 1 value] + .... so on.

您将能够从上述步骤中推导出所需的方程式,并且该方程式对您来说会更清晰,更适合您的情况。否则,您可以复制网络上的任何评级方程并根据需要进行修改,但每个方程都会给出不同的结果,并且当更多输入变量到达时您将无法控制它们。

希望这对您有所帮助。

关于市场排名算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56388515/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com