评估加权平均最佳权重的算法-6ren

评估加权平均最佳权重的算法

转载作者：塔克拉玛干更新时间：2023-11-03 03:37:10

27

4

我有以下形式的数据集:

[9.1 5.6 7.4] => 8.5, [4.1 4.4 5.2] => 4.9, ..., x => y(x)

因此 x 是三元素的实向量，y 是标量函数。

我假设此数据的加权平均模型:

y(x) = (a * x[0] + b * x[1] + c * x[2])/(a+b+c) + E(x)

其中 E 是一个未知的随机误差项。

我需要一个算法来找到 a、b、c，使总和误差最小化:

错误 = { E(x)^2 } 的所有 x 的总和

对于给定的数据集。

最佳答案

假设权重归一化为总和为 1(令人高兴的是不失一般性)，那么我们可以用 c = 1 - a - b 重新计算问题，所以我们实际上是在求解 a 和 b。

有了这个我们就可以写

error(a,b) = sum over all x { a x[0] + b x[1] + (1 - a - b) x[2] - y(x) }^2

现在只是取偏导数 d_error/da 和 d_error/db 并将它们设置为零以找到最小值的问题。

稍加修改，您将得到一个由 a 和 b 中的两个方程组成的系统。

C(X[0],X[0],X[2]) a + C(X[0],X[1],X[2]) b = C(X[0],Y,X[2])
C(X[1],X[0],X[2]) a + C(X[1],X[1],X[2]) b = C(X[1],Y,X[2])

X[i] 的含义是数据集 x 值中所有第 i 个分量的向量。

Y的含义是所有y(x)值的向量。

系数函数C的含义如下:

C(p, q, r) = sum over i { p[i] ( q[i] - r[i] ) }

除非这是一个问题，否则我将省略如何求解 2x2 系统。

如果我们插入您提供的二元数据集，我们应该会得到精确的系数，因为您总是可以用一条线完美地近似两个点。因此，例如第一个方程系数是:

C(X[0],X[0],X[2]) =  9.1(9.1 - 7.4) + 4.1(4.1 - 5.2) = 10.96
C(X[0],X[1],X[2]) = -19.66
C(X[0],Y,X[2]) = 8.78

第二个方程类似:4.68 -13.6 4.84

求解 2x2 系统会产生:a = 0.42515，b = -0.20958。因此 c = 0.78443。

请注意，在此问题中会产生负系数。没有什么可以保证它们会是积极的，尽管“真实”数据集可能会产生这个结果。

实际上，如果您使用这些系数计算加权平均值，则它们分别为 8.5 和 4.9。

为了好玩我也尝试了这个数据集:

X[0]        X[1]        X[2]        Y
0.018056028 9.70442075  9.368093544 6.360312244
8.138752835 5.181373099 3.824747424 5.423581239
6.296398214 4.74405298  9.837741509 7.714662742
5.177385358 1.241610571 5.028388255 4.491743107
4.251033792 8.261317658 7.415111851 6.430957844
4.720645386 1.0721718   2.187147908 2.815078796
1.941872069 1.108191586 6.24591771  3.994268819
4.220448549 9.931055481 4.435085917 5.233711923
9.398867623 2.799376317 7.982096264 7.612485261
4.971020963 1.578519218 0.462459906 2.248086465

我用 1/3 x[0] + 1/6 x[1] + 1/2 x[2] + E 生成了 Y 值，其中 E 是 [- 0.1..+0.1]。如果该算法工作正常，我们希望从该结果中大致得到 a = 1/3 和 b = 1/6。事实上，我们得到 a = .3472 和 b = .1845。

OP 现在说他的实际数据大于 3 向量。这种方法可以毫不费力地推广。如果向量的长度为 n，那么您将得到一个要求解的 n-1 x n-1 系统。

关于评估加权平均最佳权重的算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23980556/

27

4

0

文章推荐： javascript - 这种算法怎么称呼？

文章推荐： java - Maven ojdbc jar依赖报错: package oracle. jdbc不存在

Makefile变量扩展/评估
目前，由于生成变量的评估，我的Makefile遇到了问题。我降低了复杂性，仅保留了导致问题的基本要素。读取Makefile时， $(LIST)被评估为文件列表。在步骤1中，其中一个文件被删除。在
JavaScript 评估
为什么这 eval 没有调用alert("Summer") ？ eval('(caption="Summer";alert(caption))'); 和《夏天》里的台词有关系吗？最佳答案 Uncau
JavaScript 评估
我正在努力让以下工作正常进行。最初似乎可以工作，但不知何故它停止工作了 var setCommonAttr = "1_row1_common"; var val = document.getEleme
javascript 评估
eval('({"suc":true})') 以上错误，应该是: eval('{"suc":true}') 为什么？最佳答案当尝试评估时，解释器会看到大括号并认为它是一个 block 开头。将其括
JavaScript 评估
我的页面 A 发出了 ajax 调用并引入了片段 B。该片段被添加到 DOM 中，并且该片段中的所有脚本都经过了评估。在该代码片段中，我有 2 个脚本标签: function doOptions()
javascript && 评估
这里是javascript代码: var test = { "h" : function (a) {return a;}, "say" : "hello" }; 第一次运行: test
PHP 评估 $a ="$a"?
我正在查看一些工作代码，并遇到了这一行: eval("\$element = \"$element\";"); 我真的很困惑为什么任何 PHP 开发人员都会写这一行。除了给自己设置一个变量之外，这还有
Java- && 评估
谁能帮我解决以下问题: 我有这样的代码: if(cond1 && cond2 && .. && cond10) 这里，cond1 是昂贵的操作，其输出是 boolean 值。现在我的问题是，当 co
华为AppCube通过中国信通院“低代码开发平台通用能力要求”评估
**摘要：**华为AppCube应用魔方顺利通过信通院评估，被认证为具备 “低代码开发平台通用能力”的企业服务平台。本文分享自华为云社区《华为AppCube通过中国信通院“低代码开发平台通用能力要求
php - 评估()不工作？
我正在尝试通过 PHP 从图像的 EXIF 数据中获取焦距。这是我目前得到的代码: $exif = exif_read_data("$photo"); $length10 = $exif['Foca
javascript - Null不是对象(评估
我想使用id =“key”将一个类添加到元素中，但是为什么不起作用？我是js的初学者:这是代码: audio.classList.add('yellow'); 这是错误: null is not an
PHP XPATH 评估
这是我的 XML: QueWay Password Recovery 现在我想用 php 用 xpath 选择文本“QueWay”。到目前为止我所拥有的一切都很好: $xml =
java - If 语句评估
使用下面的代码，即使我输入的数字大于 18，我也会得到这个结果。运行:你今年多大？ 21你还没有达到成年年龄!构建成功(总时间:3 秒) 我是java新手，正在尝试自学，有人可以帮忙吗？ impor
函数参数的 R 评估
我正在阅读 http://www.cran.r-project.org/doc/manuals/R-lang.pdf手册第 4.3 章，我就是不明白。也许有人可以给我一个快速的解释，为什么 R 的行为
c# - IEnumerable 评估
在这个实现中，每次都会评估 hand 并返回另一个列表吗？ foreach (Card card in hand.Cards) { } 我们应该用下面的实现替换上面的实现吗？ var cards =
c# - 评估 LambdaExpression？
我正在制作 LINQ lambda 表达式: Expression> add = (x, y) => x + y; 但现在我将如何评估它，比如说找到 2+3？最佳答案这应该适合你: var su
c++ - 评估 IF 条件的最有效方法是什么？
我正在制作一个语言解释器，我已经到了需要评估 if 语句的地步。起初我认为这很简单，我能够让我的解释器评估简单的 if 条件，10 == 10 但是当我试图让它评估更复杂的条件时， 10 == 10
python - PySpark 评估
我正在尝试以下代码，该代码向 RDD 中的每一行添加一个数字，并使用 PySpark 返回 RDD 列表。 from pyspark.context import SparkContext file
compilation - 评估-何时使用？
在阅读了很多关于 Lisp eval-when 运算符的文档后，我仍然无法理解它的用途，我知道使用这个运算符我可以控制表达式的计算时间，但我做不到找出任何可能适用的示例？最好的问候，utxee. 最
C++ 业务规则表达式解析器/评估
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，

首页

博学

6Ren·AI

商城

评估加权平均最佳权重的算法