gpt4 book ai didi

optimization - 哪个目标是优化的簇内距离总和或 MSE?

转载 作者:行者123 更新时间:2023-12-03 16:57:29 25 4
gpt4 key购买 nike

在使用元启发式算法的聚类分析论文中,许多都优化了均方量化误差 (MSE)。例如在 [1][2] .

我对结果感到困惑。他们告诉他们已经使用 MSE 作为目标函数。但是他们已经报告了欧几里德距离的簇内总和的结果值。

K-Means 最小化簇内平方和 (WCSS)(来自 wiki)[3] .当计算 MSE 时,在差异度量的情况下使用欧氏距离时,我找不到 WCSS 和 MSE 之间的区别。

在 K-Means 的情况下,WCSS 被最小化,如果我们将相同的 MSE 函数与元启发式算法一起使用,它们也会将其最小化。在这种情况下,K 均值和其他均值的欧氏距离之和如何变化?

如果我优化欧氏距离的簇内和,我可以重现论文中显示的结果。

我想我在这里做错了什么。谁能帮我解决这个问题。

主要问题:引用论文的目标是什么 [1][2]优化,表中显示了哪个函数的值?

最佳答案

K-means 优化(集群内的总和)平方和,也就是方差,也就是欧氏距离平方和。

如果你研究收敛性证明就很容易看出这一点。

我无法研究您引用的两篇论文。他们与蹩脚的 Elsevier 合作并且有付费专区,我不会支付 36 美元 + 32 美元来回答你的问题。

更新:我设法获得了其中一个的免费副本。他们称之为“MSE,均方量化误差”,但他们的方程是通常的簇内平方和,不涉及均值;这句话附有一个可疑的自引,一半的引用文献是自引……似乎是这个作者更喜欢称它为与其他人不同的东西。对我来说,这有点像“用不同的名字重新发明轮子”。我会仔细检查他们的结果。我并不是说它们是假的,我还没有更详细地检查过。但是“均方误差”肯定不涉及均值;它是误差平方和。

更新:如果“簇内总和”是指任意两个对象的成对距离之和,请考虑以下内容:

在不失一般性的情况下,移动数据,使均值为 0。(平移不会改变欧氏距离或平方欧氏距离)。

sum_x sum_y sum_i (x_i-y_i)^2
= sum_x sum_y [ sum_i (x_i)^2 + sum_i (y_i)^2 - 2 sum_i (x_i*y_i) ]
= n * sum_x sum_i (x_i)^2 + n * sum_y sum_i (y_i)
- 2 * sum_i [sum_x x_i * sum_y y_i]

前两个加数是相同的。所以我们有 2n 倍的 WCSS。但是由于 mu_i = 0sum_x x_i = sum_y y_i = 0,第三项消失了。

如果我没有搞砸这个计算,那么簇内的均值、非对称成对平方欧氏距离与 WCSS 相同。

关于optimization - 哪个目标是优化的簇内距离总和或 MSE?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28785458/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com