gpt4 book ai didi

r - 如何评估无监督算法的效率? pam 算法如何工作?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:53:21 26 4
gpt4 key购买 nike

我正在使用 k-means 和 K-medoids。使用 K-means 执行出现以下信息:

Within cluster sum of squares by cluster:
[1] 12636160 7631152 10226254
(between_SS / total_SS = 79.2 %)

between_SS/total_SS 是表示算法总体吞吐量的比率吗?

还有 pam:

Objective function:
build swap
211.6604 210.5670

您如何解读这些结果?

最佳答案

如果您所说的“吞吐量”和“效率”意味着什么关于处理速度,然后没有。这些都是措施聚类算法在查找方面的成功程度良好的分组(或者这些点可以分组的程度)。

k-均值
between_SS(簇间平方和)的含义和total_SS(total sum of squares)在这个前面已经解释过了 Cross Validated问题及其答案。 between_SS 与 total_SS 之比是点聚类程度的某种度量。

PAM
来自 ?pam 帮助页面

the algorithm first looks for a good initial set of medoids (this is called the build phase). Then it finds a local minimum for the objective function, that is, a solution such that there is no single switch of an observation with a medoid that will decrease the objective (this is called the swap phase).

列出的值是目标函数的值(点到它们的中心点的距离之和)在两个阶段。同样,这是衡量点聚类程度的指标。

有关更多详细信息,请参阅 pam 帮助页面 ?pam ,
pam.object 帮助页面 ?pam.object,
Wikipedia Page在 k-medoids 或
原始论文 Kaufman, L. 和 Rousseeuw, P.J. (1987),通过中心点聚类

关于r - 如何评估无监督算法的效率? pam 算法如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44476081/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com