gpt4 book ai didi

machine-learning - 确定最佳簇数和 Davies-Bouldin 指数?

转载 作者:行者123 更新时间:2023-11-30 08:26:41 25 4
gpt4 key购买 nike

我正在尝试评估对某些数据进行聚类所需的正确聚类数量。

我知道使用 Davies–Bouldin 指数 (DBI) 可以实现这一点。

要使用 DBI,您必须针对任意数量的集群进行计算,并且最小化 DBI 的集群对应于所需的正确集群数量。

问题是:

如何使用 DBI 知道 2 个集群是否优于 1 个集群?那么,当我只有 1 个集群时,如何计算 DBI?

最佳答案

仅考虑所有集群的平均 DBI 显然不是一个好主意。

当然,增加簇的数量 - k,在没有损失的情况下,总是会减少生成的簇中的 DBI 量,在极端情况下,DBI 为零每个数据点都被视为自己的簇(因为每个数据点与其自己的质心重叠)。

how to know if 2 clusters are better than 1 cluster using DBI? So, how can I compute DBI when I have just 1 cluster?

因此,如果仅使用平均DBI作为性能指标,很难说哪一个更好。

一个很好的实用方法是使用 Elbow method

Another method looks at the percentage of variance explained as a function of the number of clusters: You should choose a number of clusters so that adding another cluster doesn't give much better modeling of the data. More precisely, if you graph the percentage of variance explained by the clusters against the number of clusters, the first clusters will add much information (explain a lot of variance), but at some point the marginal gain will drop, giving an angle in the graph. The number of clusters are chosen at this point, hence the "elbow criterion".

enter image description here

关于选择最佳簇数的其他一些不错的选择:

关于machine-learning - 确定最佳簇数和 Davies-Bouldin 指数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14383648/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com