- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 this paper ,作者使用CH(Caliński-Harabasz指数)和SIL(Silhouette指数)方法来决定簇的数量。然而,它不是选择最高值,而是对这些指数应用 L 方法,选择其拐点(肘部)。
In this link有很多子问题,其中一个是关于为什么作者使用 CH 的最大“稳定性”来定义簇的数量。然而,这个子问题的答案并没有解释这个决定。
该问题的最大“稳定性”与 L 方法有关,因为他们选择了变化开始最小的点。
将 L 方法(或最大稳定性)与 CH 和 SIL 指数结合使用的原因是什么?我通常希望将这些指数最大化? (例如,我会理解他们是否会使用内部平方和)
最佳答案
聚类分析的一个常见问题是人们预先设定必须有一个良好的聚类,并且它必须可以通过他们的预处理、方法来实现、和参数。 未能聚类显然不是一种选择 - 但它应该是。特别是如果您(必须)进行大量预处理,这很容易失败。对足够复杂的数据应用 PCA,您将得到一个单个类似高斯的 Blob 。统计学中最大的错误是你没有测试你的整个假设是否都是错误的......
您可以在此处找到成功的 CH 和轮廓图示例:
https://mathworks.com/help/stats/clustering.evaluation.calinskiharabaszevaluation-class.html
https://mathworks.com/help/stats/clustering.evaluation.silhouetteevaluation-class.html
该图表明,在“表现非常良好”的 Iris 数据上,3 个簇可能是更好的选择。如果您想用它来争论簇的数量,这就是 CH 轮廓图的样子。如果绘图没有显示这样的峰值,那么您可能无法使用它 - 或者您的所有聚类都不好......
还应该指出的是,这些措施只是启发式的。更好的 CH 或 Silhouette 并不能保证在每个目的上都能获得更好的结果。
关于machine-learning - 为什么要使用 CH 和 SIL 来查找 Elbow(或使用 L 方法)来选择簇数量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52880393/
曲线的一个例子如下所示。肘点可能是 x=3 或 4。 如何自动和数学地计算曲线的肘部? 最佳答案 您可能想要寻找具有最大绝对二阶导数的点,对于一组离散点 x[i]正如你在那里,可以用中心差异来近似:
我正在尝试 Elbow 方法来查找我的数据中的簇数,该数据被命名为“data.clustering”。它必须具有以下特征:年龄和性别。其头部如下:头(数据.聚类); > head(data.clust
在下面的曲线(蓝线)中,我试图检测应该位于 x = 2.5 附近的“膝盖/肘部” 这是我正在使用的一组值: x = {-10, -9, -8, -7, -6, -5, -4, -3, -2 , -1,
我正在使用 K-Means 从文本中提取主题。我知道这不是最好的方法,但这只是迈向更复杂模型的一步。让我困惑的是我得到的肘部曲线(如下)。你会如何解释它?为什么在 50 K 左右突然出现峰值?或者肘部
我有一个点列表,它们是 kmeans 算法的惯性值。 为了确定最佳集群数量,我需要找到这条曲线开始变平的点。 数据示例 以下是我的值列表的创建和填充方式: sum_squared_dist = []
我尝试为机器学习中的 k 均值方法找到合适的 k 簇。我用的是Elbow法,但是耗时且复杂度高。谁能告诉我另一种方法来代替它。非常感谢 最佳答案 可用于评估聚类结果的指标是 silhouette co
我是 Threejs 的新手。我试图用不同的方式画一个肘部 begin_radius和 end_radius沿着带有 curve_radius 的曲线路径和一个 angle ,却无法取得成果。 Cyl
因此,我尝试使用 Elbow 曲线来查找 K 均值聚类中的最佳“K”(聚类数)值。 对数据集中文本列(1467 行)的平均向量(使用 Word2Vec)进行聚类。但查看我的文本数据,我可以清楚地发现数
在 this paper ,作者使用CH(Caliński-Harabasz指数)和SIL(Silhouette指数)方法来决定簇的数量。然而,它不是选择最高值,而是对这些指数应用 L 方法,选择其拐
我是一名优秀的程序员,十分优秀!