gpt4 book ai didi

cluster-analysis - 如何从不同的中心找到最佳 K 均值聚类

转载 作者:行者123 更新时间:2023-12-04 04:59:45 24 4
gpt4 key购买 nike

我目前正在学习聚类。我已经执行了我存储在我的数据库中的订阅者的 average_duration_of_call 的 k 均值集群。在 首次运行 3 个中心 cluster1(53.33369 秒)-367 订阅者,cluster2(121.67123 秒)-128 订阅者,cluster3(369.09000 秒)-8 订阅者。

我再次使用 重新运行聚类中心6 获得的中心为 cluster1(904.66670 sec) -1 订户,cluster2(27.7 sec) - 108 订户,cluster3(151.58)-43 订户,cluster4(95 sec) - 135 订户,cluster5(59.5 sec) - 207 订户,cluster6 (278 秒)-9 订阅者。

现在我的问题是哪个是最佳集群以及如何找到最佳集群。任何经验都需要帮助(我目前正在使用 R 语言)

最佳答案

如果您是初学者,那么我建议您开始基于密度的聚类,这样就不需要 K 的初始值。您可以首先使用 epsilon=10 和 minpts=5 启动 dbscan 集群,然后检查生成的集群数量。之后,开始平滑增加 epsilon (11, 12, ... 15) 和减少 minpt (4, 3, ..1) 并检查每次生成的簇数。然后这些数字的平均值应该反射(reflect)真实集群的平均数量。

但是如果您需要应用 k 均值聚类,那么您可能会发现 Selection of K in K-means clustering纸有用。

关于cluster-analysis - 如何从不同的中心找到最佳 K 均值聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16291139/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com