gpt4 book ai didi

python - 如何在 python 中使用 k-prototype 找到最佳簇数

转载 作者:行者123 更新时间:2023-12-05 01:17:40 25 4
gpt4 key购买 nike

我正在尝试使用 k-prototypes 算法对一些大数据进行聚类。我无法使用 K-Means 算法,因为我同时拥有分类数据和数值数据。通过 k 原型(prototype)聚类方法,如果我定义了我想要的 k 值,我就能够创建集群。

如何为此找到合适的集群数量?

仅使用数值数据的流行方法(如肘部方法和轮廓评分法)是否适用于混合数据?

最佳答案

您可以使用此代码:

#Choosing optimal K
cost = []
for num_clusters in list(range(1,8)):
kproto = KPrototypes(n_clusters=num_clusters, init='Cao')
kproto.fit_predict(Data, categorical=[0,1,2,3,4,5,6,7,8,9])
cost.append(kproto.cost_)

plt.plot(cost)

来源:https://github.com/aryancodify/Clustering

关于python - 如何在 python 中使用 k-prototype 找到最佳簇数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49166657/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com