作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 k-prototypes 算法对一些大数据进行聚类。我无法使用 K-Means 算法,因为我同时拥有分类数据和数值数据。通过 k 原型(prototype)聚类方法,如果我定义了我想要的 k 值,我就能够创建集群。
如何为此找到合适的集群数量?
仅使用数值数据的流行方法(如肘部方法和轮廓评分法)是否适用于混合数据?
最佳答案
您可以使用此代码:
#Choosing optimal K
cost = []
for num_clusters in list(range(1,8)):
kproto = KPrototypes(n_clusters=num_clusters, init='Cao')
kproto.fit_predict(Data, categorical=[0,1,2,3,4,5,6,7,8,9])
cost.append(kproto.cost_)
plt.plot(cost)
关于python - 如何在 python 中使用 k-prototype 找到最佳簇数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49166657/
我是一名优秀的程序员,十分优秀!