gpt4 book ai didi

python - EM 聚类算法中附加的标签

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:48:07 27 4
gpt4 key购买 nike

我在数据集 (x) 上使用 3 个组件进行 EM 聚类,这只是具有 15 个特征的数据框。

from sklearn import mixture
import pandas as pd

x=pd.read_csv('tr.csv', sep=';')
em = mixture.GMM(n_components=3)
em.fit(x)

然后我想在我的数据框中为集群创建一个额外的列,并附加到每个变量的每个集群的标签中(例如,像在 k-means 方法中使用 labels_)。但是我最好的是权重,它似乎不太正确:

x['CLUSTER'] = pd.Series(em.weights_, index=x.index).astype(str)

它给我一个错误(比如您的数据中有 100000 行,但您尝试仅附加 3 行)。

那么我如何才能在 EM 算法中使用集群的标签,以及如何将它们插入到第一个 df 中每个变量的列中?

谢谢!

最佳答案

为了获得“标签”,您需要调用 .predict(x) 而不是 .weights.weights 是(其中之一许多!)拟合分布的参数,而不是逐点标签。

x['CLUSTER'] = em.predict(x)

关于python - EM 聚类算法中附加的标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40197998/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com