python - 如何在sic-kit learn的K-means中检索簇质心？-6ren

python - 如何在sic-kit learn的K-means中检索簇质心？

转载作者：行者123 更新时间：2023-11-30 23:01:00

25

4

我正在使用这个简单的脚本通过 sci-kit learn 对数据进行聚类

from sklearn.cluster import KMeans
import pandas as pd 
import matplotlib.pyplot as plt
X = pd.read_csv('TestData.csv')
est = KMeans(n_clusters=10)
Y = pd.DataFrame(est.fit_predict(X))
frames = [X,Y]
Out = pd.concat(frames, axis = 1)

这给了我以下输出:

   (feat1) (feat2) (cluster ID) 
0   0.866  1124.182  9
1   2.078  2688.612  1
2   0.000     0.000  0
3   0.000     0.000  0
4   1.038  1344.306  6
5   2.388  3090.338  5
6   0.580   749.456  8
7   1.556  2016.456  2

我还想显示每个簇的质心，以便输出如下所示:

   (feat1) (feat2) (cluster ID) (centroid 1) (centroid 2)  
0   0.866  1124.182  9
1   2.078  2688.612  1
2   0.000     0.000  0
3   0.000     0.000  0
4   1.038  1344.306  6
5   2.388  3090.338  5
6   0.580   749.456  8
7   1.556  2016.456  2

我尝试使用 est.cluster_centers_

但这没有用。

如何获得正确的聚类中心？

最佳答案

import sklearn.cluster as cluster
import pandas as pd 
import numpy as np 
np.random.seed(2016)

X = pd.DataFrame(np.random.random((100, 2)))
est = cluster.KMeans(n_clusters=10)
Y = pd.DataFrame(est.fit_predict(X), columns=['cluster ID'])
Z = pd.DataFrame(est.cluster_centers_[Y['cluster ID']], 
                 columns=['centroid_x', 'centroid_y'])
result = pd.concat([X, Y, Z], axis=1)  

print(result.head())

产量

          0         1  cluster ID  centroid_x  centroid_y
0  0.896705  0.730239           4    0.900182    0.772332
1  0.783276  0.741652           7    0.705625    0.720808
2  0.462090  0.642565           6    0.279384    0.689603
3  0.224864  0.708547           6    0.279384    0.689603
4  0.747126  0.625107           7    0.705625    0.720808

请注意，Z 向 DataFrame 添加了大量重复信息。如果数据集很大，您不会想这样做。

关于python - 如何在sic-kit learn的K-means中检索簇质心？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35048263/

25

4

0

文章推荐： python - 正确初始化列表

文章推荐： php - 从 mysql 回显 PHP 代码

文章推荐： mysql - 存储过程 - 需要使用 SELECT 语句的结果

文章推荐： python - BeautifulSoup 查找找到的标签后的下一个特定标签

ruby - 是否有用于从youtube下载视频的维护[sic] gem ？
我需要下载youtube视频并将其转换为mp3。是否有任何可维护的[sic] gem 用于从youtube下载视频？最佳答案不是gem，而是可以在shell中运行的可执行文件youtube-dl。
c - SIC 汇编程序 I/O
我编写了一个 SIC 汇编程序，除了 I/O 方面外，一切似乎都运行良好。我已经将目标代码加载到内存中(将 char 格式转换为机器表示形式)，但是当我调用 SICRun();执行代码时，我收到一条
swift:无法将 [sic] 字符数组缩减为字符串
我意识到这是一个不必要的问题，但是......为什么我不能使用 reduce 将字符数组转换为字符串？例如， let str = "this is a string" let clist = Arr
c++ - 标记 SIC 汇编程序源代码
我几乎已经为我的系统编程类(class)完成了 SIC 汇编程序的编码，但我在标记化部分遇到了困难。例如，拿这行源码来说: 格式(自由格式)为:{LABEL} OPCODE {OPERAND{,X}
java - 尝试从文件中读取时正则表达式匹配失败(Java 中的 SIC 汇编程序)
我目前正在研究 SIC 汇编程序并扫描以下文件中的行: begin START 0 main LDX zero copy LDCH str1, x S
hadoop - Hadoop安装:什么是 “This is comment for WebHCat Service (sic)”
使用Ambari，This is comment for WebHcat Service是“服务选择”步骤中的最终选择。如果我没有选择此服务，那么Customize Services步骤将无限期挂起
Perl REST : How to send DELETE request with some data (sic!)？
有一个网络服务，在它的 onDelete 方法中处理数据；所以，我需要用我的 DELETE 请求传输一些数据......实际上我完全不知道如何在 Perl 中做到这一点:( 有没有人对此有任何想法？也
c - SIC/XE 我能否为已经具有自身值(value)的值赋予新的值(value)？
嗨，我正在我的大学上学习系统软件类(class)，并且正在使用 SIC 编写汇编代码。我已经用 C 编写了代码。所以我将其翻译为 SIC，并且我有一个关于 SIC 变量策略的问题。我可以重复使用人口来
java - JDBC 瘦驱动程序 : Invalid Packet Lenght [sic]
当我对我的一些 Java 代码运行自动批量测试时，我遇到了一个奇怪的“Invalid Packet Lenght”(错误的拼写方式)错误，我希望有人之前遇到过这个错误或者可以指出我在正确的方向。通过
python - 从 10-K -- 提取 SIC、CIK，创建元数据表
我正在使用 Edgar 的 10-Ks。为了协助文件管理和数据分析，我想创建一个表，其中包含每个文件的路径、提交的公司的 CIK 编号(这是由 SEC 颁发的唯一 ID)以及它所属的 SIC 行业代码
asp.net-mvc - ASPNET MVC : Way to figure out the route of the referer (sic)?
我的 Controller 上有一些 POST Action ，它们是从一对 GET Action 中命中的。当验证失败时，我想呈现 POST 来自的操作的 View 。例如: ~/accounts
objective-c - [NSOpenPanel openPanel] 调用上的 "Failed to updated [sic] bookmark for item"
My Mac 应用程序旨在编辑和分析图形，用户可以在文件系统的任何位置创建和存储这些图形。我去找用户让他们用 [NSOpenPanel openPanel] 和一个内联完成处理程序 block 打开一
java - Prolog/tuprolog，一行返回 'The enitire [sic] string could not be read as one term'
tl:dr - 我有一行 prolog，在一个版本的 Prolog (SWI) 中工作正常，但在另一个版本 (TuProlog) 中则不行。我正在将脚本从 SWI prolog 移植到 Tuprol

首页

博学

6Ren·AI

商城

python - 如何在sic-kit learn的K-means中检索簇质心？