- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用这个简单的脚本通过 sci-kit learn 对数据进行聚类
from sklearn.cluster import KMeans
import pandas as pd
import matplotlib.pyplot as plt
X = pd.read_csv('TestData.csv')
est = KMeans(n_clusters=10)
Y = pd.DataFrame(est.fit_predict(X))
frames = [X,Y]
Out = pd.concat(frames, axis = 1)
这给了我以下输出:
(feat1) (feat2) (cluster ID)
0 0.866 1124.182 9
1 2.078 2688.612 1
2 0.000 0.000 0
3 0.000 0.000 0
4 1.038 1344.306 6
5 2.388 3090.338 5
6 0.580 749.456 8
7 1.556 2016.456 2
我还想显示每个簇的质心,以便输出如下所示:
(feat1) (feat2) (cluster ID) (centroid 1) (centroid 2)
0 0.866 1124.182 9
1 2.078 2688.612 1
2 0.000 0.000 0
3 0.000 0.000 0
4 1.038 1344.306 6
5 2.388 3090.338 5
6 0.580 749.456 8
7 1.556 2016.456 2
我尝试使用 est.cluster_centers_
但这没有用。
如何获得正确的聚类中心?
最佳答案
import sklearn.cluster as cluster
import pandas as pd
import numpy as np
np.random.seed(2016)
X = pd.DataFrame(np.random.random((100, 2)))
est = cluster.KMeans(n_clusters=10)
Y = pd.DataFrame(est.fit_predict(X), columns=['cluster ID'])
Z = pd.DataFrame(est.cluster_centers_[Y['cluster ID']],
columns=['centroid_x', 'centroid_y'])
result = pd.concat([X, Y, Z], axis=1)
print(result.head())
产量
0 1 cluster ID centroid_x centroid_y
0 0.896705 0.730239 4 0.900182 0.772332
1 0.783276 0.741652 7 0.705625 0.720808
2 0.462090 0.642565 6 0.279384 0.689603
3 0.224864 0.708547 6 0.279384 0.689603
4 0.747126 0.625107 7 0.705625 0.720808
请注意,Z
向 DataFrame 添加了大量重复信息。如果数据集很大,您不会想这样做。
关于python - 如何在sic-kit learn的K-means中检索簇质心?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35048263/
我需要下载youtube视频并将其转换为mp3。是否有任何可维护的[sic] gem 用于从youtube下载视频? 最佳答案 不是gem,而是可以在shell中运行的可执行文件youtube-dl。
我编写了一个 SIC 汇编程序,除了 I/O 方面外,一切似乎都运行良好。 我已经将目标代码加载到内存中(将 char 格式转换为机器表示形式),但是当我调用 SICRun();执行代码时,我收到一条
我意识到这是一个不必要的问题,但是......为什么我不能使用 reduce 将字符数组转换为字符串? 例如, let str = "this is a string" let clist = Arr
我几乎已经为我的系统编程类(class)完成了 SIC 汇编程序的编码,但我在标记化部分遇到了困难。 例如,拿这行源码来说: 格式(自由格式)为:{LABEL} OPCODE {OPERAND{,X}
我目前正在研究 SIC 汇编程序并扫描以下文件中的行: begin START 0 main LDX zero copy LDCH str1, x S
使用Ambari,This is comment for WebHcat Service是“服务选择”步骤中的最终选择。 如果我没有选择此服务,那么Customize Services步骤将无限期挂起
有一个网络服务,在它的 onDelete 方法中处理数据;所以,我需要用我的 DELETE 请求传输一些数据......实际上我完全不知道如何在 Perl 中做到这一点:( 有没有人对此有任何想法?也
嗨,我正在我的大学上学习系统软件类(class),并且正在使用 SIC 编写汇编代码。我已经用 C 编写了代码。所以我将其翻译为 SIC,并且我有一个关于 SIC 变量策略的问题。我可以重复使用人口来
当我对我的一些 Java 代码运行自动批量测试时,我遇到了一个奇怪的“Invalid Packet Lenght”(错误的拼写方式)错误,我希望有人之前遇到过这个错误或者可以指出我在正确的方向。 通过
我正在使用 Edgar 的 10-Ks。为了协助文件管理和数据分析,我想创建一个表,其中包含每个文件的路径、提交的公司的 CIK 编号(这是由 SEC 颁发的唯一 ID)以及它所属的 SIC 行业代码
我的 Controller 上有一些 POST Action ,它们是从一对 GET Action 中命中的。当验证失败时,我想呈现 POST 来自的操作的 View 。例如: ~/accounts
My Mac 应用程序旨在编辑和分析图形,用户可以在文件系统的任何位置创建和存储这些图形。我去找用户让他们用 [NSOpenPanel openPanel] 和一个内联完成处理程序 block 打开一
tl:dr - 我有一行 prolog,在一个版本的 Prolog (SWI) 中工作正常,但在另一个版本 (TuProlog) 中则不行。 我正在将脚本从 SWI prolog 移植到 Tuprol
我是一名优秀的程序员,十分优秀!