python - 如何使用 Python 从最高到最低设置 k-Means 聚类标签？

转载作者：太空狗更新时间：2023-10-29 20:21:03

27

4

我有一个包含 38 间公寓及其早上、下午和晚上的用电量的数据集。我正在尝试使用 scikit-learn 中的 k-Means 实现对该数据集进行聚类，并得到了一些有趣的结果。

第一个聚类结果:

一切都很好，对于 4 个集群，我显然得到了与每个公寓关联的 4 个标签 - 0、1、2 和 3。使用 KMeans 的 random_state 参数> 方法，我可以修复其中随机初始化质心的种子，因此我始终如一地获得归因于相同公寓的相同标签。

但是，由于此特定案例涉及能源消耗，因此可以在最高和最低消费者之间执行可衡量的分类。因此，我想将标签 0 分配给消费水平最低的公寓，将标签 1 分配给消费多一点的公寓，依此类推。

截至目前，我的标签是 [2 1 3 0]，或 ["black", "green", "blue", "red"]；我希望它们是 [0 1 2 3] 或 [“红色”、“绿色”、“黑色”、“蓝色”]。我应该如何继续这样做，同时仍然保持质心初始化随机(使用固定种子)？

非常感谢您的帮助!

最佳答案

通过查找表 转换标签是实现您想要的目标的直接方法。

首先我生成一些模拟数据:

import numpy as np

np.random.seed(1000)

n = 38
X_morning = np.random.uniform(low=.02, high=.18, size=38)
X_afternoon = np.random.uniform(low=.05, high=.20, size=38)
X_night = np.random.uniform(low=.025, high=.175, size=38)
X = np.vstack([X_morning, X_afternoon, X_night]).T

然后我对数据进行聚类:

from sklearn.cluster import KMeans
k = 4
kmeans = KMeans(n_clusters=k, random_state=0).fit(X)

最后我使用 NumPy 的 argsort创建一个这样的查找表:

idx = np.argsort(kmeans.cluster_centers_.sum(axis=1))
lut = np.zeros_like(idx)
lut[idx] = np.arange(k)

示例运行:

In [70]: kmeans.cluster_centers_.sum(axis=1)
Out[70]: array([ 0.3214523 ,  0.40877735,  0.26911353,  0.25234873])

In [71]: idx
Out[71]: array([3, 2, 0, 1], dtype=int64)

In [72]: lut
Out[72]: array([2, 3, 1, 0], dtype=int64)

In [73]: kmeans.labels_
Out[73]: array([1, 3, 1, ..., 0, 1, 0])

In [74]: lut[kmeans.labels_]
Out[74]: array([3, 0, 3, ..., 2, 3, 2], dtype=int64)

idx 显示从最低到最高消费级别排序的聚类中心标签。 lut[kmeans.labels_] 为0/3 的公寓属于消费水平最低/最高的集群。

关于python - 如何使用 Python 从最高到最低设置 k-Means 聚类标签？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44888415/

27

4

0

文章推荐： c# - 如何在 C# 中打开与 Microsoft Access 数据库的连接

文章推荐： c++ - 通用引用模板类型总是评估为左值

resolution - 我应该在网站上支持的标准“最低”分辨率是多少？
This question already has answers here: Closed 11 years ago. Duplicate: Recommended website resoluti
javascript - 最低 IE9 浏览器要求和其他等效浏览器版本
我有一个网络应用程序需要 IE9。其他浏览器(Firefox、Chrome、Opera 等)的等效浏览器版本是什么？我知道如何检查用户当前的浏览器/版本，如果不支持，我需要看看是否可以为用户提供下载
php - 最低 varchar 数量
我在比较 Mysql 数据库中的两个值并显示最低值时遇到问题。比如我有这个: value1 = 23.4 value2 = 4.479 我试过这个: ORDER BY CAST(column AS
Android 最低 SDK 问题
我有一个需要使用的功能，但我需要将我的最小 SDK 设置为 23 才能使用它。问题是，我们的应用程序运行在很多低端 SDK 设备上。有什么方法可以设置我的项目以允许我在编译应用程序的同时仍然使用较低的
c++ - 在32位数字中查找第一个(最低)置位位置
我需要在32位数字中获得一个1位数字，其中只有一个1位（总是）。用C ++或asm最快的方法。例如 input: 0x00000001, 0x10000000 output:
Python - 计算不同组中的范围(最高 - 最低)
我已经对我的数据进行了分组。现在，我要做的是每周从“高”列中选择最高值，并从“低”列中选择最低值，然后使用最高值减去最低值得到范围。但是代码总是错误的。有人对我有想法吗？这是我的 DataFrame
数组存储20个数，然后显示最高、最低、总数和平均值
如何编写一个存储 20 个数字的数组，然后显示以下数据:数组中最小的数字、最大的数字、数字的总和以及它们的平均值？最佳答案使用java编程语言 int myArray[] = {15,25,85,
c - 最低 504Kb 内存使用量
在学习 C 的同时做一些实验，我遇到了一些奇怪的事情。这是我的程序: int main(void) {sleep(5);} 当它被编译时，可执行文件的文件大小为 8496 字节(与 26 字节的源代码
Swift Package 最低 ios 版本
我已经创建了我想在我的项目中使用的包。在包中，我使用的是 UIStackView。当我将包添加到项目并运行它时，我收到错误 'UIStackView' 仅适用于 iOS 9.0 或更高版本。如果我的项
sql - 最高/最低 pl/sql
我已经制定了一个程序来显示给定日期的特定时间的最高和最低流行项目。该过程没有错误或异常，并且一切正常。如您所见，为了显示 Items 的第一条记录，查询重复了两次，但唯一的区别在于顺序(ASC 和 D
java - 最低 BPEL/BPMN 要求？
我是 BPEL/BPMN 新手。是否可以在没有 WS-* Web 服务和 EJB 容器(例如 jBoss、WebLogic、Glassfish)的情况下编写 BPEL/BPMN 感知软件？我想知道
opengl - "Emulate"最低 OpenGL 规范？
我们正在使用 OpenGL 4.3。但是，我们担心我们使用的功能适用于我们的显卡，但不符合 OpenGL 4.3 的“最低”要求规范。是否有可能模拟最低限度的行为？例如，让显卡拒绝任何非标准纹理格式
Android Facebook 最低 API 级别错误
我正在我的应用程序中实现 Facebook SDK。按照 facebook 开发人员指南，除了我没有设置 GIT，所以我下载了 SDK，并将其导入 Eclipse，将 Java 合规级别更改为 1.
java - Android 最低 SDK 和配色方案
所以我构建了一个使用 API 15 中特定默认配色方案的应用程序。但是，我知道大多数设备仍在运行 API 10。为了吸引这些设备，我在我的设备上切换了最小 SDK设备到 10。这样做之后，我注意到我的
MySQL 多对一连接。如何找到最差(最低)结果和最新结果？
数据所以，假设我有一个应用程序，我正在测试汽车的速度、性能、安全性等。我有一组以下格式的数据: CAR TABLE ID CAR_NAME 1 Ford Focus 2006 2 To
php - MySQL 一行数据中的最高/最低 5
我有以下查询: SELECT AVG(q1) AS q1, AVG (q2) AS q2, AVG(q3) AS q3, AVG(q4) AS q4, AVG(q5) AS q5 FROM tresu
android - 无法降级 Android 最低 sdk
我刚刚创建了我的第一个 Android 应用程序(第 10 次)。我创建的项目的 sdk 比我预期的要高，现在我想降低它。我最初的 android maifest 不包含部分，所以我补充说: 我还
c - 输入数字，显示最高、最低、平均值以及输入的数字数量。使用菜单
我的小组作业是制作一个程序，允许用户输入任意数量的数字，然后程序会告诉你输入的最高数字、输入的最低数字、平均值、输入的总数和平均值。我们必须使用菜单。我们已经写好了菜单。我们的大部分计算代码都在案例
ios - 在 UITableView 中显示文档目录中的文件 - 最低 iOS5
我正在尝试设置一个显示文档目录中数据的 UITableView。我对代码有点迷茫，因为我尝试了来自 Google 和论坛等的许多示例。我正在创建没有 Storyboard 的应用程序，所以它全部在
algorithm - 如何将最后(最低)0 位设置为 1
我们都知道将最后 1 位设置为 0 的技巧 n&(n-1)。例如，0110 & (0110-1) = 0100。但是反过来呢？将最后一个 0 设置为 1？所以 0110 变成 0111？我在 sta

首页

博学

6Ren·AI

商城

python - 如何使用 Python 从最高到最低设置 k-Means 聚类标签？

示例运行: