r - 从主成分的 K 均值中提取有用信息-6ren

r - 从主成分的 K 均值中提取有用信息

转载作者：行者123 更新时间：2023-12-02 08:40:30

25

4

我正在处理一个相对较大的数据集(仅使用大约 1/32，但该子集约为 50000x9000)。为了对此进行分析，我采取了几个步骤来降低维度，以便我可以应用某种聚类算法。

看一下下面的数据框:

set.seed(340)
df = data.frame(replicate(10,sample(0:10,size = 10,replace = TRUE)))
> df
   X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
1   4  9  4  6  9  4  2  5  8   8
2   5  8  2  0  4  6  1  1  0  10
3   1  7  6  3  5  9  6  0  7   1
4   0  6  8  6  6  0  5  5 10  10
5   2  0  5  8  2 10  8  2  1   5
6   3  9 10  2  8  5  2 10  3  10
7   9  0  1  0  6  8  9  6  5   0
8   5  6  9  3 10  4  4  8  6   9
9   8  7  6  2 10  9  9  7  1  10
10  0  7  2  6  1  6  3  2  3   9

每一行代表一个人，每个变量表示该人表现出这种品质的频率。假设我使用 princomp() 对此执行主成分分析，并收集前四个 pc 用于 k 均值。

pc = princomp(df)
new_df = cbind(pc$loadings[,1],pc$loading[,2],pc$loadings[,3],pc$loadings[,4])
fit = kmeans(new_df,2)

据此，我可以推断出哪个簇表现出哪些主成分的高值，我可以使用载荷来查看每个主成分的一般衡量标准。然而，我想最终将这些信息连接到我的原始数据集。有没有一种方法可以将原始数据中的每个人聚类到根据主成分分析的 k 均值创建的聚类中？或者我误解了PCA的概念。

最佳答案

pc$loadings 查找输入变量的坐标，而不是个体的坐标。因此，kmeans(new_df,2) 对变量而不是个体进行分类。为了确保这一点，请尝试使用 10x5 data.frame 而不是 10x10 data.frame 来编写代码:您只能获得 5 个簇坐标:

df = data.frame(replicate(5,sample(0:10,size = 10,replace = TRUE)))
pc = princomp(df)
new_df = cbind(pc$loadings[,1],pc$loading[,2],pc$loadings[,3],pc$loadings[,4])
fit = kmeans(new_df,2)
fit$cluster
X1 X2 X3 X4 X5 
 2  2  1  2  2

如果这就是您想要做的，那么您只需rbind fit$cluster到您的原始data.frame，您将拥有变量的集群。

df <- rbind(df,fit$cluster)

但是，如果您打算对个体(即原始 data.frame 的行)进行聚类，则需要对主成分分析生成的行坐标执行聚类。我不知道如何访问 princomp 中的内容，但其他 pca 方法可以轻松实现这一点。 FactoMineR::PCA 输出一个包含行坐标 ($ind$coord) 和列坐标 ($var$coord) 的列表。

library(FactoMineR)
pf <- PCA(df,graph=FALSE)

fit <- kmeans(pf$ind$coord[,1:4],2)

fit$cluster
 1  2  3  4  5  6  7  8  9 10 
 1  2  1  1  1  2  1  1  1  2

要将它们添加到原始 data.frame 中:

df$cluster <- fit$cluster

关于r - 从主成分的 K 均值中提取有用信息，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32020071/

25

4

0

文章推荐： sql - 如何查看约会是否在周末？

文章推荐： css - 使用 :first line selector? 的边框半径

文章推荐： java - 在 Java 8 中的标识字段上查找数组列表的子集

Android MediaPlayer 信息/警告 (703, 0) 信息/警告 (701, 0) 慢速 wifi 或数据连接
03-25 05:52:15.329 8029-8042/com.mgh.radio W/MediaPlayerNative: info/warning (703, 0) 03-25 05:52:15
c# - FrameworkElementFactory 信息
我一直在 Internet 上到处寻找关于 FrameworkElementFactory 类的适当文档，但我似乎找不到有关它的适当教程或有用信息。请问对这个问题了解更多的人可以给我更多的信息吗？这
c - 如何在线程之间发送变量/信息
我需要知道一个线程在进入等待状态之前如何将其ID发送到另一个线程。我想传递一个带有其ID的变量，但我不知道该怎么做。最佳答案如果只有一个线程及其父线程，则可以使用全局变量，因为它们在所有线程之间共
rust - 如何阅读打印品前的文字!信息？
我正在尝试制作一个程序，该程序可以读取命令行上的所有单词，然后将其打印在新行上，而我想要做的是这样的: Some text: hello 但是相反，我得到了这样的东西: Some text: Hell
rabbitmq - 如何获取有关rabbitmq连接操作的详细日志/信息？
我有一个连接到rabbitmq服务器的python程序。当该程序启动时，它连接良好。但是当rabbitmq服务器重新启动时，我的程序无法重新连接到它，并留下错误“Socket已关闭”(由kombu产生
kubernetes - 如何在CD输出中包含Pod启动日志/信息？
我正在设置CI / CD管道。部署步骤运行以下命令: kubectl apply -f manifest.yml --namespace kubectl rollout status Deploym
java - 如何在java中使用ews从电子邮件中获取 "To"信息
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
SVN 信息 - 我上次更改的日期在我的文本上次更新日期之前
这是我在文件上运行 svn info 时输出的一部分: Last Changed Author: [user] Last Changed Rev: 269612 Last Changed Date:
java - android制作一个音乐应用程序访问sd卡以获取音乐数据帮助/信息
所以我正在构建这个音乐应用程序，到目前为止它只扫描 SD 卡内的特定文件夹。这将返回路径，然后播放它们。几个小时前我得知android系统中有一个媒体文件数据库所以我想知道这个媒体文件数据库是否存
python - 如何在树状图上添加%信息？
我正在绘制树形图，并且想知道如何绘制树类的相对百分比，即 A组=100 B地=30 C地=50 D 地 =20 然后，在图中，应该添加: A 组“50%” B 组“15%” 等在其“Group X”标
php - 如何在用户首次登录时显示教程/信息？
我正在构建一个社交网站，我想知道如何在用户首次登录时显示交互式教程和信息。比如只有在第一次登录时，用户才会被要求在他们的个人资料中填写更多信息。我怎样才能通过 php 和 mysql 实现这一点？例子
java servlet 信息
我是 java servlet 的新手。我研究了一些关于 servlet 的代码，但我真的很想知道更多基本的东西以及它是如何工作的。我只是想知道什么类型的 Material /内容可以从 java s
mysql - 避免多个内部联接从同一个表添加新列(信息)
我想知道是否有办法为 user_id、sender_user_id 和 recipient_user_id 提供 name 信息来自 this fiddle 中的模式. 我现在唯一能想到的办法就是做这
c++ - 存储2人c++信息
这是我存储2个大学生信息的源代码。我想从输入中获取每个人的姓名、姓氏、ID 和 5 分，然后在输出中显示它们。我在输出中显示分数时遇到问题。请帮忙 #include using namespace
python - 从图像中提取统计数据/信息
假设我有一张带有条形图的图像，如下所示: 我想提取条形图和标签的值，除了训练 ML 模型之外，还有其他方法吗？我有一堆图像，我为其生成了图表和一些描述。我目前正尝试仅从我能够做到的描述中提取信息，但
iphone - GKTurnBasedParticipant 信息
有没有办法从 GKTurnBasedParticipant 对象中检索玩家的名字？似乎除了根据类引用的难看的 playerID 之外，没有办法显示有关游戏玩家的相关信息。还是我遗漏了什么？谢谢...
c# - KeyNotFoundException 信息
我有一个随机抛出“KeyNotFoundException”的 C# Silverlight 应用程序。我不知道找不到什么 key 。这让我想到了两个问题: KeyNotFoundException
iOS获取本地音频文件(属性/信息)
本文实例为大家分享了ios获取本地音频文件的具体代码，供大家参考，具体内容如下获取本地音频文件地址： ?
Sql查询MySql数据库中的表名和描述表中字段(列)信息
下面为大家介绍利用SQL查询语句获取Mysql数据库中表的表名，表描述、字段ID、字段名、数据类型、长度、精度、是否可以为null、默认值、是否自增、是否是主键、列描述 1、查询表信息（表名/表
c# - 是否有可能获得例如代码中的位置成员(member)信息？
问题有没有办法获取代码中使用属性的位置，或声明成员变量的位置？我不是在寻找解决此问题的方法，只是寻求一个简单的答案，无论这在技术上是否可行。一些背景信息我已经定义了一个属性，该属性使用提供给属

首页

博学

6Ren·AI

商城

r - 从主成分的 K 均值中提取有用信息