gpt4 book ai didi

r - 如何根据定义的组为树状图的标签着色? (在 R 中)

转载 作者:行者123 更新时间:2023-12-04 22:59:14 25 4
gpt4 key购买 nike

我在 R 中有一个数字矩阵,有 24 行和 10,000 列。这个矩阵的行名基本上是文件名,我从中读取了与 24 行中的每一行相对应的数据。除此之外,我有一个单独的因子列表,其中包含 24 个整数,指定了 24 个文件所属的组。有 3 组 - 醇类、烃类和酯类。名称和它们所属的相应组如下所示:

> MS.mz
[1] "int-354.19" "int-361.35" "int-368.35" "int-396.38" "int-408.41" "int-410.43" "int-422.43"
[8] "int-424.42" "int-436.44" "int-438.46" "int-452.00" "int-480.48" "int-648.64" "int-312.14"
[15] "int-676.68" "int-690.62" "int-704.75" "int-312.29" "int-326.09" "int-326.18" "int-326.31"
[22] "int-340.21" "int-340.32" "int-352.35"

> MS.groups
[1] Alcohol Alcohol Alcohol Alcohol Hydrocarbon Alcohol Hydrocarbon Alcohol
[9] Hydrocarbon Alcohol Alcohol Alcohol Ester Alcohol Ester Ester
[17] Ester Alcohol Alcohol Alcohol Alcohol Alcohol Alcohol Hydrocarbon
Levels: Alcohol Ester Hydrocarbon

我想生成一个树状图来查看矩阵中的数据如何聚类。所以,我使用了以下命令:
require(vegan)
dist.mat<-vegdist(MS.data.scaled.transposed,method="euclidean")
clust.res<-hclust(dist.mat)
plot(clust.res)

我得到了一个树状图。现在我想根据它们所属的组(即酒精、碳氢化合物或酯)为树状图中的文件名着色。我查看了论坛上发布的不同示例,例如

Label and color leaf dendrogram in r

Label and color leaf dendrogram in R using ape package

Clustering with bootstrapping

,但无法为我的数据实现它。我不确定如何将 row.names 与 MS.groups 相关联以获取树状图中的彩色名称。

在使用 dendextend 生成树时(如 https://nycdatascience.com/wp-content/uploads/2013/09/dendextend-tutorial.pdf 中所述),我得到以下树

enter image description here

这是用于生成它的代码:
require(colorspace)
d_SIMS <- dist(firstpointsample5[,-1])
hc_SIMS <- hclust(d_SIMS)
labels(hc_SIMS)
dend_SIMS <- as.dendrogram(hc_SIMS)
SIMS_groups <- rev(levels(firstpointsample5[, 1]))
dend_SIMS <- color_branches(dend_SIMS, k = 3, groupLabels = SIMS_groups)
is.character(labels(dend_SIMS))
plot(dend_SIMS)
labels_colors(dend_SIMS) <- rainbow_hcl(3)[sort_levels_values(as.numeric(firstpointsample5[,1])[order.dendrogram(dend_SIMS)])]
labels(dend_SIMS) <- paste(as.character(firstpointsample5[, 1])[order.dendrogram(dend_SIMS)],"(", labels(dend_SIMS), ")", sep = "")
dend_SIMS <- hang.dendrogram(dend_SIMS, hang_height = 0.1)
dend_SIMS <- assign_values_to_leaves_nodePar(dend_SIMS, 0.5,"lab.cex")
par(mar = c(3, 3, 3, 7))
plot(dend_SIMS, main = "Clustered SIMS dataset\n (the labels give the true m/z groups)",horiz = TRUE, nodePar = list(cex = 0.007))
legend("topleft", legend = SIMS_groups, fill = rainbow_hcl(3))

最佳答案

我怀疑您正在寻找的功能是 color_labelsget_leaves_branches_col 。第一种颜色基于 cutree(如 color_branches 所做的),第二种允许您获取每片叶子的分支的颜色,然后使用它为树的标签着色(如果您使用不寻常的方法为分支着色(就像使用 branches_attr_by_labels 时发生的那样)。例如:

# define dendrogram object to play with:
hc <- hclust(dist(USArrests[1:5,]), "ave")
dend <- as.dendrogram(hc)

library(dendextend)
par(mfrow = c(1,2), mar = c(5,2,1,0))
dend <- dend %>%
color_branches(k = 3) %>%
set("branches_lwd", c(2,1,2)) %>%
set("branches_lty", c(1,2,1))

plot(dend)

dend <- color_labels(dend, k = 3)
# The same as:
# labels_colors(dend) <- get_leaves_branches_col(dend)
plot(dend)

enter image description here

无论哪种方式,您都应该始终查看 set 函数,以了解可以对您的树状图执行的操作(这样可以省去记住所有不同函数名称的麻烦)。

关于r - 如何根据定义的组为树状图的标签着色? (在 R 中),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31117849/

25 4 0