gpt4 book ai didi

r - pheatmap 中有些奇怪的东西(错误?)

转载 作者:行者123 更新时间:2023-12-02 15:35:13 25 4
gpt4 key购买 nike

可重现的数据:

data(crabs, package = "MASS")
df <- crabs[-(1:3)]
set.seed(12345)
df$GRP <- kmeans(df, 4)$cluster
df.order <- dplyr::arrange(df, GRP)

数据说明:

df有 5 个数值变量。我根据这5个属性做了K-means算法,产生了一个新的分类变量GRP有 4 个级别。接下来,我用 GRP 订购了它。并将其命名为df.order .

<小时/>

我对 pheatmap 做了什么:

## 5 numerical variables for coloring
colormat <- df.order[c("FL", "RW", "CL", "CW", "BD")]

## Specify the annotation variable `GRP` shown on left side of the heatmap
ann_row <- df.order["GRP"]

## gap indices
gapRow <- cumsum(table(ann_row$GRP))

library(pheatmap)
pheatmap(colormat, cluster_rows = F, show_rownames = F,
annotation_row = ann_row, gaps_row = gapRow)

Error in annotation_colors[[colnames(annotation)[i]]] : subscript out of bounds

<小时/>

这是我得到一些奇怪的东西的地方:

首先,我猜问题是由参数 annotation_row 引起的。 .我检查两个数据框的行名称。

all.equal(rownames(colormat), rownames(ann_row))
# [1] TRUE

你可以看到它们是相等的。但是,我执行了以下代码并且热图工作了。

rownames(colormat) <- rownames(ann_row)
pheatmap(colormat, cluster_rows = F, show_rownames = F,
annotation_row = ann_row, gaps_row = gapRow)

理论上这个代码 "rownames(colormat) <- rownames(ann_row)" 应该没有意义,因为这两个对象本来是相等的,但为什么它会变成 pheatmap()功能工作?

<小时/>

编辑:根据@steveb的评论,我什至不必使用 ann_row 设置行名。我刚刚设置

rownames(colormat) <- rownames(colormat)

pheatmap 也可以工作。这种情况仍然违反直觉。

<小时/>

最终输出:

enter image description here

最佳答案

简而言之,colormat没有rownames之前rownames(colormat) <- rownames(colormat)但有rownames后。这个答案开始触及问题的本质,但没有深入探讨原因或方式pheatmap正在遇到这个问题,或者为什么 R 会这样工作。换句话说,我不会深入研究 R 中如何处理行名的细节。

此问题的性质与 rownames 有关。返回行号的默认向量;每个元素都是数值,但表示为字符串,因此第 10 行变为行名称“10”。使用时attributes(colormat) ,你会看到$row.names rownames(colormat) <- rownames(colormat) 之前是一个数值向量和后面的字符向量(现在有行名称)。我不清楚为什么当某些内容没有设置行名称时会返回任何内容(除了 NULL 或 NA 之外)。

attributes(colormat)
## $names
## [1] "FL" "RW" "CL" "CW" "BD"
##
## $row.names
## [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
## [39] 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76
## [77] 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114
## [115] 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152
## [153] 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190
## [191] 191 192 193 194 195 196 197 198 199 200
##
## $class
## [1] "data.frame"

rownames(colormat) <- rownames(colormat)

attributes(colormat)
## $names
## [1] "FL" "RW" "CL" "CW" "BD"
##
## $row.names
## [1] "1" "2" "3" "4" "5" "6" "7" "8" "9" "10" "11" "12" "13" "14" "15" "16" "17" "18" "19" "20" "21" "22" "23" "24" "25"
## [26] "26" "27" "28" "29" "30" "31" "32" "33" "34" "35" "36" "37" "38" "39" "40" "41" "42" "43" "44" "45" "46" "47" "48" "49" "50"
## [51] "51" "52" "53" "54" "55" "56" "57" "58" "59" "60" "61" "62" "63" "64" "65" "66" "67" "68" "69" "70" "71" "72" "73" "74" "75"
## [76] "76" "77" "78" "79" "80" "81" "82" "83" "84" "85" "86" "87" "88" "89" "90" "91" "92" "93" "94" "95" "96" "97" "98" "99" "100"
## [101] "101" "102" "103" "104" "105" "106" "107" "108" "109" "110" "111" "112" "113" "114" "115" "116" "117" "118" "119" "120" "121" "122" "123" "124" "125"
## [126] "126" "127" "128" "129" "130" "131" "132" "133" "134" "135" "136" "137" "138" "139" "140" "141" "142" "143" "144" "145" "146" "147" "148" "149" "150"
## [151] "151" "152" "153" "154" "155" "156" "157" "158" "159" "160" "161" "162" "163" "164" "165" "166" "167" "168" "169" "170" "171" "172" "173" "174" "175"
## [176] "176" "177" "178" "179" "180" "181" "182" "183" "184" "185" "186" "187" "188" "189" "190" "191" "192" "193" "194" "195" "196" "197" "198" "199" "200"
##
## $class
## [1] "data.frame"

问题不是 rownames 的数值与字符值,而是 rownames 是否设置。如果您执行了以下操作:

rownames(colormat) <- 1:nrow(colormat)

您会发现这也可以解决问题,如 rownames现在设置为行号的数值(请参阅 attributes(colormat) 输出)。

如果您使用tibble::has_rownames(colormat)之前rownames(colormat) <- rownames(colormat) ,那么你会得到FALSE 。分配后,您将得到TRUE .

tibble::has_rownames(colormat)
## [1] FALSE
rownames(colormat) <- rownames(colormat)
tibble::has_rownames(colormat)
## [1] TRUE

我不知道怎么办pheatmap正在使用colormat在内部,但它一定遇到了rownames的这个问题没有被设置。如果您联系此包的作者(可能通过 GitHub: https://github.com/raivokolde/pheatmap ),他们可能会更新代码以在下一版本中处理此极端情况。

关于r - pheatmap 中有些奇怪的东西(错误?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53871845/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com