gpt4 book ai didi

r - 有什么解决方法可以对混合数据类型进行聚类并在 R 中渲染 3D 散点图吗?

转载 作者:行者123 更新时间:2023-12-01 23:00:39 26 4
gpt4 key购买 nike

我试图查看 3D 图中标记组内的数据点分布,因为我想查看数据点的分布,并想查看 3D 空间中每组数据点的相似程度。为此,我使用了 CRAN 的 scatterplot3d 包来获取 3D 散点图,但没有获得正确的数据图。

可重现的数据

这是我使用的可重现数据。

    > dput(head(phenDat,30))
structure(list(SampleID = c("Tarca_001_P1A01", "Tarca_013_P1B01",
"Tarca_025_P1C01", "Tarca_037_P1D01", "Tarca_049_P1E01", "Tarca_061_P1F01",
"Tarca_051_P1E03", "Tarca_063_P1F03", "Tarca_075_P1G03", "Tarca_087_P1H03",
"Tarca_004_P1A04", "Tarca_064_P1F04", "Tarca_076_P1G04", "Tarca_088_P1H04",
"Tarca_005_P1A05", "Tarca_017_P1B05", "Tarca_054_P1E06", "Tarca_066_P1F06",
"Tarca_078_P1G06", "Tarca_090_P1H06", "Tarca_007_P1A07", "Tarca_019_P1B07",
"Tarca_031_P1C07", "Tarca_079_P1G07", "Tarca_091_P1H07", "Tarca_008_P1A08",
"Tarca_020_P1B08", "Tarca_022_P1B10", "Tarca_034_P1C10", "Tarca_046_P1D10"
), GA = c(11, 15.3, 21.7, 26.7, 31.3, 32.1, 19.7, 23.6, 27.6,
30.6, 32.6, 12.6, 18.6, 25.6, 30.6, 36.4, 24.9, 28.9, 36.6, 19.9,
26.1, 30.1, 36.7, 13.6, 17.6, 22.6, 24.7, 13.3, 19.7, 24.7),
Batch = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 4L, 4L, 5L, 5L, 6L,
6L, 6L, 6L), Set = c("PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA",
"PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA",
"PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA",
"PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA",
"PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA", "PRB_HTA",
"PRB_HTA", "PRB_HTA"), Train = c(1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L), Platform = c("HTA20",
"HTA20", "HTA20", "HTA20", "HTA20", "HTA20", "HTA20", "HTA20",
"HTA20", "HTA20", "HTA20", "HTA20", "HTA20", "HTA20", "HTA20",
"HTA20", "HTA20", "HTA20", "HTA20", "HTA20", "GSE113966", "GSE113966",
"GSE113966", "GSE113966", "GSE113966", "GSE113966", "GSE113966", "GSE113966", "GSE113966",
"GSE113966")), row.names = c(NA, 30L), class = "data.frame")

我的尝试:

hclustfunc <- function(x) hclust(x, method="complete")
distfunc <- function(x) as.dist((1-cor(t(x)))/2)
d <- distfunc(persons_df)
fit <- hclustfunc(d)

我的更新尝试:

library(rgl)
library(car)
scatter3d(x = PC1, y = PC2, z = PC3, surface = FALSE, groups = as.factor(clusters), surface.col = cluster.colors, col = cluster.colors, xlab="PC1",ylab="PC2",zlab="PC3")

基本上,我想查看属于不同批处理(或组)的数据点(也称为行),想通过某些“组”属性对它们进行着色。我只是想看看如果我们按不同年龄类别、不同批处理和不同平台对数据点进行分组,它们之间的相似程度如何

我正在考虑使用kmeans,PCA,其他方法可以给我可以在3D图中可视化的不同组件,但这对我来说不是很直观如何在R中做到这一点?

所需情节:

我想要得到像这样的 3D 绘图:

enter image description here

谁能指出我怎样才能做到这一点?有什么方法可以对我的数据进行聚类并在 R 的 3D 图中将其可视化吗?有什么想法吗?谢谢

更新:最简单的事情可能是可能的:

我首先不想得到太复杂的解决方案,我只想对属于不同批处理、平台和年龄类别的数据点(也称为每行)进行分组(我使用 findInterval( people_df$ages, c(10,20,30,40,50)))。有什么办法可以在 R 中实现这一点吗?

最佳答案

编辑 - 添加了用于混合数据聚类的 k-modes 方法。

您还可以考虑使用 plotly 进行 3d 绘图。这是一个数据示例,其中我为批处理、平台和 10 年期限的每个现有组合定义了组。在绘图中,这些被分配了不同的颜色,您可以双击组图例来切换外观。您需要修改更大的数据,例如您可以从分组中删除 Platform,因为它已经映射到 z。

library(plotly); library(dplyr); library(RColorBrewer)
age_group = 10
phenDat %>%
mutate(group = paste(Batch, Platform, "age",
floor(GA/age_group)*age_group, "-",
floor(GA/age_group)*age_group + age_group - 1)) %>%
plot_ly(x = ~GA, y = ~Set, z = ~Platform, color = ~group) %>%
add_markers(marker = list(size = 2,
color = colorRampPalette(brewer.pal(11,"Spectral"))(10))) %>%
layout(scene = list(xaxis = list(title = "GA"),
yaxis = list(title = "Set"),
zaxis = list(title = "Platform")))

enter image description here

对于给定混合数据的聚类,这里有一种使用 klaR 包的 kmodes 函数的方法,它似乎在这里创建了合理的结果:

phenDat %>%
bind_cols(cluster = klaR::kmodes(phenDat, 6)[["cluster"]] %>% as.character) %>%
plot_ly(x = ~GA, y = ~Set, z = ~Platform, color = ~cluster) %>%
add_markers(marker = list(size = 5)) %>%
layout(scene = list(xaxis = list(title = "GA"),
yaxis = list(title = "Set"),
zaxis = list(title = "Platform")))

enter image description here

关于r - 有什么解决方法可以对混合数据类型进行聚类并在 R 中渲染 3D 散点图吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56997557/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com