gpt4 book ai didi

r - R中的长矢量图/覆盖图

转载 作者:行者123 更新时间:2023-12-02 01:13:20 25 4
gpt4 key购买 nike

我真的需要你的 R 技能。几天来一直在处理这个情节。我是 R 新手,所以这可以解释。

我有染色体的序列覆盖率数据(基本上是每条染色体长度上每个位置的值,使向量的长度达到数百万)。我想为我的阅读制作一个很好的覆盖图。这是我到目前为止得到的: enter image description here

看起来不错,但我缺少 y 标签,所以我可以判断它是哪条染色体,而且我在修改 x 轴时遇到了问题,所以它在覆盖结束的地方结束。此外,我自己的数据要大得多,这使得这个图特别需要很长时间。这就是我尝试这个 HilbertVis plotLongVector 的原因。它有效,但我不知道如何修改它、x 轴、标签、如何记录 y 轴,以及矢量在绘图上的长度都相同,即使它们的长度不一样。

source("http://bioconductor.org/biocLite.R")
biocLite("HilbertVis")
library(HilbertVis)
chr1 <- abs(makeRandomTestData(len=1.3e+07))
chr2 <- abs(makeRandomTestData(len=1e+07))

par(mfcol=c(8, 1), mar=c(1, 1, 1, 1), ylog=T)

# 1st way of trying with some code I found on stackoverflow
# Chr1
plotCoverage <- function(chr1, start, end) { # Defines coverage plotting function.
plot.new()
plot.window(c(start, length(chr1)), c(0, 10))
axis(1, labels=F)
axis(4)
lines(start:end, log(chr1[start:end]), type="l")
}
plotCoverage(chr1, start=1, end=length(chr1)) # Plots coverage result.

# Chr2
plotCoverage <- function(chr2, start, end) { # Defines coverage plotting function.
plot.new()
plot.window(c(start, length(chr1)), c(0, 10))
axis(1, labels=F)
axis(4)
lines(start:end, log(chr2[start:end]), type="l")
}
plotCoverage(chr2, start=1, end=length(chr2)) # Plots coverage result.


# 2nd way of trying with plotLongVector
plotLongVector(chr1, bty="n", ylab="Chr1") # ylab doesn't work
plotLongVector(chr2, bty="n")

然后我有另一个特别感兴趣的称为基因的载体。它们与染色体向量的长度大致相同,但在我的数据中,它们包含的零多于值。

genes_chr1 <- abs(makeRandomTestData(len=1.3e+07)) 
genes_chr2 <- abs(makeRandomTestData(len=1e+07))

我想将这些基因向量绘制为染色体下方的红点!基本上,如果矢量在那里有一个值(>0),它在长矢量图下显示为一个点(或线)。这个我不知道怎么加!但这似乎相当简单。

请帮帮我!非常感谢。

最佳答案

免责声明:不要简单地复制和粘贴此代码以运行染色体的整个位置。请采样位置(例如,@Gx1sptDTDa 显示)并绘制它们。否则,如果您的计算机在排水管中幸存下来,您可能会在许多小时后得到一个巨大的黑色填充矩形。

使用 ggplot2,使用 geom_area 很容易实现。在这里,我生成了一些具有 300 个位置的三个染色体的随机数据,只是为了展示一个例子。我希望你可以在此基础上再接再厉。

# construct a test data with 3 chromosomes and 100 positions
# and random coverage between 0 and 500
set.seed(45)
chr <- rep(paste0("chr", 1:3), each=100)
pos <- rep(1:100, 3)
cov <- sample(0:500, 300)
df <- data.frame(chr, pos, cov)

require(ggplot2)
p <- ggplot(data = df, aes(x=pos, y=cov)) + geom_area(aes(fill=chr))
p + facet_wrap(~ chr, ncol=1)

ggplot2_geom_area_coverage_plot

关于r - R中的长矢量图/覆盖图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14629607/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com