- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在用 R 分析一些基因表达数据。我想用 limma 的 eBayes 进行差异基因表达分析(limma 是 BioConductor 的一部分),但为此我需要将我的表达数据作为一个 eset 对象。问题是,我只有预处理数据,没有 CEL 文件,我可以直接转换为 eset 对象。我尝试从 Internet 搜索,但找不到解决方案。我唯一发现的是,这是可能的。
为什么选择 eBayes:即使在某些组中只有两个或三个样本,它也应该有可靠的结果,我确实有 3 个组,样本大小从 2 到 3 个不等。
详细说明我有什么和想做什么:我有表达数据,已经是对数的、归一化的强度值。数据在表达式矩阵中。大约有 20 000 行,每一行都是一个基因,行名是官方基因名称。有 22 列,每列对应一个癌症样本。我那里有不同种类的癌症亚型,并且想比较例如亚型 1 样本的基因表达与组 2 的基因表达。下面是一个两行 5 列的矩阵示例。
示例矩阵:
SAMP1 SAMP2 SAMP3 SAMP4 SAMP5
GENE1 123.764 122.476 23.4764 2.24343 123.3124
GENE2 224.233 455.111 124.122 112.155 800.4516
问题:要使用 eBayes 评估差异基因表达,我需要这个表达数据中的 eset 对象,老实说,我不知道如何进行该步骤。 :(
我非常感谢能帮助我的每一点信息!如果有人可以建议另一种可靠的小样本比较方法,那也可能会解决我的问题。
谢谢!
最佳答案
使用 ExpressionSet
似乎与 SummarizedExperiment
非常相似,后者在 Bioconductor 包中也很普遍。据我所知,在一个包中使用一个或另一个没有什么特别的——根据我的经验,它被认为是一个通用的数据容器,以便跨 Bioconductor 包标准化数据集格式。
来自 Bioconductor 上的小插图:
Affymetrix data will usually be normalized using the affy package. We will assume here that the data is available as an ExpressionSet object called eset. Such an object will have an slot containing the log-expression values for each gene on each array which can be extracted using exprs(eset).
换句话说,ExpressionSet 的数据没有什么特别之处。 ExpressionSet
只是将一堆相关的实验数据串在一起,但似乎我可以仅从常规对象创建一个新对象:
library(limma)
# counts is the assay data I already have.
dim(counts)
# [1] 64102 8
# Creates a new ExpressionSet object (quite bare, only the assay data)
asdf <- ExpressionSet(assayData = counts)
# Returns the data you put in.
exprs(asdf)
这适用于我的设置。
您需要考虑的第二部分是差异表达分析比较模型矩阵的设计。您将需要预定义的因素与您的样本一起使用(可能在 phenoData
到 ExpressionSet
的参数,然后使用 R 的特殊 formula
语法创建一个 model.matrix
。它们看起来类似于:dependent ~ factor1 + factor2 + co:related
。请注意,factor1
是一个因素类别或维度,而不仅仅是一个级别。
完成后,您应该能够运行 lmFit
。实际上,我之前并没有使用过 limma
,但它似乎与 edgeR
的方案类似。
关于r - 从预处理的表达式矩阵创建 eset 对象?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25581769/
我正在用 R 分析一些基因表达数据。我想用 limma 的 eBayes 进行差异基因表达分析(limma 是 BioConductor 的一部分),但为此我需要将我的表达数据作为一个 eset 对象
我试图从 ESet 中排除我所有的样本,这些样本对于 10 个表型之一没有条目: 我有一个包含 50 个样本和 10 个表型的 ESet。 sample A 在表型 1 中含有 NA,在表型 3 中含
我收到了一封包含 .js 文件附件的垃圾邮件,出于好奇,我在记事本中打开了它(当然没有运行它)。不得不暂时禁用 ESET,因为它将其标记为木马。我想知道这实际上是做什么的: autonomousRa
我是一名优秀的程序员,十分优秀!