- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所以我正在处理癌症分期数据。假设有一个这种类型的数据集。它是一个数据框。
cancertype stage
TCGA-67-6215-01 1
TCGA-67-6216-01 1
TCGA-67-6217-01 2
TCGA-69-7760-01 2
TCGA-69-7761-01 1
TCGA-69-7763-01 1
TCGA-69-7764-01 1
TCGA-69-7765-01 4
TCGA-69-7980-01 1
TCGA-71-6725-01 1
TCGA-73-4658-01 1
TCGA-73-4659-01 3
TCGA-73-4662-01 1
TCGA-73-4675-01 3
list(
dataframe of stage1 and 2
dataframe of stage1 and 3
dataframe of stage 1 and 4
dataframe of stage 2 and 3
...etc
dataframe of stage 1,2 and 3
dataframe of stage 2,3 and 4
...
dataframe of stage 1,2 and 3,4
dataframe of stage 1,3 and 2,4
dataframe of stage 1,2,3 and 4
dataframe of stage 1,2,4 and 3
.. etc etc I think this should give you the idea.
)
stage # dataframe of stage data as factors
stage_split <-split(stage,stage[,1])
allcombos<- c(combn(stage_split,2,simplify=F), combn(stage_split,3,simplify=F), combn(stage_split,4,simplify=F))
allcombos_cmbnd<- lapply(allcombos, function(x) Reduce(rbind,x))
最佳答案
当您将阶段分组在一起时,您正在对大小为 3 或 4 的集进行分区。有一个包,partitions
使用 setparts
实现集合分区.在这里,我专注于合并部分,因为听起来您已经弄清楚了非合并分组。
## For unmerged, get groupings with something like this
combos <- unlist(lapply(2:4, function(x) combn(unique(dat$stage), x, simplify=F)), rec=F)
## For merged groupings, use set partitioning
library(partitions)
dats <- unlist(sapply(3:4, function(p) {
parts <- setparts(p) # set partitions of size p
lst <- lapply(split(parts, col(parts)), function(idx) {
if (p==3) { # with sets of 3, need to exclude one of the stages
subLst <- lapply(1:4, function(exclude) {
tmp <- dat$stage
tmp[dat$stage==exclude] <- NA
ids <- seq(4)[-exclude]
for (i in 1:3) tmp[dat$stage==ids[i]] <- idx[i]
data.frame(dat$cancertype, stage=tmp)
})
names(subLst) <- paste(1:4)
subLst
} else { # sets of 4, no need to exclude
tmp <- dat$stage
for (i in 1:length(idx)) tmp[dat$stage==i] <- idx[i]
data.frame(dat$cancertype, stage=tmp)
}
})
names(lst) <- lapply(split(parts, col(parts)), paste, collapse=".")
lst
}), rec=F)
dats
现在是
data.frames
的列表与
stage
s 按设置的分区分组。对大小为 3 的集合进行分区时,必须删除其中一个阶段。因此,
dats
中的那些条目显示为长度为 4 的列表,每个元素对应于从考虑中删除一个阶段(列表是有序的,因此第一个组件删除阶段 1,第二个组件删除阶段 2,等等)。让我们看看一个或大小为 3 的分区,
dats[4]
$`2.1.1`
# $`2.1.1`$`1`
# dat.cancertype stage
# 1 TCGA-67-6215-01 NA
# 2 TCGA-67-6216-01 NA
# 3 TCGA-67-6217-01 2
# 4 TCGA-69-7760-01 2
# 5 TCGA-69-7761-01 NA
# 6 TCGA-69-7763-01 NA
# 7 TCGA-69-7764-01 NA
# 8 TCGA-69-7765-01 1
# 9 TCGA-69-7980-01 NA
# 10 TCGA-71-6725-01 NA
# 11 TCGA-73-4658-01 NA
# 12 TCGA-73-4659-01 1
# 13 TCGA-73-4662-01 NA
# 14 TCGA-73-4675-01 1
#
# $`2.1.1`$`2`
# dat.cancertype stage
# 1 TCGA-67-6215-01 2
# 2 TCGA-67-6216-01 2
# 3 TCGA-67-6217-01 NA
# 4 TCGA-69-7760-01 NA
# 5 TCGA-69-7761-01 2
# 6 TCGA-69-7763-01 2
# 7 TCGA-69-7764-01 2
# 8 TCGA-69-7765-01 1
# 9 TCGA-69-7980-01 2
# 10 TCGA-71-6725-01 2
# 11 TCGA-73-4658-01 2
# 12 TCGA-73-4659-01 1
# 13 TCGA-73-4662-01 2
# 14 TCGA-73-4675-01 1
group1.group2.group3$excludedGroup
, 相同的数字表示组已合并。所以,
2.1.1$1
表示第一组已被排除(
$1
,实际上只是转换为
NA
),而在其余数据中,第 2 组和第 3 组已合并。这有点令人困惑,可能需要更好的命名方案。例如,
$2.1.1$1
表示“排除了第 1 阶段(NA)并且第 3 阶段和第 4 阶段已合并”。因此,我可以使用
dats[['2.1.1']][['1']]
访问该数据。 .此列表中还有两个 data.frames 未显示(不包括第 3 阶段和第 4 阶段)。
dats[19]
# $`2.3.1.1`
# dat.cancertype stage
# 1 TCGA-67-6215-01 2
# 2 TCGA-67-6216-01 2
# 3 TCGA-67-6217-01 3
# 4 TCGA-69-7760-01 3
# 5 TCGA-69-7761-01 2
# 6 TCGA-69-7763-01 2
# 7 TCGA-69-7764-01 2
# 8 TCGA-69-7765-01 1
# 9 TCGA-69-7980-01 2
# 10 TCGA-71-6725-01 2
# 11 TCGA-73-4658-01 2
# 12 TCGA-73-4659-01 1
# 13 TCGA-73-4662-01 2
# 14 TCGA-73-4675-01 1
data.frame
进行多次比较。 .例如,对于上面显示的数据集,可以使用
dats[['2.3.1.1']]
进行等效测试。或两者
dats[['2.1.1']][['1']]
和
dats[['2.1.1']][['2']]
结合。
data.frame
s 在一个列表中,你可以只存储索引,或者只是在循环中进行计算。
关于R 为列表生成因子的所有组合、合并的所有组合和组合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31622189/
我有一个 mysql 表,其中包含一些随机数字组合。为简单起见,以下表为例: index|n1|n2|n3 1 1 2 3 2 4 10 32 3 3 10 4 4
我有以下代码: SELECT sdd.sd_doc_classification, sdd.sd_title, sdd.sd_desc, sdr.sd_upl
如果我有两个要合并的数据框 Date RollingSTD 01/06/2012 0.16 01/07/2012 0.18 01/08/2012 0.17 01/09/20
我知道可以使用 lein ring war 创建一个 war 文件,但它似乎仍然包含码头依赖项。当我构建 war (并在 tomcat 上部署)时,有没有办法排除码头依赖项? 如果我根本不能做这件事,
维基百科关于封装的文章指出: “封装还通过防止用户将组件的内部数据设置为无效或不一致的状态来保护组件的完整性” 我在一个论坛上开始讨论封装,在那里我问你是否应该始终在 setter 和/或 gette
对于我使用的组合框内的复选框: AOEDComboAssociationName = new Ext.form.ComboBox({ id: 'AOEDComboAssociationName',
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: How do I combine LINQ expressions into one? public boo
如何在 rust 中找到排列或组合的数量? 例如C(10,6) = 210 我在标准库中找不到这个函数,也找不到那里的阶乘运算符(这就足够了)。 最佳答案 以@vallentin 的回答为基础,可以进
我有一个复杂的泛型类型用例,已在下面进行了简化 trait A class AB extends A{ val v = 10 } trait X[T<:A]{ def request: T }
如何使用 Hibernate 限制来实现此目的? (((A='X') and (B in('X',Y))) or ((A='Y') and (B='Z'))) 最佳答案 思考有效 Criteria c
我一定会在我的一个项目中使用谷歌图表。我需要的是,显示一个条形图,并且在条形图中,与每个条形相交的线代表另一个值。如果您查看下面的 jsfiddle,您会发现折线图仅与中间的条形图相交,并继续向其他条
只是一个简单的问题,我也很想得到答案,因为我不能百分百理解 Javascript 示例:假设您提示用户输入名称。够简单吧?但是你有一个数组,上面写着一些名字(其中之一就是),基本上就是我到目前为止所说
我试图通过 Haskell 理解函数式编程,但在处理函数组合时遇到了很多麻烦。 其实我有这两个功能: add:: Integer -> Integer -> Integer add x y = x
我正在寻找一种在 Realm 查询中组合 AND 和 OR 的方法。 这是我的课: class Event extends RealmObject { String id; String
例如,我有一个包含 5 个元素的哈希: my_hash = {a: 'qwe', b: 'zcx', c: 'dss', d: 'ccc', e: 'www' } 我的目标是每次循环哈希时都返回,但没
我是Combine 的新手,我想得到一个看似简单的东西。假设我有一个整数集合,例如: let myCollection = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 我想以例如 0
关于“优先组合而不是继承”的问题,我的老师是这样说的: 组合:现有类成为新类的组件 转发:新类中的每个实例方法,在现有类的包含实例上调用相应的方法并返回结果 包装器:新类封装了现有的 这三个概念我不是
我正在尝试将单个整数从 ASCII 值转换为 0 和 1。相关代码如下所示: int num1 = bin.charAt(0); int num2 = bin.charAt(1);
这个问题已经有答案了: What is a NullPointerException, and how do I fix it? (12 个回答) 已关闭 7 年前。 我经常看到“嵌套”类中的非静态变
我尝试合并两个数据集(DataFrame),如下所示: D1 = pd.DataFrame({'Village':['Ampil','Ampil','Ampil','Bachey','Bachey',
我是一名优秀的程序员,十分优秀!