- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个由大约 7.000 行组成的巨大数据框,每行都有一个特定的 ID 号,可以出现多次(最多 16 次)。在一个简单的版本中,它看起来像这样:
ID <- factor(c("a","a","a","a","b","c","c","d","d","d"))
var1 <-c(10,20,10,40,30,20,20,10,10,40)
var2 <-c(5,5,4,8,9,2,4,7,1,3)
df <- data.frame(ID,var1,var2)
df
ID var1 var2
1 a 10 5
2 a 20 5
3 a 10 4
4 a 40 8
5 b 30 9
6 c 20 2
7 c 20 4
8 d 10 7
9 d 10 1
10 d 40 3
现在我想以具有相同 ID 的属性写在一行中的方式形成我的 data.frame
,这样我(在这种情况下)最多有 4 列用于var1 和 4 列用于 var2,因为最常见的 ID 出现了四次 (ID a)。所有其他不存在数据的空间都应该用 .
生成的 data.frame
应该如下所示:
ID var1_1 var1_2 var1_3 var1_4 var2_1 var2_2 var2_3 var2_4
1 a 10 20 10 40 5 5 4 8
2 b 30 NA NA NA 9 NA NA NA
3 c 20 20 NA NA 2 4 NA NA
4 d 10 10 40 NA 7 1 3 NA
我的想法是通过 tapply
解决这个问题
df2 <- tapply (df$var1,df$ID,paste)
这给了我以下输出:
$a
[1] "10" "20" "10" "40"
$b
[1] "30"
$c
[1] "20" "20"
$d
[1] "10" "10" "40"
如果我将其转换为数据框,它看起来像这样:
> df3 <-as.data.frame(df2)
> df3
df3
a 10, 20, 10, 40
b 30
c 20, 20
d 10, 10, 40
问题是我现在只有一个变量,而不是所需的四个。 (或者实际上是八个,关于那些由 var2 产生的结果,我会像 var1 一样处理它们,并在最后一步通过合并合并)。
然后我尝试了 strsplit()
但这并不能帮助我解决问题,因为我没有得到不同的列并且我不知道如何添加 NA 值。
也许有一个简单的函数来重构data.frame
?如果有人能帮助我,我会很幸运。
最佳答案
添加辅助 ID 并使用 reshape
:
这是我们的第二个 ID 应该是这样的(实际上,这通常被称为您的“时间”变量)
with(df, ave(rep(1, nrow(df)), ID, FUN = seq_along))
# [1] 1 2 3 4 1 1 2 1 2 3
有了这个,基础 R 的未被充分认识的 reshape
可以轻松解决这个问题:
df$ID2 <- with(df, ave(rep(1, nrow(df)), ID, FUN = seq_along))
reshape(df, direction = "wide", idvar="ID", timevar="ID2")
# ID var1.1 var2.1 var1.2 var2.2 var1.3 var2.3 var1.4 var2.4
# 1 a 10 5 20 5 10 4 40 8
# 5 b 30 9 NA NA NA NA NA NA
# 6 c 20 2 20 4 NA NA NA NA
# 8 d 10 7 10 1 40 3 NA NA
或者,使用“reshape2”:
library(reshape2)
df$ID2 <- with(df, ave(rep(1, nrow(df)), ID, FUN = seq_along))
dfL <- melt(df, id.vars=c("ID", "ID2"))
dcast(dfL, ID ~ variable + ID2, value.var="value")
# ID var1_1 var1_2 var1_3 var1_4 var2_1 var2_2 var2_3 var2_4
# 1 a 10 20 10 40 5 5 4 8
# 2 b 30 NA NA NA 9 NA NA NA
# 3 c 20 20 NA NA 2 4 NA NA
# 4 d 10 10 40 NA 7 1 3 NA
关于R如何通过创建新列在一行中写入可变数量的具有相同属性的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23563753/
为什么禁用类型像 type t = A of int | B of string * mutable int 虽然允许此类类型: type t = A of int | B of string * i
我正在寻找一种类似结构的数据结构,我可以从中创建多个实例并具有某种类型提示而不是不可变的。 所以我有这样的东西: class ConnectionConfig(NamedTuple): nam
我需要转到引用的结构: class SearchKnot { var isWord : Bool = false var text : String = "" var to
如sec 10.4.3中所述 当控制进入执行时,执行以下步骤 功能对象F(调用者)中包含的功能代码的上下文 提供thisArg,而调用方提供argumentsList: 如
i make a game that start display Activity indicator And activity indicator bottom display UiLable wi
编辑:我在这里不断获得支持。只是为了记录,我认为这不再重要。自从我发布它以来我就不再需要它了。 我想在 Scala 中执行以下操作... def save(srcPath: String, destP
使用可变对象作为 Hashmap 键是一种不好的做法吗?当您尝试使用已修改足以更改其哈希码的键从 HashMap 中检索值时,会发生什么? 例如,给定 class Key { int a; /
如果您在Kotlin中访问List类型的Java值,则将获得(Mutable)List!类型。 例如。: Java代码: public class Example { public stati
我编写了 str 类(内置)的以下扩展,以便执行以下操作:假设我有字符串 "Ciao" ,通过做"Ciao" - "a"我想要的结果是字符串 "Cio" 。这是执行此操作的代码,并且运行良好: cla
使用可变对象作为 Hashmap 键是一种不好的做法吗?当您尝试使用已修改足以更改其哈希码的键从 HashMap 中检索值时,会发生什么? 例如,给定 class Key { int a; /
我正在为我的公司设计一个数据库来管理商业贷款。每笔贷款都可以有担保人,可以是个人或公司,在借款业务失败时作为财务支持。 我有 3 个表:Loan、Person 和 Company,它们存储明显的信息。
我使用二进制序列化从 C# 类中保存 F# 记录。一切正常: F#: type GameState = { LevelStatus : LevelStatus
import javax.swing.JOptionPane; public class HW { public static void main(String[] args) { Strin
使用 flatbuffer mutable 有多少性能损失? 是否“正确”使用 FlatBuffers 来拥有一个应该可编辑的对象/结构(即游戏状态) 在我的示例中,我现在有以下类: class Ga
std::function create_function (args...) { int x = initial_value (args...); return [x] () mut
我需要在 for 循环中找到用户输入的字符。我通常会这样做 如果(句子[i] == 'e') 但是因为在这里,'e' 将是一个单字母字符变量,我不知道如何获取要比较的值。我不能只输入 if (sent
我有一个这样的算法: let seed: Foo = ... let mut stack: Vec = Vec::new(); stack.push(&seed); while let Some(ne
这个问题可能看起来非常基础,但我很难弄清楚如何做。我有一个整数,我需要使用 for 循环来循环整数次。 首先,我尝试了—— fn main() { let number = 10; // An
如果我有以下结构: struct MyStruct { tuple: (i32, i32) }; 以及以下函数: // This will not compile fn function(&mut s
我希望在每个 session 的基础上指定列的默认值。下面的脚本不起作用,但描述了我想如何使用它。我目前使用的是 MySQL 5.5.28,但如果需要可以升级。 CREATE TABLE my_tbl
我是一名优秀的程序员,十分优秀!