使用 dcast reshape 数据？-6ren

使用 dcast reshape 数据？

转载作者：行者123 更新时间：2023-12-02 21:53:49

24

4

我不知道是否使用 dcast()是正确的方法，但我想 reshape 以下 data.frame:

df <- data.frame(x=c("p1","p1","p2"),y=c("a","b","a"),z=c(14,14,16))
df
   x y  z
1 p1 a 14
2 p1 b 14
3 p2 a 16

使它看起来像这样:

df2 <- data.frame(x=c("p1","p2"),a=c(1,1),b=c(1,0),z=c(14,16))
   x a b  z
1 p1 1 1 14
2 p2 1 0 16

变量y在df应该被破坏，以便它的元素是新的变量，每个虚拟编码。所有其他变量(在本例中只是 z )对于每个人(p1，p2 等)都是相等的。特定人 p 具有不同值的唯一变量是 y .
我想要这个的原因是因为我需要通过变量 x 将此数据集与其他数据集合并。问题是，每人需要一行(p1、p2 等)。

最佳答案

这几乎是 previous question 的重复，并且我在那里使用的相同基本答案再次起作用。也不需要任何外部包。

aggregate(model.matrix(~ y - 1, data=df),df[c("x","z")],max)

   x  z ya yb
1 p1 14  1  1
2 p2 16  1  0

为了解释这一点，因为它看起来有点奇怪，最基本的 model.matrix 调用为 data.frame 的每一行的每个唯一值返回一个二进制指示符变量，例如所以:

如果您通过两个 id 变量(x 和 z)聚合该中间结果，那么您实际上是在对初始数据进行操作.框架:

   x  z ya yb
1 p1 14  1  0
2 p1 14  0  1
3 p2 16  1  0

因此，如果您在 x 和 的每个组合中取 ya 和 yb 的 max 值>z，你基本上会这样做:

   x  z ya      yb
1 p1 14  1*max*  0
2 p1 14  0       1*max*

--collapse--

   x  z ya      yb
1 p1 14  1       1

...并对每个唯一的 x/z 组合重复此操作以给出最终结果:

   x  z ya yb
1 p1 14  1  1
2 p2 16  1  0

将其推广到更多列会有点疯狂，但这是可以做到的，由 this question 提供，例如:

df <- data.frame(x=c("p1","p1","p2"),y=c("a","b","a"),z=c("14","15","16"))
intm <- model.matrix(~ y + z - 1, data=df,
                 contrasts.arg = sapply(df[2:3], contrasts, contrasts=FALSE))
aggregate(intm,df[c("x")],max)

   x ya yb z14 z15 z16
1 p1  1  1   1   1   0
2 p2  1  0   0   0   1

关于使用 dcast reshape 数据？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18113443/

24

4

0

文章推荐： c# - 在 DropDownOpened 事件上设置的 WPF 组合框绑定(bind)列表

文章推荐： ruby-on-rails - 思考 sphinx 无法配置开发配置

文章推荐： kendo-ui - Kendo UI MVVM 与 Kendo UI 拖放

文章推荐： HTML CSS 表格在底部而不是表格顶部显示行

r - 传播与 dcast
我有一张这样的 table ， > head(dt2) Weight Height Fitted interval limit value 1 65.6 174.0 71.9120
r - 一步熔断/dcast
我有以下 data.table library(data.table) testdt <- data.table(var1=rep(c("a", "b"), e=3), p1=1:6, p2=11:1
重新排序 dcast 数据帧
是否可以重新排序数据帧的列，这是 dcast() 调用的结果前任。鉴于数据: > dput(copyOfRes) structure(list(docName = c("doc2", "doc1"
r - dcast 特定列并保留所有
我正在尝试为每种类型的 gridNumber 的每种类型的元素取一个具有特定值的列。和 dcast它以便从元素列创建 3 个单独的列。我不确定如何做到这一点。输入: df % spread(elem
r - dcast 中的自定义聚合函数
我有一个表需要重新格式化。该表如下所示: date ItemID NewPrice Sale Amount 1-1 1 5 3 1-1
使用虚拟变量使用 dcast 重新排列数据帧
我喜欢使用 dcast 函数(reshape2 包)来返回 reshape 数据框，但不起作用。在我的例子中: #Data set X% select(-dummy) %>% group_by
r - 以奇怪的方式应用 dcast
我想根据“主导”变量来分隔变量。在以下情况下为 x3: set.seed(2) df = data.frame(x1 = sample(4), x2 = sample(4), x3 = sample(
R: dcast 降序
我有以下形式的数据框: time1 % mutate(time2 = factor(time2, levels = rev(unique(time2)))) %>% dcast(time2 ~
r - dcast 重命名所有变量以数字开头
所以我得到了如下所示的数据: id year principal interest 1: 011000600 2013 0.00 0.00 2: 01100
r - `dcast` 空 RHS
这个问题在这里已经有了答案: Transpose / reshape dataframe without "timevar" from long to wide format (8 个回答) 4年前关
r - 更改 dcast 以显示多列
我有以下情况。考虑以下 df: mymatrix mymatrix Patient marker Number Visit 1 B1 A 1 baseline
r - 在 dcast 中对列进行排序
使用 dcast 时，如何根据列“Col”指定列顺序？ df <- dcast(x, ID ~ ColumnName, value.var = "Answer") 我需要解决方案不特定于数据，因为 x
R:从 dcast 输出中按数字而不是按字典顺序重新排序列
这是关于对包含数字和文本的列名称进行排序。我有一个来自 dcast 的数据框并有 200 行。我有订购问题。列名称采用以下格式: names(DF) <- c('Testname1.1', 'Tes
r - 如何使用 dcast() 对列的值求和？
我坚持使用 dcast 函数；我正在尝试为每个计数年的许多物种的个体创建一个总和表。我有一个包含 3 列的数据框:(1)年份(因子)，(2)物种名称(因子)，以及(3)计数(数字)。 Year
r - 当数据量很大时，dcast 无法转换字符列
我正在使用 dcast library(reshape2) 中的函数封装以转换一个简单的三列表格 df = data.table(id = 1:1e6, var = c('
R:使用 dcast 时包括没有条目的因素
我在数据帧上使用 reshape2 函数 dcast。其中一个变量是某些级别未出现在数据框中的因素，但我会在创建的新列中包含所有值。例如说我运行以下 library(reshape2) dataDF
r - dcast 2 列
我有以下data.frame: group <- sample(c("egyptian", "american", "irish", "australian"), 50, TRUE) E <- c(r
使用 dcast reshape 数据？
我不知道是否使用 dcast()是正确的方法，但我想 reshape 以下 data.frame: df z，你基本上会这样做: x z ya yb 1 p1 14 1*max*
r - 可以在没有聚合函数的情况下使用 dcast 吗？
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: This R reshaping should be simple, but dcast来自reshape2无需公式
r - 使用 dcast 加宽数据框
我有以下数据框: z dcast(z, id ~ item, value.var="freq") id x y z 1 1 4 3 2 2 2 4 4 1 关于r - 使用 dcast 加宽

首页

博学

6Ren·AI

商城

使用 dcast reshape 数据？