R 使用 dcast、melt 和 concatenation reshape 数据框-6ren

R 使用 dcast、melt 和 concatenation reshape 数据框

转载作者：行者123 更新时间：2023-12-05 04:12:57

25

4

我有一个数据框如下:

mydf <- data.frame(Term = c('dog','cat','lion','tiger','pigeon','vulture'), Category = c('pet','pet','wild','wild','pet','wild'),
    Count = c(12,14,19,7,11,10), Rate = c(0.4,0.7,0.3,0.6,0.1,0.8), Brand = c('GS','GS','MN','MN','PG','MN')    )

产生数据框:

     Term Category Count Rate Brand
1     dog      pet    12  0.4    GS
2     cat      pet    14  0.7    GS
3    lion     wild    19  0.3    MN
4   tiger     wild     7  0.6    MN
5  pigeon      pet    11  0.1    PG
6 vulture     wild    10  0.8    MN

我希望将此数据框转换为以下 resultDF

Category         pet              wild              
Term             dog,cat,pigeon   lion,tiger,vulture
Countlessthan13  dog,pigeon       tiger,vulture     
Ratemorethan0.5  cat              tiger,vulture     
Brand            GS,PG            MN

行标题表示像 Countlessthan13 这样的操作意味着将 Count < 13 应用于术语然后分组。另请注意，品牌名称是独一无二的，不会重复。

我已经尝试过 dcast 和 melt...但没有得到想要的结果。

最佳答案

我们可以使用 data.table 来做到这一点.将 'data.frame' 转换为 'data.table' ( setDT(mydf) )，按 'Category' 分组，按 paste 创建一些汇总列正在 unique 'Count' 小于 13 或 'Rate' 大于 0.5 的 'Term' 值，以及 paste正在 unique “品牌”的元素。

library(data.table)
dt <- setDT(mydf)[, .(Term = paste(unique(Term), collapse=","),
                      Countlesstthan13 =  paste(unique(Term[Count < 13]), collapse=","),

                      Ratemorethan0.5 = paste(unique(Term[Rate > 0.5]), collapse=","), 
                      Brand = paste(unique(Brand), collapse=",")), by = Category]

从汇总数据集 ('dt') 中，我们 melt通过将 'id.var' 指定为 'Category' 为 'long' 格式，然后 dcast它回到“宽”格式。

dcast(melt(dt, id.var = "Category", variable.name = "category"),
                            category ~Category, value.var = "value")
#           category            pet               wild
#1:             Term dog,cat,pigeon lion,tiger,vulture
#2: Countlesstthan13     dog,pigeon      tiger,vulture
#3:  Ratemorethan0.5            cat      tiger,vulture
#4:            Brand          GS,PG                 MN

关于R 使用 dcast、melt 和 concatenation reshape 数据框，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39031705/

25

4

0

文章推荐： deep-learning - Keras ImageDataGenerator 未按预期工作

文章推荐： r - 在 Wiki 的网球 table 上使用 Rvest 进行网页抓取

r - 传播与 dcast
我有一张这样的 table ， > head(dt2) Weight Height Fitted interval limit value 1 65.6 174.0 71.9120
r - 一步熔断/dcast
我有以下 data.table library(data.table) testdt <- data.table(var1=rep(c("a", "b"), e=3), p1=1:6, p2=11:1
重新排序 dcast 数据帧
是否可以重新排序数据帧的列，这是 dcast() 调用的结果前任。鉴于数据: > dput(copyOfRes) structure(list(docName = c("doc2", "doc1"
r - dcast 特定列并保留所有
我正在尝试为每种类型的 gridNumber 的每种类型的元素取一个具有特定值的列。和 dcast它以便从元素列创建 3 个单独的列。我不确定如何做到这一点。输入: df % spread(elem
r - dcast 中的自定义聚合函数
我有一个表需要重新格式化。该表如下所示: date ItemID NewPrice Sale Amount 1-1 1 5 3 1-1
使用虚拟变量使用 dcast 重新排列数据帧
我喜欢使用 dcast 函数(reshape2 包)来返回 reshape 数据框，但不起作用。在我的例子中: #Data set X% select(-dummy) %>% group_by
r - 以奇怪的方式应用 dcast
我想根据“主导”变量来分隔变量。在以下情况下为 x3: set.seed(2) df = data.frame(x1 = sample(4), x2 = sample(4), x3 = sample(
R: dcast 降序
我有以下形式的数据框: time1 % mutate(time2 = factor(time2, levels = rev(unique(time2)))) %>% dcast(time2 ~
r - dcast 重命名所有变量以数字开头
所以我得到了如下所示的数据: id year principal interest 1: 011000600 2013 0.00 0.00 2: 01100
r - `dcast` 空 RHS
这个问题在这里已经有了答案: Transpose / reshape dataframe without "timevar" from long to wide format (8 个回答) 4年前关
r - 更改 dcast 以显示多列
我有以下情况。考虑以下 df: mymatrix mymatrix Patient marker Number Visit 1 B1 A 1 baseline
r - 在 dcast 中对列进行排序
使用 dcast 时，如何根据列“Col”指定列顺序？ df <- dcast(x, ID ~ ColumnName, value.var = "Answer") 我需要解决方案不特定于数据，因为 x
R:从 dcast 输出中按数字而不是按字典顺序重新排序列
这是关于对包含数字和文本的列名称进行排序。我有一个来自 dcast 的数据框并有 200 行。我有订购问题。列名称采用以下格式: names(DF) <- c('Testname1.1', 'Tes
r - 如何使用 dcast() 对列的值求和？
我坚持使用 dcast 函数；我正在尝试为每个计数年的许多物种的个体创建一个总和表。我有一个包含 3 列的数据框:(1)年份(因子)，(2)物种名称(因子)，以及(3)计数(数字)。 Year
r - 当数据量很大时，dcast 无法转换字符列
我正在使用 dcast library(reshape2) 中的函数封装以转换一个简单的三列表格 df = data.table(id = 1:1e6, var = c('
R:使用 dcast 时包括没有条目的因素
我在数据帧上使用 reshape2 函数 dcast。其中一个变量是某些级别未出现在数据框中的因素，但我会在创建的新列中包含所有值。例如说我运行以下 library(reshape2) dataDF
r - dcast 2 列
我有以下data.frame: group <- sample(c("egyptian", "american", "irish", "australian"), 50, TRUE) E <- c(r
使用 dcast reshape 数据？
我不知道是否使用 dcast()是正确的方法，但我想 reshape 以下 data.frame: df z，你基本上会这样做: x z ya yb 1 p1 14 1*max*
r - 可以在没有聚合函数的情况下使用 dcast 吗？
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: This R reshaping should be simple, but dcast来自reshape2无需公式
r - 使用 dcast 加宽数据框
我有以下数据框: z dcast(z, id ~ item, value.var="freq") id x y z 1 1 4 3 2 2 2 4 4 1 关于r - 使用 dcast 加宽

首页

博学

6Ren·AI

商城

R 使用 dcast、melt 和 concatenation reshape 数据框