r - 将行旋转为具有每个测量值 R 的计数值的列-6ren

r - 将行旋转为具有每个测量值 R 的计数值的列

转载作者：行者123 更新时间：2023-12-04 23:42:45

26

4

我有一个正在使用的示例数据框

ID <- c("A","A","A","A","A","A","A","A","A","A","A","A","B","B","B","B","B","B","B","B","B","B")
TARG_AVG <- c(2.1,2.1,2.1,2.1,2.1,2.1,2.3,2.3,2.5,2.5,2.5,2.5,3.1,3.1,3.1,3.1,3.3,3.3,3.3,3.3,3.5,3.5)
Measurement <- c("Len","Len","Len","Wid","Ht","Ht","Dep","Brt","Ht","Ht","Dep","Dep"
                 ,"Dep","Dep","Len","Len","Ht","Ht","Brt","Brt","Wid","Wid")
df1 <- data.frame(ID,TARG_AVG,Measurement)

我试图在这里解决 3 个不同的问题

1) 我想获得 (ID & TARG_AVG) 分组有多少唯一度量的摘要。我目前这样做

unique <- summaryBy(Measurement~ID+TARG_AVG, data=df1, FUN=function(x) { c(Count=length(x)) } )

这给了我总数(measurement.count)，但我也想要每个测量的计数。 我想要的输出 是

  ID TARG_AVG Len Wid Ht Dep Brt Measurement.Count
1  A      2.1   3   1  2   0   0                 6
2  A      2.3   0   0  0   1   1                 2
3  A      2.5   0   0  2   2   0                 4
4  B      3.1   2   0  0   2   0                 4
5  B      3.3   0   0  2   0   2                 4
6  B      3.5   0   2  0   0   0                 2

2) 获得上述输出后，我想对行进行子集化，以便获得过滤后的输出，该输出返回至少有 2 个测量值的行 > 2 .这里 我想要的输出 将是

  ID TARG_AVG Len Wid Ht Dep Brt Measurement.Count
1  A      2.1   3   1  2   0   0                 6
3  A      2.5   0   0  2   2   0                 4
4  B      3.1   2   0  0   2   0                 4
5  B      3.3   0   0  2   0   2                 4

3) 最后，我想将列转回只有测量值的行 > 2 . 我想要的输出 这里将是

      ID TARG_AVG Measurement
    1  A      2.1   Len   
    2  A      2.1   Len   
    3  A      2.1   Len   
    4  A      2.1   Ht   
    5  A      2.1   Ht   
    6  A      2.5   Ht   
    7  A      2.5   Ht   
    8  A      2.5   Dep  
    9  A      2.5   Dep  
   10  B      3.1   Len  
   11  B      3.1   Len  
   12  B      3.1   Dep 
   13  B      3.1   Dep
   14  B      3.3   Ht 
   15  B      3.3   Ht 
   16  B      3.3   Brt 
   17  B      3.3   Brt

我目前正在学习 reshape2、dplyr 和 data.table 包，如果有人能通过向我指出正确的方向来帮助我解决这个问题，那将非常有用。

最佳答案

最新解决方案

library(data.table) #v 1.9.6+
setDT(df1)[, indx := .N, by = names(df1)
           ][indx > 1, if(uniqueN(Measurement) > 1) .SD, by = .(ID, TARG_AVG)]
#     ID TARG_AVG Measurement indx
#  1:  A      2.1         Len    3
#  2:  A      2.1         Len    3
#  3:  A      2.1         Len    3
#  4:  A      2.1          Ht    2
#  5:  A      2.1          Ht    2
#  6:  A      2.5          Ht    2
#  7:  A      2.5          Ht    2
#  8:  A      2.5         Dep    2
#  9:  A      2.5         Dep    2
# 10:  B      3.1         Dep    2
# 11:  B      3.1         Dep    2
# 12:  B      3.1         Len    2
# 13:  B      3.1         Len    2
# 14:  B      3.3          Ht    2
# 15:  B      3.3          Ht    2
# 16:  B      3.3         Brt    2
# 17:  B      3.3         Brt    2

或者 dplyr相等的

df1 %>%
  group_by(ID, TARG_AVG, Measurement) %>%
  filter(n() > 1) %>%
  group_by(ID, TARG_AVG) %>%
  filter(n_distinct(Measurement) > 1)

较旧的解决方案

library(data.table)
## dcast the data (no need in total)
res <- dcast(df1, ID + TARG_AVG  ~ Measurement)
## filter by at least 2 incidents of at least length 2
res <- res[rowSums(res[-(1:2)] > 1) > 1,]
## melt the data back and filter again by at least 2 incidents
res <- melt(setDT(res), id = 1:2)[value > 1]
## Expand the data back
res[, .SD[rep(.I, value)]]

原题的解答

这是使用 reshape2 的可能解决方案

第一步

library(reshape2)
res <- dcast(df1, ID + TARG_AVG  ~ Measurement, margins = "Measurement")

第二步

res <- res[res$"(all)" > 2,]

3d 步骤

library(data.table)
setDT(df1)[, if(.N > 2) .SD, by = .(ID, TARG_AVG)]

关于r - 将行旋转为具有每个测量值 R 的计数值的列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33003929/

26

4

0

文章推荐： phalcon - 如何在phalcon框架中连接多个数据库

文章推荐： r - 确定和分组完全相关的变量(有效地)

文章推荐： scala - 使用 SBT 或 gradle 将 scala 编译为 assembly jar

文章推荐： qtip - 右键单击Cytoscape js qtip

前端性能精进之优化方法论（一）——测量
　　性能优化的重要性不言而喻，Google 的研究表明，当网站达到核心 Web 指标（Core Web Vitals）阈值时，用户放弃加载网页的可能性会降低 24%。　　如何
javascript - 横幅设计创建者 - 测量
我正在创建一个横幅设计创建器(这样人们就可以使用自己的文本、背景、图像、形状等来制作自己的设计)。我的产品有各种尺寸，例如:800x2000 mm、A4(210 x 297mm)、3300x2200m
swift - 测量 - 获取完整的单位名称
我不确定如何使用测量来获取单位的全名。例如“公里”而不是“公里”。 let measurement = Measurement(value: 50, unit: UnitLength.meters)
android - 测量 ViewPager
我有一个自定义 ViewGroup，它有一个子 ViewPager。 ViewPager 由 PagerAdapter 提供，该 LinearLayout 向 ViewPager 提供 LayoutP
memory - 测量 make 运行的内存消耗
我想测量一个大型软件项目在 Linux (make) 中构建过程中的内存消耗是多少内存。理想情况下，消耗会按操作(即编译、链接)拆分，但一开始绘制随时间变化的图表可能就足够了。我有哪些选择？最佳答
ssis - 测量 SSIS 数据流的进度
我正在运行一个 SSIS 包来从一个平面文件加载一百万行，它使用一个脚本任务进行复杂的转换和一个 SQL Server 表目标。我试图找出在数据流处理期间将行数(可能是 1000 的倍数以提高效率)写
python - 测量 Keras 层执行时间的正确方法
我正在尝试检查 Keras 模型不同层的执行速度(使用来自 tensorflow 2.3.0 v 的 keras) 我从这个 repo 中获取了代码并修改它，使用 timer() from from
java - 测量 Java 程序性能
我有一个旧的应用程序，一个 JAR 文件，它经过了一些增强。基本上必须修改代码的某些部分以及修改一些逻辑。将旧版本与新版本进行比较，新版本比旧版本慢约 2 倍。我试图缩小导致速度变慢的原因，但我发
silverlight - 测量 Silverlight 图表加载时间
我正在尝试测量不同 Silverlight 图表库(例如 Silverlight Control Toolkit、Visifire、Telerik)在屏幕上加载所需的时间。我的问题是我只能测量加载控
PHP:测量 TTFB(第一个字节的时间)
由于 TTFB 会因每个请求而异，因此我想对其进行统计并获取平均值。有谁知道我如何通过 PHP 进行测量？bytecheck.com 网站能够分析这些数据:这是 example.com 的示例:htt
c# - 测量 .NET 对象的大小
我正在使用 .NET 4.0 C# 编写应用程序。我将对象放在 .net httpruntime 缓存中，并希望在其上生成一些统计信息。我想知道对象在放入缓存之前的大小以及它在缓存中的大小。我该如何衡
flutter - 测量 Flutter 应用程序启动时间
我正在寻找某种方法来测量应用程序的启动时间。从点击应用程序图标的那一刻到用户可以看到例如登录页面的那一刻。最佳答案跑 flutter run --trace-startup --profile 跟
iphone - 测量 iPhone 应用程序加载时间
我正在优化 iPhone 应用程序以实现非常短的加载时间，我想知道: 是否有一种方法可以测量 iPhone 应用程序从用户点击图标到应用程序可用(或至少 –viewDidLoad 被调用)的加载时间？
android - 谷歌分析/Activity 测量
我无法理解中的一件事谷歌分析 .我的应用中需要一个功能，例如一个用户将我的应用转至乙用户然后他得到了一些奖励，但我想跟踪一个时通过链接的用户 ID乙用户点击该链接然后我可以得到一个中的用
delphi - 测量 Delphi 中的代码覆盖率
有没有办法用 DUnit 来衡量代码覆盖率？或者有没有免费的工具可以实现这一点？你用它做什么？您通常追求什么代码覆盖率？ Jim McKeeth:感谢您的详细回答。我谈论的是 TDD 方法意义上的单元
makefile - 测量(配置文件)在Makefile的每个目标中花费的时间
当我执行Makefile时，是否可以递归地回荡在make all的每个目标中花费的（系统，用户，实际）时间？我想以比time make all更细粒度的方式对项目的编译进行基准测试。理想情况下，它将
r - 测量 R 中函数的执行时间
R 中有衡量函数执行时间的标准化方法吗？显然我可以在执行之前和之后获取system.time，然后取它们的差异，但我想知道是否有一些标准化的方法或功能(不想发明轮)。我似乎记得我曾经使用过如下的东
fortran - 测量 Fortran 程序所花费的时间
我最近为了好玩而开始学习 Fortran，我想知道是否有任何简单的方法来显示执行我的代码所花费的时间。这只是一个数到一百万的简单循环，我想看看完成这个需要多长时间。如果有帮助，这是我正在使用的代码:
r - 测量 Shiny 内部的执行速度
我正在开发一个 Shiny 的应用程序。我对计算执行某些代码块(例如 ggplot 等)所需的时间很感兴趣。出于某种原因，使用通常的时钟方法似乎在响应式(Reactive)调用中不起作用，例如:
r - 测量 jpeg 中的空白
我想测量 jpeg 的白色/黄色量(在可调整的容差范围内)。我正在尝试开发一种质量控制工具来测量杏仁的缺陷。缺陷是棕色杏仁皮上的划痕(见下图)。由于这些缺陷是白色/黄色的，我想要一种简单地将图像加载

首页

博学

6Ren·AI

商城

r - 将行旋转为具有每个测量值 R 的计数值的列