r - 整理 "Benchmark"列-6ren

r - 整理 "Benchmark"列

转载作者：行者123 更新时间：2023-12-02 02:46:17

我有一个大部分整洁的数据框，但有 2 列包含基准，而不是将基准合并为观察结果。我该如何整理，以便将“Facility_score”和“TTP”col_names 添加为每个独特的 FYQ 和 Metric 组合的“Facility_label”下的观察值？

输入数据:

library(zoo)

dd <- structure(list(Facility_label = structure(c(1L, 1L, 1L, 1L, 2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
3L, 3L, 3L, 4L, 4L, 4L, 4L, 4L, 4L), .Label = c("A", "B", "C", 
"D", "Nashville"), class = "factor"), FYQ = structure(c(2017.75, 
2018, 2018.25, 2018.5, 2017.75, 2018, 2018.25, 2018.5, 2018.75, 
2017.75, 2018, 2018.25, 2018.5, 2018.75, 2017.75, 2018, 2018.25, 
2018.5, 2018.75, 2017.75, 2018, 2018.25, 2018.5, 2018.75, 2017.75, 
2018, 2018.25, 2018.5, 2018.75, 2017.75), class = "yearqtr"), 
    Metric = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
    2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 
    1L, 1L, 1L, 1L, 1L, 2L), .Label = c("Safety Recall", "Turnaround days", 
    "Consult Active <= 30d", "Consult Pending <- 7d", "Consult Scheduling <- 90d", 
    "ICB Compliance Rate", "FCA Assessment", "Minor construction execution", 
    "NRM funding execution", "Deficincies", "%Deficienceis corrected among corrected or action plan", 
    "%Deficienceis corrected or action plan", "Ratio of Hospital Staff to HR FTE", 
    "Turnover Rate", "GEMS no Action", "Lost time claims", "RTMS risk score", 
    "DOC Control", "Loaner deficiencies", "Pretreatment", "RME rate", 
    "SPS staff vacany rate", "Stock Inactive", "MSPV-NG", "Days to close prosthetis consult", 
    "%Prosthetic PO using national contracts"), class = "factor"), 
    Facility_score = c(84.78802993, 95.59659091, 100, 100, 77.61732852, 
    57.87671233, 81.28898129, 33.33333333, 31.57894737, 10.2, 
    7.902356902, 8.62, 11.71, 13.15, 30.98236776, 33.26086957, 
    31.19584055, 54.54545455, 27.27272727, 11, 17.19132653, 26.02008197, 
    22.29, 30.41, 89.09090909, 93.47826087, 82.10735586, 91.66666667, 
    87.5, 3.2), `Facility mean` = c(85.35550152, 87.31899147, 
    93.11498231, 100, 85.35550152, 87.31899147, 93.11498231, 
    100, 100, 12, 13.06073298, 12.2, 11.51, 10.56, 85.35550152, 
    87.31899147, 93.11498231, 100, 100, 12, 13.06073298, 12.2, 
    11.51, 10.56, 85.35550152, 87.31899147, 93.11498231, 100, 
    100, 12), TTP_score = c(100, 100, 100, 100, 100, 100, 100, 
    100, 100, 5.65, 5.063953488, 4.779310345, 4.47, 4.545, 100, 
    100, 100, 100, 100, 5.65, 5.063953488, 4.779310345, 4.47, 
    4.545, 100, 100, 100, 100, 100, 5.65)), row.names = c(NA, 
-30L), class = c("tbl_df", "tbl", "data.frame"))

期望的输出:

dd_output <- structure(list(Facility_label = c("A", "Facility mean", "TTP score", 
"A", "Facility mean", "TTP score", "A", "Facility mean", "TTP score", 
"A", "Facility mean", "TTP score", "B", "B", "B", "B", "B", "B", 
"Facility mean", "TTP score", "B", "Facility mean", "TTP score", 
"B", "Facility mean", "TTP score", "B", "Facility mean", "TTP score", 
"B", "Facility mean", "TTP score", "C", "C", "C", "C", "C", "C", 
"C", "C", "C", "C", "D", "D", "D", "D", "D", "D"), FYQ = c("2017 Q4", 
"2017 Q4", "2017 Q4", "2018 Q1", "2018 Q1", "2018 Q1", "2018 Q2", 
"2018 Q2", "2018 Q2", "2018 Q3", "2018 Q3", "2018 Q3", "2017 Q4", 
"2018 Q1", "2018 Q2", "2018 Q3", "2018 Q4", "2017 Q4", "2017 Q4", 
"2017 Q4", "2018 Q1", "2018 Q1", "2018 Q1", "2018 Q2", "2018 Q2", 
"2018 Q2", "2018 Q3", "2018 Q3", "2018 Q3", "2018 Q4", "2018 Q4", 
"2018 Q4", "2017 Q4", "2018 Q1", "2018 Q2", "2018 Q3", "2018 Q4", 
"2017 Q4", "2018 Q1", "2018 Q2", "2018 Q3", "2018 Q4", "2017 Q4", 
"2018 Q1", "2018 Q2", "2018 Q3", "2018 Q4", "2017 Q4"), Metric = c("Safety Recall", 
"Safety Recall", "safety Recall", "Safety Recall", "Safety Recall", 
"Safety Recall", "Safety Recall", "Safety Recall", "Safety Recall", 
"Safety Recall", "Safety Recall", "Safety Recall", "Safety Recall", 
"Safety Recall", "Safety Recall", "Safety Recall", "Safety Recall", 
"Turnaround days", "Turnaround days", "Turnaround days", "Turnaround days", 
"Turnaround days", "Turnaround days", "Turnaround days", "Turnaround days", 
"Turnaround days", "Turnaround days", "Turnaround days", "Turnaround days", 
"Turnaround days", "Turnaround days", "Turnaround days", "Safety Recall", 
"Safety Recall", "Safety Recall", "Safety Recall", "Safety Recall", 
"Turnaround days", "Turnaround days", "Turnaround days", "Turnaround days", 
"Turnaround days", "Safety Recall", "Safety Recall", "Safety Recall", 
"Safety Recall", "Safety Recall", "Turnaround days"), Facility_score = c(84.78802993, 
85.35550152, 100, 95.59659091, 87.31899147, 100, 100, 93.11498231, 
100, 100, 100, 100, 77.61732852, 57.87671233, 81.28898129, 33.33333333, 
31.57894737, 10.2, 12, 5.65, 7.902356902, 13.06073298, 5.063953488, 
8.62, 12.2, 4.779310345, 11.71, 11.51, 4.47, 13.15, 10.56, 4.545, 
30.98236776, 33.26086957, 31.19584055, 54.54545455, 27.27272727, 
11, 17.19132653, 26.02008197, 22.29, 30.41, 89.09090909, 93.47826087, 
82.10735586, 91.66666667, 87.5, 3.2)), class = c("spec_tbl_df", 
"tbl_df", "tbl", "data.frame"), row.names = c(NA, -48L), spec = structure(list(
    cols = list(X1 = structure(list(), class = c("collector_skip", 
    "collector")), Facility_label = structure(list(), class = c("collector_character", 
    "collector")), FYQ = structure(list(), class = c("collector_character", 
    "collector")), Metric = structure(list(), class = c("collector_character", 
    "collector")), Facility_score = structure(list(), class = c("collector_double", 
    "collector"))), default = structure(list(), class = c("collector_guess", 
    "collector")), skip = 1), class = "col_spec"))

最佳答案

我们可以通过 tidyr::gather 和一些 dplyr::mutate 操作来做到这一点:

library(tidyverse)

dd %>%
  mutate(ID = row_number()) %>%
  gather(var, Facility_score, Facility_score:TTP_score) %>%
  group_by(FYQ, Metric,
           temp_ID = case_when(var == "Facility mean" ~ 1, 
                               var == "TTP_score" ~ 2, 
                               TRUE ~ 0)) %>%
  slice(if(any(temp_ID == 0)) row_number() else 1) %>%
  mutate(Facility_label = if_else(var == "Facility_score", as.character(Facility_label), var)) %>%
  ungroup() %>%
  arrange(ID, temp_ID) %>% 
  select(ID, everything(), -var, -temp_ID)

请注意，我添加了 ID 列以指示原始行号。当同一行中的所有分数合并时，这会减少困惑。

注意事项:

gather 将表格从宽格式 reshape 为长格式，处理 Facility_score、Facility mean 和 TTP_score< 的条目 作为新的 Facility_score。创建一个变量 var 来临时存储值标签。
然后我们创建了 group_by FYQ、Metric 和一个临时 ID 变量 (temp_ID)通过将 Facility mean 设置为 1，将 TTP_score 设置为 2，以及 var 中的所有其他内容> 到 0。
根据 temp_ID，如果它是 0，我们使用 slice 来抓取所有行，否则只抓取第一行。这有效地返回了对应于 Facility_score 的所有行，但在每个 FYQ 中只有 Facility mean 和 TTP_score 之一 + Metric 组合。
接下来，我们将 Facility_label 替换为 var 中的相应标签。
最后，取消分组，按ID和temp_ID排列，并重新排列列顺序，同时删除 var 和 temp_ID(everything 当我们想把一个变量放在前面同时保持其他变量不变时很有用)。

输出:

# A tibble: 50 x 5
      ID Facility_label FYQ           Metric          Facility_score
   <int> <chr>          <S3: yearqtr> <fct>                    <dbl>
 1     1 A              2017 Q4       Safety Recall             84.8
 2     1 Facility mean  2017 Q4       Safety Recall             85.4
 3     1 TTP_score      2017 Q4       Safety Recall            100  
 4     2 A              2018 Q1       Safety Recall             95.6
 5     2 Facility mean  2018 Q1       Safety Recall             87.3
 6     2 TTP_score      2018 Q1       Safety Recall            100  
 7     3 A              2018 Q2       Safety Recall            100  
 8     3 Facility mean  2018 Q2       Safety Recall             93.1
 9     3 TTP_score      2018 Q2       Safety Recall            100  
10     4 A              2018 Q3       Safety Recall            100  
11     4 Facility mean  2018 Q3       Safety Recall            100  
12     4 TTP_score      2018 Q3       Safety Recall            100  
13     5 B              2017 Q4       Safety Recall             77.6
14     6 B              2018 Q1       Safety Recall             57.9
15     7 B              2018 Q2       Safety Recall             81.3
16     8 B              2018 Q3       Safety Recall             33.3
17     9 B              2018 Q4       Safety Recall             31.6
18     9 Facility mean  2018 Q4       Safety Recall            100  
19     9 TTP_score      2018 Q4       Safety Recall            100  
20    10 B              2017 Q4       Turnaround days           10.2
# ... with 30 more rows

关于r - 整理 "Benchmark"列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54753014/

文章推荐： sql - 从具有动态 WHERE 条件的多个 cte 中选择

文章推荐： haskell - 如何让 foldl 消耗恒定内存？

文章推荐：正则表达式 URL 提取斜杠

MySQL - 整理
当我创建一个数据库时，我被要求选择默认排序规则，当我创建一个表时，我被要求选择排序规则。 utf8_general_ci 或...拉丁...？区分哪个是对的依据是什么？最佳答案 A collatio
PHP那些琐碎的知识点(整理)
PHP不会检查单引号 '' 字符串中变量内插或（几乎）任何转义序列，所以采用单引号这种方式来定义字符串相当简单快捷。但是，双引号 "" 则不然，php会检查字符串中的变量或者转义
正则表达式（regular）知识(整理)
正则（regular），要使用正则表达式需要导入Python中的re（regular正则的缩写）模块。正则表达式是对字符串的处理，我们知道，字符串中有时候包含很多我们想要提取的信息，掌握这些处理字符
IOS正则表达式判断输入类型(整理)
在开发过程中，有时需要对用户输入的类型做判断，最常见是在注册页面即用户名和密码，代码整理如下：只能为中文 ?
JAVA中正则表达式小总结(整理)
]js正则表达式基本语法(精粹)： http://www.zzvips.com/article/94068.html 许多语言，包括P
windows下mongodb安装与使用图文教程(整理)
1、首先安装mongodb 1.下载地址：http://www.mongodb.org/downloads 2.解压缩到自己想要安装的目录，比如d:\mongodb 3.创建文件夹d:\mo
R - 合并多个大型数据帧(整理)
我更愿意在 R 中执行以下操作，但我愿意接受(易于学习的)其他解决方案。我有多个(比如说 99 个)制表符分隔文件(我们称它们为 S1.txt 到 S99.txt)和表格，所有文件都具有完全相同的格
c# - 整理 if 语句
我制作了一个小程序，可以使用数学进行物理计算。我有几个 if 语句，它们做同样的事情，但变量不同，但它们必须是它们，就好像 TextBox 是空的，int 将是 0。例子如下: if (first
javascript - 扩展框 - 整理
我正在构建需要扩展框的东西 - 这很好，我可以正常工作。然而，如果你看看这个FIDDLE你会看到它有点乱。我希望有一种方法可以扩展它们所在的盒子，这样它们就不会跳来跳去？那么盒子 3 的左侧会比右侧膨
matlab - 整理 list
我相当确定(在 MATLAB 中)应该有一个优雅的解决方案，但我现在想不起来。我有一个包含 [classIndex, start, end] 的列表，我想将连续的类索引折叠成一个组，如下所示: 这个
java - 整理 XMPP
维基百科将 XMPP 定义为: ...an open-standard communications protocol for message-oriented middleware based on
Git - 整理 repo
我的代码库已经进入了某种状态，希望能够摆脱它 repo 看起来有点像这样(A1、B1、C1 等显然是提交) A1 ---- A2 ---- A3 ---- A4 -
r - 整理 R 数据框中的数字数组
如何整理以下数据框 data.frame(a = c(1,2), values = c("[1.1, 1.2, 1.3]", "[2.1, 2.2]")) a values 1
haskell - 整理 Haskell 中的列表理解
所以我试图在 Haskell 中生成出租车号码列表。出租车号码是可以用两种不同方式写成两个不同立方体之和的数字 - 最小的是 1729 = 1^3 + 12^3 = 9^3 + 10^3 . 现在，我
r - 如何记录数据集而不将其添加到“整理”字段？
我正在使用 roxygen2 来记录我正在开发的包的数据集。我知道你可以 use roxygen to document a dataset ，但是Shane's answer最终建议进行黑客攻击，虽
php - 整理 PHP 回显代码
这个问题在这里已经有了答案: How can I combine two strings together in PHP? (19 个回答) 关闭 5 年前。提前致歉，尽管我已经尝试并失败了几件不
r - 整理 "Benchmark"列
我有一个大部分整洁的数据框，但有 2 列包含基准，而不是将基准合并为观察结果。我该如何整理，以便将“Facility_score”和“TTP”col_names 添加为每个独特的 FYQ 和 Metr
python - 整理 Pandas 的实验结果
我有以下输入数据。每一行都是一个实验的结果: instance algo profit time x A 10 0.5 y A
php - 用于搜索的最佳 MySQL 整理
我已经使用 PHP 和 MySQL 实现了搜索。目前我的表格整理是 "utf8_unicode_ci"。问题是，使用此排序规则 "ä"= "a" 是。如果我将排序规则更改为 "utf_bin" 一切正
javascript - 隐藏和显示复选框选项 - 整理 Jquery
所以我是 JS 和 Jquery 库的新手。我一直在玩弄一些东西，可以看到它非常不整洁，这就是我希望你们能帮助建议一种更好的方法来实现我想要实现的目标的地方。目标: 要有多个复选框，其中一些如果被选

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 整理 "Benchmark"列