r - 传播与 dcast-6ren

r - 传播与 dcast

转载作者：行者123 更新时间：2023-12-04 13:48:24

24

4

我有一张这样的 table ，

> head(dt2)
  Weight Height   Fitted interval limit    value
1   65.6  174.0 71.91200     pred   lwr 53.73165
2   80.7  193.5 91.63237     pred   lwr 73.33198
3   72.6  186.5 84.55326     pred   lwr 66.31751
4   78.8  187.2 85.26117     pred   lwr 67.02004
5   74.8  181.5 79.49675     pred   lwr 61.29244
6   86.4  184.0 82.02501     pred   lwr 63.80652

我希望它有这样的，

> head(reshape2::dcast(dt2, 
         Weight + Height + Fitted + interval ~ limit, 
         fun.aggregate = mean))
  Weight Height   Fitted interval      lwr      upr
1   42.0  153.4 51.07920     conf 49.15463 53.00376
2   42.0  153.4 51.07920     pred 32.82122 69.33717
3   43.2  160.0 57.75378     conf 56.35240 59.15516
4   43.2  160.0 57.75378     pred 39.54352 75.96404
5   44.8  149.5 47.13512     conf 44.87642 49.39382
6   44.8  149.5 47.13512     pred 28.83891 65.43133

但是使用 tidyr::spread ，我怎样才能做到这一点？

我正在使用，

> tidyr::spread(dt2, limit, value)

但得到错误，

Error: Duplicate identifiers for rows (1052, 1056), (238, 242), (1209, 1218), (395, 404), (839, 1170), (25, 356), (1173, 1203, 1215), (359, 389, 401), (1001, 1200), (187, 386), (906, 907), (92, 93), (930, 1144), (116, 330), (958, 1171), (144, 357), (902, 1018), (88, 204), (960, 1008), (146, 194), (1459, 1463), (645, 649), (1616, 1625), (802, 811), (1246, 1577), (432, 763), (1580, 1610, 1622), (766, 796, 808), (1408, 1607), (594, 793), (1313, 1314), (499, 500), (1337, 1551), (523, 737), (1365, 1578), (551, 764), (1309, 1425), (495, 611), (1367, 1415), (553, 601)

随机 10 行::

> dt[sample(nrow(dt), 10), ]
     Weight Height   Fitted interval limit    value
1253   52.2  162.5 60.28203     conf   upr 61.51087
426    49.1  158.8 56.54022     pred   upr 74.75756
1117   78.4  184.5 82.53066     conf   lwr 80.98778
1171   85.9  166.4 64.22611     conf   lwr 63.21254
948    61.4  177.8 75.75494     conf   lwr 74.66393
384    90.9  172.7 70.59731     pred   lwr 52.41828
289    75.9  172.7 70.59731     pred   lwr 52.41828
3      44.8  149.5 47.13512     pred   lwr 28.83891
774    87.3  182.9 80.91258     pred   upr 99.12445
772    86.4  175.3 73.22669     pred   upr 91.40919

最佳答案

假设您从如下所示的数据开始:

mydf
#   Weight Height  Fitted interval limit    value
# 1     42  153.4 51.0792     conf   lwr 49.15463
# 2     42  153.4 51.0792     pred   lwr 32.82122
# 3     42  153.4 51.0792     conf   upr 53.00376
# 4     42  153.4 51.0792     pred   upr 69.33717
# 5     42  153.4 51.0792     conf   lwr 60.00000
# 6     42  153.4 51.0792     pred   lwr 90.00000

请注意分组列(1 到 5)的第 5 行和第 6 行中的重复项。这基本上就是“tidyr”告诉你的。第一行和第五行是重复的，第二行和第六行也是如此。

tidyr::spread(mydf, limit, value)
# Error: Duplicate identifiers for rows (1, 5), (2, 6)

正如@Jaap 所建议的，解决方案是首先“总结”数据。由于“tidyr”仅用于整形数据(与聚合和整形的“reshape2”不同)，您需要在更改数据形式之前使用“dplyr”执行聚合。在这里，我用 summarise 做到了。对于“值”列。

如果您在 summarise 处停止执行一步，你会发现我们原来的 6 行数据集已经“缩小”到 4 行。现在， spread会按预期工作。

mydf %>% 
  group_by(Weight, Height, Fitted, interval, limit) %>% 
  summarise(value = mean(value)) %>% 
  spread(limit, value)
# Source: local data frame [2 x 6]
# 
#   Weight Height  Fitted interval      lwr      upr
#    (dbl)  (dbl)   (dbl)    (chr)    (dbl)    (dbl)
# 1     42  153.4 51.0792     conf 54.57731 53.00376
# 2     42  153.4 51.0792     pred 61.41061 69.33717

这与 dcast 的预期输出相匹配与 fun.aggregate = mean .

reshape2::dcast(mydf, Weight + Height + Fitted + interval ~ limit, fun.aggregate = mean)
#   Weight Height  Fitted interval      lwr      upr
# 1     42  153.4 51.0792     conf 54.57731 53.00376
# 2     42  153.4 51.0792     pred 61.41061 69.33717

样本数据:

 mydf <- structure(list(Weight = c(42, 42, 42, 42, 42, 42), Height = c(153.4, 
     153.4, 153.4, 153.4, 153.4, 153.4), Fitted = c(51.0792, 51.0792,         
     51.0792, 51.0792, 51.0792, 51.0792), interval = c("conf", "pred",        
     "conf", "pred", "conf", "pred"), limit = structure(c(1L, 1L,             
     2L, 2L, 1L, 1L), .Label = c("lwr", "upr"), class = "factor"),            
         value = c(49.15463, 32.82122, 53.00376, 69.33717, 60,          
         90)), .Names = c("Weight", "Height", "Fitted", "interval",     
     "limit", "value"), row.names = c(NA, 6L), class = "data.frame")

关于r - 传播与 dcast，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35225052/

24

4

0

文章推荐： elixir - 在 Elixir 中缓存昂贵的计算

文章推荐： apache - 单个服务器进程可以从多个端口监听吗？

文章推荐： f# - 同时使用构建器类的相同实例是否会引起任何副作用？

java - @Transactional(传播=传播。需要)
如果有人能解释这个注释的作用以及我们何时使用它: @Transactional(propagation=Propagation.REQUIRED) 谢谢最佳答案如果您需要在 Spring Docs
Javascript - 阻止模态键盘事件冒泡/传播
我有一个页面，它有一个 keydown 事件监听器，用于监听 Escape 键，以便返回。我还有一个简单的模态类，它也监听 Escape 键以关闭它。主页监听器检查模式是否打开，如果打开，则不执行任何
Modelica 传播/默认变量名
我想在模型中设置默认变量名称 T (=xx) - 将该模型拖到新模型中并在其中定义变量 xx。我收到错误消息:使用未声明的变量 xx。这是子模型 model test parameter Rea
jqueryMobile 水龙头和冒泡/传播
在 android 2.x 浏览器中查看此示例..它是在我的应用程序中复制场景的示例.. http://johnchacko.net/samples/tap.html 它是关于监听“tap”并从监听器
C# 捕获特定异常类型的重新抛出/传播
如您所见，我正在尝试将 GatewayConnectionFailedException 传播到我的 UI。我希望此代码捕获除异常之外的所有内容，我希望表示层捕获该异常以通知用户数据库是问题所在，以便
CMake 静态库依赖项不随 ExternalProject_Add 传播
我目前正在尝试让可执行文件与它需要的所有依赖项正确链接。这是依赖项的示例结构: exe -> libA -> libB exe和 libA有自己的存储库。 exe拉入libA像这样的东西: add_
scala - Scala中的“传播”参数？
有什么方法可以调用带有单个参数的 Scala 函数，给定一个数组 (类似于 JavaScript Spreads在 ECMAScript 6) 中？ ys = [10.0, 2.72, -3.14]
Cmake:包含目录的 target_link_libraries 传播
我有一个小型静态库，它需要 boost 头文件，并且需要包含目录中的“include”目录。 ... add_library(alib STATIC ...) target_include_direc
javascript - 传播 Promise 并在新对象中扩展
我有一些 promise 可以返回对象。现在我想将它们合并/扩展为一个新对象，因此我使用 Lodash's extend . var whenEverythingIsDone = Promise.a
scala - 传播 Scala 类型参数
这是我认为人们通常希望在 Scala 中做的事情，但如果我能在任何地方找到一个例子，我就该死了。这段代码由于类型删除而无法编译，但它演示了我正在努力完成的事情: def parse[T](json:
scala - 传播 Scala 类型参数
这是我认为人们通常希望在 Scala 中做的事情，但如果我能在任何地方找到一个例子，我就该死了。这段代码由于类型删除而无法编译，但它演示了我正在努力完成的事情: def parse[T](json:
Sharepoint default.master 传播？
我们有大量 MOSS 2007 站点需要添加大量的 javascript。我编辑、 checkin 、发布并批准了对 default.master 的更改，更改反射(reflect)在根网站上，但没有
jQuery:函数被调用两次。传播？为什么会出现这种情况？
请看一下下面的 fiddle :http://jsfiddle.net/K9NjY/ 我在这段代码上花了 3-4 个小时，并将其缩小到最短的版本，但现在我陷入了困境。问题:1. 点击“divOne”
java - Spring 集成中的错误处理/传播
我读到如果在流程中抛出异常，框架要做的第一件事就是检查消息头中的错误 channel 属性。总是这样吗？在我的特殊情况下，我将自定义错误 channel 分配给消息 header ，但该消息似乎已向
c++ - 不能通过carry让值(value)传播
创建一个小的 C++ 大型精度类，一切似乎都运行良好，但是添加，如果我将 0xffffffff 和 0x04 加在一起，我会得到 0xffff0003，而我应该得到 0x0100000003。这是有问
javascript - react : problems with . ..传播
我正在尝试重新创建 Dan Abramov 类(class)中的 Redux 示例。传播{...store.getState()}在应用程序级别不起作用，Redux 正在更改状态并且 React 不会
mysql - 传播.REQUIRES_NEW 锁定
考虑一个需要很长时间的事务。在此期间，我想对 TableSmall 执行一些小更新。，它应该立即执行，并且主事务的回滚不应该回滚那些小的更新。我当前的问题是这些小更新将锁定 TableSmall\
c - 如何处理子函数中的 const 传播
我需要对现有函数进行修改，具有一些 const 输入参数: int f(const owntype *r1, const owntype *r2) 为了做到这一点，我想调用一个使用相同类型但没有 co
c# - 传播 DependencyProperty 默认值
我有一个带有 ViewModel 的 WPF UserControl: 这个 UserControl 有一个 De
android - 停止 SMS 传播
我试图在收到这样的短信时不传播 public class SMSReceiver extends BroadcastReceiver { @Override public void onRec

首页

博学

6Ren·AI

商城

r - 传播与 dcast