r - 从组创建索引以从原始 data.frame 中选择值以用于结果-6ren

r - 从组创建索引以从原始 data.frame 中选择值以用于结果

转载作者：行者123 更新时间：2023-12-04 11:32:02

25

4

我有一个数据框 df .我想使用 summarize 的输出创建一个新变量作为从原始 data.frame 中的列中检索值的索引。
df.l有以下列 trial , location , posi , date , 和 value .

我想使用每个组( value 、 trial 、 location )的“date ==1”的总和作为从 posi 中选择值的索引并将其存储为新变量。
value在 df.l可以是 1 或 0(一旦它变为零，它就保持不变，只要它的顺序正确，即 posi 0 - 1)。此分组总和指示值在组内从 1 变为 0 的位置。

要确定索引位置，请使用以下代码:

test <- df.l %>% 
  group_by(trial, location, date) %>%
  summarise(n= sum(value==1))

但当然， posi不见了。

我希望像下面的代码这样的东西可以工作，但它没有。它以正确的结果开始，但在某处索引出错了。我不知道像我一样调用专栏是否有意义。

test <- df.l %>% 
  group_by(trial, location, date) %>%
  summarise(n= sum(value==1)) %>%
  mutate(ANS = nth(df.l$posi,n))

使用 dplyr我可以从组中创建一个“索引”以从原始 data.frame 中选择一个值，然后将此变量添加到新的 data.frame 中吗？或者，是否有另一种方法使用 dplyr 来达到相同的结果？

# truncated data.frame
df.l <- structure(list(trial = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), 
    location = c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 
    3L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L), posi = c(0, 
    0.28, 0.65, 1, 0, 0.33, 0.67, 1, 0, 0.2, 0.5, 1, 0, 0.28, 
    0.65, 1, 0, 0.33, 0.67, 1, 0, 0.2, 0.5, 1), date = c(1L, 
    1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
    1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L), value = c(1L, 1L, 1L, 0L, 
    1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 0L, 0L, 0L, 1L, 1L, 1L, 
    1L, 1L, 1L, 0L, 0L)), .Names = c("trial", "location", "posi", "date", "value"), row.names = c(NA, 24L), class = "data.frame")

    #desired result
    result <- structure(list(trial = c(1L, 1L, 1L, 2L, 2L, 2L), location = c(1L, 
2L, 3L, 1L, 2L, 3L), date = c(1L, 1L, 1L, 1L, 1L, 1L), n = c(3L, 
4L, 4L, 1L, 4L, 2L), posi = c(0.65, 1, 1, 0, 1, 0.2)), class = "data.frame", .Names = c("trial", 
"location", "date", "n", "posi"), row.names = c(NA, -6L))

最佳答案

您可以在 summarise 内完成:

df.l %>% 
    group_by(trial, location, date) %>%
    summarise(n= sum(value==1), ANS = nth(posi,n))
#Source: local data frame [6 x 5]
#Groups: trial, location
#
#  trial location date n  ANS
#1     1        1    1 3 0.65
#2     1        2    1 4 1.00
#3     1        3    1 4 1.00
#4     2        1    1 1 0.00
#5     2        2    1 4 1.00
#6     2        3    1 2 0.20

或者，如果您实际上并不需要 n结果，你可以做

df.l %>% 
    group_by(trial, location, date) %>%
    summarise(ANS = nth(posi, sum(value == 1)))

或者

df.l %>% 
    group_by(trial, location, date) %>%
    summarise(ANS = posi[sum(value == 1)])

关于r - 从组创建索引以从原始 data.frame 中选择值以用于结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31732869/

25

4

0

文章推荐： .net - 如何将 Enum 与其他选项一起使用(全部、无)

文章推荐： r - 获取矩阵条目的等级？

文章推荐：使用 GDB 进行调试时可能会导致问题的 GCC 选项

文章推荐： tsql - T-SQL : DROP Table cascade constraints equivalent?

iphone - XCode- "Previous frame inner to this frame (gdb could not unwind past this frame)"
最近，我在 XCode 上的调试器停止正常工作，并给出了以下错误: 此帧内的前一帧(gdb 无法展开超过此帧) 我已经浏览过 SO 的另一个线程，谈论丢失的符号。我通过删除符号目录并让它从 iPod
iphone - 调试器错误 : Previous frame inner to this frame (gdb could not unwind past this frame)
当我在设备上遇到断点时，出现以下调试器错误: 来自调试器的错误:此帧内的上一帧(gdb 无法展开超过此帧) 当应用程序遇到断点时，就会发生这种情况。如果我点击调试器中的继续按钮，它会愉快地继续，直到下
frame - 如何从 Frame 的历史记录中删除页面？
如何在 WinRT XAML 应用程序中操作框架的历史记录？用户将从我的中心页面开始，他们可以在其中选择一个现有项目以转到其编辑屏幕，或者他们可以选择“新项目”。 “新项目”将引导他们完成一个简短的
python - 比较后用其他 Frame 覆盖 Frame
2 帧，我希望第 2 帧“覆盖”/更新第 1 帧。基本上，其中 Table1-colB-value = Table2-oldB-value，用 Table2-newB-value 覆盖 Table1-
安卓 : Frame by Frame animation not working?
我正在尝试逐帧动画，但它给了我一个强制关闭，我不确定为什么它给我一个强制关闭。在我看来一切都很好。这是我的代码，我希望有人能帮忙吗？提前致谢。动画测试.java import android.ap
Java Swing Frame 导航到另一个 Frame
这是我的主课。 package pomsystem; public class POMSystem { public static void main(String[] args) {
class - 为什么 ifelse 将 data.frame 转换为列表 : ifelse(TRUE, data.frame(1), 0)) != data.frame(1)？
如果为TRUE，我想从函数返回一个data.frame，否则使用return(ifelse(condition, mydf, NA)) 返回NA 但是， ifelse 会从 data.frame 中删
python Pandas : compare two data-frames along one column and return content of rows of both data frames in another data frame
我正在处理两个 csv 文件并导入为数据框 df1 和 df2 df1 有 50000 行，df2 有 150000 行。我想比较(遍历每一行)df2 的“时间”df1，求时间差，返回所有列的值对应
r - 将 data.frames(n x 2 data.frames)列表 reshape 为单个 data.frame(n x 3 列)
我将许多文件夹中的小文本文件读取到一个列表中。因此，我有一个长度为 n 的列表，其中包含 2 个 data.frames。这是列表元素 3 的示例(在问题末尾输入) ip_list[[3]] $`d
R:如何高效地判断data.frame A是否包含在data.frame B中？
为了找出数据框 df.a 是否是数据框 df.b 的子集，我做了以下操作: df.a semi_join(df.b, df.a) Joining by: c("x", "y") x y 1 1
从一维 data.frame 中删除行并将其保留为 data.frame
在某些情况下，出于实现原因，我有一个只包含一个列的 data.frame df=as.data.frame(alpha=1:15) 如果我现在使用 df[-1, ] 它返回一个向量，但我想将它保留为一
c# - Frame.Navigate() 与 this.Frame.Navigate()
Windows 8.1 商店应用中的 Frame.Navigate() 和 this.Frame.Navigate() 有什么区别？这有什么区别 Frame.Navigate(typeof(Logi
根据另一个 data.frame 替换 data.frame 中的一些列值
我有两个 data.frames (df1, df2)，我想用 df1$V2 的值替换 P1-P10 列中的字母值，但保留前两列df2. df1 = data.frame(V1=LETTERS, V2
r - 使用与现有 data.frame 相同的列和行名称初始化空白 data.frame
有没有更好的方法来制作与现有 data.frame 具有相同维度、列名和行名的空白 data.frame？ BAM<-read.table(~/myfile) # 10 rows and 10 co
r - data.frames 列表中特定 data.frame 列的高效函数
我有一个列表 data.frame s。例如 set.seed(1) my_list result.df id var_p var_m var_d var_a
r - 通过匹配变量将值从一个 data.frame 添加到另一个 data.frame
假设我有两个数据框 df1 和 df2 如下 Df1 Id Price Profit Month 10 5 2 1 10 5 3 2 10 5 2
iframe - X-Frame-Options : does not permit framing 拒绝加载
我将创建一个网站，除了它自己的内容之外，它还将链接(在 iframe 中)到世界最大的报纸网站，如纽约时报、金融时报和其他一些网站。但是我遇到了框架许可的问题。例如，纽约时报向我展示了一个错误 Lo
r - 如何从 data.frame 中提取单个列作为 data.frame？
假设我有一个 data.frame: df x x A 1 10 2 20 3 30 从文档中(参见 ?"[" )您可以找到: If drop=TRUE the result is coer
r - 如何创建与现有 data.frame 具有相同列名称和类型的新 data.frame？
我有一个想要克隆的现有 data.frame，但没有其中的值。 IE。我希望新框架具有与现有框架相同的列名称和类型。原始帧的大小可能为 GB 量级，因此复制和删除数据似乎不是正确的方法，并且迭代现有列
r - 使用一个 data.frame 更新另一个 data.frame
给定两个在列名称/数据类型方面相同的数据帧，其中某些列唯一标识行，是否有一种有效的函数/方法可以让一个数据帧“更新”另一个数据帧？例如，在下面的例子中，原始和替换由'Name'和'Id'标识>。 g

首页

博学

6Ren·AI

商城

r - 从组创建索引以从原始 data.frame 中选择值以用于结果