r - 根据列中两行之间的距离选择因素-6ren

r - 根据列中两行之间的距离选择因素

转载作者：行者123 更新时间：2023-12-02 08:18:25

25

4

我正在尝试从下面的数据框中选择 num 列中值为 2 且至少相隔 2 行的 ID。换句话说，给定以下数据框:

df2 <- data.frame(id=c(1,1,1,1,1,2,2,2,2,3,3,3,3,3,3),
                 num=c(1,2,1,1,2,1,1,1,2,2,1,1,1,2,2))
df2$id <- as.factor(df2$id)

如何选择 id 变量，使 2 的值至少隔行？

我正在寻找的过程的结果将选择 id 1，因为 2 的值至少由一行分隔(本例中为 2 行)。谢谢。

此外，下面的解决方案似乎不适用于以下示例:

df <- data.frame(
  id=c(1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4),
  num=c(1,2,1, 1,2,2, 1,1,1,2,2,1, 1,1,1,2,2,1, 1,2,1,2,2,2)
)     
df$id<-as.factor(df$id)

同样，结果应该只有 id 1。我只想根据 ID 查找数字 2 被另一个 2 分隔一行或多行的任何实例。

最佳答案

data.table 我会使用 data.table 包:

library(data.table)
setDT(df)

df[num == 2, .N > 1L && any(diff(.I) > 2L), by=id]

   id    V1
1:  1  TRUE
2:  2 FALSE
3:  3 FALSE

工作原理:语法为 DT[i, j, by]

i 子集行
然后by将剩余的行分组
然后计算j

在j里面我们有.I，为了方便存储行号；和 .N，by 组中的行数。所以要提取具有 V1 == TRUE 的 id，我们可以执行 res[V1 == TRUE, id]。或者，整个操作可以像

df[num == 2, .N > 1L && any(diff(.I) > 2L), by=id][V1 == TRUE, id]

[1] 1
Levels: 1 2 3

base 或 dplyr base R 中的(几乎)类似物是

sapply(split(df$num == 2, df$id), function(x){
  w = which(x)
  length(w) > 1L && any(diff(w) > 2L) 
})

    1     2     3 
 TRUE FALSE FALSE

后者也适用于 dplyr

library(dplyr)

df %>% group_by(id) %>% summarise(x = {
  w = which(num == 2)
  length(w) > 1L && any(diff(w) > 2L) 
})

# A tibble: 3 x 2
      id     x
  <fctr> <lgl>
1      1  TRUE
2      2 FALSE
3      3 FALSE

关于r - 根据列中两行之间的距离选择因素，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39839816/

25

4

0

文章推荐： Twig 使用变量访问数组值

文章推荐： scala - 使用尾递归过滤列表

c++ - 为什么我得到一个无限循环(因素)？
The proper divisors of a positive integer, n, are all the positive integers that divide n evenly oth
pipe - 因素 sudo 跨管道
我有这个命令行 $ sudo find /etc/grub.d | sort | tail -n 1 | xargs sudo cat | wc 我想用一个 sudo 命令执行 $ sudo --so
Qt 大小策略和拉伸(stretch)因素
选项大小策略和拉伸(stretch)因子如何影响小部件的大小？下图显示了三个不同排列的窗口的预览。对于所有三个窗口 (W1-W3)，右侧的小部件是一个 QFrame 小部件，其水平和垂直大小策略设置
重新编码/重新调整具有不同级别的 data.frame 因素
每次当我必须重新编码一组变量时，我都会想到 SPSS 重新编码功能。我必须承认这很简单。有一个类似的recode函数在 car包，它可以解决问题，但让我们假设我想用 factor 完成任务. 我有 d
c++ - 什么是 Unresolved external 因素？
这个问题在这里已经有了答案: Template issue causes linker error (C++) [duplicate] (6 个答案) 关闭 9 年前。我的问题查了没用所以特地来问
c++ - SimplicialLLT 返回错误的 cholesky 因素
我想使用 Eigen 来计算稀疏矩阵的 cholesky 分解。但是，结果不正确，我找不到原因。我如何获得正确答案？ Eigen 中是否实现了特殊例程，利用稀疏矩阵的结构来提高性能(例如，对于下例中的
angularjs - 如何使 angularjs 应用程序在配置方面符合 12 因素
我正在尝试使 angularjs 应用程序在配置( http://12factor.net/config )方面符合 12 因素。它应该取决于环境，我不应该看到 development 字样, te
c++ - 使用 Soil Unresolved external 因素
我在我的项目中使用 Soil，我在我的包含目录中添加了 soil，在我的预编译头文件中我包含了“Soil.h”。对于我预编译头中的库，我添加了这个: #pragma comment(lib,"SOIL
java - 如何将本地时间转换为 UTC，同时牢记 DayLightSaving 因素
在我的 Web 应用程序中，我将所有最终用户的日期信息以 UTC 格式存储在数据库中，在向他们显示之前，只需将 UTC 日期转换为他们选择的时区。我正在使用此方法将本地时间转换为 UTC 时间(在存
java - 使用 JDBC 设置高 maxPoolSize 时需要注意哪些风险/因素
我的申请是 Piwik Server从放置在数百个网站上的跟踪代码接收传入的跟踪数据。当这些跟踪请求进入时，大部分工作负载是每秒向数据库写入数百次。我使用的是带有 JDBC 和 Hibernate 的
android - 居中 GWT DialogBox 不考虑我手机浏览器的 "zoom"因素
我有一个非常简单的 GWT 应用程序，它收集一些数据并在用户单击“提交”时提供确认对话框。我创建了一个 com.google.gwt.user.client.ui.DialogBox，填充它，然后调用
delphi - Delphi IBX TIBSQL.ExecQuery 是否有奇怪的事务要求(FStreamedActive 因素)？
我正在使用 Delphi(2009 年，没关系)和 IBX，并且我正在尝试执行简单的代码: TestSQL.ExecQuery; 在此代码之前，我已检查(也可以在调试器监视中看到)TestSQL.Tr
c - BLAS/cuBLAS 如何在他们的程序中处理 alpha 和 beta 因素？
许多线性代数例程都将常量(例如 alpha 和 beta)作为参数。例如cublas?GEMM执行以下操作: C := alpha*op( A )op( B ) + betaC 假设我将 beta 设

首页

博学

6Ren·AI

商城

r - 根据列中两行之间的距离选择因素