r - 如何根据聚集的人口找到指数-6ren

r - 如何根据聚集的人口找到指数

转载作者：行者123 更新时间：2023-12-04 12:17:53

26

4

数据集有一些聚集组的模式。这是数据集:

index <- c(1:30)
a <- c(0,1,0,0,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,0,0,1,0,1,1,1,0,1,0)
b <- c(1,1,1,0,0,1,1,1,0,0,1,1,1,1,0,0,1,1,1,0,0,0,0,0,1,0,1,1,1,1)
c <- c(1,1,1,0,0,0,0,0,0,0,0,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0)
d <- c(0,0,0,0,0,0,1,0,1,0,1,1,1,1,1,0,0,1,1,1,0,0,0,0,0,1,0,1,1,1)
df <- data.frame(cbind(index, a, b, c, d))

一般情况下，任务是当数据列(即a、b、c、d)中至少显示三个连续值(即1)时，识别索引(即“index”列)列及其相邻列显示至少三个连续值(即 1)。

例如，下例的结果将输出 2、3、4、7、8、9。请参见突出显示的连续值。

索引 1 2 3 4 5 6 7 8 9

col-a 0 0 0 0 0 1 1 0 1

col-b 1 0 1 0 1 1 1 1 1

col-c 0 1 1 1 0 0 1 1 1

col-d 1 1 1 1 0 0 0 0 0

结果应输出索引:1, 2, 3, 6, 7, 8, 12, 13, 14, 17, 18, 19, 27。

最佳答案

这不是最可扩展的解决方案，但它返回了所需的结果

# convert 1s that do not have at least runs of length 3 to 0
df[LETTERS[1:4]] <- lapply(df[-1], function(x) {
                                     tmp <- rle(x)
                                     tmp$values[tmp$lengths < 3] <- 0L
                                     inverse.rle(tmp)})

# add neighbor columns use logical subsetting to return the relevant indices
df$index[(pmax(df[[LETTERS[1]]] + df[[LETTERS[2]]],
               df[[LETTERS[2]]] + df[[LETTERS[3]]],
               df[[LETTERS[3]]] + df[[LETTERS[4]]]) > 1)]
[1]  1  2  3  6  7  8 12 13 14 17 18 19 27

这是一个可扩展到 n 列的版本。

# convert 1s that do not have at least runs of length 3 to 0, put into list
l <- lapply(df[-1], function(x) {
                                 tmp <- rle(x)
                                 tmp$values[tmp$lengths < 3] <- 0L
                                 inverse.rle(tmp)})

同上，只是存储在一个新的对象中，为了方便。现在，使用 Map 返回相邻列之和的列表。使用 do.call 和 pmax 返回元素级最大值。

df$index[do.call(pmax, Map(function(x, y) l[[x]] + l[[y]],
                           head(seq_along(l), -1), tail(seq_along(l), -1))) > 1]

关于r - 如何根据聚集的人口找到指数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47337909/

26

4

0

文章推荐： r - 仅添加到向量中的负条目

文章推荐： julia - 无法在VS Code中启动Julia语言服务器

文章推荐： r - 子集 ffdf 对象(子集 vs ffwhich)

c++ - 像ArrayFire中的Numpy一样分散/聚集
我想沿着一个轴从特定位置的X数组中分散并收集元素。因此，给定一个索引数组idx，我想选择第0列的idx(0) th元素，第1列的idx(1) th元素，等等。在Numpy中，以下语句: X = n
java - 聚集 HashMap
我有一个在集群硬件中运行的 Java 应用程序。我使用 Hashmap 作为缓存。我也希望缓存能够集群。有没有一些开源java项目可以在两台连接的机器上同步Hashmap？最佳答案看看 Hazel
r - 按行计算列数，避免熔化/聚集
这个问题在这里已经有了答案: Count number of times that an item occurred in each of multiple columns (4 个答案) 关闭 5
python - 在python中“聚集”一个列表
我一直在尝试“组合”一个列表 I mean putting items together depending on the item inbetween, so ['d','-','g','p','q
MySQL:聚集(逻辑索引)保存的地方
非聚集文件存储在数据文件中，聚集索引按逻辑索引顺序存储数据。逻辑顺序位于哪里？最佳答案大多数 MySQL 索引的结构为 BTree。 (参见维基百科) (我在此讨论中排除了 FULLTEXT 和
c - 我需要将分散-聚集 DMA 链表放入不可缓存的内存中吗？
所有源和目标都位于不可缓存的内存中。毫无疑问。在启动 DMA(即分散-聚集 DMA)之前，我构建了 DMA 链表(包含 src、dest、size 和 next)。我想我不必将列表放入不可缓存的内存中
java - 用于字符串处理的 Akka 分散-聚集
我需要将输入字符串拆分为输出字符串(按一定顺序)通过在输入字符串上应用一组正则表达式。我想实现这个功能与 akka Actor 集群一起使用，我将其分散正则表达式和输入字符串并收集字符串。不过我想知道
windows - 我们什么时候应该使用分散/聚集(矢量)IO？
Windows 文件系统支持scatter/gather IO .(当然，其他平台也可以) 但是不知道什么时候用IO机制。你能给我解释一个合适的案例吗？使用I/O机制我们能得到什么好处？(只是一点
wso2 - 分散-聚集(克隆+聚合)不起作用
我正在尝试使用克隆调用两个端点并收集它们的信息以通过聚合发送，我必须将其与分散收集中介器一起使用。每个端点返回一个 json 字符串。但我一直遇到“期望 SOAP Envelope 的实现作为父级”错
caching - DMA/Microblaze 直接访问用户空间页面物理地址后读取错误数据(内核分散/聚集)
我想要实现的目标是使用户空间中的内存块可以通过 PCIe 直接由 FPGA 板中的 DMA 内核访问(不受内核的任何干扰)。为此，我在用户空间中使用 posix_memalign() 在用户空间中分
r - tidyr 聚集 : simultaneously gather and rename key?
假设我有以下数据框: > a a Source: local data frame [3 x 2] my_type_1_num_widgets my_type_2_num_widgets 1
c - 如何在 AVX 或 SSE 指令中进行间接加载(聚集-分散)？
我已经搜索了一段时间，但似乎无法在文档或 SO 上找到任何有用的信息。 This question并没有真正帮助我，因为它引用了修改程序集，而我正在用 C 语言编写。我有一些代码进行间接访问，我想对
reactjs - 没有 Ice Candidates 聚集，peerConnection.iceGatheringState 立即返回 "complete"
我已经坚持了一段时间了。我的代码基于 https://webrtc.org/getting-started/firebase-rtc-codelab .我基本上只是将其更改为 React 和 fire
java - 分散-聚集 : combine set of Mono> into single Mono>
我可以合并 Mono> 的列表吗？数据源整合为单个Mono>包含所有项目而不阻塞？在我的带有 Lombok 分散收集应用程序的 JDK 9 Spring Boot 2 中，此阻塞版本有效:

首页

博学

6Ren·AI

商城

r - 如何根据聚集的人口找到指数