r - 按行号将数据框拆分为数据框列表-6ren

r - 按行号将数据框拆分为数据框列表

转载作者：行者123 更新时间：2023-12-04 08:41:36

25

4

我有一个具有可变数量或行的数据框，并希望将其按附近的行组拆分为数据框列表(或只是多个 dfs)。应该分组在一起的附近行可以通过变量列来理解，其中每个组由数字上彼此相邻的样本组成。例如:第 1-9 行是一组，第 10-12 行是第 2 组，等等。变量列中内容的确切身份将与黑白数据集不一致。
这是df:

> conseq_high
   variable 6 7 8 9 10 11 12 13 14 position rnum
1    pep_14 L L L L  Q  L  S  C  S        3    1
2    pep_15 L L L Q  L  S  C  S  Y        4    2
3    pep_16 L L Q L  S  C  S  Y  A        5    3
4    pep_17 L Q L S  C  S  Y  A  G        6    4
5    pep_18 Q L S C  S  Y  A  G  Q        7    5
6    pep_19 L S C S  Y  A  G  Q  F        8    6
7    pep_20 S C S Y  A  G  Q  F  R        9    7
8    pep_21 C S Y A  G  Q  F  R  V       10    8
9    pep_22 S Y A G  Q  F  R  V  I       11    9
10  pep_136 E L K V  E  D  P  F  Y       19   10
11  pep_137 L K V E  D  P  F  Y  W       20   11
12  pep_138 K V E D  P  F  Y  W  V       21   12
13  pep_164 V S V G  L  V  F  L  F       26   13
14  pep_165 S V G L  V  F  L  F  L       27   14
15  pep_166 V G L V  F  L  F  L  Q       28   15
16  pep_175 H R L R  G  K  L  R  A       30   16
17  pep_176 R L R G  K  L  R  A  E       31   17
18  pep_223 Y N W L  H  R  R  L  A       36   18
19  pep_224 N W L H  R  R  L  A  G       37   19

我尝试获取必须按以下方式分组的每组行中最后一行的位置:

#subset out individual groups of peptides
as_vector(conseq_high$position) -> seq2
xy1 <- c(diff(seq2),0)  
which(xy1 !=1) -> grp_ids #these are the ending positions of each group of peptides

>  grp_ids
[1]  9 12 15 17 19

从这里开始，我遇到了实际分割出我想要的行组的问题。我尝试使用拆分和拼接但没有成功。有什么建议？
提前致谢!

最佳答案

我们可以用 cumsum 创建一个分组索引基于 diff 创建的逻辑向量“位置”中的相邻元素不是连续的，即差异不等于 1

lst1 <-  split(conseq_high, cumsum(c(TRUE, diff(conseq_high$position) != 1)))

-输出

lst1
#$`1`
#  variable X6 X7 X8 X9 X10 X11 X12 X13 X14 position rnum
#1   pep_14  L  L  L  L   Q   L   S   C   S        3    1
#2   pep_15  L  L  L  Q   L   S   C   S   Y        4    2
#3   pep_16  L  L  Q  L   S   C   S   Y   A        5    3
#4   pep_17  L  Q  L  S   C   S   Y   A   G        6    4
#5   pep_18  Q  L  S  C   S   Y   A   G   Q        7    5
#6   pep_19  L  S  C  S   Y   A   G   Q   F        8    6
#7   pep_20  S  C  S  Y   A   G   Q   F   R        9    7
#8   pep_21  C  S  Y  A   G   Q   F   R   V       10    8
#9   pep_22  S  Y  A  G   Q   F   R   V   I       11    9

#$`2`
#   variable X6 X7 X8 X9 X10 X11 X12 X13 X14 position rnum
#10  pep_136  E  L  K  V   E   D   P   F   Y       19   10
#11  pep_137  L  K  V  E   D   P   F   Y   W       20   11
#12  pep_138  K  V  E  D   P   F   Y   W   V       21   12

#$`3`
#   variable X6 X7 X8 X9 X10 X11 X12 X13 X14 position rnum
#13  pep_164  V  S  V  G   L   V   F   L   F       26   13
#14  pep_165  S  V  G  L   V   F   L   F   L       27   14
#15  pep_166  V  G  L  V   F   L   F   L   Q       28   15

#$`4`
#   variable X6 X7 X8 X9 X10 X11 X12 X13 X14 position rnum
#16  pep_175  H  R  L  R   G   K   L   R   A       30   16
#17  pep_176  R  L  R  G   K   L   R   A   E       31   17
#$`5`
#   variable X6 X7 X8 X9 X10 X11 X12 X13 X14 position rnum
#18  pep_223  Y  N  W  L   H   R   R   L   A       36   18
#19  pep_224  N  W  L  H   R   R   L   A   G       37   19

数据

conseq_high <- structure(list(variable = c("pep_14", "pep_15", 
   "pep_16", "pep_17", 
"pep_18", "pep_19", "pep_20", "pep_21", "pep_22", "pep_136", 
"pep_137", "pep_138", "pep_164", "pep_165", "pep_166", "pep_175", 
"pep_176", "pep_223", "pep_224"), X6 = c("L", "L", "L", "L", 
"Q", "L", "S", "C", "S", "E", "L", "K", "V", "S", "V", "H", "R", 
"Y", "N"), X7 = c("L", "L", "L", "Q", "L", "S", "C", "S", "Y", 
"L", "K", "V", "S", "V", "G", "R", "L", "N", "W"), X8 = c("L", 
"L", "Q", "L", "S", "C", "S", "Y", "A", "K", "V", "E", "V", "G", 
"L", "L", "R", "W", "L"), X9 = c("L", "Q", "L", "S", "C", "S", 
"Y", "A", "G", "V", "E", "D", "G", "L", "V", "R", "G", "L", "H"
), X10 = c("Q", "L", "S", "C", "S", "Y", "A", "G", "Q", "E", 
"D", "P", "L", "V", "F", "G", "K", "H", "R"), X11 = c("L", "S", 
"C", "S", "Y", "A", "G", "Q", "F", "D", "P", "F", "V", "F", "L", 
"K", "L", "R", "R"), X12 = c("S", "C", "S", "Y", "A", "G", "Q", 
"F", "R", "P", "F", "Y", "F", "L", "F", "L", "R", "R", "L"), 
    X13 = c("C", "S", "Y", "A", "G", "Q", "F", "R", "V", "F", 
    "Y", "W", "L", "F", "L", "R", "A", "L", "A"), X14 = c("S", 
    "Y", "A", "G", "Q", "F", "R", "V", "I", "Y", "W", "V", "F", 
    "L", "Q", "A", "E", "A", "G"), position = c(3L, 4L, 5L, 6L, 
    7L, 8L, 9L, 10L, 11L, 19L, 20L, 21L, 26L, 27L, 28L, 30L, 
    31L, 36L, 37L), rnum = 1:19), class = "data.frame", 
    row.names = c("1", 
"2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12", "13", 
"14", "15", "16", "17", "18", "19"))

关于r - 按行号将数据框拆分为数据框列表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64544067/

25

4

0

文章推荐： html - 输入元素后标签的XPath？

文章推荐： php - 在 WP_Query 中获取 WooCommerce 订阅产品类型和特定类别

文章推荐： javascript - 如何将从循环中获得的 Ajax 变量附加到标记中

文章推荐： ios - SwiftUI:NavigationLink 内的水平 ScrollView 中断导航

Python 这段代码做了什么？列表=列表[列表!=值]
如标题所示，ans_list是一个答案列表，ans_index是一个数字(答案在词汇表中的索引，但与atm无关) 这里生成的 tree.anslist 是什么？ (例如，仅针对第一个)，忽略迭代。 f
MySQL 列表 IN 列表
我目前将用户的输入存储在逗号分隔的列表中，如下所示: Userid | Options 1 | 1,2,5 用户在一个数组形式中勾选一组选项，然后用逗号连接起来 1,2,5 然后 MySQ
MySQL 列表 IN 列表
我目前将用户的输入存储在逗号分隔的列表中，如下所示: Userid | Options 1 | 1,2,5 用户在一个数组形式中勾选一组选项，然后用逗号连接起来 1,2,5 然后 MySQ
list - 我怎样才能完全展平一个列表(列表(列表)......)
我想知道如何完全展平列表和包含它们的东西。除其他外，我想出了一个解决方案，它可以将具有多个元素的东西滑倒并将它们放回原处，或者在滑倒后将具有一个元素的东西拿走。这与 How do I “flatte
list - 我怎样才能完全展平一个列表(列表(列表)......)
我想知道如何完全展平列表和包含它们的东西。除其他外，我想出了一个解决方案，它可以将具有多个元素的东西滑倒并将它们放回原处，或者在滑倒后将带有一个元素的东西拿走。这与 How do I “flatte
java - 列表<列表<字符串>>到字符串[][]
这个问题已经有答案了: Convert nested list to 2d array (3 个回答) 已关闭 7 年前。 java中有没有快捷方式可以转换 List> 到 String[][] ？
java - 列表<列表<对象>>排序
我在排序时遇到问题 List> 。我创建了一个自定义比较器，在其中编写了对数据进行排序的代码。 public class CustomComparator implements Comparator
java - 列表数组列表转换
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: Java Generics: Cannot cast List to List? 我只是想知道为什么下面的java代
c# - 列表<逗号分隔的字符串> => 列表<字符串>?
试图想出一个 LINQy 方法来做到这一点，但我什么也没想到。我有一个对象列表<>，其中包含一个属性，该属性是逗号分隔的字母代码列表: lst[0].codes = "AA,BB,DD" lst[1
python - 列表 += 元组与列表 = 列表 + 元组
假设我有这些任务: points = [] point = (1, 2) 我怎么会这样做: points += point 它工作得很好，并且给了我点 = [1, 2]。但是，如果我这样做: poin
scala - 将列表[任务[列表[A]]]转换为任务[列表[A]]
如何在 scala 中将 List[Task[List[Header]]] 类型转换为 Task[List[Header]]。我有一个方法返回 Task[List[Header]] 并多次调用 do
java - 如何在Java中获取二维列表的元素？例如，列表<列表<整数>>
如何在 Java 中查找二维列表的元素？我有一个参数为 List> 的函数我想知道如何找到这个列表的行和列。最佳答案如果你喜欢 List> obj 然后你就可以像这样访问 obj.get(cur
java - 列表<列表没有按预期工作
分配 List到 List工作正常。分配 List>到 List>不编译。代码 public class Main { public static void main(String[] a
java - 列表<可序列化> vs 列表
我正在用 Java 编写一个方法，该方法必须接收并迭代 Serializable 的 List。有什么区别: public void myMethod(List list) { } 和 public
java - 通知网格/列表/树内网格/列表/树的更改
我看到很多人想用 mvvm 更新网格/列表/树的一部分，但他们不想刷新整个列表。对于所有遇到此问题的人，我做了以下示例。希望这对你有用。最佳答案这是一个简单的例子。整个代码中最重要的是: Bi
C++ 列表到 Python 列表
我正在为现有的 C++ 库编写包装器，该库使用列表，其中 T 是自定义结构。我被建议使用 vector 而不是列表，但我试图避免修改库。为了更好地理解这个场景，我做了一个简单的应用程序，使用一个列表
java - 列表 VS 列表<基础>
List list List list 这两种声明有什么区别吗？谢谢，最佳答案是的。 List可以包含所有派生自 Base 的不同事物的混合物. List包含同质项(从某种意义上说，它们必须全部
Java 泛型 : List, 列表<对象>、列表
有人可以尽可能详细地解释以下类型之间的区别吗？ List List List 让我更具体一点。我什么时候想使用 // 1 public void CanYouGiveMeAnAnswer(List l
python - 是否有任何 python 模块可以计算(列表，列表)元组的频率？
我有一个元组列表，每个元组都是一对列表。所以我的数据看起来像: mylist = [(['foo', 'bar'], ['bar', 'bar']),(['bar', 'bar'],['bar', '
list - 给定一个 (a * b) 列表，返回一个 (a * b list) 列表
也许是一个时髦的标题，但我遇到了以下问题: 给定一个类型为 (a * b) list 的列表，我想创建一个类型为 (a * b list) list 的新列表。一个例子: 给定列表 let testL

首页

博学

6Ren·AI

商城

r - 按行号将数据框拆分为数据框列表