gpt4 book ai didi

r - 基于分隔符将快速 data.table 列拆分为多行

转载 作者:行者123 更新时间:2023-12-03 16:46:28 24 4
gpt4 key购买 nike

<分区>

我有一个包含 3 列的 data.table,我想用分隔符将第 3 列拆分为多行。

我目前的实现是:

protein.ids <- c("PA0001","PA0001", "PA0002", "PA0002", "PA0002")
protein.names <- c("protein A", "protein A", "protein B", "protein B", "protein B")
peptides.ids <- c("1;3;2", "81;23;72", "7;6;8", "10;35;21", "5;2;7")

data <- data.frame(matrix(c(protein.ids, protein.names, peptides.ids),
nrow = 5),
stringsAsFactors = FALSE)

colnames(data) <- c("Protein IDs", "Protein Names", "Peptide IDs")

data <- data.table(data)

data[ ,list(`Peptide IDs` = unlist(strsplit(`Peptide IDs`, ";"))),
by = list(`Protein IDs`, `Protein Names`)]

但是我的 data.table 非常大 (~1.2G),直到现在它运行大约 3 秒,那么是否有更快的方法来获得相同的结果或者没有任何值得榨取的汁液?

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com