gpt4 book ai didi

sql - 在R中的表中选择行的快速方法?

转载 作者:行者123 更新时间:2023-12-04 09:41:28 25 4
gpt4 key购买 nike

我正在寻找一种从更大的表中提取大量行的快速方法。我的表的顶部如下:

> head(dbsnp)

snp gene distance
rs5 rs5 KRIT1 1
rs6 rs6 CYP51A1 1
rs7 rs7 LOC401387 1
rs8 rs8 CDK6 1
rs9 rs9 CDK6 1
rs10 rs10 CDK6 1

和尺寸:
> dim(dbsnp)
[1] 11934948 3

我想选择包含在列表中的行名的行:
> head(features)
[1] "rs1367830" "rs5915027" "rs2060113" "rs1594503" "rs1116848" "rs1835693"

> length(features)
[1] 915635

毫不奇怪,这样做的简单方法 temptable = dbsnp[features,]需要相当长的时间。

我一直在寻找通过 R 中的 sqldf 包来做到这一点的方法。我认为这可能会更快。不幸的是,我不知道如何在 SQL 中选择具有某些行名的行。

谢谢。

最佳答案

data.table解决方案:

library(data.table)
dbsnp <- structure(list(snp = c("rs5", "rs6", "rs7", "rs8", "rs9", "rs10"
), gene = c("KRIT1", "CYP51A1", "LOC401387", "CDK6", "CDK6",
"CDK6"), distance = c(1L, 1L, 1L, 1L, 1L, 1L)), .Names = c("snp",
"gene", "distance"), class = "data.frame", row.names = c("rs5",
"rs6", "rs7", "rs8", "rs9", "rs10"))

DT <- data.table(dbsnp, key='snp')
features <- c('rs5', 'rs7', 'rs9')
DT[features]

snp gene distance
1: rs5 KRIT1 1
2: rs7 LOC401387 1
3: rs9 CDK6 1

关于sql - 在R中的表中选择行的快速方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12204171/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com