- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在寻找更快的方法来计算这种事情。 (真实数据库有 109 964 694 行)。
DT<-data.table(id=c(1,2,1,4,2,1,7,8,8,10),
effect=c("A","A","B","B","B","C","C","C","A","D"),
value=1)
effect =="A"
的 ID和
effect == "C"
intersect(DT[effect=="A",(id)], DT[effect=="C",(id)])
effect =="A"
的 ID和
effect =="C"
.. 但不是
effect=="B"
setdiff(
intersect(DT[effect=="A",(id)],DT[effect=="C",(id)]),
DT[effect=="B",(id)]
)
DT[,effect=="diag_998" | effect=="diag_1900",by=id][,sum(V1)==2,by=id][V1==TRUE,(id)]
system.time(V1<-intersect(DT[effect=="A",(id)],DT[effect=="C",(id)]))# 0.014 sec
system.time(V2<-DT[effect=="A" | effect=="C", unique(id[duplicated(id)])]) #17sec
system.time(V3<-DT[,list(cond=all(c("A","C") %in% effect)),by=id][cond==TRUE,id] ) #more than 1 min
system.time(V4<-DT[effect=="A" | effect=="C", .N[.N > 1], by = id]$id) # 17 sec
system.time(V5<-DT[, .GRP[sum(c("A", "C") %chin% effect)==2], id]$id) # 103 sec
system.time(V6<-DT[, .GRP[sum(c("A", "C") %in% effect)==2], id]$id)#more than 1 min
setkey(DT, effect)
system.time(V7<-DT[.(c("A", "C")), if (.N > 1) TRUE, by = id]$id)#0.19 sec
system.time(A1<-setdiff(intersect(DT[effect=="A",(id)],DT[effect=="C",(id)]),DT[effect=="D",(id)])) # 0.014 sec
system.time(A2<-DT[,list(cond=all(c("A","C") %in% effect) & (!"D" %in% effect)),by=id][cond==TRUE,id])#more than 1 min
system.time(A3<-DT[,list(cond=all(c("A","C") %chin% effect) & (!"D" %chin% effect)),by=id][cond==TRUE,id])
system.time(A4<-DT[.(c("A", "C", "D")), if (.N == 2 & !("D" %in% effect)) TRUE, by = id]$id)# 1sec
microbenchmark(times=50L,
+ bakal=intersect(DT[effect=="A", id], DT[effect=="C", id]),
+ bakal.keyed=intersect(DT["A", id], DT["C", id]),
+ rscr1=DT[effect %in% c("A","C"), unique(id[duplicated(id)])],
+ rscr1.keyed=DT[.(c("A","C")), unique(id[duplicated(id)])])
Unit: milliseconds
expr min lq mean median uq max neval
bakal 10.963171 11.003494 11.072844 11.019909 11.060331 12.641751 50
bakal.keyed 10.738537 10.794715 10.878960 10.838630 10.892020 12.416713 50
rscr1 9.504886 9.572026 9.662024 9.598426 9.645478 11.127047 50
rscr1.keyed 9.013076 9.037370 9.065215 9.065669 9.083492 9.206366 50
最佳答案
看来你走对了路;我只能建议键入以加快速度。
这是一个小样本数据集,用于剔除最糟糕的尝试:
set.seed(10239)
NN<-1e6
DT<-data.table(id=sample(8e5,NN,T),
effect=sample(LETTERS[1:4],NN,T),
val=rnorm(NN),key="effect")
setkey(DT,effect); DT[.(c("A", "C")), if (.N > 1) TRUE, by = id]$id
。
cond==TRUE
替换
(cond)
,在@RichardScriven 的方法中用
effect=="A"|effect=="C"
替换
effect %in% c("A", C")
):
library(microbenchmark)
microbenchmark(times=50L,
bakal=intersect(DT[effect=="A", id], DT[effect=="C", id]),
rscr1=DT[effect %in% c("A","C"), unique(id[duplicated(id)])],
nicol=DT[,.(cond=all(c("A","C") %in% effect)), by=id][(cond), id],
rscr2=DT[effect %in% c("A","C"), .N[.N > 1], by = id]$id,
akrun=DT[, .GRP[sum(c("A", "C") %chin% effect) == 2], id]$id,
mikec=DT[.(c("A", "C")), if (.N > 1) TRUE, by = id]$id)
Unit: milliseconds
expr min lq mean median uq max neval cld
bakal 14.82926 15.18540 17.86200 15.56453 16.70924 64.99443 50 a
rscr1 13.41102 13.98252 20.11127 14.93054 18.02248 66.14476 50 a
nicol 1329.82013 1377.03884 1436.45650 1404.48956 1483.47944 1758.00831 50 e
rscr2 260.54888 269.86605 294.05219 276.66802 310.76356 479.50419 50 c
akrun 997.43300 1075.17322 1103.06220 1095.08246 1118.16848 1360.80793 50 d
mikec 154.39418 158.90884 180.01096 163.32763 206.59246 235.45523 50 b
data.table
上的表现如何:
set.seed(12039)
NN<-1e8
DT<-data.table(id=sample(8e5,NN,T),
effect=sample(LETTERS[1:4],NN,T),
val=rnorm(NN),key="effect")
microbenchmark(times=50L,
bakal=intersect(DT[effect=="A", id], DT[effect=="C", id]),
bakal.keyed=intersect(DT["A", id], DT["C", id]),
rscr1=DT[effect %in% c("A","C"), unique(id[duplicated(id)])],
rscr1.keyed=DT[.(c("A","C")), unique(id[duplicated(id)])])
Unit: seconds
expr min lq mean median uq max neval cld
bakal 3.772309 3.991414 4.395669 4.408319 4.681609 5.170224 50 a
bakal.keyed 3.708500 3.807447 4.289518 4.384870 4.653427 5.085429 50 a
rscr1 4.962940 5.210845 5.721636 5.707369 6.162103 6.779900 50 b
rscr1.keyed 4.904702 5.117411 5.727848 5.807186 6.194990 6.975508 50 b
关于r - 加速 data.table 相交,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33321061/
这个问题在这里已经有了答案: What is the best way to parse html in C#? [closed] (15 个答案) 关闭 3 年前。 string input =
为什么 wrapper #4 没有继承其父表容器的高度?表格嵌套在一个显示 block 包装器中,每个嵌套的div是显示表格,每个表格继承到最里面的一个。是什么原因造成的,我该如何解决? jsfidd
我正在使用带有 Bootstrap 的自定义 css 作为外边框。但顶部边框不可见,除非我将其大小设置为 2 px。 我该如何解决这个问题? HTML #name 1.one 2.two 3.thr
我正在逻辑层面上设计一个数据库,以便稍后将其传递给程序员来交付。我只是粗略地了解它们的工作原理,所以我很难简洁地表达我的问题。这是我的问题: 我有一个名为 MEANINGS 的表。 我有一个名为 WO
在 Laravel 上,我们可以使用 DB::table('table')->get(); 或使用 model::('table')->all() 进行访问;我的问题是它们之间有什么区别? 谢谢。 最
我试图从以下内容中抓取 URL从 WorldOMeter 获取 CoVid 数据,在此页面上存在一个表,id 为:main_table_countries_today其中包含我希望收集的 15x225
这是我的图表数据库:/image/CGAwh.png 我用 SEQUELIZE 制作了我的数据库模型: 型号:级别 module.exports = (sequelize, DataTypes) =>
我真的不明白为什么我的代码不能按预期工作。当我将鼠标悬停在表格的每一行上时,我想显示一个图像(来 self 之前加载的 JSON)。每个图像根据行的不同而不同,我想将它们显示在表格之外的另一个元素中。
假设我的数据库中有一张地铁 map ,其中每条线路的每个站点都是一行。如果我想知道我的线路在哪里互连: mysql> SELECT LineA.stop_id FROM LineA, LineB WH
我最近经常使用这些属性,尤其是 display: table-cell。它在现代浏览器中得到了很好的支持,并且它对某些网格有很多好处,并且可以非常轻松地对齐内容,而无需棘手的标记。但在过去的几天里,我
在 CSS 中,我可以这样做: http://s1.ipicture.ru/uploads/20120612/Uk1Z8iZ1.png http://s1.ipicture.ru/uploads/20
问题作为标题,我正在学习sparkSQL,但我无法很好地理解它们之间的区别。谢谢。 最佳答案 spark.table之间没有区别& spark.read.table功能。 内部 spark.read.
我正在尝试根据 this answer 删除表上的非空约束.但是,它似乎没有在 sqlite_sequence 中创建条目。这样做之后,即使我可以在使用测试表时让它正常工作。 有趣的是,如果我备份我的
var otable = new sap.m.Table();//here table is created //here multiple header I'm trying to create t
下面两种方法有什么区别: 内存 性能 答: select table.id from table B: select a.id from table a 谢谢(抱歉,如果我的问题重复)。 最佳答案 完
我尝试在表格后添加点,方法是使用 table::after 选择器创建一个点元素并使用 margin: 5px auto 5px auto; 将其居中。它有效,但似乎在第一个表格列之后添加了点,而不是
我正在设计一个可以标记任何内容的数据库,我可能希望能够选择带有特定标记的所有内容。 我正在为以下两个选项而苦苦挣扎,希望得到一些建议。如果有更好的方法请告诉我。 选项A 多个“多对多”连接表。 tag
"center" div 中的下表元素导致 "left" div 中的内容从顶部偏移几个像素(在我的浏览器中为 8 ).在表格之前添加一些文本可消除此偏移量。 为什么?如何在不要求在我的表格前添加“虚
我是一名优秀的程序员,十分优秀!