- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个包含 3 列的数据表:pid(作业)、starttime(开始时间)和 fintime(结束时间),如下所示:
require(data.table)
dt <- data.table(pid=sample(1:100,100), starttime = sample(1:100,100)/100)[,fintime:=starttime + round(runif(100)/4,2)]
我需要确定所有可能的两个工作,这些工作可以按顺序完成,但要确认工作之间的可接受“差距”。我可以使用 SQL 在 0.05 到 0.4 个单位(时间)之间执行此操作,如下所示:
require(sqldf)
res <- sqldf("select a.pid as first, b.pid as second , a.starttime as startime, b.fintime as fintime
from dt a, dt b
where a.fintime < b.starttime - 0.05
and a.fintime > b.starttime - 0.4
")
我如何使用 data.table 做到这一点?(我希望在数据量大且约束更多的情况下比 sqldf 有性能改进)
最佳答案
所以这里有一个 data.table 方法,速度大约快 20 倍,但是有一些注意事项(在最后描述)。
require(data.table)
set.seed(1) # for reproducible example
n <- 100 # simple example
dt <- data.table(pid=sample(1:n,n),
starttime = sample(1:n,n)/n,2)[,fintime:=starttime + round(runif(n)/4,2)]
# sqldf approach
require(sqldf)
f.sql <- function(dt) {
sqldf("create index idx on dt(starttime,fintime)")
res <- sqldf("select a.pid as first, b.pid as second , a.starttime as starttime, b.fintime as fintime
from dt a, dt b
where b.starttime >= a.fintime + 0.05
and b.starttime <= a.fintime + 0.4
")
}
res.sql <- f.sql(dt)
# data.table approach with foverlaps(...): need >= 1.9.4 for this!!
packageVersion("data.table")
# [1] ‘1.9.4’
f.DT <- function(dt) {
lookup <- dt[,list(second=pid, fintime, a=starttime,b=starttime)]
setkey(lookup,a,b)
DT <- dt[,list(first=pid, starttime, a=fintime+0.05,b=fintime+0.4)]
J.olaps <- foverlaps(DT,lookup,type="any",nomatch=0)
J.olaps[,list(first,second,starttime,fintime)]
}
res.DT <- f.DT(dt)
所以这在最新版本的 data.table
(1.9.4) 中使用了 foverlaps(...)
函数。假设您有两个 data.tables,x
和 y
。每个都有一对构成范围的列。 foverlaps(...)
查找 x
和 y
中 x
范围重叠的所有记录组合code> 和 y
中的范围。在这里我们设置它,以便 x
具有由 fintime+0.04
和 fintime+0.5
和 y
定义的范围两端的范围由 starttime
定义。所以现在 foverlaps(...)
查找开始时间比 fintime 多 0.04 到 0.5 之间的任何记录组合。
现在注意事项:
首先,这仅在您愿意将约束放宽到封闭间隔时才有效(据我所知)(例如,b.starttime >= a.fintime + 0.05
, 与严格 >
相比)。
其次,data.table 方法查找在 sql 方法中找到的所有记录加上一些额外的记录。您可以使用以下代码看到这一点:
indx <- data.table(first=res.sql$first,second=res.sql$second,key=c("first","second"))
setkey(res.DT,first,second)
extra <- res.DT[!indx,]
额外的记录看起来是合法的,所以问题是:为什么 sqldf(...)
找不到它们?我无法回答。
第三,这适用于您的示例,但可能不容易通过“更多约束”进行扩展。
最后,这是一个与您的实际数据更相似的数据集的“基准”:
set.seed(1)
n <- 1e4 # more realistic example
dt <- data.table(pid=sample(1:n,n),
starttime = sample(1:n,n)/n)[,fintime:=starttime + round(runif(n)/4,2)]
system.time(res.sql <- f.sql(dt))
# user system elapsed
# 45.25 0.53 45.80
system.time(res.DT <- f.DT(dt))
# user system elapsed
# 2.09 0.86 2.94
关于r - 可以使用 data.table 完成 SQL 非等连接任务(下面的示例)(更快和/或更整洁)吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26311275/
从 Redis 获取消息时,onDone:(){print('done')} 从未起作用。 import 'package:dartis/dartis.dart' as redis show PubS
昨天我玩了一些vim脚本,并设法通过循环来对当前输入的内容进行状态栏预测(请参见屏幕截图(灰色+黄色栏))。 问题是,我不记得我是怎么得到的,也找不到我用于该vim魔术的代码片段(我记得它很简单):它
我尝试加载 bash_completion在我的 bash (3.2.25) 中,它不起作用。没有消息等。我在我的 .bashrc 中使用了以下内容 if [ -f ~/.bash_completio
我正在尝试构建一个 bash 完成例程,它将建议命令行标志和合适的标志值。例如在下面 fstcompose 命令我想比赛套路先建议 compose_filter= 标志,然后建议来自 [alt_seq
当我尝试在重定向符号后完成路径时,bash 完成的行为就好像它仍在尝试在重定向之前完成命令的参数一样。 例如: dpkg -l > /med标签 通过在 /med 之后点击 Tab我希望它完成通往 /
我的类中有几个 CAKeyframeAnimation 对象。 他们都以 self 为代表。 在我的animationDidStop函数中,我如何知道调用来自哪里? 是否有任何变量可以传递给 CAKe
我有一个带有 NSDateFormatter 的 NSTextField。格式化程序接受“mm/dd/yy”。 可以自动补全日期吗?因此,用户可以输入“mm”,格式化程序将完成当前月份和年份。 最佳答
有一个解决方案可以使用以下方法完成 NSTextField : - (NSArray *)control:(NSControl *)control textView:(NSTextView *)tex
我正在阅读 Passport 的文档,我注意到 serialize()和 deserialize() done()被调用而不被返回。 但是,当使用 passport.use() 设置新策略时在回调函数
在 ubuntu 11.10 上的 Firefox 8.0 中,尽管 img.complete 为 false,但仍会调用 onload 函数 draw。我设法用 setTimeout hack 解决
假设我有两个与两个并行执行的计算相对应的 future 。我如何等到第一个 future 准备好?理想情况下,我正在寻找类似于Python asyncio's wait且参数为return_when=
我正在寻找一种 Java 7 数据结构,其行为类似于 java.util.Queue,并且还具有“最终项目已被删除”的概念。 例如,应可以表达如下概念: while(!endingQueue.isFi
这是一个简单的问题。 if ($('.dataTablePageList')) { 我想做的是执行一个 if 语句,该语句表示如果具有 dataTablesPageList 类的对象也具有 menu
我用replaceWith批量替换了许多div中的html。替换后,我使用 jTruncate 来截断文本。然而它不起作用,因为在执行时,replaceWith 还没有完成。 我尝试了回调技巧 ( H
有没有办法调用 javascript 表单 submit() 函数或 JQuery $.submit() 函数并确保它完成提交过程?具体来说,在一个表单中,我试图在一个 IFrame 中提交一个表单。
我有以下方法: function animatePortfolio(fadeElement) { fadeElement.children('article').each(function(i
我刚刚开始使用 AndEngine, 我正在像这样移动 Sprite : if(pValueY < 0 && !jumping) { jumping =
我正在使用 asynctask 来执行冗长的操作,例如数据库读取。我想开始一个新 Activity 并在所有异步任务完成后呈现其内容。实现这一目标的最佳方法是什么? 我知道 onPostExecute
我有一个脚本需要命令名称和该命令的参数作为参数。 所以我想编写一个完成函数来完成命令的名称并完成该命令的参数。 所以我可以这样完成命令的名称 if [[ "$COMP_CWORD" == 1 ]];
我的应用程序有一个相当奇怪的行为。我在 BOOT_COMPLETE 之后启动我的应用程序,因此在我启动设备后它是可见的。 GUI 响应迅速,一切正常,直到我调用 finish(),按下按钮时,什么都没
我是一名优秀的程序员,十分优秀!