- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
抱歉标题不明确。这是感兴趣的数据表:
dt <- data.table(K=c("A","A","A","B","B","B"),Y=c("2010","2010","2011","2011","2011","2010"),Q1=c(2,3,4,1,3,4),Q2=c(3,3,3,1,1,1))
dt
K Y Q1 Q2
1: A 2010 2 3
2: A 2010 3 3
3: A 2011 4 3
4: B 2011 1 1
5: B 2011 3 1
6: B 2010 4 1
假设 K 的值是人,所以这里有两个。一年中的季度存储在 Q1 和 Q2 中。 Q2 是一种引用季度变量,值始终与 2011 年相关)。现在我想选择 dt 中的那些行,其中,对于 K 中的每个人,Q1 位于 Q2 值之前 4 个季度的间隔内。
一个例子:
Person A 在 Q2 中的值为 3,因此应选择值 2 (2011)、1(2011)、4(2010) 和 3 (2010)。考虑到这个数据集,这只是第 2 行。第 3 行中的值 Q1=4 太大,第 1 行中的值 Q1=2 太小。对于第二个人“B”,只会选择第 6 行。不是第 4 行,因为这和 Q2 是同一个季度(我只想要那些小于 Q2 中的值,而第 5 行明显大于 Q2 中的值。
dt_new
K Y Q1 Q2
1: A 2010 3 3
2: B 2010 4 1
总结:
Q2 中的值 4 表示:选择 Q1 中小于 4 的所有值,其中 Y=2011,并选择 Q1 中所有等于或大于 4 的值(因此只有 4),其中 Y=2010。结果:3(2011),2(2011),1(2011),4(2010)。此规则适用于 Q2 的所有值。所有这一切都应该为每个人完成。
我希望我的问题得到解决。我认为有很多方法可以解决这个问题,但由于我仍在学习 data.table,所以我想向您询问漂亮而优雅的解决方案(希望有)。
谢谢
编辑:
几乎找到了一个解决方案:这给了我一个逻辑向量。如何提取数据集中的线条?
setkey(dt,K)
dt[,(Q1<Q2 & Y=="2011")|(Q1>=Q2 & Y=="2010"),by="K"]
K V1
1: A FALSE
2: A TRUE
3: A FALSE
4: B FALSE
5: B FALSE
6: B TRUE
不这样做:
log <-dt[,(Q1<Q2 & Y=="2011")|(Q1>=Q2 & Y=="2010"),by="K"]$V1
dt[log]
最佳答案
这是普通的按行过滤,因此您不需要(或不应该)使用分组 (by = "K"
),只需执行以下操作:
dt[(Q1 < Q2 & Y == "2011") | (Q1 >= Q2 & Y == "2010"), ]
或者如果您要使用的范围不仅仅是 4
个季度,则可能更灵活:
quarter.diff <- function(Q1, Y1, Q2, Y2) {
4L * (as.integer(Y2) - as.integer(Y1)) +
(as.integer(Q2) - as.integer(Q1))
}
dt[quarter.diff(Q1, Y, Q2, Y2 = "2011") > 0L &
quarter.diff(Q1, Y, Q2, Y2 = "2011") <= 4L, ]
这不仅更通用,而且读起来更好,并且使 reference-year-is-2011 假设明确。
请注意我是如何在 quarter.diff
函数中小心地将所有列转换为整数的。理想情况下,您的年度和季度数据应该已经存储为整数而不是字符或数字。
最后,如果您担心 quarter.diff
被调用两次并且速度是一个问题,您可以按照@Arun 在评论中的建议暂时存储结果:
dt[{qdiff <- quarter.diff(Q1, Y, Q2, Y2 = "2011")
qdiff > 0L & qdiff <= 4L}, ]
关于r - 数据准备问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18352122/
我一直在试图找出为什么这会给我一个错误: PREPARE test FROM 'SELECT t.blah FROM (SELECT ? AS blah) t;'; ERROR 1054 (42S22
我想了解 Go 中的 channel 。我读过默认情况下发送和接收 block ,直到发送方和接收方都准备好。但是我们如何确定发送方和接收方的准备情况。 例如在下面的代码中 package main
大部分的pytorch入门教程,都是使用torchvision里面的数据进行训练和测试。如果我们是自己的图片数据,又该怎么做呢? 1、我的数据 我在学习的时候,使用的是fashion-mnis
在我的 Storyboard中,controller1 有 natigationController 和 segues 到 controller 2。奇怪的是 Segue 工作正常但是 overrid
我正在尝试使用Openshift在线从我的仓库中放入一些代码。 我的构建编译正常,但是部署失败: error: update acceptor rejected nodejs-mongo-persis
已结束。此问题不符合 Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是无关紧要的,
我有一个每晚运行的存储过程。 它从链接服务器中提取一些数据并将其插入到运行 sql 代理作业的服务器上的表中。在运行 INSERT 语句之前,该过程检查链接服务器上的数据库是否联机 (STATE =
我对 PDO 准备好的语句比较陌生。 我忍不住觉得必须有一种更简单、更整洁的方法来执行以下操作:我无论如何都将所有内容加载到一个数组中,然后必须将整个内容重写为一组 ':blah '=>$found[
我正在准备一个 pandas 数据框,用于在 R 的 ggplot2 中绘制带有误差条的图,这需要计算列的统计数据。误差条需要最小值(平均值 - 标准偏差)和最大值(平均值+标准差)。我使用 grou
我的 prepareForSegue 方法没有将数据传递到目标 View Controller 。 var buttonsDictionary = [Int: UIButton]() func cre
需要帮助来完成这个简单的任务。该 sp 应该提供一个结果集,并将从 MS-Access-Database 报告目的中调用。 表名可变,但以数字 (lsid) 结尾。使用串联。max_prepared_
我正在为我工作的小型企业创建销售订单表单。我有一个表单连接到数据库以获取下拉菜单,然后连接到文本框以在需要时添加新数据。如果前面的部分中的所有数据框均已填写,还会出现另外四个部分。 链接到数据库的
以下代码: class Database { (...) public function query($query){ $this->stmt = $this->dbh
我正在开展一个学校项目,涉及一个具有数据库集成的网站。目前正致力于通过它向网站添加新内容(文本、标题、图像)。我已经可以通过网站向数据库添加新用户,但由于某种原因,相同的代码和逻辑不适用于内容。 我注
我如何mysqli::stmt->bind_param在mysql中被视为NULL的东西? 我目前正在使用 $stmt->bind_param('s', 'NULL'); 最佳答案 bind_para
我在此处运行准备 stmt 时遇到语法错误。我尝试手动执行 @c 中的查询并且它有效。不知道为什么 stmt 会给出这个错误。这是我正在使用的代码。 SET @i=24; SET @Bill_mont
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。 这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
我想知道准备好的查询是否与未准备的查询一样安全。下面是两个示例,一个用于 SELECT,一个用于 UPDATE。第一行是未准备的查询,第二行是准备好的查询。 选择示例: $userDetails =
我是 ios 开发的新手,在我尝试做的事情上遇到了障碍。 我的方法中有这段代码,旨在将特定的 NSObject 从这个 View 传递到下一个 View ,但是它总是让我的应用程序崩溃。 -(void
自上次调用 segue 以来,我的 UIButton 类的 statValue 属性已更新,但 segue 仍发送旧的原始值。有没有办法刷新 prepare 函数(如下),以便它发送新值? overr
我是一名优秀的程序员,十分优秀!