- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
考虑 BigQuery 上的这个表架构:
Table User
{
user_id: STRING (REQUIRED)
user_name: STRING (REQUIRED)
actions: RECORD (REPEATED)
{
action_id: STRING (REQUIRED)
action_type: INTEGER (REQUIRED)
action_date: TIMESTAMP (REQUIRED)
}
}
我想找到所有多次创建某种类型操作的用户(user_id 和 user_name),并且这些操作之间的最短时间少于 X 天。
未定义每个用户存储的操作数(可以是 1、2 或 n)。这些操作不按任何标准排序(但我认为这可以通过使用 ORDER BY
来解决)。
例如,与用户:
{
user_id: "u1",
user_name: "User 1",
actions:
{action_id: "a1", action_type: 1, action_date: "2016-02-22"},
{action_id: "a2", action_type: 1, action_date: "2016-01-22"},
{action_id: "a3", action_type: 1, action_date: "2015-12-22"}
},
{
user_id: "u2",
user_name: "User 2",
actions:
{action_id: "a4", action_type: 1, action_date: "2016-02-22"},
{action_id: "a5", action_type: 2, action_date: "2016-01-22"},
{action_id: "a6", action_type: 1, action_date: "2015-12-22"}
},
{
user_id: "u3",
user_name: "User 3",
actions:
{action_id: "a7", action_type: 1, action_date: "2016-02-22"}
},
{
user_id: "u4",
user_name: "User 4",
actions:
{action_id: "a8", action_type: 1, action_date: "2016-02-22"},
{action_id: "a9", action_type: 1, action_date: "2015-02-22"},
{action_id: "a10", action_type: 1, action_date: "2015-01-22"}
},
查询“选择多次执行 1
类型操作的用户,并且每次执行之间的最短时间小于 45
天”应该返回 用户 1
和 用户 4
。
关于如何在 BigQuery 上执行此操作的任何想法?
最佳答案
试试下面
随手写,因此未经测试,但我觉得它应该可以工作并且可以满足您的需求
SELECT
user_id,
user_name,
action_type,
MIN(DATEDIFF(action_date_next, action_date)) AS min_distance
FROM (
SELECT
user_id,
user_name,
action_type,
action_date,
LAG(action_date)
OVER(PARTITION BY user_id, action_type
ORDER BY action_date DESC) AS action_date_next
FROM (
SELECT
user_id,
user_name,
actions.action_type AS action_type,
actions.action_date AS action_date
FROM table_users
)
)
WHERE action_date_next IS NOT NULL
GROUP BY user_id, user_name, action_type
HAVING action_type = 1 AND min_distance < 45
下面的版本更紧凑 - 试试吧
SELECT
user_id,
user_name,
action_type,
MIN(DATEDIFF(action_date_next, action_date)) AS min_distance
FROM (
SELECT
user_id,
user_name,
actions.action_type AS action_type,
actions.action_date AS action_date,
LAG(actions.action_date)
OVER(PARTITION BY user_id, actions.action_type
ORDER BY actions.action_date DESC) AS action_date_next
FROM table_users
)
WHERE action_date_next IS NOT NULL
GROUP BY user_id, user_name, action_type
HAVING action_type = 1 AND min_distance < 45
关于google-bigquery - 大查询 : Selecting the smallest difference among fields in a repeated record,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35567979/
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 5 年前。 Improve
我有一个 mysql 表,其中包含一个名为“id”、“name”和“number”的字段。 每一行的字段'number',都有一个数字。 id name number 1 test 30
我需要获得两个字段之间的最大和最小值。我将 JPA 2.1 与 EclipsLink 结合使用。 这是我的简化查询: SELECT GREATEST(c.min, mc.max), LEAST(c.m
我想知道是否可以询问具有相同字段名称的多个表,并且只写入一次询问的值。可能是为了避免裁员。 例如: SELECT * FROM table WHERE Table1.Status AND Ta
我想知道如何以负增量更新字段,但如果新值小于 1,则删除该行? 是否可以在 case 或 if/else block 中放置和更新语句? 目前我正在执行一个 select 语句来获取当前值,然后使用
嗨,我一直在寻找 secnhatouch 字段的 readOnly 属性,但没有找到它......有人可以帮助我解决这个问题吗 { xtype: 'textfield
SQL Server 2005 报告服务。 我想在报告文本框中使用以下内容: =IIF(IsNothing(Fields!Certification.Value), "", "Certs: "
考虑下表: un_id avl_id avl_date avl_status 1738 6377398 2011-03-10 unavailable 1738 6377399
鉴于集合将包含 50 多万份文档,每个文档都有最大数量的字段(如选项 a 所示)处理可能为空/稀疏的字段的最佳实践是什么? a)将每个具有相同字段和空字段的文档保存为 null 是否更好? { "
尝试开始使用 apioto http://apiato.io/A.getting-started/installation/ 如果我尝试测试 http://api.apiato.dev/registe
我在教程中找不到这两个指令之间的区别。 th:field="${something}"和 th:field="*{something}" 谁能告诉我一些例子? 最佳答案 Reference site
在 MongoDb 中 - 如果我的字段并不总是包含值 - 更好的做法是:在所有记录中保留相同的字段,即使有时这些字段为空或根本不创建这些字段? 10 倍! 最佳答案 字段会占用键的磁盘空间,即使没有
如何使用 factory-boy 定义依赖于其他字段的字段? 例如,我想定义一个 email这取决于 first name和 last name的 User . 我尝试使用 post_generati
嘿嘿, 我遇到了以下问题:我尝试阻止用户为“用户名”和“电子邮件”字段选择相同的值。我正在使用 jquery 表单验证插件 (http://bassistance.de/jquery-plugins/
在性能方面,哪个更适合使用? ...关于可读性/可理解性? ...关于公认的标准? SELECT * FROM Wherever WHERE Greeting IN ('hello', 'hi', '
我想知道使用 this 和 super 访问父类字段的区别。 我们有以下名为 ListItem 的抽象类,它扩展了 Node 类。 public abstract class ListItem {
假设 this 是一个指针,(2) 和 (3) 行如何在下面的 C++ 类中编译,所以应该需要 -> 符号来访问字段(如 (1) 行所示)? ( Source ) #include #include
我想更好地理解通过单独使用 this.field 和 field 来引用类字段有什么区别 this.integerField = 5; 和 integerField = 5; 最佳答案 this 关键
问题:我有一张库存表,还有一张列出正在拍卖的元素的表格。我想要一个别名字段(“isAuction”)来表示具有库存库存编号的项目是否存在于拍卖项目表中。 我写了以下查询: SELECT FROM in
如果我将包含多个字段的文档添加到 Elasticsearch 索引,当我在 Kibana 中查看它时,我每次都会得到相同的字段两次。其中之一将被称为 some_field 另一个将被调用 some_f
我是一名优秀的程序员,十分优秀!