- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我使用 postgres 并且有非常重要的查询。我有 2 个解决方案,问题是它们速度不快。
有一张表user_status_changes
,是用户状态变化的历史
user_id | created_at | from_status | to_status
---------+---------------------+-------------+-----------
3 | 2016-03-24 04:00:00 | active | pending
3 | 2016-03-27 19:59:21 | pending | banned
6 | 2016-03-16 10:00:00 | pending | active
6 | 2016-03-21 15:00:00 | active | banned
6 | 2016-03-25 19:52:46 | banned | pending
6 | 2016-03-25 20:53:22 | pending | canceled
用户
id | created_at
----+----------------------------
3 | 2016-03-21 19:54:09.831252
6 | 2016-03-14 13:04:09.134358
我想要得到的是从 user.created_at
到今天的每一天的用户状态和前一天的用户状态的列表。
示例结果(假设今天是 2016-03-27):
user_id | date | status_at | previous_status
-----------+-------------+-----------+-----------------
3 | 2016-03-21 | |
3 | 2016-03-22 | |
3 | 2016-03-23 | |
3 | 2016-03-24 | pending |
3 | 2016-03-25 | pending | pending
3 | 2016-03-26 | pending | pending
3 | 2016-03-27 | banned | pending
6 | 2016-03-14 | |
6 | 2016-03-15 | |
6 | 2016-03-16 | active |
6 | 2016-03-17 | active | active
6 | 2016-03-18 | active | active
6 | 2016-03-19 | active | active
6 | 2016-03-20 | active | active
6 | 2016-03-21 | banned | active
6 | 2016-03-22 | banned | banned
6 | 2016-03-23 | banned | banned
6 | 2016-03-24 | banned | banned
6 | 2016-03-25 | canceled | banned
6 | 2016-03-26 | canceled | canceled
6 | 2016-03-27 | canceled | canceled
我想到了 2 个解决方案。一个带有子查询(相当慢)
WITH possible_dates AS (
SELECT date(generate_series) AS "date"
FROM generate_series(
(SELECT min(created_at) FROM users)::date,
'2016-03-27'::date,
'1 day'
)
)
SELECT
user_id,
possible_dates.date,
(
SELECT to_status
FROM user_status_changes
WHERE user_status_changes.user_id = users.user_id
AND date(user_status_changes.created_at) <= possible_dates.date
ORDER BY user_status_changes.created_at DESC
LIMIT 1
) AS status_at,
LAG(
SELECT to_status
FROM user_status_changes
WHERE user_status_changes.user_id = users.user_id
AND date(user_status_changes.created_at) <= possible_dates.date
ORDER BY user_status_changes.created_at DESC
LIMIT 1
) OVER (PARTITION BY users.user_id ORDER BY possible_dates.date ASC) AS previous_status
FROM users
CROSS JOIN possible_dates
WHERE date(users.created_at) <= possible_dates.date
另一个via joins(似乎更快):
WITH status_changes AS (
SELECT
DISTINCT ON(user_id, date)
user_id,
created_at::date AS date,
to_status,
from_status
FROM user_status_changes
ORDER BY user_id, date, created_at DESC
),
possible_dates AS (
SELECT date(generate_series) AS "date"
FROM generate_series(
(SELECT min(created_at) FROM users)::date,
'2016-03-27'::date,
'1 day'
)
)
SELECT
DISTINCT ON (users.user_id, possible_dates.date)
users.user_id AS user_id,
possible_dates.date AS date,
s1.to_status AS status_at,
s2.to_status AS previous_status
FROM users
CROSS JOIN possible_dates
LEFT OUTER JOIN status_changes s1
ON s1.date <= possible_dates.date
AND s1.user_id = users.user_id
LEFT JOIN LATERAL (
SELECT
status_changes.to_status,
status_changes.date
FROM status_changes
WHERE
status_changes.date < possible_dates.date AND
status_changes.user_id = users.user_id
) s2 ON true
WHERE date(users.created_at) <= possible_dates.date
ORDER BY users.user_id, possible_dates.date DESC, s1.date DESC, s2.date DESC;
目前我们有大约 2 万名用户,每个用户每月约有 10 次付款和 2 次状态更改。第一个用户创建于 1 年前。
我认为连接方法的问题是我们连接所有以前的状态更改,然后仅通过 DISTINCT ON
删除冗余。
任何更好的解决方案将不胜感激,也欢迎索引建议。
最佳答案
我的查询不使用 LATERAL
,它需要像您或 @Mike 那样计算每一行,所以这应该快得多。
首先像您之前所做的那样生成数据集。 CTE: generate_dates
。
然后将输出限制为每个用户创建时的日期,并获取在这些日期设置的状态。 CTE: basic_status
。
在内部选择中,使用 LEFT JOIN
和 COALESCE()
在每个状态之间填充空值,并限制输出抛出使用 DISTINCT ON
将日期之后的所有状态设置为最接近的状态。
外部选择仅用于使用 LAG()
窗口函数计算先前状态。
WITH generate_dates AS (
SELECT date(generate_series) AS date
FROM generate_series(
(SELECT min(created_at) FROM users)::date,
'2016-03-27'::date,
'1 day'
)
)
, basic_status AS (
SELECT
u.id AS user_id,
g.date,
s.to_status AS status_at,
row_number() OVER (PARTITION BY u.id ORDER BY g.date) AS rownum
FROM users u
JOIN generate_dates g ON
g.date > u.created_at - interval '1 day'
LEFT JOIN user_status_changes s ON
u.id = s.user_id
AND s.created_at BETWEEN g.date AND g.date + interval '1 day'
)
SELECT
*,
LAG(status_at) OVER (PARTITION BY user_id ORDER BY date) AS previous_status
FROM (
SELECT
DISTINCT ON ( b1.user_id, b1.date )
b1.user_id,
b1.date,
COALESCE(b1.status_at, b2.status_at) AS status_at
FROM basic_status b1
LEFT JOIN basic_status b2 ON
b1.user_id = b2.user_id
AND b1.status_at IS NULL
AND b2.status_at IS NOT NULL
AND b1.rownum > b2.rownum
ORDER BY b1.user_id, b1.date DESC, b2.rownum DESC
) foo;
您可以创建以下索引来加快速度:
用户(id)
user_status_changes(user_id, created_at
)users(created_at)
- 这个可能没那么重要请记住使用ANALYZE table
更新您的统计信息以更准确地估算成本。
关于sql - 从状态变化历史中获取每天的用户状态,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39512688/
嘿伙计们。 实现背景变化(基本上是幻灯片放映)和过渡效果的常见方法有哪些。我想每隔一段时间改变complte文档背景。 我是一名 ASP.net 开发人员,并且希望大部分内容都可以在 ASP 中实现。
也许,指针已经在修改过程中指向 auto_ptr 的常规指针指向 unique_ptr 和 shared_ptr 我只是想知道已经开发出来的新型指针是否完全覆盖了旧版本(或者您可能认为存在内存泄漏问题
我使用 Android Studio 构建 Android 应用。 我的问题是:当 fragment 改变时,应用程序崩溃。 控制台输出[控制台] 01-06 18:35:21.952 27756-
****澄清**我做了这个 [Fiddle] ( http://jsfiddle.net/sggPv/10/ ) 来帮助澄清情况。 该脚本起初适用于两个表格,但随后当您点击 slider 并将新表格加
我有图标,单击它会将新的 div(列)添加到 div 容器。问题是,当新的 div(列)出现时,按钮不会向右移动。是否可以以某种方式仅在 div 内添加 position:fixed? 这是我的几个屏
我是 Java 新手,继承了现有的 Android 应用程序。原始开发人员选择使用常量接口(interface)。 我的问题是我需要更改其中一些常量来编译生产应用程序与开发应用程序。如果我手动修改一些
在 Apple developer Document 中,我在 UIColor 中发现了一些新东西。 If your app was linked on or after iOS 10 and whe
我没有经常使用 ShareKit,但我只想拥有三个共享选项:Facebook、Twitter 和电子邮件。 ShareKit 提供了更多选项,包括更多按钮。但是,我不想要“更多”选项,只想要三个。 在
我正在构建一个 JS 库,其中一个用例要求我在 DOM 更改时触发一个事件,特别是如果它是一个单页应用程序,例如:github search bar 经过一番研究,我遇到了MutationObserv
我已经设法编写了一个代码来检测任何工作表中特定单元格的值变化,但我一直在努力构建检测和跟踪范围(值)变化的东西。 例如,如果用户决定复制和粘贴某个范围的数据(假设超过 1 个单元格),它不会被宏捕获。
使用 ffmpeg ,我们可以对音频电平进行多少控制?例如,我想在程序的时间轴上映射一个“M”形: t0 - t1 : fade in from 0 to 1 t1 - t2 : play at fu
使用 jQuery 1.7.1,我尝试为下拉列表上的更改事件创建一个事件处理程序。下拉列表会动态添加到 DOM 中。似乎在大多数浏览器上都能很好地工作,但是哦,奇怪的 IE8 想要变得困难。有解决方法
我想制作一个具有可选边框大小的自定义控件。请参阅下面的代码。边框绘制在非客户区,其宽度可以是 0、1 或 2 像素。我已经在 WM_NCPAINT 中成功完成了边框绘制。问题是,在更改控制边框大小的属
我知道这个问题之前已经被问过,而且我实际上已经找到了一些我已经实现的解决方案。不幸的是,我没能得到我想要的。 我以前没有做过AngularJS,我想做的是: 检测网址何时更改 根据网址更改的内容进行一
我有一个 auto-carousel 指令,它循环访问链接元素的子元素。 但是,子级尚未加载到 DOM 中,因为它们的 ng-if 表达式尚未解析。 如何确保父指令知道其 DOM 树已发生更改?
我有一个流程可以通过内容提供商从数据库中获取数据。 fun getDataFlow(): Flow { return flow { emit(Result.Loading)
我有一些有效的代码,但有时它只是“跳转”到其他文本而不考虑间隔。 该代码基本上按时间间隔更改标题的文本。 var text = ["text1", "text2", "text3","text4","
我正在尝试将 onCLick 监听器添加到我的 PreferenceScreen 上的开关,但它不起作用。我尝试了 Java 教程中的代码并将其转换为 Kotlin,但由于某种原因它无法正常工作。 这
我们目前正在尝试升级我们的程序使用的 ffmpeg 版本。跳跃很大,因为我们目前使用的是 ffmpeg 0.8,最新版本是 1.2。 在这些测试中,我使用的是(让我说)我发现的令人惊叹的软件包 her
我有一个流程可以通过内容提供商从数据库中获取数据。 fun getDataFlow(): Flow { return flow { emit(Result.Loading)
我是一名优秀的程序员,十分优秀!