performance - PostgreSQL - 在 VIEW 上加入慢速查询-6ren

performance - PostgreSQL - 在 VIEW 上加入慢速查询

转载作者：行者123 更新时间：2023-11-29 11:25:12

我正在尝试在表(玩家)和 View (player_main_colors)之间做一个简单的连接:

SELECT P.*, C.main_color FROM players P
    OUTER LEFT JOIN player_main_colors C USING (player_id)
    WHERE P.user_id=1;

此查询耗时约 40 毫秒。

这里我在 VIEW 上使用嵌套的 SELECT 而不是 JOIN:

SELECT player_id, main_color FROM player_main_colors
    WHERE player_id IN (
        SELECT player_id FROM players WHERE user_id=1);

此查询也需要大约 40 毫秒。

当我将查询分成两部分时，它变得如我预期的那样快:

SELECT player_id FROM players WHERE user_id=1;

SELECT player_id, main_color FROM player_main_colors
    where player_id in (584, 9337, 11669, 12096, 13651,
        13852, 9575, 23388, 14339, 500, 24963, 25630,
        8974, 13048, 11904, 10537, 20362, 9216, 4747, 25045);

这些查询每次大约需要 0.5 毫秒。

那么，为什么上述使用 JOIN 或 sub-SELECT 的查询速度如此之慢，我该如何解决？

以下是有关我的表和 View 的一些详细信息:

CREATE TABLE users (
    user_id INTEGER PRIMARY KEY,
    ...
)

CREATE TABLE players (
    player_id INTEGER PRIMARY KEY,
    user_id INTEGER NOT NULL REFERENCES users (user_id),
    ...
)

CREATE TABLE player_data (
    player_id INTEGER NOT NULL REFERENCES players (player_id),
    game_id INTEGER NOT NULL,
    color INTEGER NOT NULL,
    PRIMARY KEY (player_id, game_id, color),
    active_time INTEGER DEFAULT 0,
    ...
)

CREATE VIEW player_main_colors AS
    SELECT DISTINCT ON (1) player_id, color as main_color
        FROM player_data
        GROUP BY player_id, color
        ORDER BY 1, MAX(active_time) DESC

看来一定是我的VIEW有问题...？

下面是上面嵌套的 SELECT 查询的 EXPLAIN ANALYZE:

Merge Semi Join  (cost=1877.59..2118.00 rows=6851 width=8) (actual time=32.946..38.471 rows=25 loops=1)
   Merge Cond: (player_data.player_id = players.player_id)
   ->  Unique  (cost=1733.19..1801.70 rows=13701 width=12) (actual time=32.651..37.209 rows=13419 loops=1)
         ->  Sort  (cost=1733.19..1767.45 rows=13701 width=12) (actual time=32.646..34.918 rows=16989 loops=1)
               Sort Key: player_data.player_id, (max(player_data.active_time))
               Sort Method: external merge  Disk: 376kB
               ->  HashAggregate  (cost=654.79..791.80 rows=13701 width=12) (actual time=13.636..19.051 rows=17311 loops=1)
                     ->  Seq Scan on player_data  (cost=0.00..513.45 rows=18845 width=12) (actual time=0.005..1.801 rows=18845 loops=1)
   ->  Sort  (cost=144.40..144.53 rows=54 width=8) (actual time=0.226..0.230 rows=54 loops=1)
         Sort Key: players.player_id
         Sort Method: quicksort  Memory: 19kB
         ->  Bitmap Heap Scan on players  (cost=4.67..142.85 rows=54 width=8) (actual time=0.035..0.112 rows=54 loops=1)
               Recheck Cond: (user_id = 1)
               ->  Bitmap Index Scan on test  (cost=0.00..4.66 rows=54 width=0) (actual time=0.023..0.023 rows=54 loops=1)
                     Index Cond: (user_id = 1)
 Total runtime: 39.279 ms

至于索引，除了我的主键的默认索引之外，我只有 1 个相关索引:

CREATE INDEX player_user_idx ON players (user_id);

我目前使用的是 PostgreSQL 9.2.9。

更新:

我已经减少了下面的问题。查看 IN (4747) 和 IN (SELECT 4747) 之间的区别。

慢:

>> explain analyze SELECT * FROM (
          SELECT player_id, color 
            FROM player_data
            GROUP BY player_id, color
            ORDER BY MAX(active_time) DESC
       ) S
       WHERE player_id IN (SELECT 4747);

 Hash Join  (cost=1749.99..1975.37 rows=6914 width=8) (actual time=30.492..34.291 rows=4 loops=1)
   Hash Cond: (player_data.player_id = (4747))
   ->  Sort  (cost=1749.95..1784.51 rows=13827 width=12) (actual time=30.391..32.655 rows=17464 loops=1)
         Sort Key: (max(player_data.active_time))
         Sort Method: external merge  Disk: 376kB
         ->  HashAggregate  (cost=660.71..798.98 rows=13827 width=12) (actual time=12.714..17.249 rows=17464 loops=1)
               ->  Seq Scan on player_data  (cost=0.00..518.12 rows=19012 width=12) (actual time=0.006..1.898 rows=19012 loops=1)
   ->  Hash  (cost=0.03..0.03 rows=1 width=4) (actual time=0.007..0.007 rows=1 loops=1)
         Buckets: 1024  Batches: 1  Memory Usage: 1kB
         ->  HashAggregate  (cost=0.02..0.03 rows=1 width=4) (actual time=0.006..0.006 rows=1 loops=1)
               ->  Result  (cost=0.00..0.01 rows=1 width=0) (actual time=0.001..0.001 rows=1 loops=1)
 Total runtime: 35.015 ms
(12 rows)

Time: 35.617 ms

快速:

>> explain analyze SELECT * FROM (
          SELECT player_id, color 
            FROM player_data
            GROUP BY player_id, color
            ORDER BY MAX(active_time) DESC
       ) S
       WHERE player_id IN (4747);

 Subquery Scan on s  (cost=17.40..17.45 rows=4 width=8) (actual time=0.035..0.035 rows=4 loops=1)
   ->  Sort  (cost=17.40..17.41 rows=4 width=12) (actual time=0.034..0.034 rows=4 loops=1)
         Sort Key: (max(player_data.active_time))
         Sort Method: quicksort  Memory: 17kB
         ->  GroupAggregate  (cost=0.00..17.36 rows=4 width=12) (actual time=0.020..0.027 rows=4 loops=1)
               ->  Index Scan using player_data_pkey on player_data  (cost=0.00..17.28 rows=5 width=12) (actual time=0.014..0.019 rows=5 loops=1)
                     Index Cond: (player_id = 4747)
 Total runtime: 0.080 ms
(8 rows)

Time: 0.610 ms

最佳答案

您的 VIEW 定义中同时包含 GROUP BY 和 DISTINCT ON。这就像开枪打死人。简化:

CREATE VIEW player_main_colors AS
SELECT DISTINCT ON (player_id)
       player_id, color AS main_color
FROM   player_data
ORDER  BY player_id, active_time DESC NULLS LAST;

NULLS LAST 必须等同于您的原始数据，因为根据您的表定义，active_time 可以为 NULL。应该更快。但还有更多。为了获得最佳性能，请创建这些索引:

CREATE INDEX players_up_idx ON players (user_id, player_id);
CREATE INDEX players_data_pa_idx ON player_data
    (player_id, active_time DESC NULLS LAST, color);

使用DESC NULLS LAST in the index以及匹配查询的排序顺序。或者您将 player_data.active_time 列声明为 NOT NULL 并简化所有内容。

是LEFT OUTER JOIN不是 ~~OUTER LEFT JOIN~~ - 或者只是省略干扰词 OUTER:

SELECT *  -- equivalent here to "p.*, c.main_color"
FROM   players p
LEFT   JOIN player_main_colors c USING (player_id)
WHERE  p.user_id = 1;

我假设每个 player_id 在 player_data 中有很多行。而您只选择了几个 player_id。 JOIN LATERAL 对于这种情况是最快的，但是你需要 Postgres 9.3 或更高版本。在 pg 9.2 中，您可以使用相关子查询 实现类似的效果:

CREATE VIEW player_main_colors AS
SELECT player_id
    , (SELECT color 
       FROM   player_data
       WHERE  player_id = p.player_id
       ORDER  BY active_time DESC NULLS LAST
       LIMIT  1) AS main_color
FROM   players p
ORDER  BY 1;  -- optional

与您的原始 View 有细微差别:这包括 player_data 中没有任何条目的玩家。您可以根据新 View 尝试与上面相同的查询。但我根本不会使用 View 。这可能是最快:

SELECT *
    , (SELECT color 
       FROM   player_data
       WHERE  player_id = p.player_id
       ORDER  BY active_time DESC NULLS LAST
       LIMIT  1) AS main_color
FROM   players p
WHERE  p.user_id = 1;

详细解释:

Optimize GROUP BY query to retrieve latest row per user

关于performance - PostgreSQL - 在 VIEW 上加入慢速查询，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28131205/

文章推荐： json - Bookshelf.js 哪里有 json 列 Postgresql

文章推荐： mysql - 带有条件的多个 WHERE 子句

文章推荐： mysql - 如何避免在 MySQL 中导致对称结果的自连接？

文章推荐： sql-server - SQL Server 和 PostgreSQL 之间的 MD5 值不匹配

view - Laravel View 无法调用子文件夹 View
我在尝试从子文件夹调用 View 时遇到一些错误。首先，这东西能用 Route::get('/', function() { return View::make('sample'); }); 但是当我
mvvm - 显示当前 View 模型中的另一个 View 并关闭 View 模型中的 View ？
我有另一个 View 设置，并准备好等待其viewmodel。我的RelayCommand到达我的“当前” View 模型。从当前的 View 模型显示新 View 的最佳方法是什么？我一直在阅读，
view - 如何共享从其他数据集中查询其他 View 的授权 BigQuery View ？
我有一个 bigquery View ，我想与数据分析师共享，以便他们可以通过 Data Studio 访问其数据。此共享 View 对另一个数据集中的私有(private) View 进行查询，而私
view - Jenkins - 将 View 移入 View
我有 3 个 View ，并希望将它们集成到一个 View 中，以便它们成为这一 View 中的子文件夹。我怎样才能做到这一点？还是我必须制作一个 View ，然后再次手动添加和配置这些 View
views - ouchdb View ，该 View 在数组字段中搜索作为键数组传入的值
我在沙发数据库中有一些文档，这些文档的字段是不同关联文档的ID数组: { associatedAssets: ["4c67f6241f4a0efb7dc2abc24a004dfe", "270f
wpf - 共同的共享 View 。 View + View 模型或用户控件？
我正在开发一个小实用程序 View ，它将嵌入到我们的几个应用程序中。它将位于一个公共(public)图书馆中。我应该将其作为 ViewModel 以及默认的 View 实现公开，还是作为具有固定
c# - 如果不同的 View 共享同一 View 模型，如何从 View 模型中选择 View
由于我的某些 View 具有相似的功能，因此我希望能够与每个 View 共享相同的 View 模型。我的想法是将 token 传递给viewmodel的构造函数，但这将导致代码中出现许多if和else
swift - View 旋转后移动 View ， View 中触摸位置错误
我有一个目标 View (蓝色 View 和红色 View 用于左上角位置)。我试图用手指移动这个 View 。如果 View 不旋转，一切都很好。但当我旋转 View 并移动时，第一次就很好了。但
android - 尝试在空对象引用上调用虚拟方法 'android.view.View android.view.View.getRootView()'
我收到这个错误， "Attempt to invoke virtual method 'android.view.View android.view.View.getRootView()' on a
wpf - 使用数据模板将 View 与 View 模型相关联时，如何动画化从一个 View 到另一个 View 的过渡
我将发布我目前拥有的源代码，然后解释我的问题。这是我希望过渡发生的窗口这是关联的 View 模型 public class MainViewModel {
iphone - self.view = someController.view 与 [self.view addSubview :someController. view]
我正在尝试找出我遇到的错误。最初，我的同事只是使用将 View 添加到 subview 中 [self.view addSubview:someController.view]; 来自当前ViewC
wpf - MVVM:所有 View 的一个 View 模型结构与每个 View 单独的 View 模型结构？
我是 MVVM 的新手，需要一些帮助。我的应用程序由许多不同的窗口组成，这些窗口显示允许用户编辑业务层中的数据的控件。目前，每次用户打开这些窗口之一的新实例时，都会从头开始创建一个 ViewMod
java - 尝试在空对象引用上调用虚拟方法 'android.view.View android.view.View.findViewById(int)'
我一直在寻找与我类似的问题以找到解决方案，但我真的找不到类似的东西。我试图使用 asynctask 类从解析中下载帖子数组，在获取帖子后，它应该在我的页面中设置帖子数组，并执行 setAdapter
java - EJB View (本地 View 、远程 View 、无接口(interface) View )的含义是什么
这个问题在这里已经有了答案: What is local/remote and no-interface view in EJB? (2 个答案) 关闭 9 年前。我以前理解它的意思是“接口(in
ios - 我如何在堆栈 View 中找到 View 的 super View /父 View Controller
希望这不会太困惑。我有一个主视图 Controller ( MainView )，在 View 底部有一个堆栈 View ，在堆栈 View 中我有三个 View 。在一个 View 中(我们称之为
iPhone 如何将 View Controller 的 View 添加到另一个 View Controller 的 View ？
我一直在想这个问题，我真的不知道如何正确地将一个 View Controller 管理的 View 添加到另一个 View Controller 的 View 中。这不起作用，因为 View 没有完
view - 是否有任何简单的方法可以将特定文件从一个 View 复制到另一个 View 中的 clearcase？
在明显的情况下，我必须将大量文件从一个 View 复制到另一个 View 。要复制的文件名将作为输入给出。有什么想法可以通过脚本实现吗？谢谢，日语最佳答案最简单的方法是使用 clearfsimp
jquery - 如何在完整日历中查找月 View 或周 View 或日 View
我正在使用完整日历。这里我的问题是，当单击上一个按钮或下一个按钮单击功能时，如何找到月 View 、周 View 或日 View 格式的完整日历。这里正在调用下一个和上一个按钮的自定义代码。因为使用这
sql - View 与索引 View 或物化 View 的区别
我对这两者感到困惑，并试图找出差异，但没有得到我正在寻找的特定内容。在哪里使用索引 View 而不是普通 View 。它们之间的一些重要区别。最佳答案关键的区别在于物化 View 很好，物化了
cocoa - 在单个自定义 View 中将一个 View 切换到另一个 View
我在一个 xib 中有一个 CustomView，在两个不同的 xib 中有两个不同的 View 。我想在一个 CustomeView 中依次显示这两个 View 。我有一个 NSView 对象，它连

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

performance - PostgreSQL - 在 VIEW 上加入慢速查询