- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
使用 PG 9.5,我有一个查询将 rubber
表的 FK 列连接到 fuzzy
表的主要 id
列。两列都使用标准 btree 索引进行索引。 rubber
表行数超过230MM,fuzzy
表行数超过25MM。当我对这些表进行连接并在 fuzzy
中对列应用约束时,PG 在连接中继续使用顺序扫描,查询大约需要 2 分钟。
SELECT * FROM rubber r
JOIN fuzzy fp ON fp.id = r.fuzzy_id
WHERE fp.bean_num IN (73470871);
我已将其缩小为连接,即查询中顺序的、缓慢的部分。即,以下非常快,并使用索引:
SELECT * FROM rubber WHERE fuzzy_id = 12345
但是当我尝试这样的事情时,它和上面的 JOIN 查询一样慢:
SELECT * FROM rubber WHERE fuzzy_id IN (
SELECT id FROM fuzzy WHERE bean_num IN (73470871)
);
我怀疑这与查询规划器在尝试匹配某些外键集时无法(决定不?)使用索引有关。外键不是唯一的,但不是高度重复的,并且没有一个设置为空,所以我无法利用部分索引之类的东西。
-- 231MM rows
CREATE TABLE rubber (
id bigint DEFAULT nextval('rubber_id_seq1'::regclass) PRIMARY KEY,
context_id integer NOT NULL REFERENCES context(id) ON DELETE CASCADE,
fuzzy_id integer REFERENCES fuzzy(id),
);
CREATE UNIQUE INDEX rubber_pkey1 ON rubber(id int8_ops);
CREATE INDEX rubber_context_id_idx1 ON rubber(context_id int4_ops);
CREATE INDEX rubber_fingerprint_id_idx1 ON rubber(fingerprint_id int4_ops);
CREATE INDEX rubber_conclusion_id_idx1 ON rubber(conclusion_id int4_ops);
CREATE UNIQUE INDEX rubber_id_idx ON rubber(id int8_ops);
CREATE INDEX rubber_fuzzy_id_idx1 ON rubber(fuzzy_id int4_ops);
-- 26.5MM rows
CREATE TABLE fuzzy (
id SERIAL PRIMARY KEY,
trip_id integer NOT NULL REFERENCES trip(id),
device_id integer NOT NULL REFERENCES device(id),
chirp_vision_id integer NOT NULL REFERENCES chirp_vision(id),
mode_id integer NOT NULL REFERENCES mode(id),
fig_id integer NOT NULL REFERENCES fig(id),
gist_id integer NOT NULL REFERENCES gist(id),
bean_num integer REFERENCES bean_num(id),
key_path jsonb NOT NULL,
CONSTRAINT fingerprint_tuple UNIQUE (chirp_vision_id, gist_id, key_path, trip_id, fig_id, device_id, mode_id)
);
CREATE UNIQUE INDEX fuzzy_pkey ON fuzzy(id int4_ops);
CREATE INDEX fuzzy_fig_id_idx ON fuzzy(fig_id int4_ops);
CREATE INDEX fuzzy_gist_id_idx ON fuzzy(gist_id int4_ops);
CREATE INDEX fuzzy_bean_num_idx ON fuzzy(bean_num int4_ops);
CREATE UNIQUE INDEX fingerprint_tuple ON fuzzy(chirp_vision_id int4_ops,gist_id int4_ops,key_path jsonb_ops,trip_id int4_ops,fig_id int4_ops,device_id int4_ops,mode_id int4_ops);
解释(缓冲区,分析)
:"QUERY PLAN"
"Hash Join (cost=5288.99..6339911.22 rows=15277 width=189) (actual time=82319.995..136625.784 rows=483 loops=1)"
" Hash Cond: (r.fuzzy_id = fp.id)"
" Buffers: shared hit=599 read=3151247"
" -> Seq Scan on rubber r (cost=0.00..5466479.88 rows=231463888 width=80) (actual time=0.078..117561.885 rows=231463887 loops=1)"
" Buffers: shared hit=597 read=3151244"
" -> Hash (cost=5267.11..5267.11 rows=1750 width=109) (actual time=2.251..2.251 rows=23 loops=1)"
" Buckets: 2048 Batches: 1 Memory Usage: 20kB"
" Buffers: shared hit=2 read=3"
" -> Index Scan using fuzzy_bean_num_idx on fuzzy fp (cost=0.44..5267.11 rows=1750 width=109) (actual time=2.220..2.244 rows=23 loops=1)"
" Index Cond: (bean_num = 73470871)"
" Buffers: shared hit=2 read=3"
"Planning time: 0.382 ms"
"Execution time: 136625.875 ms"
有没有办法从这样的查询中获得更好的性能?
dba stack exchange comment 中也有一个有趣的评论,建议在 (fuzzy_id, bean_num) 上建立索引会有帮助,但我不明白这有什么帮助。
更新:我已经迁移到 PG 12.3,这个查询现在可以在几百毫秒内运行。
最佳答案
问题:为什么要在 rubber.id 上创建 2 个(几乎)相同的索引:
CREATE UNIQUE INDEX rubber_pkey1 ON rubber(id int8_ops);
CREATE UNIQUE INDEX rubber_id_idx ON rubber(id int8_ops);
建议:DROP INDEX rubber_id_idx;
一个可能对 JOIN 非常有用的索引,可以为计划者提供有关这些表之间关系的更好信息,是这个:
CREATE INDEX fuzzy_bean_num_idx_2 ON fuzzy(bean_num, id);
您可能需要对 statistics 的数量进行不同(更好)的设置。以及。也许只是一张 table ,也许两张 table ,也许是整个系统。
编辑:更改统计信息设置后,您必须为这些表运行ANALYZE
以更新统计信息。
Offtopic:9.5 版本已经过时,将在未来几个月内停产。较新版本的行为确实有所不同,也可能会解决此性能问题。
关于postgresql - 为什么 Postgres 在我的 JOIN 子句中使用顺序扫描?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66020370/
我在网上搜索但没有找到任何合适的文章解释如何使用 javascript 使用 WCF 服务,尤其是 WebScriptEndpoint。 任何人都可以对此给出任何指导吗? 谢谢 最佳答案 这是一篇关于
我正在编写一个将运行 Linux 命令的 C 程序,例如: cat/etc/passwd | grep 列表 |剪切-c 1-5 我没有任何结果 *这里 parent 等待第一个 child (chi
所以我正在尝试处理文件上传,然后将该文件作为二进制文件存储到数据库中。在我存储它之后,我尝试在给定的 URL 上提供文件。我似乎找不到适合这里的方法。我需要使用数据库,因为我使用 Google 应用引
我正在尝试制作一个宏,将下面的公式添加到单元格中,然后将其拖到整个列中并在 H 列中复制相同的公式 我想在 F 和 H 列中输入公式的数据 Range("F1").formula = "=IF(ISE
问题类似于this one ,但我想使用 OperatorPrecedenceParser 解析带有函数应用程序的表达式在 FParsec . 这是我的 AST: type Expression =
我想通过使用 sequelize 和 node.js 将这个查询更改为代码取决于在哪里 select COUNT(gender) as genderCount from customers where
我正在使用GNU bash,版本5.0.3(1)-发行版(x86_64-pc-linux-gnu),我想知道为什么简单的赋值语句会出现语法错误: #/bin/bash var1=/tmp
这里,为什么我的代码在 IE 中不起作用。我的代码适用于所有浏览器。没有问题。但是当我在 IE 上运行我的项目时,它发现错误。 而且我的 jquery 类和 insertadjacentHTMl 也不
我正在尝试更改标签的innerHTML。我无权访问该表单,因此无法编辑 HTML。标签具有的唯一标识符是“for”属性。 这是输入和标签的结构:
我有一个页面,我可以在其中返回用户帖子,可以使用一些 jquery 代码对这些帖子进行即时评论,在发布新评论后,我在帖子下插入新评论以及删除 按钮。问题是 Delete 按钮在新插入的元素上不起作用,
我有一个大约有 20 列的“管道分隔”文件。我只想使用 sha1sum 散列第一列,它是一个数字,如帐号,并按原样返回其余列。 使用 awk 或 sed 执行此操作的最佳方法是什么? Accounti
我需要将以下内容插入到我的表中...我的用户表有五列 id、用户名、密码、名称、条目。 (我还没有提交任何东西到条目中,我稍后会使用 php 来做)但由于某种原因我不断收到这个错误:#1054 - U
所以我试图有一个输入字段,我可以在其中输入任何字符,但然后将输入的值小写,删除任何非字母数字字符,留下“。”而不是空格。 例如,如果我输入: 地球的 70% 是水,-!*#$^^ & 30% 土地 输
我正在尝试做一些我认为非常简单的事情,但出于某种原因我没有得到想要的结果?我是 javascript 的新手,但对 java 有经验,所以我相信我没有使用某种正确的规则。 这是一个获取输入值、检查选择
我想使用 angularjs 从 mysql 数据库加载数据。 这就是应用程序的工作原理;用户登录,他们的用户名存储在 cookie 中。该用户名显示在主页上 我想获取这个值并通过 angularjs
我正在使用 autoLayout,我想在 UITableViewCell 上放置一个 UIlabel,它应该始终位于单元格的右侧和右侧的中心。 这就是我想要实现的目标 所以在这里你可以看到我正在谈论的
我需要与 MySql 等效的 elasticsearch 查询。我的 sql 查询: SELECT DISTINCT t.product_id AS id FROM tbl_sup_price t
我正在实现代码以使用 JSON。 func setup() { if let flickrURL = NSURL(string: "https://api.flickr.com/
我尝试使用for循环声明变量,然后测试cols和rols是否相同。如果是,它将运行递归函数。但是,我在 javascript 中执行 do 时遇到问题。有人可以帮忙吗? 现在,在比较 col.1 和
我举了一个我正在处理的问题的简短示例。 HTML代码: 1 2 3 CSS 代码: .BB a:hover{ color: #000; } .BB > li:after {
我是一名优秀的程序员,十分优秀!