- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们的应用程序中有一个用例,我们首先将一个 csv 文件复制到一个staging 表 - 然后将经过验证的数据插入第二个表 participants。新创建的参与者 ID(主键)随后会在 staging 表中更新以供进一步处理。
在我们的应用程序中,我们经常遇到性能问题。有时此过程可在 15-20 秒内处理 100 000 行。有时它永远不会在正常时间内完成(pg_cancel_backend 来拯救)。
当我尝试创建一个非常有值(value)的最小测试用例时,我无法重现问题:/。因此,这是尝试获得一些建议,了解如何进一步调试或重写底层查询。
我们用 CTE 来做这件事——基本上是这样的:
WITH inserted_participants AS (
INSERT INTO participants (email, project_id, survey_token, participant_uname)
SELECT
staging.email,
1,
staging.generated_token,
staging.email -- is used as uname
FROM
staging
RETURNING
participants.participant_id,
participants.participant_uname
) -- Update existing staging data with newly created participant_id
UPDATE
staging AS stage_update
SET
resulting_participant_id = inserted_participants.participant_id
FROM
inserted_participants
WHERE stage_update.email = inserted_participants.participant_uname;
再次声明:我无法重现此测试用例的性能问题。我怀疑它与 CTE 有关。
这是否可以在不使用 CTE 的情况下重写,并且仍然可以安全地返回新创建的行并在暂存表中更新这些行?
这是最小测试用例的表结构:
CREATE EXTENSION IF NOT EXISTS citext;
CREATE EXTENSION IF NOT EXISTS "pgcrypto";
DROP TABLE IF EXISTS public.staging;
CREATE TABLE public.staging
(
staging_id serial,
email citext COLLATE pg_catalog."default",
generated_token character varying(255) COLLATE pg_catalog."default",
resulting_participant_id integer,
CONSTRAINT staging_pkey PRIMARY KEY (staging_id),
CONSTRAINT unique_generated_token UNIQUE (generated_token)
);
CREATE INDEX ON public.staging (email);
CREATE INDEX ON public.staging (generated_token);
DROP TABLE IF EXISTS public.participants;
CREATE TABLE public.participants
(
participant_id serial,
email citext COLLATE pg_catalog."default" NOT NULL,
project_id integer NOT NULL,
survey_token character varying(255) COLLATE pg_catalog."default" NOT NULL,
participant_uname citext COLLATE pg_catalog."default" NOT NULL,
CONSTRAINT participants_pkey PRIMARY KEY (participant_id),
CONSTRAINT participants_participant_uname_project_id_key UNIQUE (participant_uname, project_id),
CONSTRAINT participants_project_id_email_key UNIQUE (project_id, email),
CONSTRAINT participants_project_id_participant_uname_key UNIQUE (project_id, participant_uname),
CONSTRAINT participants_survey_token_key UNIQUE (survey_token)
);
CREATE INDEX ON public.participants (participant_uname);
CREATE INDEX ON public.participants (project_id);
以及我使用的虚拟数据:
INSERT INTO
staging (staging_id, email, generated_token)
SELECT
generate_series(1,100000),
gen_random_uuid()::citext,
gen_random_uuid()::TEXT;
最佳答案
你应该首先确定你是否被锁住了。 pg_locks
是否包含具有长时间运行的后端进程 ID 和 granted = FALSE
的行?
如果不是这样,找到瓶颈。后端进程是否使 CPU 饱和?您的 I/O 子系统是否一直很忙?
您还应该使用 EXPLAIN
来检查执行计划。有什么可疑的东西可以解释持续时间吗?
在完成查询的较小数据集上测试查询会非常有帮助。这将使您能够运行 EXPLAIN (ANALYZE, BUFFERS)
,这是调试查询的最佳起点。不过,请先检查您是否有相同的执行计划。
索引可以大大减慢数据修改的速度。你有很多吗?通常,在批量更新之前删除所有索引和约束并在之后重新创建它们是最快的。
关于postgresql - 使用 CTE 调试性能问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52576730/
是否可以在 CTE 内编写 CTE? 我希望它遵循这个逻辑,但解释器不喜欢这段代码。 with outertest as( with test as ( select
我有一个 with 子句,按时间间隔和天气描述对一些天气数据进行分组: With temp_table (counter, hour, current_Weather_description) as
我想要一个普通的 CTE,然后是一个递归的 CTE 如何将这两者结合起来? 我知道我可以做多个纯正常的 CTE WITH CTE1 AS( ), CTE2 AS(),... 所以我试过了 WITH C
在 SQL 中是否可以在同一查询中的另一个 C.T.E 内的公共(public)表表达式内使用引用?这里有一个例子: WITH CT1 AS (SELECT * FROM T), CT2 A
请不要将此问题标记为 CTE within a CTE 的重复项..我检查了那个问题和答案……但那个答案不能满足我的需要。 我想像这样运行嵌套 CTE 查询 Drop Table #Temp Crea
在 jOOQ 中,我在以后的 CTE 中重复使用 CTE。我正在尝试按年份和学校汇总学生的完成记录。我正在使用 jOOQ 3.11.2 和 postgres 9.4。 我有有效的 SQL 代码。但是在
我需要根据最新的时间戳更新 CTE o/p 列值之一(前 1 条记录),然后返回。 查询 WITH cte AS ( select dt_zone.zone_name, dt_mate
我的 CTE 出现错误。我在 Amazon RDS 上托管数据库。我的计算机上有另一个示例数据库主机 (localhost)。 CTE 在我的本地计算机上运行良好。我认为 Amazon RDS 有问题
我正在使用 SQL Server 进行分页,我想通过计算结果总数作为我的部分结果集的一部分来避免重复,而不是获取该结果集然后执行单独的查询以获取计数。然而,麻烦的是,它似乎增加了执行时间。例如,如果我
我想(使用 cte)以这种方式计算表中的 child 数量,以在 parent 级别所有 child 的数量包括他们的 child 。有 sample 吗? 最佳答案 CREATE TABLE t_p
鉴于以下递归 CTE(在我的示例中简化了一点): WITH myCTE (sort, parentid, myid, level, somedata) AS ( -- Anchor membe
我有一张带有自连接的表。您可以将结构视为表示组织层次结构的标准表。例如表:- MemberId MemberName RelatedMemberId 该表由 50000 条样本记录组成。我写了 CTE
我正在尝试将公用表表达式加入现有表 (table1),如下所示。 select column1, column2 from table1 left outer join ;with cte as
我可以在标量函数中使用公用表表达式(CTE) 吗? 我试图用它来获取单个浮点值,但始终为空 这是我计算每位员工总工作时间的函数代码: ALTER FUNCTION GetTotalWorkingHou
我可以在分层数据模型中找到给定记录的所有子项(请参阅下面的代码),但我不确定如何使用给定的子 ID 遍历备份父/子链。谁能指出我正确的方向来弄清楚如何做到这一点?这在 Linq to SQL 中也可能
我在这里遇到了一点困难。我的主要目标是能够在 C# 和 Entity Framework 中使用它,而我们的高层指令是远离存储过程。 我有 2 个表:一个外部参照和一个 (Celko) 树表。 /**
尝试运行此 cte 时出现以下错误 Invalid Object Name 'cte' 使用以下 CTE 语句时出错 WITH cte (LOC_ID, [Description], LOC_TYPE
我正在阅读“Murach 的 SQL Server 2016 for Developers”一书中的示例。该示例说明了如何在 SQL 中编写递归 CTS 代码。我非常了解递归函数(在 C# 中),但我
我有一个相当复杂的查询,其中包含多个 CTE,但有 1 个主 CTE,其他所有 CTE 都从中提取,这是否会导致该主 CTE 被执行多次? 最佳答案 您可以这样使用 CROSS JOIN: SELEC
我正在尝试编写一个递归 CTE,它引用另一个在它之前编写的 CTE。 第一个 cte nodes 在编写递归 Hierarchy cte 之前我用分号关闭了: WITH nodes(node, nod
我是一名优秀的程序员,十分优秀!