sql - 每周总计唯一序列号-6ren

sql - 每周总计唯一序列号

转载作者：行者123 更新时间：2023-12-04 14:53:51

27

4

我正在尝试编写一个查询来搜索我的数据库并每周查找设备的唯一序列号总数。我当前的代码是:

SELECT date_part('week', "timestamp") , count(DISTINCT serialno) 
FROM eddi_minute em 
GROUP BY date_part('week', "timestamp")

不幸的是，我正在搜索的数据集很大 (~600Gb)，因此搜索时间非常长。我希望能够每周搜索一次，每周搜索一次很短的时间，即 1 分钟 a.k.a.

select count(distinct serialno) as Devices
        from eddi_minute em where "timestamp" >= '2021-06-23 00:01:00' and "timestamp" < '2021-06-23 00:02:00';

但是对于一整年的每个星期，这样我就可以按一次回车键，它会为整个数据库执行此操作，以避免不必要的计数。

在理想情况下，我的想法是创建一个我要搜索的时间表，然后用它和我的数据库进行左连接以减少我正在搜索的数据，但我只有读取权限到服务器，所以这不是一个选项。有没有简单的方法可以做到这一点？抱歉，如果这里有任何不清楚的地方，如果有任何地方没有得到正确解释，我会详细说明。

表的索引是

CREATE UNIQUE INDEX "PK_4c94f05e4de575488f4a0c2905d" ON ONLY public.eddi_minute USING btree (serialno, "timestamp")

解释分析结果是:

GroupAggregate  (cost=41219561.55..90787854.96 rows=200 width=16) (actual time=7065790.406..8172419.446 rows=53 loops=1)
  Group Key: (date_part('week'::text, em."timestamp"))
  ->  Gather Merge  (cost=41219561.55..88747442.16 rows=408082059 width=16) (actual time=7052726.256..7834672.575 rows=408057194 loops=1)
        Workers Planned: 2
        Workers Launched: 2
        ->  Sort  (cost=41218561.53..41643646.99 rows=170034187 width=16) (actual time=6956066.331..7201252.404 rows=136019065 loops=3)
              Sort Key: (date_part('week'::text, em."timestamp"))
              Sort Method: external merge  Disk: 3368720kB
              Worker 0:  Sort Method: external merge  Disk: 3640792kB
              Worker 1:  Sort Method: external merge  Disk: 3371808kB
              ->  Parallel Append  (cost=0.00..9256242.79 rows=170034187 width=16) (actual time=0.435..2825202.379 rows=136019065 loops=3)
                    ->  Parallel Seq Scan on eddi_minute_p2021_05 em_11  (cost=0.00..1725776.58 rows=34898767 width=16) (actual time=0.011..1722528.987 rows=83740195 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_06 em_12  (cost=0.00..1488905.33 rows=30102507 width=16) (actual time=1.266..1488189.219 rows=72252984 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_04 em_10  (cost=0.00..1428581.36 rows=28905149 width=16) (actual time=149.934..1290294.249 rows=69366177 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_03 em_9  (cost=0.00..1290438.50 rows=26110040 width=16) (actual time=69.475..483281.530 rows=20887814 loops=3)
                    ->  Parallel Seq Scan on eddi_minute_p2021_02 em_8  (cost=0.00..922294.02 rows=18661202 width=16) (actual time=195.734..931653.840 rows=44786882 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_01 em_7  (cost=0.00..823415.96 rows=16660557 width=16) (actual time=102.708..834900.144 rows=39985282 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2020_12 em_6  (cost=0.00..293130.95 rows=5931036 width=16) (actual time=182.465..296634.818 rows=14234537 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2020_11 em_5  (cost=0.00..111271.35 rows=2251388 width=16) (actual time=195.367..110910.685 rows=5403366 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2020_10 em_4  (cost=0.00..105311.10 rows=2130808 width=16) (actual time=146.920..109340.586 rows=5113938 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2020_09 em_3  (cost=0.00..93692.39 rows=1895711 width=16) (actual time=87.456..94169.812 rows=4549714 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2020_08 em_2  (cost=0.00..86189.97 rows=1743918 width=16) (actual time=0.007..88029.891 rows=4185403 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2020_07 em_1  (cost=0.00..33400.45 rows=675796 width=16) (actual time=1.046..14190.279 rows=1621911 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_07 em_13  (cost=0.00..3438.66 rows=88773 width=16) (actual time=0.006..51.229 rows=150887 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_default em_26  (cost=0.00..45.20 rows=1456 width=16) (actual time=0.016..0.639 rows=2477 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_08 em_14  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.000 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_09 em_15  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.515 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_10 em_16  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.000 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_11 em_17  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.000 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2021_12 em_18  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.000 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2022_01 em_19  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.000 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2022_02 em_20  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.000 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2022_03 em_21  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.001 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2022_04 em_22  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.000 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2022_05 em_23  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.000 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2022_06 em_24  (cost=0.00..15.00 rows=400 width=16) (actual time=0.000..0.000 rows=0 loops=1)
                    ->  Parallel Seq Scan on eddi_minute_p2022_07 em_25  (cost=0.00..15.00 rows=400 width=16) (actual time=0.002..0.003 rows=0 loops=1)
Planning Time: 35.809 ms
Execution Time: 8172556.078 ms

最佳答案

一些想法:

尽管"timestamp"是有效的列名，为对象使用保留名称被认为是不好的做法。它可能看起来无害，但从长远来看会变得非常烦人。

我相信列中的索引 "timestamp"应该显着提高第二个查询的性能:

CREATE INDEX idx_timestamp ON eddi_minute ("timestamp");

关于第一个查询:考虑到您有一个 600GB (!) 的表，创建 partial index 可能会很有趣在 "timestamp" 栏中, 以便时间戳按您将在查询中使用的值编制索引，例如周:

CREATE INDEX idx_timestamp_week ON eddi_minute (date_part('week', "timestamp"));

注意:虽然索引可以加快查询速度，但它们会减慢其他操作的速度，例如插入、更新和删除。如果您创建新索引，请测试所有相关操作的性能。

演示: db<>fiddle

关于sql - 每周总计唯一序列号，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/68531799/

27

4

0

文章推荐： css - Google Maps Api 未显示缩放按钮、街景或全屏图标？

文章推荐： r - R中两个数据框的条形图

文章推荐： FFmpeg amix + 音量过滤器创建饱和输出？

java - 序列号 : What to do?
我一直在阅读此处的一些帖子和网络上的文章，但我无法为我的应用程序描绘一个基于串行 key 的系统。 http://www.brandonstaggs.com/2007/07/26/implementi
WMI Win32_BaseBoard 序列号
我使用 Win32_BaseBoard SerialNumber 属性来获取主板序列号并且它在大部分时间都可以工作，但有时在某些计算机中我会得到 SerialNumber = "Base Board
Talend Second 序列号
我有以下数据: ID;NAME;SKILL 1;JOE;XML 1;JOE;JAVA 1;JOE;ORACLE 2;JOHN;JAVA 2;JOHN;API 我需要一个能给我这个结构的计数器: ID;
postgresql - 是否可以压缩主键/序列号？
我有一个数据库，其中所有内容都与外键链接，因此 Postgres 确切地知道数据库是如何布局的。假设我有 Table1 和 Table2。 Table1 有 3 个字段:RID、table2_rid
从多播流中计算 RTP 序列号
我尝试从多播流中计算 RTP 序列号并确定丢失的包。请看下面的C代码: int sock, bytesRead; char buffer[MAXBUFSIZE]; uint16_t seq = 0;
numbers - TLS 序列号
我正在写一篇关于 TLS 的大学论文，有人问我为什么 TLS 序列号计数器是 64 位数字，而 TLS 在其消息中仅使用 32 位序列号。我环顾四周，甚至检查了 RFC，但到目前为止我一无所获。谁能帮
安卓电视 Chromecast 序列号
我正在尝试从 Android TV 添加 Chromecast 以转换开发设备列表，但是... 在尝试获取设备序列号时，电视上显示“0123456789ABCDEF”。我试图将它添加到列表中，但随后我
networking - TCP 序列号
为什么我们需要TCP头中的序列号和下一个序列号字段？下面是使用 wireshark 捕获的数据包中的 TCP header 。最佳答案首先，Wireshark 中 [brackets] 中的字段
程序中嵌入的 C# 序列号
我正在为我编写的软件编写自己的序列号验证/保护。假设序列号验证器正在使用模式匹配...一旦序列号被验证，我如何更改程序本身以便它不再要求用户提供序列号？我真的不想创建一个单独的许可文件。有没有办法
python - 在python中进行正则表达式匹配后获取 token 序列号
我想在列表中找到与正则表达式匹配的所有元素。为了减少正则表达式匹配的次数，我通过连接以空格分隔的元素创建了一个字符串，如下所示: list_a = ["4123", "7648", "afjsdn",
Delphi RAD Studio 序列号
我们目前使用Rad Studio 2007，并希望很快升级到Delphi XE! 有人知道我们如何查看安装 Rad Studio 2007 时使用的序列号吗？问候，彼得最佳答案 “Rad Stud
sql - 每个组的 postgresql 序列号
调查数据表(survey_data)的样子 groupid| res_q_1| resp_q_2 -------|--------|---------- 12 | 1 |61 12
java - 如何以编程方式获取 Glass 序列号
如何以编程方式获取 Google Glass 的 14 字符字母数字(如 LGGXXXXXXXXXXX)序列号？最佳答案看起来您可以通过检索值 android.os.Build.SERIAL 轻松
c++ - 序列号 : write() throttling?
我正在开发一个项目，发送串行数据来控制 LED 灯的动画，这需要与动画引擎保持同步。似乎有一个大的串行写入缓冲区(OSX(POSIX)+ FTDI 芯片组 USB 串行设备)，因此无需手动限制对 wr
c - 在发送数据包之前读取 TCP 序列号
我正在 Linux 下编写 C/C++ 客户端-服务器程序。假设一条消息m要从客户端发送到服务器。 Is it possible for the client to read the TCP sequ
win2003上安装SQL2000时CD-KEY(序列号)无法验证解决方法
方法一：在给出的输入CD-KEY(序列号)的界面中，输入你已经安装的windows server 2003 的CD-KEY(序列号)即可以继续安装，而不是SQL 2000的CD-KEY
配置单元 XML 序列号 : table is empty
我想将xml数据存储到hive表中，XML数据: 1266 /: 61%used(9714MB/15975MB) ( / Disk Usage zab
sql - 代理键/序列号/ID 列的备用名称
我有一个遗留表，其自然键的一部分是一个名为 _IDENTIFIER 的列创建一个名为 _ID 的代理键似乎会让人感到困惑或 ID所以我倾向于将其命名为 SURROGATE_KEY .我所有其他表都使用
C++ - Windows - BIOS 序列号 - 如何获取
这个问题在这里已经有了答案: How can I get hardware ids/serial numbers through command prompt? (1 个回答) 关闭 9 年前。我
c# - 更改 Windows 7 序列号
我想用 C# 做一点许可证管理。使用普通 PC 镜像，我设置了一些没有序列号的工作站，然后我想使用 C# 守护程序更改序列号。我的问题:如何使用 C# 更改序列号并激活 Windows 7？谢谢

首页

博学

6Ren·AI

商城

sql - 每周总计唯一序列号