sql - 在 PostgreSQL 中发现表的行数的快速方法-6ren

sql - 在 PostgreSQL 中发现表的行数的快速方法

转载作者：行者123 更新时间：2023-11-29 11:04:48

25

4

我需要知道表中的行数来计算百分比。如果总计数大于某个预定义的常量，我将使用常量值。否则，我将使用实际的行数。

我可以用 SELECT count(*) FROM table .但是如果我的常量值为 500,000，并且我的表中有 5,000,000,000 行，那么计算所有行会浪费很多时间。

一旦超过我的常数值，是否可以停止计数？

我只需要确切的行数，只要它低于给定的限制。否则，如果计数高于限制，我将使用限制值并希望尽快得到答案。

像这样的东西:

SELECT text,count(*), percentual_calculus()  
FROM token  
GROUP BY text  
ORDER BY count DESC;

最佳答案

众所周知，在 PostgreSQL 中计算大表中的行数很慢。 MVCC模型需要完整计数的事件行以获得精确数字。 有解决方法显着加快速度 如果计数是不是必须是精确就像你的情况一样。
(请记住，即使是“精确”计数也可能在到达时死亡!)
精确计数( 慢对于大表):

SELECT count(*) AS exact_count FROM myschema.mytable;

估计( 极快 ):

SELECT reltuples AS estimate FROM pg_class where relname = 'mytable';

通常，估计值非常接近。多近，要看是否 ANALYZE 或 VACUUM 足够运行 - 其中“足够”由表的写入事件级别定义。
更安全
以上忽略了在一个数据库中多个同名表的可能性 - 在不同的模式中。考虑到这一点:

SELECT c.reltuples::bigint AS estimate
FROM   pg_class c
JOIN   pg_namespace n ON n.oid = c.relnamespace
WHERE  c.relname = 'mytable'
AND    n.nspname = 'myschema';

投到 bigint格式化 real数字很好，特别是对于大计数。
更好

SELECT reltuples::bigint AS estimate
FROM   pg_class
WHERE  oid = 'myschema.mytable'::regclass;

更快、更简单、更安全、更优雅。请参阅 Object Identifier Types 上的手册.
替换 'myschema.mytable'::regclass与 to_regclass('myschema.mytable')在 Postgres 9.4+ 中，除了无效表名的异常之外，什么也得不到。见:

How to check if a table exists in a given schema

更好(只需很少的额外成本)
我们可以做 Postgres 规划器所做的。引用 Row Estimation Examples in the manual :

These numbers are current as of the last VACUUM or ANALYZE on thetable. The planner then fetches the actual current number of pages inthe table (this is a cheap operation, not requiring a table scan). Ifthat is different from relpages then reltuples is scaledaccordingly to arrive at a current number-of-rows estimate.

所以:

SELECT ((reltuples / relpages)
      * (pg_relation_size('myschema.mytable') / current_setting('block_size')::int)
       )::bigint
FROM   pg_class
WHERE  oid = 'myschema.mytable'::regclass;

通常，我们可以替换 current_setting('block_size')::int只需 8192让它稍微快一点。但是查询只需要大约 1 毫秒。
更多网络资源:

Postgres Wiki FAQ

Postgres wiki 页面 count estimates和 count(*) performance

TABLESAMPLE SYSTEM (n) 在 Postgres 9.5+

SELECT 100 * count(*) AS estimate FROM mytable TABLESAMPLE SYSTEM (1);

赞 @a_horse commented ，为 SELECT 添加的子句如果 pg_class 中的统计信息很有用，则命令很有用由于某种原因不够当前。例如:

否 autovacuum运行。

紧接着大INSERT/UPDATE/DELETE .

TEMPORARY表(不包括在 autovacuum 中)。

这仅查看随机 n %(在示例中为 1)块的选择并计算其中的行数。更大的样本会增加成本并减少错误，您的选择。准确性取决于更多因素:

行大小的分布。如果给定的块碰巧包含比通常更宽的行，则计数低于通常等。

死元组或 FILLFACTOR每块占用空间。如果表中分布不均，则估计值可能会偏离。

一般舍入误差。

通常，估计来自 pg_class会更快更准确。
回答实际问题

First, I need to know the number of rows in that table, if the totalcount is greater than some predefined constant,

以及是否...

... is possible at the moment the count pass my constant value, it willstop the counting (and not wait to finish the counting to inform therow count is greater).

是的。 您可以使用 带有 LIMIT 的子查询 :

SELECT count(*) FROM (SELECT 1 FROM token LIMIT 500000) t;

Postgres 实际上会停止超出给定限制的计数，您可以获得最多 n 行(示例中为 500000)的准确和当前计数，否则为 n。没有 pg_class 中的估计那么快，不过。

关于sql - 在 PostgreSQL 中发现表的行数的快速方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7943233/

25

4

0

文章推荐： macos - 如何检查 PostgreSQL 服务器 Mac OS X 的状态

文章推荐： postgresql - 如何在简单的 PostgreSQL 脚本中使用变量？

文章推荐： mysql - 视觉基本: Best way to share data/variables over network?

文章推荐： mysql - 增强表 MYSQL 性能

快速/更改循环中变量的名称
如何更改循环中变量的名称？比如 number1 、 number2 、 number3 、 number4 ？ var array = [2,4,6,8] func ap ( number1: Int
iOS延迟更改背景颜色(快速)
我想设置 View 的背景颜色并在一定延迟后将其更改为另一种颜色。这是我的尝试方式: print("setting color 1") self.view.backgroundColor = UICo
快速 session 在请求之间不持久
我在使用 express-session 时遇到问题。 session 数据不会在请求之间持续存在。正如您在下面的代码中看到的那样，/join 路由设置了一些 session 属性，但是当 /sur
快速 Steam 叶环
我试图从叶渲染器获得一个非常简单的结果，用于快速 Steam 的 for 循环。我正在上传叶文件 HTML，因为它不接受此处格式正确的代码 - 下面的pizza.swift代码- import
performance - 快速、简单的程序员编辑器
你们中有人有什么好的链接可以与我分享吗？我正在寻找一个 FAST 程序员编辑器，它可以非常快速地打开包含超过 100, 000 行代码的文件？我目前正在使用记事本自动取款机，打开一个 29000 行长
r - 快速、高效地循环数百万行并匹配列
我现在正在处理眼动追踪数据，因此拥有一个巨大的数据集(想想数百万行)，因此希望有一种快速的方法来完成此任务。这是它的简化版本。数据告诉您眼睛在每个时间点正在查看的位置以及我们正在查看的每个文件。 X
ios - 选择提示音-快速
我是新手，想为计时器或其他设备选择提示音。如何打开此列表，以选择其中一种声音？ Alert sound list 最佳答案您将无法在应用中使用系统声音。但是，您可以包括自己的声音文件，并将其显示
arrays - 将顺序字符串构建到数组中(快速)
我编写了以下代码来构建具有顺序字符串的数组。它的工作方式与我预期的一样，但我希望它能更快地运行。有没有更有效的方法在PowerShell中产生我想要的结果？我是PowerShell的新手，非常感谢
r - 快速、简洁地生成唯一矩阵行的有序频率计数的方法
我有一个包含一些非唯一行的矩阵，例如: x 尝试 y <- rle(apply(x, 1, paste, collapse = " ")) # y$lengths is the vector con
ios - 键盘打开时移动菜单(快速)
我的函数“keyboardWillShown”有问题。所以我想要的是菜单打开时，菜单正好出现在键盘上方。它可以在Iphone 8 plus，8、7、6上完美运行。但是，当我在模拟器上运行Iphone
ios - 第二次API调用后应用崩溃(快速)
我正在尝试通过Swift 5中的HTTP get方法从API提取数据。它在启动时成功加载了数据，但是当我刷新页面时，它说“索引超出范围”，这是因为数据是不再会在我的日志中读取，因此索引中没有任何内容。
ios - 将时间戳转换为其他时区(快速)
我想做什么: 从我的数据库中获取时间戳并将其转换为用户的时区。我的代码: let tryItNow = "\(model.timestampName)" let format = D
ios - 查找字符串的宽度(快速)
给定字体名称和字体大小，如何查找字符串的宽度(CGFloat)？ (目标是将UIView的宽度设置为足以容纳字符串的宽度。) 我有两个字符串:一个重复“1”，重复36次，另一个重复“M”，重复36次。
ios - JSON解析(快速)
我正在尝试解析此JSON ["Items": ( { AccountBalance = 0; AlphabetType = 3; Description = "\U0631\U
ios - 根据自动布局更改UILabel中的字体大小(快速)
我在UINavigationBar内放置了一个UILabel。我想根据navigationBar的高度增加该标签的字体大小。当navigationBar很大时，我希望字体大小更大；当滚动并缩小nav
ios - 消除数字中的多个小数点(快速)
我想将用户输入限制为仅有效数字并使用以下内容: func textView(_ textView: UITextView, shouldChangeTextIn range: NSRange, rep
C# - 图像比较(快速)
目前我有一个包含超过 100.000 张图像的数据库，它们大小不一或类似，但我想为我的公司制作以下内容: 我插入/上传一张图片，系统返回最有可能相同的图片。我不知道使用什么算法，但它需要快速。我可以预
ios - 按下按钮时发生的操作 - 快速
在我的 swift 项目中，我有一个按钮，我想在标签上打印按下该按钮的时间。如何解决这个问题？最佳答案添加到DHEERAJ的答案中，您只需在func press(sender: UIButton
arrays - 我想从解析加载数组数据(快速)
我必须发表评论，尝试在解析中导入数组。然而，有一个问题。当我尝试从 Parse 加载数组时，我的输出是 ("Blah","Blah","Blah")这是一个元组...而不是一个数组 TT... 如何
swift - 简化嵌套 if 快速
我的应用程序有一个名为 MyDevice 的类，我用它来与硬件通信。该硬件是可选的，实例变量也是可选的: var theDevice:MyDevice = nil 然后，在应用程序中，我必须初始化设备

首页

博学

6Ren·AI

商城

sql - 在 PostgreSQL 中发现表的行数的快速方法