PostgreSQL数据库中如何保证LIKE语句的效率(推荐)-6ren

PostgreSQL数据库中如何保证LIKE语句的效率(推荐)

转载作者：qq735679552 更新时间：2022-09-27 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章PostgreSQL数据库中如何保证LIKE语句的效率(推荐)由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

在任何数据库中使用LIKE语句往往都是令人头疼的一件事，因为不少用户发现LIKE语句效率极低，查看执行计划后发现原来没有走索引，那么在Postgresql数据中LIKE语句的执行效率又是怎样的呢？我们又该如何提高LIKE语句的执行效率呢?

实验环境。

数据库环境： PostgreSQL 12.3 X86_64 。

创建虚拟环境:

 
    ? 
   
         postgres=#  
         create 
         database 
         testdb01 owner highgo; 
        
         CREATE 
         DATABASE 
        
         postgres=# \c testdb01 highgo 
        
         testdb01=#  
         create 
         table 
         testliketb01 (userid  
         int 
         primary 
         key 
         ,username  
         varchar 
         (20), 
         password 
         varchar 
         (60),description text); 
        
         CREATE 
         TABLE

为何保证测试效果更直观，我们使用随机数据填充一下该表。

 
    ? 
   
 
     
       
       
         testdb01=#  
         insert 
         into 
         testliketb01  
         select 
         generate_series(1,500000),split_part( 
         '张三,李四,王五,小明,小红' 
         , 
         ',' 
         ,(random()*(5-1)+1):: 
         int 
         ),md5((random()*(5-1)+1):: 
         varchar 
         ),split_part( 
         'highgo,highgo02,highgo03' 
         , 
         ',' 
         ,(random()*(3-1)+1):: 
         int 
         ); 
        
 
     
 
   

至此，虚拟数据创建完毕.

 
    ? 
   
         testdb01=#  
         select 
         *  
         from 
         testliketb01 limit 10; 
        
         userid | username |              
         password              
         | description 
        
         --------+----------+----------------------------------+------------- 
        
         1 | 王五     | 4f2bca371b42abd1403d5c20c4542dff | highgo 
        
         2 | 李四     | 2a978c605188770c5ed162889fff189e | highgo02 
        
         3 | 李四     | f5d129ab728b72ac6f663fe544bc7c16 | highgo 
        
         4 | 小明     | 53134fa1022c58e65168b6aa1fbe5e39 | highgo02 
        
         5 | 王五     | 2cf9abb2a8b676a626fa2c317d401ed8 | highgo02 
        
         6 | 王五     | 2247a0cfda1f2819554d6e8e454622eb | highgo02 
        
         7 | 张三     | 59dfdc680c17533dfba1c72c9ce0bf76 | highgo02 
        
         8 | 王五     | 87db4258236a3826259dcc3e7cb5fc63 | highgo02 
        
         9 | 王五     | baaf7a2f7027df9aaeb665121432b6e2 | highgo02 
        
         10 | 王五     | 2f8fb36b3227c795b111b9bd5b031a76 | highgo02 
        
         (10  
         rows 
         ) 
        
         此时数据库的状态： 
        
         testdb01=# \l+ testdb01 
        
         List  
         of 
         databases 
        
         Name    
         | Owner  | Encoding |    
         Collate    
         |    Ctype    | Access  
         privileges 
         |  
         Size   
         | Tablespace | Description 
        
         ----------+--------+----------+-------------+-------------+-------------------+-------+------------+------------- 
        
         testdb01 | highgo | UTF8     | en_US.UTF-8 | en_US.UTF-8 |                   | 59 MB | pg_default | 
        
         (1 row)

简单LIKE语句查询:

 
    ? 
   
         testdb01=# explain analyze  
         select 
         *  
         from 
         testliketb01  
         where 
         username  
         like 
         '王%' 
         ; 
        
         QUERY PLAN                                                        
        
         ----------------------------------------------------------------------------------------------------------------------- 
        
         Seq Scan  
         on 
         testliketb01  (cost=0.00..11405.00  
         rows 
         =125350 width=52) (actual  
         time 
         =0.014..177.571  
         rows 
         =124952 loops=1) 
        
         Filter: ((username)::text ~~  
         '王%' 
         ::text) 
        
         Rows 
         Removed  
         by 
         Filter: 375048 
        
         Planning  
         Time 
         : 0.121 ms 
        
         Execution  
         Time 
         : 190.554 ms 
        
         (5  
         rows 
         )

结论：LIKE查询没有走索引创建普通索引： testdb01=# create index idx_testliketb01_username on testliketb01(username); CREATE INDEX 执行三遍：analyze testliketb01 ; 重新执行LIKE语句，发现还是没有走索引创建包含operator class的索引： testdb01=# create index idx_testliketb01_username on testliketb01(username varchar_pattern_ops); CREATE INDEX 执行三遍：analyze testliketb01 ; 。

 
    ? 
   
 
     
       
       
         testdb01=# explain analyze  
         select 
         *  
         from 
         testliketb01  
         where 
         username  
         like 
         '王%' 
         ; 
        
 
                                                                             
         QUERY PLAN                                                                     
        
 
         ------------------------------------------------------------------------------------------------------------------------------------------------- 
        
 
         Bitmap Heap Scan  
         on 
         testliketb01  (cost=2665.26..9387.14  
         rows 
         =125350 width=52) (actual  
         time 
         =31.383..94.745  
         rows 
         =124952 loops=1) 
        
 
             
         Filter: ((username)::text ~~  
         '王%' 
         ::text) 
        
 
             
         Heap Blocks: exact=5155 
        
 
             
         ->  Bitmap  
         Index 
         Scan  
         on 
         idx_testliketb01_username  (cost=0.00..2633.92  
         rows 
         =125350 width=0) (actual  
         time 
         =29.730..29.730  
         rows 
         =124952 loops=1) 
        
 
                   
         Index 
         Cond: (((username)::text ~>=~  
         '王' 
         ::text)  
         AND 
         ((username)::text ~<~  
         '玌' 
         ::text)) 
        
 
         Planning  
         Time 
         : 0.111 ms 
        
 
         Execution  
         Time 
         : 107.030 ms 
        
 
         (7  
         rows 
         ) 
        
 
     
 
   

结论：在创建完普通索引并收集统计信息后数据库在执行LIKE语句时有可能仍然无法使用索引。在创建完带有操作类的索引收集完统计信息后，执行LIKE语句可以看到正常使用索引，且执行效率有了不小提升。。

PS：operator class是Postgresql新版中创建索引的新选项，旨在通过制定索引的操作类可以更精准的收集统计信息.

为了更精准的收集统计信息，我们也可以在初始化或者创建数据库时将Collate设置为"C"，这也是Postgresql数据中常用的优化手段。我们来测试一下将Collate设置为"C"的效果:

 
    ? 
   
         testdb01=#  
         create 
         database 
         testdb02  
         with 
         TEMPLATE template0  LC_COLLATE= 
         'C'   
         LC_CTYPE = 
         'C' 
         owner highgo; 
        
         CREATE 
         DATABASE 
        
         testdb02=# \l+ testdb02 
        
         List  
         of 
         databases 
        
         Name    
         | Owner  | Encoding |  
         Collate 
         | Ctype | Access  
         privileges 
         |  
         Size   
         | Tablespace | Description 
        
         ----------+--------+----------+---------+-------+-------------------+-------+------------+------------- 
        
         testdb02 | highgo | UTF8     | C       | C     |                   | 59 MB | pg_default | 
        
         (1 row) 
        
         testdb02=#  
         create 
         index 
         idx_testliketb01_username  
         on 
         testliketb01(username); 
        
         CREATE 
         INDEX 
        
         testdb02=# analyze testliketb01 ; 
        
         ANALYZE 
        
         testdb02=# analyze testliketb01 ; 
        
         ANALYZE 
        
         testdb02=# analyze testliketb01 ; 
        
         ANALYZE 
        
         testdb02=#  explain analyze  
         select 
         *  
         from 
         testliketb01  
         where 
         username  
         like 
         '王%' 
         ; 
        
         QUERY PLAN                                                                     
        
         ------------------------------------------------------------------------------------------------------------------------------------------------- 
        
         Bitmap Heap Scan  
         on 
         testliketb01  (cost=2680.26..9410.67  
         rows 
         =126033 width=52) (actual  
         time 
         =35.262..99.052  
         rows 
         =124992 loops=1) 
        
         Filter: ((username)::text ~~  
         '王%' 
         ::text) 
        
         Heap Blocks: exact=5155 
        
         ->  Bitmap  
         Index 
         Scan  
         on 
         idx_testliketb01_username  (cost=0.00..2648.75  
         rows 
         =126033 width=0) (actual  
         time 
         =33.920..33.920  
         rows 
         =124992 loops=1) 
        
         Index 
         Cond: (((username)::text >=  
         '王' 
         ::text)  
         AND 
         ((username)::text <  
         '玌' 
         ::text)) 
        
         Planning  
         Time 
         : 0.276 ms 
        
         Execution  
         Time 
         : 111.578 ms 
        
         (7  
         rows 
         )

结论：创建数据库时将Collate设置为"C"，即便索引为普通索引，LIKE语句也可以使用索引提升查询效率。。

优化建议:

1、初始化数据库或者创建数据库时将Collate设置为"C".

2、创建索引时指定索引的操作类。（text_pattern_ops、varchar_pattern_ops和 bpchar_pattern_ops分别支持类型text、varchar和 char上的B-tree索引）。

3、优化思路，对于%X的列无法使用索引，可以新增一列反存储列，将%X改为X%.

4、创建覆盖索引，保证复杂SQL中可以尽可能调用该索引.

5、调整业务逻辑，尽量不用LIKE语句或者调整LIKE语句在WHERE中的位置.

到此这篇关于PostgreSQL数据库中如何保证LIKE语句的效率的文章就介绍到这了,更多相关PostgreSQL保证LIKE语句的效率内容请搜索我以前的文章或继续浏览下面的相关文章希望大家以后多多支持我！。

原文链接：https://blog.csdn.net/pg_hgdb/article/details/114123959 。

最后此篇关于PostgreSQL数据库中如何保证LIKE语句的效率(推荐)的文章就讲到这里了,如果你想了解更多关于PostgreSQL数据库中如何保证LIKE语句的效率(推荐)的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐：详解PostgreSQL提升批量数据导入性能的n种方法

文章推荐： Python for Informatics 第11章之正则表达式（四）

文章推荐： Python for Informatics 第11章之正则表达式（二）

文章推荐： postgresql影子用户实践场景分析

postgresql - 将旧表从已删除的 postgresql 导入到新安装的 postgresql
我的 postgresql 有问题，我复制了所有文件，然后将其删除。然后，我安装了新的，问题就解决了。现在可以将旧文件和文件导入新文件吗？最佳答案如果它们是相同的主要版本(即 9.0 到 9.0.
postgresql - postgresql 服务器启动时，postgresql 中是否有任何系统表自动更新？
我想使用 Postgresql 9.2.2 来存储我的应用程序的数据。我不得不构建一个应该基于数据库级别的触发器(当数据库启动时，这个触发器将被触发并执行。)，当 postgresql 服务器启动时是
postgresql - 如何从 Postgresql 目录表中检索 Postgresql 序列缓存值？
我已经使用下面的查询从 Postgresql 目录表中获取 Sequence 对象的完整信息 select s.sequence_name, s.start_value, s.minimum_valu
postgresql - 执行函数从本地 PostgreSQL 数据库返回远程 PostgreSQL 数据库中的数据
Postgres 版本:9.3.4 我需要执行驻留在远程数据库中的函数。该函数根据给定的参数返回一个统计数据表。我实际上只是在我的本地数据库中镜像该函数，以使用我的数据库角色和授权来锁定对该函数的访
postgresql - 在没有 postgresql-server 的情况下重启 PostgreSQL
我在 CentOS 7 上，我正在尝试解决“PG::ConnectionBad: FATAL: Peer authentication failed for user”错误。所以我已经想出我应该更改
postgresql - Postgresql - 使用动态列名触发
我写了一个触发器函数，在触发器表列名上循环，我从具有不同列的不同表调用该函数。该函数将列名插入到数组中并在它们上循环，以便将值插入到另一个模式和表中。函数和触发器创建脚本: DROP TRIGGER
postgresql - PostgreSQL 的默认空闲连接超时值是多少
PostgreSQL 的默认空闲连接超时是多少，我运行了 show idle_in_transaction_session_timeout 查询并返回了 0，但是值 0 表示此选项被禁用，但我想知道默
postgresql - Postgresql 中十六进制值的适当数据类型？
我需要将十六进制值存储到数据库表中，谁能推荐我需要用于属性的数据类型？提前致谢最佳答案您可以使用bytea 来存储十六进制格式。更多信息 can be found in the postgres
postgresql - Postgresql 中是否需要对复合主键的一部分进行索引？
我有一个具有复合主键的(大)表，由 5 列(a、b、c、d、e)组成。我想高效地选择具有其中两列 (a + e) 的所有行到给定值。在 PostgreSQL 中，我需要索引吗？或者数据库会使用主键
postgresql - PostgreSQL 如何在内部存储日期时间类型
在阅读 PostreSQL (13) 文档时，我遇到了 this页面，其中列出了不同日期时间类型的存储大小。除其他外，它指出: Name Storag
postgresql - PostgreSQL 中批量插入的最佳大小
我有两个大整数的巨大表(500 000 000 行)。两列都被单独索引。我正在使用语法批量插入此表: INSERT into table (col1, col2) VALUES(x0, y0), (x
postgresql - 无法启动 PostgreSQL
有一台 CentOS7 Linux 机器正在运行(不是由我管理；拥有有限的权限)。请求在其中设置 PostgreSQL。刚刚从 CentOS 存储库安装了 PostgreSQL: sudo yum
postgresql - 是否可以在不破坏现有数据库的情况下安装 Postgresql？
我在 Ubuntu 18.04 上安装了 Postgresql 10，但不知何故坏了，不会重新启动。我可以重新安装它而不破坏它的数据库，以便我可以再次访问数据库吗？ pg_dump 不起作用。最佳答
postgresql - postgresql 中的自动备份创建空备份
我想在 UNIX 中使用 crontab 自动备份 PostgreSQL 数据库。我已经尝试过，但它会创建 0 字节备份。我的 crontab 条目是: 24 * * * * /home/desk
postgresql - 允许远程连接 postgresql
我已经完成了PG服务器的安装。我希望能够使用 pgAdmin 远程连接到它，但不断收到服务器不听错误。 could not connect to server: Connection refused
PostgreSQL:PostgreSQL 支持波斯历吗？
Oracle 支持波斯历但需要知道 PostgreSQL 是否支持波斯历？如果是，那么我们如何在 PostgreSQL 中将默认日历类型设置为 Persian 而不是 Gregorian(在 Ora
postgresql - PostgreSQL 模式的命名空间版本以实现向后兼容性？
假设我们有一个带有表的 SQL 数据库 Person以及访问它的几个应用程序。出于某种原因，我们想修改 Person表以向后不兼容的方式。保持兼容性的一种潜在解决方案是将表重命名为 User并创建一
postgresql - PostgreSQL 中的模式是物理对象吗？
我使用 PostgreSQL 中的模式来组织我庞大的会计数据库。每年年底，我都会通过为下一年创建一个新模式来进行协调过程。新模式的文件是否与旧模式物理分离？或者所有模式一起存储在硬盘上？这对我来说
postgresql - PostgreSQL autovacuum中的autovacuum_vacuum_cost_delay是什么？
我正在尝试使用配置文件中的以下配置参数调整 PostgreSQL 服务器: autovacuum_freeze_max_age = 500000000 autovacuum_max_workers =
postgresql - 如何仅查询具有表情符号的数据(postgresql)
我的数据包含数据库列中的表情符号，即 message_text ------- 🙂 😀 Hi 😀 我只想查询包含表情符号的数据的行。在 postgres 中是否有一种简单的方法可以做到这一点？

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

PostgreSQL数据库中如何保证LIKE语句的效率(推荐)