sql - Spring JPA 查询总是使用序列扫描而不是索引扫描-6ren

sql - Spring JPA 查询总是使用序列扫描而不是索引扫描

转载作者：行者123 更新时间：2023-11-29 11:44:30

26

4

我有一个简单的查询

@Query(value = "select * from some_table where consumer_id=:consumerId and store_id=:storeId and cancelled_at is null", nativeQuery = true)
fun checkIfNewConsumer(consumerId: BigInteger, storeId: BigInteger): List<SomeClass?>

当我直接针对超过 3000 万行的表运行带有解释的查询时

在 some_table 上使用 select_index 进行索引扫描(成本=0.56..8.59 行=1 宽度=86)(实际时间=0.015..0.015 行=0 循环=1) 索引条件:((consumer_id = 1234) AND (store_id = 4) AND (cancelled_at IS NULL)) 规划时间:0.130 毫秒执行时间:0.042 毫秒

当我使用 spring boot 通过请求运行相同的查询时:

{"Plan"=>{"Total Cost"=>1317517.92, "Relation Name"=>"some_table", "Parallel Aware"=>"?", "Filter"=>"?", "Alias"=>"some_table", "Node Type"=>"Seq Scan", "Plan Width"=>86, "Startup Cost"=>0.0, "Plan Rows"=>912}} 执行时间:9613 毫秒

上面的 spring boot 计划来自 new relic。如您所见，它默认为每个查询Seq 扫描，而不是索引扫描。我已经假设它是数据库(没有骰子)进行了吸尘分析，我已经尝试了查询的变体，没有骰子。它在 plsql 中总是看起来很完美，通过 spring 失败。

如有任何建议，我们将不胜感激。

编辑 2:潜在解决方案

我们发现通过禁用准备好的语句将 ?preferQueryMode=simple 添加到您的连接 url:jdbc:postgresql://localhost:5432/postgres?preferQueryMode=simple获得使用索引扫描的查询。

我们需要了解 How?为什么？为什么是现在？

编辑 1:技术堆栈

Spring 启动 2.0M5
Kotlin
PostgreSQL 9.6.2

编辑:解决方案@Vlad Mihalcea

please don't use preferQueryMode=simple unless you are absolutely sure what it means. Apparently, your problem is described in https://gist.github.com/vlsi/df08cbef370b2e86a5c1. I guess you have BigInt in the database and BigInteger in the Kotlin code. Can you use Long in Kotlin?

–Vladimir Sitnikov

最佳答案

由于 PostgreSQL 不包含任何执行计划缓存并且 PreparedStatement(s) 实际上是模拟的，直到达到给定的执行阈值(例如 5)，我认为这是一个索引选择性问题面对这里。

如果此查询仅返回少量记录，数据库将使用索引。

如果此查询将返回大量记录，数据库将不会使用索引，因为随机访问页面读取的成本将高于顺序扫描的成本。

因此，您可能在此处使用了不同的绑定(bind)参数值集。

你在 pgsql 控制台中给出的那些是高度选择性的，因此你得到了索引扫描。
您在运行时发送的那些可能不同，因此您会得到顺序扫描。

此外，在 pgsql 上，解释计划不会考虑将所有记录发送到 JDBC 驱动程序的网络开销。但是，这是对您的问题的补充，而不是真正的根本原因。

现在，要真正确定实际的执行计划，请尝试在 PostgreSQL 中启用 auto_explain 模式。

或者，您可以编写一个运行查询的测试方法，如下所示:

List<Object[]> executionPlanLines = doInJPA(entityManager -> {
    try(Stream<Object[]> postStream = entityManager
        .createNativeQuery(
            "EXPLAIN ANALYZE " +
            "select * from some_table where consumer_id=:consumerId and store_id=:storeId and cancelled_at is null ")
        .setParameter("consumerId", consumerId)
        .setParameter("storeId", storeId)
        .unwrap(Query.class)
        .stream()
    ) {
        return postStream.collect( Collectors.toList() );
    }
});

LOGGER.info( "Execution plan: {}",
             executionPlanLines
             .stream()
             .map( line -> (String) line[0] )
             .collect( Collectors.joining( "\n" ) )
);

这样，您将看到在生产环境中运行的实际执行计划。

关于sql - Spring JPA 查询总是使用序列扫描而不是索引扫描，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47425212/

26

4

0

文章推荐： mysql - SQL查询获取两周之间的数据？

文章推荐： ios - 如何使用 objective c 将 JPEG 文件转换为 BITMAP？

文章推荐： postgresql - 在 tsquery (postgresql) 中转义连字符

html - Z 索引 - 滑动过渡重叠有没有办法创建动态 z 索引？
这几天我一直在努力。我一直在自学 CSS，所以对菜鸟好一点。我正在创建一个推荐 slider 。推荐以 3 个 block 显示。我希望前 2 个下降，第 3 个上升。但是当 slider 激活时，无
node.js - 索引.ejs VS 索引.html
我最近开始学习 Nodejs，现在我很困惑我的网络应用程序使用什么，html 还是 ejs (Express)。 Ejs 使用 Express 模块，而 .html 使用 HTML 模块。我的第一个问
sql - 跨两列/数组的 PostgreSQL 搜索/索引(GIN 索引？)
假设我们有一个 PostgreSQL 表contacts，每条记录都有一堆带标签的电子邮件地址(标签和电子邮件对)——其中一个是“主要”。存储方式如下: id 主键电子邮件文本 email_la
Tesseract 索引 >= 0 && 索引 < size_used_ :Error:Assert failed Error
我成功为一种新的tesseract语言编写了traineddata文件，但是当我完成时，我继续收到以下错误: index >= 0 && index = 0 && 索引 < size_used_ :E
python - .loc[索引, 列] 和 .loc[索引][列] 之间有什么区别？
这个问题已经有答案了: How to deal with SettingWithCopyWarning in Pandas (21 个回答) 已关闭 4 年前。假设我有一个像这样的数据框，第一列“密
Android - 从位置 A(索引)检查位置 B(索引)是否在 GridView 布局中与它成对角线，而不管是否接近
如果我有一个位置或行/列同时用于 A 和 B 位置，请检查 B 是否与 A 成对角线？ 1 2 3 4 5 6 7 8 9 例如，我如何检查 5 是否与 7 成对角线？此外，如果我检查 4 是
MongoDB：索引
MongoDB：索引一、创建索引默认情况下，集合中的_id字段就是索引，我们可以通过getIndexes()方法来查看一个集合中的索引 > db.user.getIndexes() [ { "v
MongoDB——索引
一、索引介绍索引是一种用来快速查询数据的数据结构。 B+Tree就是一种常用的数据库索引数据结构，MongoDB采用B+Tree 做索引，索引创建在colletions上。 MongoDB不使用索引
SQLite 索引
我无法决定索引。就像我有下面的查询需要太多时间来执行: select count(rn.NODE_ID) as Count, rnl.[ISO_COUNTRY_CODE] as Cou
MySQL查询优化——索引
我有这些表: CREATE TABLE `cstat` ( `id_cstat` bigint(20) NOT NULL, `lang_code` varchar(3) NOT NULL,
mysql表性能升级(索引
我正在尝试找到一种方法来提高包含 IP 范围的 mysql 表的性能(在高峰时段每秒最多有 500 个 SELECT 查询(!)，所以我有点担心)。我有一个这种结构的表: id smallint(
jquery 索引()
jquery index() 似乎无法识别元素之一，总是说“无法读取未定义的属性‘长度’”这是我的代码。mnumber 是导致问题的原因。我需要 number 和 mnumber 才能跟踪使用鼠标，并
MongoDB 索引
我们有一个包含近 4000 万条记录的 MongoDB 集合。该集合的当前大小为 5GB。此集合中存储的数据包含以下字段: _id: "MongoDB id" userid: "user id" (i
MongoDB 索引
文档说:如果你有多个字段的复合索引，你可以用它来查询字段的开始子集。所以如果你有一个索引一个，乙，丙你可以用它查询一种一个，乙a,b,c 我的问题是，如果我有一个像这样的复合索引一个，乙，丙我可以查询
jQuery .each() 索引？
我正在使用 $('#list option').each(function(){ //do stuff }); 循环列表中的选项。我想知道如何获取当前循环的索引？因为我不想让 var i = 0;循
快速了解MySQL 索引
MySQL索引的建立对于MySQL的高效运行是很重要的，索引可以大大提高MySQL的检索速度。打个比方，如果合理的设计且使用索引的MySQL是一辆兰博基尼的话，那么没有设计和使用索引的MySQL
18、SQLite 索引
SQLite 索引（Index）索引（Index）是一种特殊的查找表，数据库搜索引擎用来加快数据检索。简单地说，索引是一个指向表中数据的指针。一个数据库中的索引与一本书后边的索引是非常相似的。
RavenDB MultiMap 索引
我是 RavenDB 的新手。我正在尝试使用多 map 索引功能，但我不确定这是否是解决我的问题的最佳方法。所以我有三个文件:Unit、Car、People。汽车文件看起来像这样: { Id: "
基于标准的 Excel 索引
我有以下数据，我想根据范围在另一个表中建立索引我想要实现的是，例如，如果三星的销售额为 2500，则折扣为 2%，低于 3000 且高于 1000 我知道它可以通过索引来完成，与多个数组匹配，然后指
SQL 索引 - 这是重叠的吗？
我正在检查并删除 SQL 数据库中的重复和冗余索引。所以如果我有两个相同的索引，我会删除。例如，如果我删除了重叠的索引... 索引1:品牌、型号指标二:品牌、型号、价格我删除索引 1。相同顺

首页

博学

6Ren·AI

商城

sql - Spring JPA 查询总是使用序列扫描而不是索引扫描