- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试尽可能加快此查询的速度。它不是很慢,但我需要它尽可能快。
SELECT name
FROM (
SELECT cities.name || ', ' || regions.name || ', ' || countries.code AS name
FROM cities
INNER JOIN regions ON regions.id = cities.region_id
INNER JOIN countries ON countries.id = regions.country_id
) AS t1
GROUP BY name
HAVING LOWER(name) ILIKE 'asheville%'
ORDER BY name ASC
LIMIT 10;
存在这些索引:
UNIQUE INDEX index_cities_on_name_and_region_id ON cities USING btree (name, region_id)
UNIQUE INDEX index_countries_on_code ON countries USING btree (code)
UNIQUE INDEX index_countries_on_name ON countries USING btree (name)
UNIQUE INDEX index_regions_on_code_and_country_id ON regions USING btree (code, country_id)
城市表包含 248016 条记录。countries 表包含 252 条记录。regions 表包含 4005 条记录。
这是查询的解释输出:http://explain.depesz.com/s/fWe
如有任何帮助,我们将不胜感激。基本上我只是在寻找建议或者指出我可能遗漏的东西。
最佳答案
在您的子查询中,您应该同时返回您已经返回的 name
和 cities.name as cname
。然后,你应该在 cname
而不是 name
上做你的 ilike
。问题是现在没有办法让 PostgreSQL 真正推断出 'ashville%'
中没有任何逗号,它可以只查看城市名称子查询,所以它真的必须(并且是,根据你的解释)迭代并构建每一个可能的字符串,以便进行最后的过滤。如果您将 cities.name
返回到上层查询,它将显着提高性能,因为现在它严重不能使用您拥有的任何索引。
真的,你应该一路走到这里,只需删除查询中的字符串连接并返回你真正想要的:select cities.name as city, regions.name as region, countries.code as country
,并将排序修改为 order by t1.city, t1.region, t1.country
。
此外,您是否真的在寻找具有'ashville%'
的城市,或者这只是寻找具有'ashville 的城市的间接方式'
,但你必须在内部处理逗号分隔?然后,在外面,使用 lower(t1.city) = 'ashville'
(注意 =
: lower(x) 就像 'lower'
是毫无意义的慢)。
此外,您还需要修复这些索引:您真正想要的是 create index whatever on cities((lower(name)))
,因为这是您实际搜索的内容,而不是 name
:如果您正在搜索与索引中的内容无关的内容,则无法使用这些索引。
(稍后您可能会查看按名称排序
,并担心它不会再被加速,但这没关系:这里的目标是快速从大量可能的位置向下过滤到你要操作的一小部分;剩下的可以在内存中快速排序,因为你可能要处理 10-20 个结果。)
因此,由于regions.id
和countries.id
可能是primary key
,所以其他的索引可以删除仅针对此查询。
最后,将查询扁平化为一个级别,删除group by
,并将其替换为distinct
。问题是我们要确保在尝试过滤器之前我们不强制 PostgreSQL 生成完整集:我们要确保它对目标有足够的了解,以便能够使用城市索引直接快速扫描到可以匹配的城市,然后开始填写地区和国家信息。
(PostgreSQL 通常非常非常擅长做这件事,即使是通过子查询,但是因为我们有一个 group by
子句通过 having
,我可以看到它不再能够推断的情况。)
(编辑)实际上,等等:您在 cities (name, region_id)
上有一个唯一索引,所以您甚至不需要 distinct
...它正在做的是使查询毫无意义地变得更加复杂。我只是继续将其从查询中删除:结果将是相同的,因为您不可能最终得到在同一地区/国家/地区的同一城市被返回两次的结果。
select
cities.name as city,
regions.name as region,
countries.code as country
from cities
join regions on
regions.id = cities.region_id
join countries on
countries.id = regions.country_id
where
lower(cities.name) = 'asheville'
order by
cities.name,
regions.name,
countries.code
limit 10;
create index "cities(lower(name))" on cities ((lower(name)));
(编辑)如果,顺便说一句,你真的想做一个前缀匹配,那么你会想改变 = 'asheville'
回到 like 'ashevill% '
(注意like
: no i
),修改索引指定如下:
create index "cities(lower(name))" on cities ((lower(name)) text_pattern_ops);
关于performance - 帮助加速 PostgreSQL 查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7243619/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!