gpt4 book ai didi

postgresql - 使 ST_Distance 查询在高负载下可扩展?

转载 作者:行者123 更新时间:2023-11-29 12:50:32 26 4
gpt4 key购买 nike

我正在运行一个包含大量公司地址表的数据库服务器。连接到它的应用程序接收用户坐标和他们正在寻找的业务类型,并返回离该用户最近的业务。

最初,我的应用程序使用一个简单的 SELECT 语句来查找最近的企业,返回所有企业名称的表格并在应用程序端完成一些排序(这是用户坐标数据和地址的位置被使用)找到离他们最近的一个:

Select * from my_table where business_type = 'bakeries';

这对我来说似乎并不理想,因为应用端在对数据进行排序以找到最近的数据时有明显的半秒滞后。我目前正在研究是否可以在数据库端更快地完成所有计算。因此,我发现了 POSTGIS及其找到最接近输入的坐标的功能。使用它的功能,我想出了要针对每个用户请求执行的查询:

SELECT *, ST_Distance(ST_GeogFromText('SRID=4326;POINT(user_long user_lat)'), geom, false) as 
distance from my_table where business_type = 'Insurance' order by distance limit 1;

这似乎是更快的响应,特别是对于表中有很多列表的业务类型(例如保险公司)。但是,当我尝试对传入的请求进行压力测试时,我注意到它的扩展非常可怕。对一个 URL 的 500 个并发请求很快导致数据库 CPU 使用率达到 100%,因此这种方法在高峰期会失败。

"Limit  (cost=12804.92 rows=1 width=261)"
" -> Sort (cost=12804.91..12878.92 rows=29602 width=261)"
" Sort Key: (_st_distance('0101000020E61000007AC7293A927F52C0D34D621058614440'::geography, (geom)::geography, '0'::double precision, false))"
" -> Index Scan using business_name_index on my_table (cost=0.43..12656.90 rows=29602 width=261)"
" Index Cond: (business_type = 'Insurance'::text)"

是否有一种方法可以使这更可行,或者我应该放弃这个想法并尝试其他途径?我知道一种替代方法是使用 ST_DWithin 查找特定半径内的所有最近地址(如图所示 here )但我无法定义最小距离,因为默认情况下有些距离对用户来说可能太远.

最佳答案

我同意 Yevgens 的回答,假设您的企业坐标也是 POINT而不是 POLYGON或其他东西,这可能导致自 <-> 以来彼此近距离内的距离不一致。使用边界框。但是ST_Distance()不使用索引,因此如果性能是重中之重,这就是要走的路。

您可以在此处详细了解您的具体问题: http://postgis.net/workshops/postgis-intro/knn.html

您的 geom 上需要一个 2d GiST 索引-<-> 的列使用 btw 的函数。

CREATE INDEX idx_mytable_geom ON my_table USING Gist(geom);

您也可以考虑使用 ST_GeomFromText()并转换你的 geom -列到 geometries作为geometries似乎比 geographies 表现更好.

在这里找到更多: https://medium.com/coord/postgis-performance-showdown-geometry-vs-geography-ec99967da4f0

或者更好地使用 ST_MakePoint() , 这也创造了 geometriesST_GeomFromtext() 快.

检查这里: https://gis.stackexchange.com/questions/58605/which-function-for-creating-a-point-in-postgis

虽然这将是一个很小的改进,因为您每次查询只创建一个点,但它可能会累加起来。

所以你的代码应该是这样的:

SELECT a.*, ST_SetSRID(ST_MakePoint(lng lat), 4326) <-> a.geom as dist
FROM my_table a
where business_type = 'Insurance'
ORDER BY dist;

这些是我的想法。

关于postgresql - 使 ST_Distance 查询在高负载下可扩展?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55187612/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com