postgresql - 优化大型 PostGIS 查询-6ren

postgresql - 优化大型 PostGIS 查询

转载作者：行者123 更新时间：2023-11-29 13:59:14

25

4

我目前有一个大表mivehdetailedtrajectory(25B 行)和一个小表cell_data_tower(400 行)，我需要使用 PostGIS 加入它们。具体来说，我需要运行这个查询:

SELECT COUNT(traj.*), tower.id
FROM cell_data_tower tower LEFT OUTER JOIN mivehdetailedtrajectory traj
ON ST_Contains(tower.geom, traj.location)
GROUP BY tower.id
ORDER BY tower.id;

它愤怒地错误地指出它不能写入磁盘。这对于 SELECT 来说似乎很奇怪，所以我运行了 EXPLAIN:注意:gserialized_gist_joinsel:不支持连接类型 1

                                                     QUERY PLAN                                                     
--------------------------------------------------------------------------------------------------------------------
 Sort  (cost=28905094882.25..28905094883.25 rows=400 width=120)
   Sort Key: tower.id
   ->  HashAggregate  (cost=28905094860.96..28905094864.96 rows=400 width=120)
         ->  Nested Loop Left Join  (cost=0.00..28904927894.80 rows=33393232 width=120)
               Join Filter: ((tower.geom && traj.location) AND _st_contains(tower.geom, traj.location))
               ->  Seq Scan on cell_data_tower tower  (cost=0.00..52.00 rows=400 width=153)
               ->  Materialize  (cost=0.00..15839886.96 rows=250449264 width=164)
                     ->  Seq Scan on mivehdetailedtrajectory traj  (cost=0.00..8717735.64 rows=250449264 width=164)

我不明白为什么 postgres 认为它应该具体化内表。另外，老实说，我总体上不了解该计划。似乎它应该将 cell_data_tower 表保存在内存中并迭代 mivehdetailedtrajectory 表。关于如何优化它以 (a) 运行，(b) 在合理的时间内运行的任何想法。具体来说，这似乎应该可以在不到 1 天的时间内完成。

编辑:Postgres 版本 9.3

最佳答案

需要大量内存的查询是相关子查询执行得更好的罕见地方(LATERAL JOIN 应该也可以，但那些超出了我的范围)。另请注意，您没有选择 tower.id，因此您的结果不会太有用。

SELECT tower.id, (SELECT COUNT(traj.*) 
                  FROM mivehdetailedtrajectory traj
                  WHERE ST_Contains(tower.geom, traj.location))
FROM cell_data_tower tower
ORDER BY tower.id;

首先尝试使用 LIMIT 1 运行它。总运行时间应该是一个塔的运行时间 * 塔的数量。

关于postgresql - 优化大型 PostGIS 查询，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24499309/

25

4

0

文章推荐： c# - dataGridView，MySQL 数据和动态变化的信息

文章推荐： android - 表格布局间距问题

文章推荐： php - 如何在php类中引用数据库

postgis - 将网络数据保存到 PostGIS
是否可以在使用 PHP 实现 API 后存储从网站 (Nestoria) 收集的数据？我可以使用 PHP 提取数据并将结果显示在网络浏览器上，但我需要将它们转储或保存到我的 PostGIS 数据库中。
postgis - 如何从实际位于 Postgis 多边形内部的多边形获取最近点
我正在尝试清理 PostGIS 数据库中的一些地理空间数据。由于地理编码过程中的一些不精确性，一些必须落在特定区域边界内的点被映射到非常接近，但在该区域的定界多边形之外。我的第一个方法是使用 Pos
postgis - 我可以在 PostGIS 中检查多边形是否包含点吗？
我得到一列( latlon )，它是 ST_MultiPolygon . 另一个几何体是一个点，我只想检查它是否在我的 MultiPolygons 内。我试过: SELECT ST_CONTAINS
postgis - 如何使用 PostGIS 高效查询大型多边形
我正在使用似乎过于分散而无法有效查询的 radio map 。当我询问一个点是否在多边形内时，响应时间为 20-40 秒(我已经测试了“内”/“包含”/“重叠”)。我使用 PostGIS 和 GeoD
postgis - mapnik 不渲染 postgis multipolygonzm？
所以我加载了一堆 NHD 数据，几何图形最终变成了 MultiPolygonZM(其他表格的 pointZM 和 areaZM) way geometry(MultiPolygonZM,90091
postgis - 如何从 PostGIS 中的地理数据获取经度/纬度
我需要 PostGIS 中地理数据中心的经度和纬度。格式称为 EPSG 2206，记录中的列是“length”、“shape_area”和“the_geom” 最佳答案我使用查询来获取经度和纬度。
postgis - 在 PostGIS 中，大于半个世界的多边形被视为相反的多边形
我正在将 GeoDjango 与 PostGIS 结合使用，并尝试使用多边形从数据库中获取属于其中的记录。如果我定义一个大于地球面积一半的多边形，则假定多边形的“内部”是我打算作为“外部”的较小区域
postgis - 尝试为 postgis 创建模板数据库 postgresql 时出现问题
我正在使用 ubuntu 12.04，我安装了 postgis2.1 和 postgresql9.1 ......我是所有人的新手!...... 我按照这个教程创建了一个模板数据库:http://li
postgis - 将线串与 PostgreSQL/Postgis 中的 group_by 通用属性合并
我正在尝试将一系列线串几何图形与匹配属性(road_name_search 和 road_id)结合起来，然后将合并的线串从以下示例数据连接回 road_id 属性 http://sqlfiddle.
postgis - 如何在 PostGIS 数据库中存储值网格，以便 GeoServer 可以绘制轮廓？
我计划将 GeoServer 与 PostGIS 数据库结合使用，以通过 Web map 服务提供等高线。我有一个简单的经纬度值网格，我想将其存储在数据库中并绘制轮廓。虽然 GeoServer 用户
django - Postgis/Geodjango : Cannot determine PostGIS version for database
我正在尝试启动 GeoDjango 应用程序。我已经在 Lion 上使用 brew 安装了 Postgres 和 PostGIS。我使用 template_postgis 创建了一个数据库:creat
postgis - osm2pgsql 错误尝试将 .osm 导入到 Ubuntu 服务器上的 postGis
我正在尝试在 Ubuntu Server 12.04 上设置一个 tile 服务器，并且我已经安装了 Postgresql 和 PostGis 以及 Mapnik 和 Osm2pgsql。我正在尝试运
java - org.postgis.PGgeometry 无法转换为 org.postgis.PGgeometry
我正在迁移一个项目的连接模式从:使用DriverManager到DataDource。但我收到了这个错误: org.postgis.PGgeometry cannot be cast to org.p
postgresql - 将 PostGIS DB 推送到 OpenShift PostGIS DB
我关注了这个tutorial on the Open shift site .我现在正在尝试添加自己的数据，但运气不佳。我在本地计算机上有一个由 PGAdmin III 管理的 postGIS 数据库
postgis - Openlayers-3 WFS-T(通过 geoserver 将功能发布到 postgis)
我在通过 geoservers wfs 将 ol3 中的功能发布到 postgis db 时遇到问题。当我运行此代码时，我只能插入 gid(pk) 和 bin 列，但_geom(Geometry) 列
postgresql - 有没有一种简单的方法可以从 osm-bright 的 postgis 数据库中获取配置 ["postgis"] ["extent"] 值？
我已经成功设置了一个用于 OSM-Bright 的 postgis 服务器。我必须承认服务器对我来说有点像黑盒子，所以虽然我已经设置好它并且运行良好，但我不知道如何以最佳方式使用它。在 OSM-Br
java - 在哪里可以找到 postgis.jar 以从 Java 查询 PostGIS/PostgreSQL 数据库？
我想从 Java 查询 PostGIS/PostgreSQL 数据库。已安装 PostgreSQL 9.4。 PostGIS 2.1 Bundle for PostgreSQL 9.4 通过 Sta
postgresql - 从 PostGIS 2.1 : "Error: attempt to redefine parameter "postgis. 后端升级”
从 PostGIS 2.1 升级:“错误:尝试重新定义参数“postgis.backend” 我正在尝试升级 AWS RDS 上的 PostGIS 数据库，但在运行 ALTER EXTENSION p
postgis - 无法在 postgresql 11 (Linux Mint 19.1 Cinnamon) 中创建 postgis 扩展
我尝试使用 pgAdmin 4 在 Postgresql 11 上运行 postgis 扩展，但在尝试创建扩展时出现以下错误: Could not access file "$libdir/postg
postgresql - 由于 Postgis 问题，我的 Postgresql 数据库出现错误(找不到 $libdir/postgis-2.0？)
今天当我尝试从包含几何值的列中进行选择时，我随机开始出现此错误错误:无法访问文件“$libdir/postgis-2.0” 我的选择之前一直运行良好，但今天才开始出现这种情况。有关如何解决此问题的任

首页

博学

6Ren·AI

商城

postgresql - 优化大型 PostGIS 查询