- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想使用 Postgres 和 PostGIS 编写查询。我也将 Rails 与 rgeo
、 rgeo-activerecord
和 activerecord-postgis-adapter
一起使用,但 Rails 的东西并不重要。
表结构:
measurement
- int id
- int anchor_id
- Point groundtruth
- data (not important for the query)
示例数据:
id | anchor_id | groundtruth | data
-----------------------------------
1 | 1 | POINT(1 4) | ...
2 | 3 | POINT(1 4) | ...
3 | 2 | POINT(1 4) | ...
4 | 3 | POINT(1 4) | ...
-----------------------------------
5 | 2 | POINT(3 2) | ...
6 | 4 | POINT(3 2) | ...
-----------------------------------
7 | 1 | POINT(4 3) | ...
8 | 1 | POINT(4 3) | ...
9 | 1 | POINT(4 3) | ...
10 | 5 | POINT(4 3) | ...
11 | 3 | POINT(4 3) | ...
此表是某种手动创建的 view
,用于更快的查找(具有数百万行)。否则我们必须连接 8 个表,它会变得更慢。但这不是问题的一部分。
参数:
p
d
查询应该做什么:
1. 查询从 Point groundtruth
中查找所有具有 distance < d
的 p
Points
SQL 非常简单:WHERE st_distance(groundtruth, p) < d
2. 现在我们有一个 groundtruth
点及其 anchor_id
的列表。正如您在上表中看到的,可能有多个相同的 groundtruth-anchor_id 元组。例如:anchor_id=3
和 groundtruth=POINT(1 4)
。
3. 接下来,我想通过随机选择其中一个(!)来消除相同的元组。为什么不直接拿第一个呢?因为 data
列不同。
在 SQL 中选择一个随机行:SELECT ... ORDER BY RANDOM() LIMIT 1
我对这一切的问题是:我可以想象一个使用 SQL LOOP
s 和大量子查询的解决方案,但是肯定有一个使用 GROUP BY
或其他一些方法的解决方案可以使它更快。
与上面基本相同,只有一个区别:输入参数变化:
p1
... p312456345
d
如果简单查询有效,则可以使用 SQL 中的 LOOP
来完成。但也许有更好(更快)的解决方案,因为数据库真的很大!
WITH ps AS (SELECT unnest(p_array) AS p)
SELECT DISTINCT ON (anchor_id, groundtruth)
*
FROM measurement m, ps
WHERE EXISTS (
SELECT 1
FROM ps
WHERE st_distance(m.groundtruth, ps.p) < d
)
ORDER BY anchor_id, groundtruth, random();
感谢 Erwin Brandstetter!
最佳答案
为了消除重复,这可能是 PostgreSQL 中最有效的查询:
SELECT DISTINCT ON (anchor_id, groundtruth) *
FROM measurement
WHERE st_distance(p, groundtruth) < d
有关此查询样式的更多信息:
如评论中所述,这为您提供了任意选择。如果你需要随机,稍微贵一些:
SELECT DISTINCT ON (anchor_id, groundtruth) *
FROM measurement
WHERE st_distance(p, groundtruth) < d
ORDER BY anchor_id, groundtruth, random()
第二部分更难优化。 EXISTS
半连接可能是最快的选择。对于给定的表ps(p点)
:
SELECT DISTINCT ON (anchor_id, groundtruth) *
FROM measurement m
WHERE EXISTS (
SELECT 1
FROM ps
WHERE st_distance(ps.p, m.groundtruth) < d
)
ORDER BY anchor_id, groundtruth, random();
这可以在一个 p
足够接近时停止计算,并使其余的查询保持简单。
请务必使用 a matching GiST index 进行备份.
如果你有一个数组作为输入,创建一个 CTE与 unnest()
即时:
WITH ps AS (SELECT unnest(p_array) AS p)
SELECT ...
如果你只需要一个单行作为答案,你可以简化:
WITH ps AS (SELECT unnest(p_array) AS p)
SELECT *
FROM measurement m
WHERE EXISTS (
SELECT 1
FROM ps
WHERE st_distance(ps.p, m.groundtruth) < d
)
LIMIT 1;
ST_DWithin()
更快使用函数 ST_DWithin()
可能更有效(以及匹配的 GiST 索引!)。
要获得一个行(在这里使用子选择而不是 CTE):
SELECT *
FROM measurement m
JOIN (SELECT unnest(p_array) AS p) ps ON ST_DWithin(ps.p, m.groundtruth, d)
LIMIT 1;
在距离 d
内为每个点 p
获取一行:
SELECT DISTINCT ON (ps.p) *
FROM measurement m
JOIN (SELECT unnest(p_array) AS p) ps ON ST_DWithin(ps.p, m.groundtruth, d)
添加 ORDER BY random()
将使此查询成本更高。如果没有 random()
,Postgres 只能从 GiST 索引中挑选第一个匹配行。否则,所有 可能的匹配都必须被检索并随机排序。
顺便说一句,EXISTS
中的 LIMIT 1
毫无意义。阅读the manual at the link I provided或 this related question .
关于sql - 按值(不是列)分组后从组中选择一个随机条目?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15091363/
情况:我想从数据条目列表导航回我的 PageViewController。 before 和 previous 函数起作用 func pageViewController(pageViewContro
尊敬的 StackOverflow 用户 我有一个 gradle 项目,我想将其工件转换为 osgi 包。在这个包中,我有: 我不想导出的包(可能不会出现在 list 的 Export-Package
我为我的 PendingIntent 设置了一个警报。现在我想在我的 Activity 中显示是否设置了此警报。 Intent service = new Intent(context, MyServ
我有 2 个表、作者和书籍 authors 包含唯一的 IDauthorId 书籍也包含此作为外键 我需要知道书籍数量最多的作者。如果 2 个或更多作者并列最多书籍,我需要显示这两位作者 我已经能够通
我有一个名为 prospective_shop 的表,其中一个列名称是“用户名”。用户名未设置为主键,但我想删除所有具有重复用户名的行。我怎样才能以最快的方式做到这一点? 我尝试执行以下操作: ALT
我现在可以添加条目了。在我的应用程序中,用户可以在他的日历上输入约会/事件。但在他这样做之前,它应该向他显示他已经添加的事件。它应该从日历中获取事件并将其显示给他。这该怎么做?我被困在这部分。提前致谢
#include #include #include #include #include #include char *msg; ssize_t write_proc(struct file
我想将大于 1024 个字符的字符串传递到我的模块(文件系统)。由于内核参数限制为 1024 个字符,someone recommended改为使用 sysfs。 我试图包括 this example
我正在尝试使用 SQLAlchemy 构建以下查询(用作包含查询的子查询,该查询定义名为 tbl_outer 的别名): SELECT max(tbl.ts) AS max_1 FROM tbl WH
假设我有两张 map : Map map1 = Map.of( "a", "1", "b", "2", "c", "3", "x
通过简化示例,假设您有以下数据集: A B C Name Group Amount Dave A 2 Mike B 3 Adam C 4
我正在尝试在我的服务器上创建一个三级域虚拟主机。我希望配置设置正确,但我得到一个 ERR_NAME_NOT_RESOLVED错误。 我已经读到我必须在某处“添加 DNS 条目”以便解析名称,但我该怎么
我需要一个可用于在逗号分隔列表中查找第 N 个条目的正则表达式。 例如,假设此列表如下所示: abc,def,4322,mail@mailinator.com,3321,alpha-beta,43 .
GWT 应用程序(在 Eclipse 中开发)的源代码管理忽略文件中的典型条目是什么? 最佳答案 我会推荐: 你leave the eclipse files (.project, .classpat
我必须创建显示表 (Tbl) 中所有字段的输出,并创建一个额外的列来按月计算每个客户的累计总和(例如,如果客户在 4 月份有两次销售,新列将具有这些销售额和两行中任何先前销售额的总和)。我能做的就这么
文档 ( http://kubernetes.io/docs/user-guide/configmap/ ) 上用于使用值的示例基于 ConfigMap,其中每个数据条目都是一对/值。例子: apiV
我有一个奇怪的错字,我一遍又一遍地犯,而不是实际工作我的打字技巧,我想编辑我的 AutoHotkey 脚本来弥补这一点。 有时,当我输入大写字母时,我会点击:按钮并输入“I:”,我希望 AHK 仅用字
使用 lgdt 初始化 GDT 并将其加载到 GDTR 后,稍后如何更新 GDT? 如果我使用 sgdt 命令获取基地址,然后更新或添加条目,然后使用 lgdt 再次重新加载,我是否正确?还有其他方法
我有两个应用程序共享同一个数据库,即 API 和 MVC5 应用程序。两者都在本地主机上运行良好,但在部署到我的 Azure 帐户时出现此错误 Configuration Error Descrip
我正在尝试修剪我拥有的一些文件。我将为您保存到目前为止我编写的野兽,并通过提供虚构代码使其保持简单。 让我们来看看这个数组: [System.String[]]$Collection = 'Invit
我是一名优秀的程序员,十分优秀!