- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
考虑一个在 PostgreSQL 中实现的投票系统,其中每个用户都可以对“foo”投票赞成或反对。有一个foo
表存储所有的“foo信息”,还有一个votes
表存储user_id
,foo_id
和 vote
,其中 vote
为 +1 或 -1。
要获得每个 foo 的投票计数,可以使用以下查询:
SELECT sum(vote) FROM votes WHERE foo.foo_id = votes.foo_id;
但是,下面的方法同样有效:
(SELECT count(vote) FROM votes
WHERE foo.foo_id = votes.foo_id
AND votes.vote = 1)
- (SELECT count(vote) FROM votes
WHERE foo.foo_id = votes.foo_id
AND votes.vote = (-1))
我目前在 votes.foo_id
上有一个索引。
哪种方法更有效? (换句话说,哪个会跑得更快?)我对特定于 PostgreSQL 的答案和一般的 SQL 答案都感兴趣。
编辑
很多答案都考虑到了 vote
为 null 的情况。我忘了提到投票列上有一个 NOT NULL
约束。
此外,许多人指出第一个更容易阅读。是的,这绝对是真的,如果一位同事写了第二个,除非有性能需要,否则我会气得发狂。尽管如此,问题仍然在于两者的表现。 (从技术上讲,如果第一个查询方式慢,那么编写第二个查询就不算犯罪。)
最佳答案
当然,第一个示例更快、更简单且更易于阅读。甚至在得到 slapped with aquatic creatures 之前就应该很明显了.虽然 sum()
比 count()
稍微贵一点,但更重要的是第二个示例需要两次扫描。
但也有一个实际差异:sum()
可以返回 NULL
,其中 count()
没有。我引用 manual on aggregate functions :
It should be noted that except for count, these functions return a null value when no rows are selected. In particular, sum of no rows returns null, not zero as one might expect,
由于您似乎在性能优化方面存在弱点,这里有一个您可能会喜欢的细节:count(*)
is slightly faster than count(vote )
。仅当 vote 为 NOT NULL
时等效。使用 EXPLAIN ANALYZE
测试性能.
两个查询都是语法废话,单独存在。只有从更大查询的 SELECT
列表中复制它们才有意义,例如:
SELECT *, (SELECT sum(vote) FROM votes WHERE votes.foo_id = foo.foo_id)
FROM foo;
这里的重点是相关子查询 - 如果您在查询中只读取一小部分 votes
,这可能没问题。我们会看到额外的 WHERE
条件,您应该有匹配的索引。
在 Postgres 9.3 或更高版本中,替代的、更清晰的、100% 等效的解决方案是使用 LEFT JOIN LATERAL ... ON true
:
SELECT *
FROM foo f
LEFT JOIN LATERAL (
SELECT sum(vote) FROM votes WHERE foo_id = f.foo_id
) v ON true;
通常性能相似。详情:
但是,在从表 votes
中读取大部分或全部时,这会(快)得多:
SELECT f.*, v.score
FROM foo f
JOIN (
SELECT foo_id, sum(vote) AS score
FROM votes
GROUP BY 1
) v USING (foo_id);
首先聚合子查询中的值,然后连接到结果。
关于使用
:
关于sql - sum() 与 count(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14998225/
我有这个示例代码: #include #include int main() { Eigen::MatrixXf M = Eigen::MatrixXf::Random(1000, 1000)
我有一个像这样的数据框: +-----+--------+ |count| country| +-----+--------+ | 12| Ireland| | 5|Thailand| +-
我想要 SUM(tot_bill_1+tot_bill_2) AS 总计,但这不起作用 SELECT *, IF(SUM(bill_1) IS NULL, '99', SUM(bill_1)) AS
如果我们有两个矩阵 X 和 Y,都是二维的,现在在数学上我们可以说:sum(X-Y)=sum(X)-总和(Y). Matlab 哪个效率更高?哪个更快? 最佳答案 在我的机器上,sum(x-y) 对于
我正在运行 Hive 1.1.0 并看到对于两个 bigint 列,active_users 和 inactive_users,SUM(active_users + inactive_users) <
是否可以在一个选择查询中求和? 类似这样的事情: SELECT id, SUM(current_price - bought_price)*amount AS profit FROM purchase
这是一个相当奇怪的结果。我希望这些具有相同的产量。 下面还有从数据库中提取的 excel 链接。 https://twentius.opendrive.com/files?89038281_muoyg
我必须对 2 个字段求和,然后再求和。从性能的角度来看,先添加字段还是在对列求和之后添加字段有什么区别? 方法 1 = SELECT SUM(columnA + columnB) 方法 2 = SEL
这是一个经典问题,但我很好奇是否有可能在这些条件下做得更好。 问题:假设我们有一个长度为4*N的排序数组,即每个元素重复4次。请注意,N 可以是任何自然数。此外,数组中的每个元素都受制于 0 A. 执
我正在编写一个 Pig 程序,该程序加载一个用制表符分隔整个文件的文件 例如:名称 TAB 年份 TAB 计数 TAB... file = LOAD 'file.csv' USING PigStora
我有一个包含以下字段的表: EmpID, Code, Amount, TransDate, CM, CMDate 我想要进入数据网格的是 SUM所有的Amount具有相同的 Code和 SUM CM具
我有两个单独的查询用于提取报告信息。一年效果很好。但是,如果一个月超过 1 年,则不会显示正确的响应。 这是我的两个查询: select SUM(rpt_complete.total) total,
我想查询一个团队的积分。通过在列上执行 SUM + 来自具有相同团队 ID 的另一个表的 SUM 来添加这些点。我试着这样写: SELECT k.id, s.fylke, s.
这个问题在这里已经有了答案: How to deal with floating point number precision in JavaScript? (47 个回答) Unexpected
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 5 年前。 Improve
我已经找了一段时间,但找不到这个问题的答案(也许我没有搜索正确的术语或其他东西)。基本上,我有一个数据库,每个日期有任意数量的条目。我需要取包含条目的最后 X 天的总和(忽略没有条目的天数)。我知道如
我正在尝试获取 B 行中包含 A 行中某个值的所有值中的一些值。我猜这个问题很简单。 这是我的查询: =QUERY('Sheet1'!$A$16:D, "Select sum(D) Where C c
我正在尝试运行以下查询,但出现以下错误: You have an error in your SQL syntax; check the manual that corresponds to your
我有一个 tableA,其中包含以下结构 我将此结构修改为如下所示的tableB,以减少行数,并且类别是固定长度的 假设我在 tableA 中修改为新结构后有 210 万条数据,tableB 仅包含
我的表在 Postgres 中的数据: id user_id sell_amount sell_currency_id buy_amount buy_currency_id type
我是一名优秀的程序员,十分优秀!