gpt4 book ai didi

sql - 带有 IGNORE NULLS 的 FIRST_VALUE() 中出现意外行为 (Vertica)

转载 作者:行者123 更新时间:2023-12-03 04:15:39 24 4
gpt4 key购买 nike

我在使用 IGNORE NULLS 参数的 Vertica FIRST_VALUE() 分析函数中看到意外行为。它似乎在不应该返回 NULL 的时候返回了 NULL。

问题发生在这个非常小的表中:

drop table if exists temp;
create table temp (time_ timestamp(6), name varchar(10));
insert into temp (time_) values ('2016-03-18 20:32:16.144');
insert into temp (time_, name) values ('2016-03-18 20:52:09.062', 'abc');

以下是表格的内容(从 temp 中选择 *):

time_                   | name
------------------------+--------
2016-03-18 20:32:16.144 | <null>
2016-03-18 20:52:09.062 | abc

这是我正在运行的查询:

select time_,
first_value(name ignore nulls) over (order by time_) first_name
from temp;

以下是该查询返回的结果:

time_                   | first_name
------------------------+------------
2016-03-18 20:32:16.144 | <null>
2016-03-18 20:52:09.062 | abc

以下是我期望(和希望)从此查询得到的结果:

time_                   | first_name
------------------------+------------
2016-03-18 20:32:16.144 | abc
2016-03-18 20:52:09.062 | abc

上面的查询是否存在非常根本的语法错误?此问题出现在 Vertica Community Edition 7.1.1 上。

最佳答案

该函数按预期工作。
over (order by time_)over (order by time_ range unboundedleading) 的快捷方式,这是 over (order by time_range unboundedleading) 的快捷方式和当前行),这意味着每一行只能看到其前面的行,包括其自身。
第一行只能看到其自身,因此其范围内没有非 NULL 值。

如果您想要整个范围的第一个非 NULL 值,则必须指定整个范围:

first_value(name ignore nulls) over 
(order by time_ range between unbounded preceding and unbounded following) first_name
<小时/>

不,这绝对不是一个错误。

您可能一直在使用 sum(x) over (order by y) 等语法来运行总计,并且 RANGE UNBOUNDED PRECEDING 的默认窗口对您来说似乎非常自然。
由于您没有为 FIRST_VALUE 函数定义显式窗口,因此您一直在使用相同的默认窗口。

这是另一个测试用例:

ts val
-- ----
1 NULL
2 X
3 NULL
4 Y
5 NULL

您希望从以下函数中得到什么?

last_value (val) order (by ts)

您希望从以下函数中得到什么?

last_value (val ignore nulls) order (by ts)

关于sql - 带有 IGNORE NULLS 的 FIRST_VALUE() 中出现意外行为 (Vertica),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40662817/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com