PostgreSQL 查询 : getting latest forecast before a deadline, 与实际比较-6ren

PostgreSQL 查询 : getting latest forecast before a deadline, 与实际比较

转载作者：行者123 更新时间：2023-11-29 13:51:24

我想查找按小时和天分割的历史实际风和预报风。

我对一天中的某个时间有多个预报。我的第二天交易的交易截止日期为东部标准时间上午 10 点，因此我希望在此之前的最新预测与该小时的实际风在同一条线上。

使事情复杂化的是时间戳是格林威治标准时间，比美国东部标准时间早 5 小时。

   WITH
   forecast_prep AS (
       SELECT
             date_trunc('day', (foretime - interval '5 hours')) :: DATE AS Foredate,
             extract(HOUR FROM (foretime - interval '5 hours')) + 1     AS foreHE,
             lat,
             lon,
             max(windspeed) as forecast,
             max(as_of) - interval '5 hours'      AS as_of
       FROM weather.forecast
       WHERE date_trunc('day', foretime) :: DATE - as_of >= INTERVAL '9 hours'
       GROUP BY Foredate, foreHE, lat, lon
  ),
  tmp AS (
     SELECT
       meso.station,
       meso.lat,
       meso.lon,
       (meso.timestmp - interval '5 hours') as timestmp,
       date_trunc('day', (meso.timestmp - interval '5 hours')) :: DATE  AS Date,
       extract(HOUR FROM (meso.timestmp - interval '5 hours')) + 1      AS HE,
       CAST(AVG(meso.windspd) AS NUMERIC(19, 2)) AS Actual
     FROM weather.meso
     GROUP BY station, lat, lon, timestmp, Date, HE
  )
SELECT 
   tmp.station, tmp.Date, tmp.HE, tmp.Actual, forecast_prep.forecast, forecast_prep.as_of
FROM tmp
INNER JOIN forecast_prep ON (
   tmp.lat = forecast_prep.lat 
   AND tmp.lon = forecast_prep.lon 
   AND tmp.Date = forecast_prep.Foredate
   AND tmp.HE = forecast_prep.foreHE
)
WHERE 
   (tmp.timestmp BETWEEN '2016-02-01' AND '2016-02-02') 
   AND (tmp.station = 'KSBN')
GROUP BY 
   tmp.station, tmp.Date, tmp.HE, forecast_prep.forecast, forecast_prep.as_of, tmp.Actual
ORDER BY tmp.Date, tmp.HE ASC;

下面是带有相关示例数据的完整表结构。

CREATE SCHEMA weather
CREATE TABLE weather.forecast
    (
    foretime timestamp without time zone NOT NULL,
  as_of timestamp without time zone NOT NULL, -- in UTC
  summary text,
  precipintensity numeric(8,4),
  precipprob numeric(2,2),
  temperature numeric(5,2),
  apptemp numeric(5,2),
  dewpoint numeric(5,2),
  humidity numeric(2,2),
  windspeed numeric(5,2),
  windbearing numeric(4,1),
  visibility numeric(5,2),
  cloudcover numeric(4,2),
  pressure numeric(6,2),
  ozone numeric(5,2),
  preciptype text,
  lat numeric(8,6) NOT NULL,
  lon numeric(9,6) NOT NULL,
  CONSTRAINT forecast_pkey PRIMARY KEY (foretime, as_of, lat, lon)
  );

INSERT INTO weather.forecast
    (windspeed, foretime, as_of, lat, lon)
VALUES
  (11.19,   '2/1/2016 8:00', '1/30/2016 23:00', 34.556, 28.345),
  (10.98,   '2/1/2016 8:00',    '1/31/2016 5:00', 34.556, 28.345),
  (10.64,   '2/1/2016 8:00',    '1/31/2016 11:00', 34.556, 28.345),
  (10.95,   '2/1/2016 8:00',    '1/31/2016 17:00', 34.556, 28.345),
  (10.39,   '2/1/2016 8:00',    '1/31/2016 23:00', 34.556, 28.345),
  (9.22,    '2/1/2016 8:00',    '2/1/2016 5:00', 34.556, 28.345),
  (10,  '2/1/2016 9:00',    '1/30/2016 11:00', 34.556, 28.345),
  (9.88,    '2/1/2016 9:00',    '1/30/2016 17:00', 34.556, 28.345),
  (10.79,   '2/1/2016 9:00',    '1/30/2016 23:00', 34.556, 28.345),
  (10.8,    '2/1/2016 9:00',    '1/31/2016 5:00', 34.556, 28.345),
  (10.35,   '2/1/2016 9:00',    '1/31/2016 11:00', 34.556, 28.345),
  (10.07,   '2/1/2016 9:00',    '1/31/2016 17:00', 34.556, 28.345),
  (9.57,    '2/1/2016 9:00',    '1/31/2016 23:00', 34.556, 28.345),
  (7.93,    '2/1/2016 9:00',    '2/1/2016 5:00', 34.556, 28.345)
;

CREATE TABLE weather.meso
(
  timestmp timestamp without time zone NOT NULL,
  station text NOT NULL,
  lat numeric NOT NULL,
  lon numeric NOT NULL,
  tmp numeric,
  hum numeric,
  windspd numeric,
  winddir integer,
  dew numeric,
  CONSTRAINT meso_pkey PRIMARY KEY (timestmp, station, lat, lon)
);
INSERT INTO weather.meso
    (station, timestmp, lat, lon, windspd)
VALUES
  ('KSBN',  '2/1/2016 8:02', 34.556, 28.345, 16.1),
  ('KSBN',  '2/1/2016 8:12', 34.556, 28.345, 12.6),
  ('KSBN',  '2/1/2016 8:54', 34.556, 28.345, 11.5),
  ('KSBN',  '2/1/2016 9:02', 34.556, 28.345, 18.1),
  ('KSBN',  '2/1/2016 9:17', 34.556, 28.345, 12.2),
  ('KSBN',  '2/1/2016 9:48', 34.556, 28.345, 11.5)
;

这是我想要的输出格式:

station   date       he  actual forecast   as_of  
KSBN      2/1/2016   4   10.4   15.1       1/31/2016 6:00  
KSBN      2/1/2016   5   12.7   11.32      1/31/2016 6:00

最佳答案

DDL 和示例数据确实有助于理解，但我所能提出的只是关于如何利用 row_number 的更多详细信息，例如，也可在此处在线获得 http://rextester.com/FIEUPI83002

select
  row_number() OVER(PARTITION BY date_trunc('day', (foretime - interval '5 hours')) :: DATE 
                    ORDER BY case when extract(HOUR FROM (foretime - interval '5 hours')) < 10 then 1 else 2 end, AS_OF desc) AS rn
, extract(HOUR FROM (foretime - interval '5 hours')) HR
, foretime
, as_of
from forecast
order by RN, as_of DESC

根据可用的示例数据，其结果如下:

+----+----+-----------+---------------------+---------------------+
|    | rn | date_part |      foretime       |        as_of        |
+----+----+-----------+---------------------+---------------------+
|  1 |  1 |         4 | 01.02.2016 09:00:00 | 01.02.2016 05:00:00 |
|  2 |  2 |         3 | 01.02.2016 08:00:00 | 01.02.2016 05:00:00 |
|  3 |  3 |         4 | 01.02.2016 09:00:00 | 31.01.2016 23:00:00 |
|  4 |  4 |         3 | 01.02.2016 08:00:00 | 31.01.2016 23:00:00 |
|  5 |  5 |         4 | 01.02.2016 09:00:00 | 31.01.2016 17:00:00 |
|  6 |  6 |         3 | 01.02.2016 08:00:00 | 31.01.2016 17:00:00 |
|  7 |  7 |         4 | 01.02.2016 09:00:00 | 31.01.2016 11:00:00 |
|  8 |  8 |         3 | 01.02.2016 08:00:00 | 31.01.2016 11:00:00 |
|  9 |  9 |         3 | 01.02.2016 08:00:00 | 31.01.2016 05:00:00 |
| 10 | 10 |         4 | 01.02.2016 09:00:00 | 31.01.2016 05:00:00 |
| 11 | 11 |         3 | 01.02.2016 08:00:00 | 30.01.2016 23:00:00 |
| 12 | 12 |         4 | 01.02.2016 09:00:00 | 30.01.2016 23:00:00 |
| 13 | 13 |         4 | 01.02.2016 09:00:00 | 30.01.2016 17:00:00 |
| 14 | 14 |         4 | 01.02.2016 09:00:00 | 30.01.2016 11:00:00 |
+----+----+-----------+---------------------+---------------------+

因此，如果您要使用过滤器 WHERE RN = 1，则应列出每天的“最近”行，即 10 之前的行。我相信这样的事情会适合您的要求。请注意，使用 case 表达式和对 row_number 序列进行排序的其他列(在 OVER() 子句内)调整列组合以满足您的需要。

下方为原创评论

在没有示例数据的情况下，我将只讨论一种方法；我建议使用 ROW_NUMBER() OVER(按 date_time_column DESC 排序) 例如

select
*
from (
  select *
    , ROW_NUMBER() OVER(ORDER BY timestmp DESC) AS RN
  from forecast_table
  -- where timestmp < 10 am (include required logic ere)
  )
WHERE RN = 1

由于 DESCendng 顺序，计算列 RN 中值为 1 的行将是最新的行。这也可以与 PARTITION BY 结合使用，因此 row_numebr 方法对于查找“最新”行或“最旧”行甚至每个分区或整体的最大/最小行很有用。

关于PostgreSQL 查询 : getting latest forecast before a deadline, 与实际比较，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40687950/

文章推荐： sql - PostgreSQL聚合函数选择2个对应字段

文章推荐： ios - 在 NSProxy 中包装一个 UITableViewController

文章推荐： ios - 尝试在表格 View 中按日期对核心数据对象进行排序

文章推荐： ios - 如何使用 UIImage 从 tableview 单元格中的 url 平滑滚动

Mdx - 标志 - 实际
我有两个维度 DimFlag 和 DimPNL 以及一个事实表 FactAmount 。我正在寻找:当 pnl 是 stat(Is Stat=1) 时:sum (Actual x FlagId)对于
jira - JQL 实际 "contains"
我想对包含其部分内容的文本字段执行简单搜索，但我不知道从哪里开始。我基本上想要人们对“包含搜索”的期望。如果我在 issue 中搜索 345 ，我会想要这个结果: 123456 234567 3456
c# - 我如何获得*实际*主机应用程序实例？
我在 VBE 的 C# 插件中有这段代码(强调“VBE”:它不是 MS-Office 插件): public abstract class HostApplicationBase : IHostApp
android - 实际 View 的高度不适合适当的内容
我有一个 ImageView，它显示来自资源的图像。ImageView 的宽度是固定的 (60dp)。高度设置为 wrap_content。调整图像大小以适合此宽度(节省宽高比 - 这很完美) 问题是
html - 实际 CSS 响应背景不响应(？)
我正在建立一个网站，但遇到了一个问题:谷歌浏览器开发者工具中的背景以较低/较高的分辨率延伸。当我直接从手机打开网站时，背景不适合屏幕，只是“剪切”了背景。这是网站:https://feargames
javascript - 实际
大小比预期的大
好吧，首先，这是 HTML 模板: ... ... ... ... 如您所见，页面位于标题下方，并且通过 JS 代码可见
algorithm - 检索相似条目的最快(实际)存储实现是什么？
我读到了 BK-trees (Burkhard-Keller-Trees) 几个月前，据说这是一种保存您想通过距离度量再次读取的内容的好方法。因此，在每种情况下，您都希望通过相似性检索某些内容。然而
Python:根据*实际*长度填充字符串
在 python 中，很容易根据字符数用空格填充字符串。例如: print "aaa".ljust(10) + "end" print "www".ljust(10) + "end" 输出是: aaa
design-patterns - 您如何在设计和(实际)实现应用程序之间取得平衡
我的问题不是特定于编程语言的，而是更通用的问题，以了解人们的思维方式。通常在大型开发公司中，每项工作都有特定的角色，例如程序员和架构师。因此架构师的观点是拥有完美的架构师和解决方案设计，另一方面程序
javascript - promise 实际 self 实现
我想将数据传递给 then 方法，但是当我通过给它 this.passedResolve 来执行此操作时，它会得到 undefined function Promises(callback){
erlang - Erlang 系统中最大(实际)节点数是多少
我希望使用 Erlang/Elixir 在金融市场创建一个平台即服务。我将在金融市场提供 AWS lambda 风格的函数，但我计划向客户分发我自己的基于 ARM 的硬件终端(基于 Nvidia Je
java - 实际 Jackrabbit/Oak 指南和文档
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便
c - 如何确定AUTOSAR Runnable的(实际)循环时间
我已经看到很多代码，这些代码使用Runnable的循环时间来实现某些计时器/超时。问题是，如果有人决定更改此Runnable的循环时间，则计时器将不正确。例: #define FOO_TIMER_1
c# - WPF DataGrid 实际 ColumnHeaderHeight
当我将 WPF DataGrid 的 ColumnHeaderHeight 设置为 Auto (double.NaN) 时，如何获取列标题的实际呈现高度？我似乎无法在 DataGrid 类中找到该属
javascript - 实际 IE6 Png 修复
目前最实用的png修复方法是什么？轻量级，支持背景重复和背景位置。最佳答案 IE7.JS在我看来: IE7.js is a JavaScript library to make Microsoft
Android onBackPressed，如何测试未保存的更改是否*实际*进行了？
我已经进行了长时间的搜索并尝试了常见的嫌疑人，但现在是寻求帮助的时候了。我的 Android Activity 非常愉快地从 SQLite 加载 EditText、Spinner 和 CheckBo
mysql - *实际*精确的 MySQL 全文搜索
因此，我在 MySQL 全文中创建精确搜索时遇到了一些困难。在我的数据库中，我正在尝试查找标题中包含特定关键字的职位。所以我可以尝试 WHERE MATCH(jobTitle) AGAINST (
实际 HTML 元素的 JAVASCRIPT 数组
我正在尝试将 JavaScript 包含到一个表单应用程序中，该应用程序从现场收集施工数据。我已经用谷歌搜索了这个废话，但我无法弄清楚将 html 元素保存在数组中是否合法(或者我的语法是否正确)。
php - 有什么方法可以确定*实际* session 保存路径吗？
我知道有六种方法可以获取 session.save_path 指令的值(phpinfo()、session_save_path()等)，但当值为空字符串时(默认情况下为空字符串)，实际路径可以是多个位
javascript - *实际*使用的是什么版本的 npm 库？
我知道 npm 库在安装时可以在分层树中安装同一库的多个版本，如下所示: a@0.1.0 -> b@1.0 -> c@2.0 -> b@2.0 在上面，版本0.1.0的包a被拉入

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

PostgreSQL 查询 : getting latest forecast before a deadline, 与实际比较