gpt4 book ai didi

time-series - 我可以将时间序列数据存储在数据仓库中吗?

转载 作者:行者123 更新时间:2023-12-04 16:36:26 24 4
gpt4 key购买 nike

背景:
我有一个 Airflow 作业,每 10 分钟从第三方端点收集一次数据(过去 24 小时内行业的市场份额)。我目前将数据存储在 S3 中。我们想用这些数据来计算我们的市场份额。我计划将数据仓库中的数据作为时间序列独立表(不是维度或事实)保存在查询中,以将其与我们的数据(存储在星型模式中)进行比较,以获得每日市场份额。
问题:
数据仓库是存储时间序列数据的正确位置吗?我们可以存储与此类似的独立表吗?表是否需要成为星型模式的一部分才能将其保存在数据仓库中?

最佳答案

Snowflake 用于存储时间序列数据没有任何限制,数据不需要存储在星型模式中。
您必须考虑如何加载这些数据,这取决于您希望在数据仓库中看到它的速度。
您可以使用 Snowpipe 功能并动态加载数据。
演讲稿:Snowpipe: Load data fast, analyze even faster
文档:Introduction to Snowpipe
或者,使用 STREAM 和 TASK 功能以指定的时间间隔加载数据。设置例如如果 STREAM 在 AWS S3 上检测到任何新数据,则每 10 分钟执行一次循环任务并下载数据。
演讲稿:Randy Pitcher Streams & Tasks Hands on Lab
文档:Introduction to Tasks
CREATE STREAM

关于time-series - 我可以将时间序列数据存储在数据仓库中吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69412707/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com