gpt4 book ai didi

database-design - 数据仓库 RedShift 与其他 RDBM

转载 作者:行者123 更新时间:2023-12-04 06:54:01 25 4
gpt4 key购买 nike

我有一个系统,数据以相当固定的间隔加载,然后再取出。假设销售数据在销售发生时传入,然后我想按行提取所有销售数据,比如一个月;一次拉取最多 200K 行。没有多少 OLTP 正在进行;仅在新数据进入时插入。

我可以使用数据仓库或 RDBMS。如果我的数据没有达到几个 TB,假设它是 1 TB 左右,那么与没有仓库标签的传统 RDBM 相比,使用数据仓库有什么优势吗?仓库还能给我买什么东西?

我问是因为我可以使用 RDBM,但像 Redshift 这样的系统谈论的是 MPP 处理。由于 MPP,RedShift 会更快吗?我应该坚持使用普通 RDBM 吗?请注意,我没有对数据进行仓库类数据分析。我的数据也不会增长到需要 RedShift 等产品的切片/多节点功能的程度。即使我使用 RedShift,我也可能在单个节点上。

-阿米特

最佳答案

您选择的系统(例如 RDS 与 Redshift)应取决于您的要求,权衡成本

Amazon Redshift 通常是跨大量信息(例如数十亿行)的复杂查询(例如许多行、许多连接)的更好选择。

一些需要考虑的因素:

  • 数据量 -- Redshift可以存储TB甚至PB级的数据
  • 查询速度和复杂性 -- Redshift 的 MPP 特性可以比传统 SQL 数据库更快地处理大量数据
  • 可扩展性 -- 传统的 SQL 数据库只能垂直扩展(更大的服务器),而 Redshift 可以垂直和水平扩展。此外,额外的 Redshift 节点增加了存储和处理能力。

答案是您应该尝试两种选择并选择最适合您的。如果传统的 SQL 数据库(可能在 Amazon RDS 下运行)很适合您,而且它比 Redshift 解决方案便宜,那就太好了!

在执行比较时,请确保您包括了数据库成本和存储成本(这两者都包含在 Redshift 节点的成本中)。

关于database-design - 数据仓库 RedShift 与其他 RDBM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38871374/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com