gpt4 book ai didi

database-design - DynamoDB 设计模式

转载 作者:行者123 更新时间:2023-12-02 08:10:45 24 4
gpt4 key购买 nike

我目前正在尝试设计一种数据库模式来存储需要按需扩展能力的数据。我正在寻找 DynamoDB 来完成这项任务。我不熟悉 no-sql 设计模式,并且在进行设计时遇到了一些麻烦。我的数据集将与跟踪进出房间的人的摄像头系统相关联。

我目前的设计计划是创建一个表,其中将特定相机的设备 ID 作为主键。每 5 分钟,摄像头将发送进入房间的总数、离开房间的总数、组 ID(用于跟踪有多个入口/导出的整个房间)和时间戳。

我的问题是,DynamoDB 似乎只需要一个给定主键的条目。每当我想添加新内容时,它都想覆盖我的数据。

我在想像下面这样的设计可能会奏效:

DeviceID: ID
{
GroupID: ID,
Entries: [
{
In: numIN,
Out: numOUT,
TimeStamp: time
},
// appending on each entry to the list
]
}

我使用 DynamoDB 的效率低吗?有没有更好的方法来解决这个问题?好像是在提问,比如“第 y 天 x 房间里有多少人?”会很困难。

最佳答案

效率低吗?

没有。你没有低效地使用它。 DynamoDB 擅长为每个请求的单个元素存储和检索分层数据组。 AWS 绝对推荐嵌套/非规范化您的数据,以便单个设备具有一系列条目,因为您不能像我认为正确设计的那样进行连接(条目表和设备表)。 https://aws.amazon.com/blogs/database/should-your-dynamodb-table-be-normalized-or-denormalized/一个缺点是您必须提取单个设备的每个条目并附加,但如果您每 5 分钟更新一次,这似乎是可以容忍的。在一个用户流量低的小型应用程序上,我做同样的事情附加到用户信息列表,然后将用户放回去。 DynamoDB 的每个请求都非常便宜,所以如果您没有数百万个请求,我认为这是值得的。

如何运行更复杂的查询?

使用 DynamoDB,您失去了查询灵 active ,但在某些情况下,它是 100% 托管的并且每个请求的成本很低...对于更复杂的查询,您可以添加 Global Secondary indexes因此您可以运行涉及该表的主键以外的列的查询。他们也有自己的缺点;每个索引仍然只能获得 2 个属性,本质上是 2 列的 where 子句,并且每个 GS 索引都有自己的预配置吞吐量,因此您需要为新索引支付额外的固定费用。对我来说,当您要查询的数据被非规范化(类似于您嵌套条目的方式)时,全局二级索引并没有真正帮助。在您的情况下,您将无法将输入、输出、时间戳字段应用于全局二级索引,因为“条目”列是一种文档类型。然而,还有其他 NoSQL 数据库,您可以将整个设备 JSON 对象转储到其中,它们甚至可以为嵌套字段编制索引……

复杂查询的另一个数据库

我自己不想使用其他数据库,因为我认为我可以将 DynamoDB 作为我的主要或唯一数据存储,但如果你需要问“给我 x,其中 A=1 AND B=2 AND C=3”这真的不可能。尝试对数据进行非规范化,同时使其查询友好,我发现这很困难。因此,我使用 DynamoDB 来存储项目和检索项目,并使用 AWS Elasticsearch Service 来跨这些项目运行查询。因此,在您的情况下,我会将设备及其嵌套条目存储在 DynamoDB 和 elasticsearch 中。当我需要通过 Id 检索单个设备或条目或提取任何内容时,它将来自 DynamoDB。当我想对任何属性进行分析时,我会使用 elasticsearch。

关于database-design - DynamoDB 设计模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47289668/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com