amazon-web-services - DynamoDB中的索引通知表-6ren

amazon-web-services - DynamoDB中的索引通知表

转载作者：行者123 更新时间：2023-12-04 23:45:27

我将实现一个通知系统，并且试图找出一种在数据库中存储通知的好方法。我有一个使用PostgreSQL数据库的Web应用程序，但是关系数据库对于这种用例似乎并不理想；我想支持各种类型的通知，每种通知都包含不同的数据，尽管数据的子集对于所有类型的通知都是通用的。因此，我认为NoSQL数据库可能比尝试规范化关系数据库中的模式更好，因为这非常棘手。

我的应用程序托管在Amazon Web Services（AWS）中，我一直在寻找DynamoDB来存储通知。这是因为它是托管的，因此我不必处理它的操作。理想情况下，我想使用MongoDB，但我真的更喜欢不必自己处理数据库的操作。我一直在努力想出一种在DynamoDB中完成我想做的事情的方法，但是我一直在努力，因此我有几个问题。

假设我要为每个通知存储以下数据：

一个ID
通知接收者的用户ID
通知类型
时间戳记
是否已阅读/看到
有关通知/事件的元数据（对此无需查询）

现在，我希望能够查询给定用户的最新X通知。另外，在另一个查询中，我想获取特定用户的未读通知的数量。我试图找出一种方法，可以索引我的表以有效地做到这一点。

我可以排除仅具有哈希主键的情况，因为我不会仅通过哈希键进行查找。我不知道“哈希和范围主键”在这里是否对我有帮助，因为我不知道将哪个属性作为范围键。我可以将唯一的通知ID作为哈希键，将用户ID作为范围键吗？这样可以让我仅通过范围键进行查找，即不提供哈希键吗？如果可能的话，也许二级索引可以帮助我按时间戳排序。

我还查看了全局二级索引，但是这些问题是，在查询索引时，DynamoDB仅可以返回投影到索引中的属性-由于我希望返回所有属性，因此我将不得不重复我的所有数据，这似乎很荒谬。

如何索引通知表以支持用例？可能吗，或者您还有其他建议吗？

最佳答案

注意：使用像DynamoDB这样的云存储时，我们必须了解存储模型，因为这将直接影响
您的性能，可伸缩性和财务成本。它是不同的
而不是使用本地数据库，因为您不仅要为
您存储的数据以及执行的操作
数据。例如，删除记录是WRITE操作，因此如果
您没有有效的清理计划（您的情况
时间序列数据特别需要一个），您将付出代价。你的
处理小数据量时，数据模型不会显示问题
但是在需要扩展时肯定会破坏您的计划。那是
说，决策就像创建（或不创建）索引，定义适当的
键的属性，创建表细分等
使整个过程变得与众不同。选择DynamoDB（或更多）
一般而言，键值存储）
权衡需要做出决定，您需要清楚地了解
有关可以使用该工具的存储模型的某些概念
有效地，选择正确的按键确实很重要，但只有
冰山一角。例如，如果您忽略了事实，
处理时间序列数据，无论使用什么主键或索引
您定义的情况下，您的预配置吞吐量将不会得到优化，因为
它分布在整个表（及其分区）中，而不是
仅是经常访问的数据，这意味着未使用的数据是
仅仅因为它是吞吐量的一部分而直接影响您的吞吐量
表。这导致以下情况：
ProvisionedThroughputExceededException在以下情况下“意外”抛出
您肯定知道预配置吞吐量应该足以满足您的需求
需求，但是，被不均匀访问的表分区
已达到其限制（更多详细信息here）。

下面的帖子提供了更多详细信息，但我想带给您一些阅读的动力，并理解，尽管您现在当然可以找到一个更简单的解决方案，但这可能意味着您在碰壁时从头开始（这种“隔离墙”可能是由于高昂的财务成本，性能和可伸缩性方面的限制或两者的结合而来。

问：我可以将唯一的通知ID作为哈希键，将用户ID作为范围键吗？这样可以让我仅通过范围键进行查找，即不提供哈希键吗？

答：DynamoDB是键值存储，这意味着最高效的查询会使用整个键（哈希或哈希范围）。仅由于您没有密钥而使用Scan操作实际执行查询绝对是您的数据模型中就您的需求而言不足的标志。有几件事情需要考虑，许多选择可以避免此问题（下面有更多详细信息）。

现在，在继续之前，我建议您阅读此快速文章，以清楚地理解哈希键和哈希+范围键之间的区别：

DynamoDB: When to use what PK type?

您的案例是典型的时序数据场景，随着时间的流逝，记录变得过时了。您需要注意两个主要因素：

确保您的表具有均匀的访问模式

如果将所有通知放在一个表中，并且更频繁地访问最近的通知，则配置的吞吐量将无法有效使用。
您应该将访问量最大的项目分组在一个表中，以便可以针对所需访问权限适当调整预配置的吞吐量。此外，请确保正确定义Hash Key that will allow even distribution of your data across multiple partitions。

以最有效的方式（努力，性能和成本合理）删除过时的数据

该文档建议将数据划分到不同的表中，以便一旦记录过时就可以删除或备份整个表（请参阅下面的更多详细信息）。

这是文档中介绍与时间序列数据相关的最佳做法的部分：

了解时间序列数据的访问模式

对于您创建的每个表，您指定吞吐量
要求。 DynamoDB分配和保留资源来处理您的
持续低延迟的吞吐量要求。设计时
您的应用程序和表，您应该考虑应用程序的
访问模式以最有效地利用表格的
资源。

假设您设计了一个表格来跟踪您网站上的客户行为，
例如他们点击的网址。您可以使用哈希和
具有客户ID作为哈希属性的范围类型主键，以及
日期/时间作为范围属性。在此应用程序中，客户数据
随着时间的推移无限增长；但是，应用程序可能会显示
表格中所有项目的访问方式不均匀
最新的客户数据更相关，您的应用程序可能
随着时间的流逝，更频繁地访问最新项目
访问较少，最终很少访问较旧的项目。如果
这是一种已知的访问模式，您可以考虑一下
设计表架构时。而不是将所有项目存储在
一个表，则可以使用多个表来存储这些项目。对于
例如，您可以创建表来存储每月或每周数据。对于
该表存储最近一个月或一周中的数据，其中数据
访问速率高，要求更高的吞吐量并用于表存储
较旧的数据，您可以降低吞吐量并节省资源。

您可以通过将“热门”项目存储在一个表中来节省资源
更高的吞吐量设置，并在另一个表中使用“冷”项
较低的吞吐量设置。您可以删除旧项目，只需删除
桌子。您可以选择将这些表备份到其他存储
诸如Amazon Simple Storage Service（Amazon S3）之类的选项。删除
整个表格比删除项目效率更高
一对一，这实际上使写入吞吐量加倍
与删除操作一样多的删除操作。

资源：

http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/GuidelinesForTables.html#GuidelinesForTables.TimeSeriesDataAccessPatterns

例如，您可以按月对表进行细分：

Notifications_April, Notifications_May, etc

问：我希望能够查询给定用户的最新X通知。

答：我建议使用 Query操作并仅使用具有 Hash Key的 UserId（ Range Key）进行查询，以按 Timestamp（日期和时间）对通知进行排序。

Hash Key: UserId
Range Key: Timestamp

注意：更好的解决方案是 Hash Key，使其不仅具有 UserId，而且具有在查询之前可以计算以确保您的 Hash Key甚至允许您访问数据的连接信息。例如，如果来自特定用户的通知比其他用户更受访问，则可以开始具有热分区...在 Hash Key中包含其他信息可以减轻这种风险。

问：我想获取特定用户的未读通知的数量。

答：创建 Global Secondary Index作为稀疏索引，以 UserId作为 Hash Key，以 Unread作为 Range Key。

例：

Index Name: Notifications_April_Unread
Hash Key: UserId
Range Key : Unuread

当您通过哈希键（UserId）查询该索引时，您将自动拥有所有未读的通知，并且不会通过与该情况无关的通知进行不必要的扫描。请记住，表中原始的主键会自动投影到索引中，因此，如果您需要获取有关通知的更多信息，可以始终使用这些属性对原始属性执行 GetItem或 BatchGetItem表。

注意：您可以探索使用除“未读”标志以外的其他属性的想法，重要的是要记住，稀疏索引可以帮助您解决此用例（下面有更多详细信息）。

详细说明：

我将使用稀疏索引来确保您可以查询简化的数据集来进行计数。在您的情况下，您可以使用属性“未读”来标记是否已读取通知，并使用该属性来创建稀疏索引。当用户阅读通知时，您只需从通知中删除该属性，以使其不再显示在索引中。以下是文档中明确适用于您的方案的一些准则：

利用稀疏索引

对于表中的任何项目，DynamoDB只会写一个对应的
索引条目（如果索引范围键）
该项目中存在属性值。如果范围键属性
并不是在每个表项中都出现，因此索引被认为是稀疏的。
[...]

要跟踪未结订单，您可以在CustomerId（哈希）和
IsOpen（范围）。表中仅定义了IsOpen的那些订单
将出现在索引中。然后，您的应用程序可以快速
通过查询索引有效地找到仍未结的订单。
例如，如果您有数千个订单，但数量很少
打开的应用程序可以查询索引并返回
每个未结订单的OrderId。您的应用程序将执行
读取次数明显少于扫描整个扫描所需要的时间
CustomerOrders表。 [...]

无需将任意值写入IsOpen属性，您可以
可以使用不同的属性，这将导致有用的排序顺序
在索引中。为此，您可以创建一个OrderOpenDate属性
并将其设置为下订单的日期（并仍然删除
订单完成后的属性），然后创建OpenOrders
具有架构客户ID（哈希）和OrderOpenDate（范围）的索引。
这样，当您查询索引时，项目将以
更有用的排序顺序。[...]

这样的查询可能非常有效，因为
索引将大大少于
表。此外，您投影到
索引，您将从索引消耗的读取容量单位越少。

资源：
http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/GuidelinesForGSI.html#GuidelinesForGSI.SparseIndexes

在下面找到一些以编程方式创建和删除表所需的操作参考：

建立表格
http://docs.aws.amazon.com/amazondynamodb/latest/APIReference/API_CreateTable.html

删除表格
http://docs.aws.amazon.com/amazondynamodb/latest/APIReference/API_DeleteTable.html

关于amazon-web-services - DynamoDB中的索引通知表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29951270/

文章推荐： c# - 如何动态地成为控制台应用程序或 Windows 应用程序

文章推荐： Python连接4检查win函数

文章推荐： sql - 如何获得员工职能的首要地位？

文章推荐： r - 为什么在 `j` 中评估比在 `$` 中评估 `data.table` 更快？

java - 为什么Maven在寻找 `webapp\WEB-INF\web.xml`而不是 `web-app\WEB-INF\web.xml`
我有一个几乎可以构建的Maven / Grails应用，但在web.xml上找不到[my-app]\webapp\WEB-INF\web.xml。但是目录结构像往常一样包含web-app文件夹，而不是
web-services - Web 服务和 Web 套接字之间的区别
正如我在标题中提到的:我想知道 web-service 和 web-socket 之间的区别？我们什么时候使用每一个？谢谢! 最佳答案一个web service是一个响应客户端 SOAP/REST
web-services - Web 服务和 Web 应用程序之间的区别
让我们看一个示例场景: 客户端打开一个网站并找到他从文本框中输入的两个数字的总和。然后单击“添加”按钮。两个参数通过 HTTP GET 发送到服务器，在服务器上写入 PHP 代码以添加数字，结果为回声
web-services - Web 服务与 Web 应用程序
我知道这是一个老问题，肯定已经被回答了数百次，但我还无法找到令人满意的答案。我正在创建一个应用程序，其他应用程序(移动/网络)将使用该应用程序来获取数据。现在我有两个选择: 将我的应用程序创建为简单
Azure Web 作业 - 同一 Web 作业中的多个函数和/或同一 Web 应用程序中的多个 Web 作业对性能有何影响？
通过 Web 作业部署新功能有 3 种方法: 创建一个新的 Web 应用，并部署一个包含该函数的 Web 作业。向现有 Web 作业添加一项新函数(这样您现在在一个 Web 作业中就拥有了多个函数)
web - Zabbix web 场景 - 如何在通知中包含 web 响应的内容？
我收到来自网络场景的通知，上面写着“问题”和“确定”。我想在问题发生时包含网络响应的内容。我不担心标题值，只担心网页的内容. 这是我可以在通知设置中引用的变量吗？最佳答案不幸的是 zabbix 不
web-applications - 学习 Web 应用程序的 Web 设计的最佳资源是什么？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
web-applications - Web 应用程序、基于 Web 的应用程序和云应用程序之间的区别
嗨，这是一个理论问题，但我真的无法弄清楚 Web 应用程序、基于 Web 的应用程序和基于云的应用程序之间的区别。这个你能帮我吗。最佳答案 @Matt 是对的 - 这真的无关紧要，但是，为了清楚起见
web-services - 从网站到 Web 应用程序的 Web 服务消费
我正在尝试使用多个 Web 服务，这些服务在它们的 wsdl 中重新定义了一些相同的公共(public)类。我目前在网站中引用了它们，但我想转换为 Web 应用程序。由于一些相同的类是从多个 Web
web-services - 将 Web 应用程序转换为 Web 服务
一个。我必须考虑哪些事项？b.当前应用程序正在执行多个存储过程。如果我创建等效的方法来执行这些过程，会有什么风险或挑战。最佳答案在架构上，将网络应用程序转换为网络服务时必须考虑的一件事是，对方法和
web-services - RESTful Web 服务的 Web 目录？
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 5年前关闭。 Improve thi
web-services - Web API 和 Web 服务有什么区别？
网络 API 和网络服务之间有什么区别吗？或者它们是同一个吗？最佳答案网络服务通常提供 WSDL您可以从中自动创建客户端 stub 。 Web 服务基于 SOAP protocol 。ASP.NE
web-services - 如何使用网络安全组仅允许我的 Web 应用程序与我的 Web 服务通信
我已经获得了我需要的所有资源。我将 Web 服务放入应用程序服务环境中，然后将 NSG 连接到应用程序服务环境使用的子网。然后，我允许 VNET 内的应用程序与 Web 服务进行通信，但它无法正常工作
web-services - 如何使用网络安全组仅允许我的 Web 应用程序与我的 Web 服务通信
我已经获得了我需要的所有资源。我将 Web 服务放入应用程序服务环境中，然后将 NSG 连接到应用程序服务环境使用的子网。然后，我允许 VNET 内的应用程序与 Web 服务进行通信，但它无法正常工作
web-services - Web 服务测试隔离 - 但何时验证 Web 服务本身？
我正在使用 stub 将我的网络服务相关测试与实际网络服务隔离开来。你/我应该如何合并测试以确保我制作的响应与实际的网络服务匹配(我无法控制它)？我不想知道怎么做，而是何时何地？我应该为测试数据
web-services - WEB API 的 VS WEB 服务？
我在互联网上搜索了很多，但我仍然没有得到网络服务和网络 API 之间的明显区别？我在某处读到所有 Web 服务都是 API，但所有 API 都不是 Web 服务。如何？我所知道的是两者都允许利用其他
java - 将 Web 应用程序移动到 Web 托管/Web 服务器
假设我已经完成了使用 JavaEE 制作的 Web 应用程序。这个 Web 应用程序包含登录系统，但最后它是非常基本的 Web 应用程序。我使用的是 GlassFish 3.1.2.2。我想知道一旦
expression-web - Microsoft Expressions Web 是否支持 Web 应用程序项目？
我希望设计者能够打开与我相同的解决方案文件。这可以通过 Expressions Web 实现吗？最佳答案简短的回答是“不”；但这是一个非常常见的请求，我知道很多人都希望下一个版本(无论何时)对此有
web-services - ColdFusion 在本地计算机而不是 Web 服务器上查找 Web 服务导入语句中的文件
我正在尝试在 CF10 中创建一个 Web 服务对象。我已验证它在 SoapUI 中按预期工作。但是，当我在 CF 中运行它时，我得到一个错误，它无法找到在 WSDL 的导入语句中导入的 XSD。这是
java - Web 服务设计 - 外部 Web 服务和客户端之间的中间 Web 服务
我的要求是开发一个 Web 服务，充当外部 Web 服务和客户端之间的中间人。我知道，我可以为我的服务设计一个wsdl，然后将外部wsdl映射到代码中我的wsdl。我的问题是有一个开源 api/工具

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

amazon-web-services - DynamoDB中的索引通知表