- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想很好地了解使用DynamoDB Titan后端的价格(以美元计)。为此,我需要能够理解DynamoDB Titan后端何时进行读写。现在我很笨。
理想情况下,我想运行一个测试用例,它添加了一些顶点,边,然后进行了相当简单的遍历,然后查看完成了多少次读写操作。关于如何实现此目标的任何想法?可能通过指标?
如果事实证明我自己不能提取此信息,我将非常感谢有关DynamoDB Titan后端何时执行读取和写入的第一个简要说明。
最佳答案
对于所有Titan后端,要了解和估计写入次数,我们依靠估计给定KCVStore的列数。您还可以测量使用用于Titan的DynamoDB Storage Backend时使用度量标准写入的列数。
要启用指标,请启用here中列出的配置选项。
具体来说,启用7-11行。
请注意max-queue-length配置属性。如果executor-queue-size metric在特定的tx.commit()
调用中达到max-queue-length,则您知道队列/ storage.buffer-size不够大。一旦执行者队列大小度量标准达到峰值而未达到最大队列长度,您就会知道您已经捕获了所有在tx.commit()
调用中写入的列,因此将为您提供在tx.commit()
中更改的列数。您可以查看边缘存储和graphindex的UpdateItem指标,以了解两个表之间的列分布。
所有Titan后端存储都实现KCVStore,根据存储类型,键和列具有不同的含义。假设您尚未打开用户定义的事务日志,则有两个存储可进行大量写操作。它们是edgestore和graphindex。
无论是否配置复合索引,都会始终写入边缘存储KCVStore。每条边和该边的所有边属性均由两列表示(除非您将该边标签的模式设置为单向)。边列的关键是直接列中边的外顶点,而后列中边的内顶点。同样,边的列是直接列中边的内顶点,而边的列是反面中的边的顶点。每个顶点至少由VertexExists隐藏属性的一列,一个顶点标签(可选)的一列和每个顶点属性的一列表示。顶点的键是顶点ID,列对应于顶点属性,隐藏的顶点属性和标签。
只有在Titan管理系统中配置复合索引时,才会写入graphindex KCVStore。您可以索引顶点和边属性。对于每一对索引值和具有该索引值的边/顶点,graphindex KCVStore中将存在一列。键将是索引ID和值的组合,而列将是顶点/边缘ID。
现在,您知道如何计算列,可以在使用适用于Titan的DynamoDB存储后端时,使用此知识来估计对edgestore和graphindex的写入大小和数量。如果将多项目数据模型用于KCVStore,则每个键列对都将获得一个项目。如果对KCVStore使用单项数据模型,则将在键处为所有列获得一项(启用图形分区时不一定是正确的,但这是我现在不再讨论的细节)。只要每个顶点属性小于1kb,并且边缘的所有边缘属性的总和小于1 kb,则在使用多项数据模型进行边缘存储时,每列的写入成本为1 WCU。同样,如果使用多项目数据模型,graphindex中的每一列将花费1 WCU编写。
假设您进行了估算,并且始终使用多项目数据模型。让我们假设您估计每秒将向edgestore写入750列,向graphindex每秒写入750列,并且您希望将这一负载驱动一天。您可以将两个表的读取容量设置为1,因此您知道每个表都将从一个物理DynamoDB分区开始。在us-east-1中,每10个单位的写入容量每小时的写入成本为$ 0.0065,因此,对于每个表而言,每天24 * 75 * $ 0.0065的写入成本为$ 11.70。这意味着Edgestore和graphindex的写入容量每天将花费$ 23.40。可以将每个表的读取次数设置为每秒1次读取,从而使每天两张表的读取成本为2 * 24 * $ 0.0065 = $ 0.312。如果您的AWS帐户是新帐户,则读取将属于免费套餐,因此,实际上,您只需为写入付费。
DynamoDB pricing的另一方面是存储。如果您每秒写入750列,即每天在一张表中写入6480万个项目,则意味着每月有19亿个(约20亿个)项目。则该表中一个月的平均项目数为10亿。如果每个项目的平均大小为412字节,并且有100字节的开销,那么这意味着一个月要存储10亿个512字节的项目,每个月大约477 GB。 477/25向上舍入为20,因此按此负载进行存储的第一个月的费用为每月20 * 0.25美元。如果您继续以这种速率添加项目而不删除它们,则每月的存储成本将每月增加约5美元。
如果图形中没有超级节点或具有相对大量属性的顶点,则对边缘存储的写入将在整个分区键空间中均匀分布。这意味着您的表在达到10GB时将划分为2个分区,然后在达到10GB时,每个分区将共划分为4个分区,依此类推。 2到477 GB /(10 GB /分区)的最近幂是2 ^ 6 = 64,因此这意味着您的边缘存储在第一个月的过程中将分裂6次。在第一个月末,您可能会有大约64个分区。最终,您的表将具有如此多的分区,以至于每个分区将只有很少的IOPS。这种现象称为IOPS饥饿。您应该有适当的策略来解决IOPS饥饿的问题。两种常用策略是1.批量清理/存档旧数据和2.滚动(时间序列)图。在选项1中,您旋转EC2实例以遍历图形并将旧数据写入较冷的存储区(S3,Glacier等),然后将其从DynamoDB中删除。在选项2中,您直接写入与时间段(周-2015W1,月-2015M1等)相对应的图形。随着时间的流逝,您向下调配了旧表上的写入,并且当需要将它们迁移到较冷的存储时,您将读取该时间段的整个图并删除相应的DynamoDB表。这种方法的优势在于,它可以使您以更高的粒度管理写入配置成本,并且可以避免删除单个项目的成本(因为您免费删除了一个表,而不是每个项目至少产生1个WCU您删除)。
关于amazon-dynamodb - 使用适用于Titan的DynamoDB存储后端的DynamoDB定价,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34791590/
我想知道 Amazon CloudSearch 和 Kendra 之间的主要区别是什么?为什么同一家公司的产品有两种不同的工具相互竞争?两者看起来都一样,我不确定功能有何不同。它是如何相互区分的。 A
我在一家小型电子商务网站工作,我们希望迁移到所有 Amazon 托管服务,但我不确定 RDS 和 SimpleDB 的确切区别。 RDS可以用MySQL,SimpleDB不行吗? 最佳答案 RDS 基
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 7年前关闭。 Improve t
任何人都知道如何 ELB如果我注册多个 EC2 将分发请求不同大小的实例。说一 m1.medium , 一 m1.large和一个 m1.xlarge . 如果我注册EC2会不会不一样相同大小的实例?
Amazon EventBridge 使开发人员能够将第 3 方事件驱动的应用程序与 Amazon 服务连接起来。 Amazon AppFlow 还提供与第 3 方应用程序的事件驱动集成。 对于事件驱
我想通过电子邮件或短信向特定用户(只有一个)发送验证码。我已经通过 Amazon SES 成功地做到了。但我没有尝试通过Amazon SMS然而。我发现自己陷入了调查的兔子洞AWS Pinpoint
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
我想使用 Amazon Glacier 镜像 S3 存储桶。 Glacier FAQ状态: Amazon S3 now provides a new storage option that enabl
我正在尝试在 Amazon RDS 上托管数据库,而数据库将存储信息的实际内容(视频)将托管在 Amazon S3 上。我对这个过程有一些疑问,希望有人能帮助我。 Amazon RDS 上托管的数
我刚刚开始使用 AWS EC2。我知道 EC2 就像一台远程计算机,我几乎可以在其中完成我想做的所有事情。后来我知道了ECS。我知道它使用 Docker,但我对这两者之间的关系感到困惑。 ECS 只是
什么时候我会使用 SNS 和 SQS,为什么它们总是耦合在一起? 最佳答案 SNS是一个分布式发布-订阅系统。当发布者将消息发送到 SNS 时,消息就会被推送给订阅者。 SQS是分布式排队系统。消息不
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a software
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭10 年前。 Improve th
我计划在 amazon EC2 中拥有一个多服务器架构,其中服务器需要相互通信。这些服务器需要位于不同的亚马逊地区(不同的数据中心)。我可以只使用亚马逊ec2的内部网络吗?有哪些安全问题?我是否应该在
我在帐户 B 中有 S3 存储桶“跨存储桶”。现在我希望帐户 A 中存在的 EC2 访问帐户 B 中的此存储桶“跨存储桶”。 我需要使用 IAM 角色来实现此目的,因为我们不允许创建用户。 我已使用以
我有使用 Backbone.js 构建的单页应用程序。 我在 Amazon S3 上托管应用程序(应用程序仅包含静态文件)。 我使用 CloudFront 作为 Bucket CDN。 应用程序通过
我可以连接到 ElastiCache来自 EC2 实例 的 VPC 中的 Redis 实例。但我想知道是否有办法连接到 Amazon EC2 实例之外的 ElastiCache Redis 节点,例如
我有几个微实例可以正常工作数周。两者都在运行WordPress博客。在过去的24小时内,其中一个已经停止。即使重新启动,我也无法插入。另一个实例工作正常。 ssh: connect to host e
我尝试了以下方法: SELECT * FROM generate_series(2,4); generate_series ----------------- 2
如何使用PHP API将包含子文件夹和文件的文件夹复制/复制到S3存储桶中的另一个目录中? $s3->copy_object仅复制文件夹,而不复制其中的文件和子文件夹。 我是否必须使用$s3->lis
我是一名优秀的程序员,十分优秀!