gpt4 book ai didi

amazon-web-services - 避免使用大量散列键和少量随机项目获得大量读/写的 dynamodb 热键

转载 作者:行者123 更新时间:2023-12-04 08:00:44 25 4
gpt4 key购买 nike

我想将大量项目放入 dynamodb(可能每天大约 100k。但 future 可能会向上扩展)。

其中一小部分会比其他人获得更多的点击次数(不确定确切数字,比如 2%-5%)。我将无法提前确定哪个。

每个的哈希键只是一个唯一的正整数 (item_id)。我需要范围键是一个 unixtime 戳。

问题是,这样的设置我会遇到热键的情况吗?我不确定是否为每个哈希键值创建了分区?还是散列键随机放入不同的分区?

如果是后者,我应该是安全的,因为命中率较高的项目将随机分布在各个分区中。但是如果是前者,那么某些分区会比其他分区获得更多的点击次数

最佳答案

不要气馁,没有 DynamoDB 表具有文档建议的完美分布式访问模式。你会有一些热点,这是正常的,没问题。您可能需要增加读/写吞吐量以适应热点,并且取决于它们的热度,这可能会影响成本。但是在您描述的适度吞吐量水平下,它不会使 DynamoDB 无法使用或发生任何事情。

我建议将您的容量要求转换为 DynamoDB 使用的每秒吞吐量指标。每天 100,000 真的会平均分配到每秒 2 次吗?

  • 读取与写入有多少?
  • 它们在 1K 容量块中有多大?
  • 高峰和低谷使用量有很大区别吗?
  • 可以使用缓存来平滑读取模式吗?

  • 是的,散列键将跨分区分布。分区不对应于单个项目,而是对应于读/写容量和存储的分配 ( Understanding Partition Behavior)。

    关于amazon-web-services - 避免使用大量散列键和少量随机项目获得大量读/写的 dynamodb 热键,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31516524/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com