python - 使用 Python 从 dynamodb 中检索 500 个项目的简单示例-6ren

python - 使用 Python 从 dynamodb 中检索 500 个项目的简单示例

转载作者：太空狗更新时间：2023-10-29 20:52:29

26

4

寻找一个从 dynamodb 中检索 500 项的简单示例，以最大限度地减少查询次数。我知道有一个“multiget”函数可以让我将其分解为 50 个查询的 block ，但不确定如何执行此操作。

我从 500 个键的列表开始。然后我正在考虑编写一个函数，它接受这个键列表，将其分解为“ block ”，检索值，将它们重新拼接在一起，并返回一个包含 500 个键值对的字典。

或者有更好的方法吗？

作为推论，之后我将如何“排序”这些项目？

最佳答案

根据您的方案，有 2 种方法可以有效地检索您的 500 件元素。

1 项在相同的 `hash_key` 下，使用 `range_key`

使用query方法和hash_key
您可能会要求对 range_keys A-Z 或 Z-A 进行排序

2 个项目在“随机”键上

你说了算:使用BatchGetItem方法
好消息:限制实际上是 100/请求或最大 1MB
您必须在 Python 端对结果进行排序。

在实践方面，由于您使用 Python，我强烈推荐 Boto library用于低级别访问或 dynamodb-mapper library用于更高级别的访问(免责声明:我是 dynamodb-mapper 的核心开发人员之一)。

遗憾的是，这些库都没有提供包装 batch_get 操作的简单方法。相反，有一个用于 scan 和 query 的生成器，它“假装”您在单个查询中获得所有内容。

为了通过批量查询获得最佳结果，我推荐这个工作流程:

提交包含所有 500 件商品的批处理。
将结果存储在你的字典中
根据需要多次使用 UnprocessedKeys 重新提交
在 python 端对结果进行排序

快速示例

我假设您已经使用单个 hash_key

创建了一个表“MyTable”

import boto

# Helper function. This is more or less the code
# I added to devolop branch
def resubmit(batch, prev):
    # Empty (re-use) the batch
    del batch[:]

    # The batch answer contains the list of
    # unprocessed keys grouped by tables
    if 'UnprocessedKeys' in prev:
        unprocessed = res['UnprocessedKeys']
    else:
        return None

    # Load the unprocessed keys
    for table_name, table_req in unprocessed.iteritems():
        table_keys = table_req['Keys']
        table = batch.layer2.get_table(table_name)

        keys = []
        for key in table_keys:
            h = key['HashKeyElement']
            r = None
            if 'RangeKeyElement' in key:
                r = key['RangeKeyElement']
            keys.append((h, r))

        attributes_to_get = None
        if 'AttributesToGet' in table_req:
            attributes_to_get = table_req['AttributesToGet']

        batch.add_batch(table, keys, attributes_to_get=attributes_to_get)

    return batch.submit()

# Main
db = boto.connect_dynamodb()
table = db.get_table('MyTable')
batch = db.new_batch_list()

keys = range (100) # Get items from 0 to 99

batch.add_batch(table, keys)

res = batch.submit()

while res:
    print res # Do some usefull work here
    res = resubmit(batch, res)

# The END

编辑:

我已经 added a resubmit() function到 Boto 开发分支中的 BatchList。它大大简化了工作流程:

将您请求的所有键添加到BatchList
提交()
resubmit() 只要它不返回 None。

这应该在下一个版本中可用。

关于python - 使用 Python 从 dynamodb 中检索 500 个项目的简单示例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12122006/

26

4

0

文章推荐： c# - 从控件添加对 header 的引用

文章推荐： c++ - 计算表达式字符串由 std::map 中的键组成

文章推荐： c# - Resharper 正确吗？

文章推荐： python - 使用 Python 上传文件

python - 什么时候使用 dynamodb.client、dynamodb.resource 和 dynamodb.Table？
我正在使用 Boto3 和 Python 开发 Dyanamodb。我发现的问题之一是我们应该何时使用 dynamodb.client、dynamodb.resource 和 dynamodb.Tab
amazon-dynamodb - DynamoDB 如何分区表？
DynamoDB documentation描述了表分区原则上是如何工作的，但它对细节(即数字)非常了解。 DynamoDB 表分区究竟如何以及何时发生？最佳答案我找到了这个 presentati
amazon-dynamodb - DynamoDB - 读取一个项目并返回一个数组大小
我在 DynamoDB 表中有一个项目。该项目看起来像这样: { data: [ 1, 2, 3, 4, 5, 6 ] more_data: [ 2, 3, 4, 5, 6, 7 ] } 使用
amazon-dynamodb - DynamoDB 通过检查属性值长度进行条件更新
我的 DynamoDB 表中的一个属性是一个名为 REQUEST_IDS 的列表，我想在更新项目之前检查该列表的长度以查看它是否满足条件(小于 10) .如何在 nodejs 的 ConditionE
amazon-dynamodb - dynamodb 从表中获取最早插入的不同值
我正在使用 Amazon Dynamodb，但没有太多经验。我有这样的价格表: 编号 |插入日期 |产品名称 |店名 |价格相同的商店名称和产品名称可以有不同的值(价格和插入日期可能不同)。例如 i
amazon-dynamodb - DynamoDB 查询限制
我对 DynamoDB 上查询/扫描的限制有疑问。我的表有 1000 条记录，对所有记录的查询返回 50 个值，但是如果我将 Limit 设置为 5，这并不意味着查询将返回前 5 个值，它只是说查询
amazon-dynamodb - DynamoDB 中的分页
我需要在 jsp 上显示最大计数为 10 的搜索结果，并且它应该有一个分页来作为分页功能来回遍历。 Dynamodb 有一个最后评估 key ，但返回上一页无济于事，尽管我可以通过移动到下一个结果
amazon-dynamodb - DynamoDB 是否支持在表的主键中使用其中一种数据类型？
我是 CouchDB 的忠实粉丝，并且完全爱上了每个文档发出不止一次的 map 函数。我想知道在 DynamoDB 中是否可以通过使用字符串或数字集类型作为散列和范围主键的一部分(作为散列或范围属性)
amazon-dynamodb - DynamoDB 中条件写入的日期时间比较
我目前正在使用 DynamoDB。如果该记录的日期早于新记录日期字段，我想使用条件写入来更新记录。有没有办法比较条件写入的 DateTime 类型？还是目前仅适用于整数、字符串和流？谢谢。最佳答
amazon-dynamodb - DynamoDb 中标记系统的数据模型
如何对 dynamoDB 表建模以构建一个标签系统，其中产品可以分配多个标签，并且我们应该能够过滤具有特定标签或标签集合的产品集，并获取分配给给定标签的所有标签产品？我考虑过有一张 table :
amazon-dynamodb - DynamoDB 邻接列表模式
我试图更好地理解在 AWS DynamoDB 中使用邻接列表模式进行多对多 (m:n) 关系设计。在此处查看 AWS 文档:https://docs.aws.amazon.com/amazondyn
amazon-dynamodb - DynamoDB 吞吐量超出异常错误
我怀疑 DynamoDB 中的这一说法是否属实或我的理解不正确。它说， ProvisionedThroughputExceededException 消息:您超出了表或一个或多个全局二级索引的最大允许
amazon-dynamodb - DynamoDB 如何查询重叠的时间范围
考虑一个 DynamoDB 表，它由一个主键和两个描述开始日期和结束日期的属性组成。如何在不扫描整个表的情况下查询时间范围是否与表中的时间范围重叠？例子: 发电机表有两条记录 PK Start
amazon-dynamodb - DynamoDB 流是这个用例的正确选择吗？
我有一个 DynamoDB 表，其中包含将由许多应用程序读取的键值对。在启动时，每个应用程序将读取整个表并将其缓存在内存中。我试图解决的问题是，如果 DynamoDB 表中的一个或多个项目已被修改，
amazon-dynamodb - dynamoDB 记录更新后如何返回项目
我正在有条件地更新 dynamoDB 记录(仅当记录具有其属性之一的特定值时)。无论是否成功更新(条件是否满足)，我都想取回记录。 docClient.update(params, function(
amazon-dynamodb - DynamoDB 批量写入项目限制
我目前正在对 DynamoDB 进行批量加载并将我们的数据项划分为批处理单元: 根据限制文件: https://docs.aws.amazon.com/amazondynamodb/latest/AP
amazon-dynamodb - Dynamodb create_table调用失败
我正在跟踪dynamodb的Python教程，以在端口8000上设置本地dynomodb http://docs.aws.amazon.com/amazondynamodb/latest/gettin
amazon-dynamodb - DynamoDB 跨主索引和全局二级索引的键唯一性
我正在创建一个 DynamoDB 表来保存与单个对象关联的注释。评论在特定时间发布到对象，我使用发布的时间作为范围，因此评论可以按时间降序排序。我有发布评论的用户的 userId 的全局二级索引，这
amazon-dynamodb - Dynamodb 自动缩放的速度不够快
我正在运行一个简单的 api，它在每次调用时从 dynamodb 表中获取一个项目，我将自动缩放设置为最小值 25 和最大值 10 000。但是，如果我使用 wrk 或 hey 之类的工具发送 15
amazon-dynamodb - Dynamodb +在putItem请求中如何传递空值？
我在模型中有一个字段已声明为字符串，如下所示: App.Student= DS.Model.extend({ name: DS.attr('string'), address1: DS.attr('s

首页

博学

6Ren·AI

商城