python - 使用 Django (Python) 在 DynamoDB 中自动生成 key-6ren

python - 使用 Django (Python) 在 DynamoDB 中自动生成 key

转载作者：行者123 更新时间：2023-11-28 19:18:44

24

4

我正在为我的项目使用 NoSQL DynamoDB。如何自动生成可用于查询的 key ？

 DynamoDB_view(tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id):
    print "in func DynamoDB_view"
    def insert_to_dynamo(conn, tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id):
        print "in Insert"
        print tableName
# uswd the data as random key generation just for now. this is inappropriate
        data = str(uuid.uuid4().get_hex()[0:16]) 
        table = conn.get_table(tableName)
        item_data = {
        'campaign_id': str(campaign_id),
        'tag_id': tag_id,
        'tag_type': tag_type,
        'app_id' : app_id,
        'group_id' : str(group_id),
        'group_p' : group_p,
        'tenant_id' : str(tenant_id),
        'insertion_timestamp' : str(datetime.now()),
        'insertion_user_id' : str(insertion_user_id)
        }
        item = table.new_item(
        # Our hash key is 'forum'
        hash_key=data,
        
        range_key='Check this out!',
       
        attrs=item_data
        )
        item.put()
    def connection_dynamo(tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id):
   
        conn = boto.dynamodb.connect_to_region(
        'us-east-1',
        aws_access_key_id=settings.ACCESS_KEY,
        aws_secret_access_key=settings.PASS_KEY)    

        insert_to_dynamo(conn,tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id)
        
    
    connection_dynamo(tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id)

最佳答案

这是一些文档的链接:

http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/QueryAndScan.html

对于查询，您必须提供散列键并且必须检查是否相等。如果你有一个范围键，它是可选的，你可以使用它们执行更广泛的操作，而不仅仅是相等。为了性能，您不需要哈希键的“热键”(始终使用相同的键)。

很多答案都归结为您在进行查询时手头有什么，以及您是否需要担心会降低性能。自动生成一些随机的东西会让你免于热键问题，但是当你返回查询你的数据时你可能无法重现这些值(即使你总是为 RNG 使用相同的种子，你的头可能会在之前爆炸你得到你想要的散列键)。这可能会迫使您进入扫描而不是查询的情况，这通常是不可取的。

在查询时，您是否可以使用任何 campaign_id、group_id、tenant_id 等字段？如果答案是肯定的，那么您至少有一些候选哈希键。您仍然应该考虑表中将有多少数据，例如，其中有多少具有相同的 group_id。如果您在查询时同时拥有 group_id 和 tenant_id，并且 tenant_id 值的多样性更高，请使用它们。如果这有助于分散数据，您还可以组合两个 ID 来创建键值。

如果您只有 group_id 并且只有少量组，那么在 group_id 的末尾附加一些随机性以避免热键对您没有帮助。从执行查询的角度来看，您将回到同样的情况，您有一堆基本上无法恢复的 key 。在这种情况下，也许最不痛苦的事情是为每个 group_id 都有一个表，使用完全随机的 key 来实现良好的传播，并接受您的数据强制您进行扫描。

如果您可以获得一个好的散列键，那么您最常见的查询可能会决定您对范围键的选择。因此，如果您通常查询最近 24 小时内的记录，insertion_timestamp 可能是一个不错的选择。如果一些其他因素进入大量查询，请改用它，例如，如果您将查询结果限制为某些事件，而这些事件没有完全随机的名称。或者，如果您有 3 个依赖于不同范围/条件的常见查询，那么您可能想要添加一些本地二级索引 ( Difference between local and global indexes in DynamoDB)。

回到您可能要问的问题，如果您在查询数据时手头什么都没有，那么您可能会被搞砸，您可能必须进行扫描才能返回你的数据。在这种情况下，为您的哈希键使用尽可能随机的东西至少对您的写入有好处，并将确保数据的良好分布。

抱歉，这有点乱，希望其中有帮助。如果我完全误解了或者还有其他一些未说明的限制，请编辑您的问题以反射(reflect)出来。

关于python - 使用 Django (Python) 在 DynamoDB 中自动生成 key ，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29983189/

24

4

0

文章推荐： javascript - Chrome扩展程序弹出安装

文章推荐： html - 你能弄清楚为什么第 2 节在视频后面吗？

文章推荐： javascript - JS 中的倒计时

文章推荐： objective-c - 获取从目录加载的 NSString 中的文件名

python - 什么时候使用 dynamodb.client、dynamodb.resource 和 dynamodb.Table？
我正在使用 Boto3 和 Python 开发 Dyanamodb。我发现的问题之一是我们应该何时使用 dynamodb.client、dynamodb.resource 和 dynamodb.Tab
amazon-dynamodb - DynamoDB 如何分区表？
DynamoDB documentation描述了表分区原则上是如何工作的，但它对细节(即数字)非常了解。 DynamoDB 表分区究竟如何以及何时发生？最佳答案我找到了这个 presentati
amazon-dynamodb - DynamoDB - 读取一个项目并返回一个数组大小
我在 DynamoDB 表中有一个项目。该项目看起来像这样: { data: [ 1, 2, 3, 4, 5, 6 ] more_data: [ 2, 3, 4, 5, 6, 7 ] } 使用
amazon-dynamodb - DynamoDB 通过检查属性值长度进行条件更新
我的 DynamoDB 表中的一个属性是一个名为 REQUEST_IDS 的列表，我想在更新项目之前检查该列表的长度以查看它是否满足条件(小于 10) .如何在 nodejs 的 ConditionE
amazon-dynamodb - dynamodb 从表中获取最早插入的不同值
我正在使用 Amazon Dynamodb，但没有太多经验。我有这样的价格表: 编号 |插入日期 |产品名称 |店名 |价格相同的商店名称和产品名称可以有不同的值(价格和插入日期可能不同)。例如 i
amazon-dynamodb - DynamoDB 查询限制
我对 DynamoDB 上查询/扫描的限制有疑问。我的表有 1000 条记录，对所有记录的查询返回 50 个值，但是如果我将 Limit 设置为 5，这并不意味着查询将返回前 5 个值，它只是说查询
amazon-dynamodb - DynamoDB 中的分页
我需要在 jsp 上显示最大计数为 10 的搜索结果，并且它应该有一个分页来作为分页功能来回遍历。 Dynamodb 有一个最后评估 key ，但返回上一页无济于事，尽管我可以通过移动到下一个结果
amazon-dynamodb - DynamoDB 是否支持在表的主键中使用其中一种数据类型？
我是 CouchDB 的忠实粉丝，并且完全爱上了每个文档发出不止一次的 map 函数。我想知道在 DynamoDB 中是否可以通过使用字符串或数字集类型作为散列和范围主键的一部分(作为散列或范围属性)
amazon-dynamodb - DynamoDB 中条件写入的日期时间比较
我目前正在使用 DynamoDB。如果该记录的日期早于新记录日期字段，我想使用条件写入来更新记录。有没有办法比较条件写入的 DateTime 类型？还是目前仅适用于整数、字符串和流？谢谢。最佳答
amazon-dynamodb - DynamoDb 中标记系统的数据模型
如何对 dynamoDB 表建模以构建一个标签系统，其中产品可以分配多个标签，并且我们应该能够过滤具有特定标签或标签集合的产品集，并获取分配给给定标签的所有标签产品？我考虑过有一张 table :
amazon-dynamodb - DynamoDB 邻接列表模式
我试图更好地理解在 AWS DynamoDB 中使用邻接列表模式进行多对多 (m:n) 关系设计。在此处查看 AWS 文档:https://docs.aws.amazon.com/amazondyn
amazon-dynamodb - DynamoDB 吞吐量超出异常错误
我怀疑 DynamoDB 中的这一说法是否属实或我的理解不正确。它说， ProvisionedThroughputExceededException 消息:您超出了表或一个或多个全局二级索引的最大允许
amazon-dynamodb - DynamoDB 如何查询重叠的时间范围
考虑一个 DynamoDB 表，它由一个主键和两个描述开始日期和结束日期的属性组成。如何在不扫描整个表的情况下查询时间范围是否与表中的时间范围重叠？例子: 发电机表有两条记录 PK Start
amazon-dynamodb - DynamoDB 流是这个用例的正确选择吗？
我有一个 DynamoDB 表，其中包含将由许多应用程序读取的键值对。在启动时，每个应用程序将读取整个表并将其缓存在内存中。我试图解决的问题是，如果 DynamoDB 表中的一个或多个项目已被修改，
amazon-dynamodb - dynamoDB 记录更新后如何返回项目
我正在有条件地更新 dynamoDB 记录(仅当记录具有其属性之一的特定值时)。无论是否成功更新(条件是否满足)，我都想取回记录。 docClient.update(params, function(
amazon-dynamodb - DynamoDB 批量写入项目限制
我目前正在对 DynamoDB 进行批量加载并将我们的数据项划分为批处理单元: 根据限制文件: https://docs.aws.amazon.com/amazondynamodb/latest/AP
amazon-dynamodb - Dynamodb create_table调用失败
我正在跟踪dynamodb的Python教程，以在端口8000上设置本地dynomodb http://docs.aws.amazon.com/amazondynamodb/latest/gettin
amazon-dynamodb - DynamoDB 跨主索引和全局二级索引的键唯一性
我正在创建一个 DynamoDB 表来保存与单个对象关联的注释。评论在特定时间发布到对象，我使用发布的时间作为范围，因此评论可以按时间降序排序。我有发布评论的用户的 userId 的全局二级索引，这
amazon-dynamodb - Dynamodb 自动缩放的速度不够快
我正在运行一个简单的 api，它在每次调用时从 dynamodb 表中获取一个项目，我将自动缩放设置为最小值 25 和最大值 10 000。但是，如果我使用 wrk 或 hey 之类的工具发送 15
amazon-dynamodb - Dynamodb +在putItem请求中如何传递空值？
我在模型中有一个字段已声明为字符串，如下所示: App.Student= DS.Model.extend({ name: DS.attr('string'), address1: DS.attr('s

首页

博学

6Ren·AI

商城

python - 使用 Django (Python) 在 DynamoDB 中自动生成 key