gpt4 book ai didi

azure - 根据行数或大小选择 Azure 表分区键

转载 作者:行者123 更新时间:2023-12-03 04:36:24 24 4
gpt4 key购买 nike

我正在设计一种哈希算法,该算法将为 azure 表生成分区键。我考虑了两种情况:

  1. 根据行数生成键
  2. 根据数据大小生成 key

解释:假设我有 300 个实体要插入(请记住,这是一个非关系商店,所以可以说它有 10 个客户、50 个销售、240 个销售项目)...为了平衡它们,我将使用 2 个分区键:K1 和 K2。
在“行计数模式” 插入 1 将有 K1,插入 2 将有 k2,插入 3->K1,插入 4->k2 等等...非常直接,可能会出现什么问题人们确实...
如果我使用“数据大小”,假设前 50kb 将获得 K1,51-100kb K2, 101-150 K1, 151-200 K2,这可能导致:插入 1, 2 和使用 K1 插入 3,使用 K2 插入 4,使用 K1 插入 5,使用 K2 插入 6,7,8,9,10,11,12,13 和 14...

我的问题是:搜索时,哪种“策略”将实现最佳吞吐量?

Edti1:
我这里最担心的是分区和原始性能之间的不平衡。让我们进一步扩展并想象这是一个 Multi-Tenancy 应用程序。如果我选择Tenant Id作为分区键,我将不得不解决这样一个事实:随着租户数据变得更大,查询性能会比我选择分区键(例如)下降得更快租户 ID + 销售月份 因为在第二种情况下,我将能够运行并行查询,例如“tenant1January”、“tenant1February”、“Tenant1Marchar”...

最佳答案

为了回答你的具体问题,我不会选择任何一个。

分区键是设计表存储查询时要考虑的最重要的事情。如果我正确理解您的 PK 方案,那么为了快速获取您正在保存的任何信息,您需要知道它还保存了多少其他行,或者所有其他数据的大小。

我会退后一步,考虑一下您想要如何获取这些数据,然后考虑您想要使用什么 PK 和 RK。

关于azure - 根据行数或大小选择 Azure 表分区键,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23271379/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com