gpt4 book ai didi

c# - Azure 表存储 - 有序数据的 RowKey 设计

转载 作者:行者123 更新时间:2023-11-30 14:13:08 24 4
gpt4 key购买 nike

我在存储表中存储了大量的 GPS 数据。每个分区最多可达 100 万个实体。插入表中的每个 GPS 实体实际上都是按顺序插入先前的数据的,因此顺序很重要。

有时我需要执行以下查询:

Get the previous/next 3 GPS entities from the current entity (within the same partition).

RowKey 设计选项:

  1. 创建一个递增整数。但是如何跟踪表的当前大小?无法获取表行数或最后插入的行。

  2. 使用日期时间刻度。但是如何使用刻度获取上一个/下一个实体?

我在 C# 中使用 SDK 版本 2.0。

最佳答案

这是一个需要解决的 super 酷问题。

如果您的工作是仅查找给定条目之后或之前的条目,那么这很简单,因为您只需采用 DateTime.Now.Ticks 或 (DateTime.Max.Ticks - DateTime.Now.Ticks ) 作为 RowKey 并在查询中使用“Take”命令来查找最近的 X 条记录。

但是,由于您需要查找给定位置 ID 之后或之前的最近位置,因此我认为以下是一种适合您的 RowKey 的设计模式:

  • 您需要为每个 GPS 位置保存两个实体。实体的数据应该相同,只是行键不同
  • 一个实体的 RowKey 为:DateTime.UtcNow.Ticks,并具有前缀:“A”(升序)
  • 另一个实体的 RowKey 为:DateTime.MaxValue.Ticks - DateTime.UtcNow.Ticks,并且有前缀字符,例如:“D”(降序)

例如,您有 7 个位置,Location1..thru..Location7,我为它们提供了从 01 到 99 的随机刻度值(为了简单起见)。假设 MaxTicks 为 100。这将使我们的表包含以下数据:

Rowkey、实体数据

  • A----01,位置1
  • A----50,位置2
  • A----55,地点3
  • A----66,地点4
  • A----67,位置5
  • A----90,位置6
  • A----99,地点7
  • D----01,位置7
  • D----10,位置6
  • D----33,位置5
  • D----34,位置4
  • D----45,地点3
  • D----50,位置2
  • D----99,位置1

现在,对于每个实体,您都可以轻松计算其“相反”Rowkey 实体。 (只需从 DateTime.MaxValue.Ticks 中减去其 RowKey 并将前缀从 A 翻转到 D 或从 D 翻转到 A)

因此,如果您需要 Location3 之前的 2 个实体,只需发出查询以从表中获取 RowKey 大于“D----45”且小于“D----99”的 2 个实体(最大限度)。如果您需要在 Location3 之后获取 2 行,只需发出 Take 2,其中 RowKey 大于“A----55”且小于“A-----99”(最大值)。发出“小于”条件很重要,这样您在查询“A”时就不会意外遇到“D”。

在批处理事务中更新/插入两组实体,以保证两个实体都进入表中,或者都不进入表中,“瞧”。

这种方法的缺点是您必须支付两倍的存储费用。

希望这对您有所帮助并且不会太令人困惑

关于c# - Azure 表存储 - 有序数据的 RowKey 设计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15195773/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com