algorithm - 同步两个有序列表-6ren

algorithm - 同步两个有序列表

转载作者：塔克拉玛干更新时间：2023-11-03 02:32:03

25

4

我们有两个通常无法相互通信的离线系统。两个系统都维护相同的有序项目列表。他们很少能够相互通信以同步列表。

项目标有修改时间戳以检测编辑。项目由 UUID 标识，以避免在插入新项目时发生冲突(与使用自动递增整数相反)。同步时会检测到新的 UUID 并将其复制到其他系统。同样对于删除。

上面的数据结构对于无序列表来说没问题，但是我们如何处理排序呢？如果我们添加一个整数“等级”，则在插入新项目时需要重新编号(因此需要同步所有后继项目，因为只有 1 次插入)。或者，我们可以使用小数等级(使用前项和后项的等级的平均值)，但这似乎不是一个可靠的解决方案，因为当插入许多新项时它会很快遇到准确性问题。

我们还考虑将其实现为双向链表，其中每个项目都包含其前项和后项的 UUID。但是，这仍然需要在插入 1 个新项目时同步 3 个项目(或者在删除 1 个项目时同步剩余的 2 个项目)。

我们最好使用一种数据结构或算法，其中只有新插入的项目需要同步。是否存在这样的数据结构？

编辑:我们也需要能够处理将现有项目移动到不同位置的问题!

最佳答案

插值排名方法确实没有问题。只需根据表示 0 和 1 之间没有尾随零的二进制小数的可变长度位向量定义您自己的编号系统。二进制小数点在第一个数字的左边。

该系统唯一的不便之处在于空位向量给出的最小可能 key 为 0。因此，只有当您确定相关项目将永远是第一个列表元素时，您才使用它。通常，只需将第一项的键设为 1。这相当于 1/2，因此在 (0..1) 范围内的随机插入往往会尽量减少位使用。要在之前和之后插入一个项目，

01 < newly interpolated = 1/4
1
11 < newly interpolated = 3/4

再次插值:

001 < newly interpolated = 1/8
01
011 < newly interpolated = 3/8
1
101 < newly interpolated = 5/8
11 
111  < newly interpolated = 7/8

请注意，如果您愿意，可以省略存储最后的 1!所有键(除了您通常不会使用的 0)都以 1 结尾，因此存储它是多余的。

二进制分数的比较很像词法比较:0<1 并且从左到右扫描中的第一位差异告诉您哪个较小。如果没有差异，即一个向量是另一个向量的严格前缀，则较短的向量较小。

根据这些规则，想出一个接受两个位向量并计算出大致(或在某些情况下恰好)介于它们之间的结果的算法非常简单。只需添加位串，然后右移 1，删除不必要的尾随位，即取两者的平均值来划分范围。

在上面的例子中，如果删除留给我们:

01
111

我们需要对这些进行插值，将01(0)和111相加得到1.001，然后移位得到 1001。这作为插值很好用。但请注意，最后的 1 不必要地使其比任何一个操作数都长。一个简单的优化是删除最后的 1 位和尾随零以得到简单的 1。果然，1 大约是我们希望的一半。

当然，如果您在同一位置进行多次插入(例如，考虑在列表开头连续插入)，位向量会变长。这与在二叉树中的同一点插入完全相同的现象。它长得又长又细。要解决此问题，您必须在同步期间通过使用尽可能短的位向量重新编号来“重新平衡”，例如对于 14，您将使用上面的序列。

添加

虽然我还没有尝试过，但 Postgres bit string type似乎足以满足我所描述的键。我需要验证的是整理顺序是否正确。

此外，对于任何 k>=2 的以 k 为底的数字，同样的推理也适用。第一项获得 key k/2。还有一个简单的优化可以防止非常常见的分别在末尾和前面追加和前置元素的情况导致长度为 O(n) 的键。它为这些情况维护 O(log n)(尽管在内部相同的位置插入仍然可以在 p 插入后生成 O(p) 键)。我会让你解决这个问题。当 k=256 时，您可以使用无限长的字节串。在 SQL 中，我相信您会想要 varbinary(max)。 SQL 提供正确的词典排序顺序。如果您有一个类似于 Java 的 BigInteger 包，则插值操作的实现很容易。如果您喜欢人类可读的数据，您可以将字节字符串转换为例如十六进制字符串 (0-9a-f) 并存储它们。那么正常的UTF8字符串排序顺序是正确的。

关于algorithm - 同步两个有序列表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10130856/

25

4

0

文章推荐： algorithm - 构建二叉表达式树

文章推荐： asp.net - 如何为搜索引擎优化动态创建的 PDF？

文章推荐： .htaccess - htaccess rewrite 用于已被 Google 索引的重写 URL

mongodb 元组比较(有序)
就类似于这个问题:mongodb query multiple pairs using $in 我想用 (first, last) >= ('John', 'Smith') 找到前 10 个全名。使用
cocoa - 有序 NSDictionary
如何保留向 NSDictionary 添加对象的方式？我意识到 NSDictionary 中的值没有特定的顺序，但就我而言，我需要保留使用 setValue:forKey: 添加的顺序，例如一个数组
assembly - 有序/无序比较是什么意思？
看看上证所运营商 CMPORDPS - ordered compare packed singles CMPUNORDPS - unordered compare packed singles 有序和
java - powermock 有序
我使用 PowerMock 来模拟静态方法。我需要验证静态和非静态方法调用的顺序。可以使用 PowerMock 来做吗？ UPD 我使用 powermockito 扩展来模拟静态方法，因此使用 pow
scala - 合并两个流(有序)以获得最终排序的流
例如，如何合并两个已排序的整数流？我认为这是非常基本的，但只是发现它根本不是微不足道的。下面的不是尾递归的，当流很大时它会堆栈溢出。 def merge(as: Stream[Int], bs: St
c - 用于在二叉树中查找(有序)节点后继的代码中的段错误
我试图在二叉树中查找/打印每个节点的中序后继，但编译器给我的结果是段错误。这是结构:- struct node { int x; struct node *left; str
sql - 使整个 block 有序
我有一个查询看起来像 SELECT a, b, c, d FROM tab ORDER BY a ASC, b ASC 我的结果集看起来像 +-----------------
php - 有序 SQL 时间戳提取
首先，我试过搜索这个主题但一无所获(似乎找不到合适的关键词)，所以如果这是重复的，请告知。我一直在尝试从我的数据库中获取一些 time_stamp 并将它们按时间间隔排序。例如，我运行一个查询，如
c++ - 有序 QVector 中的二进制搜索
这个问题在这里已经有了答案: How do I get the index of an iterator of an std::vector? (9 个回答) 关闭 6 年前。我已经订购了 QVe
java - 有序 Hibernate 列表违反唯一约束
我有以下实体，如果我尝试通过 removeTask 方法从 TaskList 中删除 Task，则会出现异常。 @Entity public class TaskList extends Generi
c - 将字符串中的每个字母(有序)合并为一个新字符串
所以，我对 C 编程还是很陌生。有3个长度相同的字符串。 str1="abc", str2="def", str3="ghi". 新字符串中的输出将类似于“adgbehcfi”。 #include
MySQL:分组/有序/左连接查询非常慢
我的查询有一个问题，它花费的时间太长(仅仅这个简单的查询就超过了两秒)。乍一看，这似乎是一个索引问题，所有连接的字段都已编入索引，但我找不到其他我可能需要编入索引以加快速度的内容。一旦我将我需要的字
java - 有序 map 实现
我正在寻找一个 Map 实现，它按照键值对的添加顺序迭代它们。例如 Map orderedMap = // instantiation omitted for obvious reasons :) o
database - 分层、有序、键值存储？
我正在寻找具有以下功能的数据库系统: 分层(多维)键每个维度的键排序因此，如果我的 key 类似于 App > User > Item，我可以运行如下查询:“该用户的下一项是什么？”或者“这个应用
c++ - 使无序初始化 statc 有序
以下类使用 CRTP 尝试将类型添加到具有 Schwarz 计数器以确保初始化顺序的 std::vector。根据 3.6.2/2 成员 h_ 具有无序初始化。我将如何更改它以确保它已订购初始化？我希
C++有序(稳定)优先级队列
我正在实现一个玩具调度程序，它读取进程规范(例如到达时间、总运行时间)的输入文件，然后根据随机 io/cpu 突发调度进程。文件格式 Arrival time, total CPU time, CP
Python - 有序 header HTTP 请求
我目前正在使用 python 2.7 requests 库，并且不支持有序 header 。我可以为 post 和 get 放置有序数据(如有序字典)，但根本不支持标题。甚至在 python 3 中也
java - java中是否有并发&自过期&有序 HashMap
我正在使用来自 google guava 的 ConcurrentHashMap(通过 MapMaker)，但该实现未排序。google guava 中有 ConcurrentSkipListMap，
java - 有序(自然插入顺序)和线程安全的 Java Map
我有一个旧应用程序，其中使用 ConcurrentHashMap。现在我们知道并发HasMap 是无序的，但是需要读取最初插入的对象。我已经在生产中使用了一段时间的代码，因此我正在寻找快速替代方案来替
c# - 保持 .NET 依赖注入(inject)有序
最近我开始使用 .NET Core 2.1 开发一个新项目，我决定使用 SOLID 原则并创建一个漂亮的项目结构。这是一个 Web API 项目。一切正常我使用了很多依赖注入(inject)，大部分

首页

博学

6Ren·AI

商城

algorithm - 同步两个有序列表