- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想在 Google App Engine 数据存储区中保留一个大型有序列表(数百万个元素)。需要快速插入。
最简单的方法是添加代表订单的索引属性(或列)“order_num”。例如,列表 [A, B, C] 将像这样存储:
content order_num
--------------------
A 1
B 2
C 3
但是,这并不能使您快速插入。例如,如果我想在 A 之后插入 X,我必须重新编号 B 和 C 以便为 X“腾出空间”,即让 B 变成 3,C 变成 4,X 变成 2。如果我这样做,这将是一场灾难有数百万个元素。
我找到了一个可行的解决方案,称为“差距方法”,描述了 here .这种方法在相邻元素之间保持间隙。像这样:
content order_num
--------------------
A 1000
B 2000
C 3000
当我想在 A 之后插入 X 时,只需将 X 的 order_num 设置为 (1000 + 2000)/2 = 1500 即可,无需重新编号。
但随着这些差距越来越小,可能需要重新编号。我的问题是,是否有任何已知的重新编号策略?并决定间隙的大小?
谢谢!
更新
这里有更多细节。假设我在数据库中有一个元素列表,每个元素都有一个名为 my_num 的整数属性。 my_num 的值是任意正整数。假设我有一个列表 [A, B, C, D],它们的 my_num 是
element my_num
---------------------
A 5
B 2
C 10
D 7
现在,让我们定义一个 accum() 运算符:
accum(n) = element[0].my_num + element[1].my_num + ... + element[n-1].my_num
所以每个元素的累加值是
element my_num accum
----------------------------
A 5 5
B 2 7
C 10 17
D 7 24
但累积值可能不应该存储在数据库中,因为列表会不断更新。最好保持快速插入。
我想设计一个输入为整数 x 的查询:
query(x) = element[i] if accum(i-1) < x <= accum(i)
例如query(11)是C,query(3)是A。
是否可以设计一个数据存储架构来加快查询速度?或者唯一的方法是在我打算做的查询时一个一个地累积它?
最佳答案
或者,您可以使用小数或字符串吗?
content order
--------------------
A 'a'
B 'b'
C 'c'
然后在a和b之间插入D,
给它赋值'aa'
生成字符串的算法最适合二进制字符串:如果您想在“1011”和“1100”之间插入一些内容,请执行以下操作:
平均值,新值 = 1+0*(1/2)+1*(1/4)+1*(1/8)+1*(1/16) 新字符串 = "10111"
content order
--------------------
A '1011'
new! '10111'
B '1100'
C '1101'
因为您总是对 2 个值求平均值,所以平均值将始终具有有限的二进制发展和有限的字符串。它有效地定义了一个二叉树。
如您所知,二叉树并不总是平衡的,换句话说,在插入足够多之后,某些字符串会比其他字符串长得多。为了使它们简短,您可以使用任何偶数基数 - 它必须是偶数,因为这样两个值的任何平均值的发展都是有限的。
但是无论您做什么,字符串都可能会变长,并且您必须在某些时候进行一些内务处理,清理值以便有效地使用字符串空间。该算法为您提供的是确定性,即在两次清理之间,系统将继续运行。
关于database - 在数据库中存储有序列表(Gap 方法),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5651299/
就类似于这个问题:mongodb query multiple pairs using $in 我想用 (first, last) >= ('John', 'Smith') 找到前 10 个全名。使用
如何保留向 NSDictionary 添加对象的方式? 我意识到 NSDictionary 中的值没有特定的顺序,但就我而言,我需要保留使用 setValue:forKey: 添加的顺序,例如一个数组
看看上证所运营商 CMPORDPS - ordered compare packed singles CMPUNORDPS - unordered compare packed singles 有序和
我使用 PowerMock 来模拟静态方法。我需要验证静态和非静态方法调用的顺序。可以使用 PowerMock 来做吗? UPD 我使用 powermockito 扩展来模拟静态方法,因此使用 pow
例如,如何合并两个已排序的整数流?我认为这是非常基本的,但只是发现它根本不是微不足道的。下面的不是尾递归的,当流很大时它会堆栈溢出。 def merge(as: Stream[Int], bs: St
我试图在二叉树中查找/打印每个节点的中序后继,但编译器给我的结果是段错误。 这是结构:- struct node { int x; struct node *left; str
我有一个查询看起来像 SELECT a, b, c, d FROM tab ORDER BY a ASC, b ASC 我的结果集看起来像 +-----------------
首先,我试过搜索这个主题但一无所获(似乎找不到合适的关键词),所以如果这是重复的,请告知。 我一直在尝试从我的数据库中获取一些 time_stamp 并将它们按时间间隔排序。例如,我运行一个查询,如
这个问题在这里已经有了答案: How do I get the index of an iterator of an std::vector? (9 个回答) 关闭 6 年前。 我已经订购了 QVe
我有以下实体,如果我尝试通过 removeTask 方法从 TaskList 中删除 Task,则会出现异常。 @Entity public class TaskList extends Generi
所以,我对 C 编程还是很陌生。 有3个长度相同的字符串。 str1="abc", str2="def", str3="ghi". 新字符串中的输出将类似于“adgbehcfi”。 #include
我的查询有一个问题,它花费的时间太长(仅仅这个简单的查询就超过了两秒)。 乍一看,这似乎是一个索引问题,所有连接的字段都已编入索引,但我找不到其他我可能需要编入索引以加快速度的内容。一旦我将我需要的字
我正在寻找一个 Map 实现,它按照键值对的添加顺序迭代它们。例如 Map orderedMap = // instantiation omitted for obvious reasons :) o
我正在寻找具有以下功能的数据库系统: 分层(多维)键 每个维度的键排序 因此,如果我的 key 类似于 App > User > Item,我可以运行如下查询:“该用户的下一项是什么?”或者“这个应用
以下类使用 CRTP 尝试将类型添加到具有 Schwarz 计数器以确保初始化顺序的 std::vector。根据 3.6.2/2 成员 h_ 具有无序初始化。我将如何更改它以确保它已订购初始化?我希
我正在实现一个玩具调度程序,它读取进程规范(例如到达时间、总运行时间)的输入文件,然后根据随机 io/cpu 突发调度进程。 文件格式 Arrival time, total CPU time, CP
我目前正在使用 python 2.7 requests 库,并且不支持有序 header 。我可以为 post 和 get 放置有序数据(如有序字典),但根本不支持标题。甚至在 python 3 中也
我正在使用来自 google guava 的 ConcurrentHashMap(通过 MapMaker),但该实现未排序。google guava 中有 ConcurrentSkipListMap,
我有一个旧应用程序,其中使用 ConcurrentHashMap。现在我们知道并发HasMap 是无序的,但是需要读取最初插入的对象。我已经在生产中使用了一段时间的代码,因此我正在寻找快速替代方案来替
最近我开始使用 .NET Core 2.1 开发一个新项目,我决定使用 SOLID 原则并创建一个漂亮的项目结构。 这是一个 Web API 项目。一切正常我使用了很多依赖注入(inject),大部分
我是一名优秀的程序员,十分优秀!