- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是我要解决的问题:
我需要能够显示存储在多个数据库分片中的分页,排序的数据表。
分页和排序是众所周知的问题,当数据来自单一来源时,我们大多数人可以通过多种方式解决。但是,如果您要在各个分片之间拆分数据,或者使用DHT或分布式文档数据库或您喜欢的任何NoSQL风格,事情都会变得更加复杂。
这是一个非常小的数据集的简单图片:
碎片|数据
1 |一个
1 | d
1 | G
2 |乙
2 | Ë
2 | H
3 | C
3 | F
3 |一世
分为页面(页面大小= 3):
页面数据
1 |一个
1 |乙
1 | C
2 | d
2 | Ë
2 | F
3 | G
3 | H
3 |一世
如果我们想显示用户页面2,我们将返回:
d
Ë
F
如果所讨论的表的大小大约为1000万行或1亿行,则不能仅将所有数据下拉到Web /应用程序服务器上以对其进行排序并返回正确的页面。而且您显然不能让每个单独的分片排序并分页其自己的数据片段,因为分片彼此之间并不了解。
使事情复杂化的是,我需要提供的数据不会太过时,因此提前预先计算一组有用的排序并将结果存储以供以后检索是不切实际的。
最佳答案
有几种解决方案,其中一些可能对您不可行,但也许其中一种会坚持下去:
通过此值的输入范围进行分片(例如,分片1包含A-C,分片2 D-F等)。或者,使用具有该表外键的另一个表作为索引,并使用此系统将索引表分片。这样,您可以轻松找到并获取指定范围。如果可以的话,此解决方案可能是性能最好的解决方案(它假定分片的数量是静态的,并且分片是可靠的)。
通过二进制搜索识别页面项。例如,假设您希望项目100到110。对于每个分片,按字典顺序计算“ M”以下的值数。如果数字总和大于100,则减小枢轴点,否则增大枢轴点(使用二进制搜索)。确定第100个项目(页面上的第一个项目)后,从每个分片中取出比该项目大的前9个(10-1)个项目,进行提取,对整个列表进行排序,从列表中获得前9个,第一项,有您的页面!这种方法更难以实施,并且需要O(log(n))
查询,因此它比(1)慢,但是如果负载不是很重的话,仍然可能相当快。
将页码与每个值一起存储。这将使您的读取速度非常快,但是写入速度却非常慢,因此它仅在写入很少(或者仅在有序变量方面追加)的情况下才起作用。
关于sorting - 您如何实现对分布式数据的排序和分页?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3927537/
我在玩一些代码挑战时发现自定义排序(排序接口(interface)的实现)比仅针对 slice 的原始结构要快得多。这是为什么?将 slice 转换为类型是否会产生一些魔力(例如转换为指向结构的指针
我正在使用 simple-import-sort eslint 插件进行 react 。我想我的 .eslintrc.js是对的,但我无法使这个特定的插件工作。我在文件的第一行收到以下错误: 未找到规
Closed. This question is not reproducible or was caused by typos。它当前不接受答案。 想改善这个问题吗?更新问题,以便将其作为on-to
好的,所以我是 Go 的新手,我正在努力让自己熟悉按函数排序。我可能误解了什么,所以如果我错了请纠正我。 我正在尝试创建一个包含字段 key 和 value 的 Nodes 数组。我想创建一个自定义排
我想从惰性列表中取出 n 个最大的元素。 我听说在 Data.List.sort 中实现的合并排序是惰性的,它不会产生不必要的元素。就比较而言,这可能是正确的,但在内存使用方面肯定不是这样。下面的程序
这个问题已经有答案了: Javascript sort function. Sort by First then by Second (10 个回答) 已关闭 3 年前。 我正在尝试返回已排序产品的列
我有一个 vector 对,如下所示。第一对值未排序,第二对值已排序(从零开始)。我可能想通过实现 std::vector 和 std::pair 来存储数据。当我有第一对值(未排序)时,找到相应的第
直到现在(Swift 2.2)我一直愉快地使用来自 this answer 的代码- 它迅速,优雅,它像梦一样工作。 extension MutableCollectionType where Ind
我在我的 Go 应用程序中实现排序界面时遇到问题。这是相关代码: type Group struct { Teams []*Team } type Team struct { Point
我很好奇 Lua 的默认算法是什么 table.sort使用,只是因为它比我遇到的其他一些排序算法慢。我也很好奇 Lua 的 table.sort是在引擎中用 C 编写的,或者如果它在 Lua 中的库
例如,插入排序被描述为部分排序数组的有效算法。但如何精确定义“部分排序”呢? 最佳答案 这是一个只有少数元素不合适的数组。如果没有指定百分比或其他阈值,则部分排序和未排序之间没有严格的区别。 正式定义
我是 GPU 编程的新手。最近,我正在尝试根据一个教程实现gpu bvh构建算法:http://devblogs.nvidia.com/parallelforall/thinking-parallel
有人可以指导我 Gnumeric 排序函数的详细说明(链接)吗? Gnumeric 手册很简短并且没有示例。我无法通过搜索引擎找到任何合适的信息,甚至 Stackoverflow 上也只有六个不合适的
在 Python 中使用什么精确规则来对列表进行排序,其中元素是列表?这可以表示为“key”或“cmp”吗功能?问题来自于有两件事考虑:长度和它们位置的值。 sorted([ [ 0, 1, 2
下面的代码应该创建一个整数数组 (a) 并对它进行排序,但是 sort.Sort 似乎没有修改变量。 package main import ( "fmt" "sort" ) type
我有一个应用于结构的自定义排序函数。完整代码是 here on play.golang.org . type Stmt struct { Name string After []st
python3 sorted取消了对cmp的支持。 python3 帮助文档: ?
以下是来自普林斯顿的 coursera 算法类(class)的练习。 如果一个数组既是 3 次排序又是 5 次排序,那么它是否也是 6 次、7 次、8 次、9 次和 10 次排序?我知道任何序列如果先
当我看到上面的语句时,我正在阅读 shell-sorting。这意味着什么?它对我看待 shell 排序的方式有何不同? PS:我不是在寻找声明的证据。 最佳答案 好吧,你可能暗示下一个排序阶段不会“
今天在检查mysql服务器的时候提示Sort aborted: Out of sort memory, consider increasing server sort buffer size,安装字
我是一名优秀的程序员,十分优秀!