- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们的系统需要处理来自数千个客户的数十亿次查询,以获得数百万个资源。某些资源的查询频率会比其他资源高得多。每个客户将同时提交数百到数亿个查询。由于每个资源每分钟只能支持数千个查询,因此查询将被排队并异步确定其结果。
现在,问题是:每个客户端的查询对于每个资源都需要给予相同的优先级。也就是说,如果一个客户端针对特定资源提交了一百万个查询,然后另一个客户端紧接着提交了十几个查询,那么第二个客户端不必等待第一个客户端的查询在其查询之前得到处理。相反,应该首先处理一个客户端的第一个查询,然后处理另一个客户端的第一个查询,然后第一个客户端的第二个查询,依此类推,如此往复。 (以及针对两个以上客户端和多个资源的类似想法;而且,只要保留这个基本想法,它可以稍微不那么细化)。
如果它足够小,可以在内存中,我们只需要有一个从资源到从帐户到查询队列的映射,并按资源循环迭代帐户;但事实并非如此,所以我们需要一个基于磁盘的解决方案。我们还需要它具有健壮性、高可用性、事务性等。。我有什么选择?我正在使用 Java SE。
提前致谢!
最佳答案
我对 HBase 的了解比对 Cassandra 的了解要多得多。我的回复的某些方面是 HBase 特定的,我将这样标记它们。
假设您配置了足够的硬件,那么像 Cassandra 或 HBase 这样的 BigTable 实现将为您提供以下功能:
简单地说,我可以看到一个模式,您使用资源 id 作为行键和帐户 id 的组合,也许还使用时间戳作为列键,但是(特别是在 HBase 中)这可能会导致托管某些流行的服务器中出现热点资源(在 HBase 和 Cassandra 中,单个服务器负责一次托管任何给定行的主副本)。在 Cassandra 中,您可以通过使用异步写入(仅写入一个或两个节点,并允许八卦复制它们)来减少更新的开销,但这可能会导致旧记录的存在时间比您在网络流量低的情况下预期的时间要长得多。高的。在 HBase 中,写入始终一致,并且始终写入托管该行的 RegionServer,因此热点肯定是一个潜在问题。
您可以通过将行键设置为资源 ID 和帐户 ID 的组合来减少热点的影响,但随后您需要扫描所有行键以确定具有未完成的资源查询的帐户列表。
您可能没有考虑到的另一个潜在优势是直接从 HBase 或 Cassandra 数据节点运行查询的潜在能力,从而使您无需再次通过网络将查询发送到执行程序进程来实际运行该查询询问。您可能想查看 HBase Coprocessors或Cassandra Plugins做类似的事情。具体来说,我正在谈论改变这个工作流程:
/-> Query -> Executor -> Resource -> Results -> \
Client -> Query -> Query Storage --> Query -> Executor -> Resource -> Results -> --> Client
\-> Query -> Executor -> Resource -> Results -> /
变成这样的东西:
/-> Query -> Resource -> Results -> \
Client -> Query -> Query Storage --> Query -> Resource -> Results -> --> Client
\-> Query -> Resource -> Results -> /
但这在您的用例中可能没有意义。
关于java - 持久映射映射到队列以实现公平调度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9579505/
我遇到一种情况,我需要从某个主题读取(正在进行的)消息并将它们放入另一个 Queue 中。我怀疑我是否需要 jms Queue 或者我可以对内存中的 java Queue 感到满意。我将通过同一 jv
队列的定义 队列(Queue):先进先出的线性表 队列是仅在队尾进行插入和队头进行删除操作的线性表 队头(front):线性表的表头端,即可删除端 队尾(rear):线性表的表尾端,即可插入端 由于这
Redis专题-队列 首先,想一想 Redis 适合做消息队列吗? 1、消息队列的消息存取需求是什么?redis中的解决方案是什么? 无非就是下面这几点: 0、数据可以顺序读
0. 学习目标 栈和队列是在程序设计中常见的数据类型,从数据结构的角度来讲,栈和队列也是线性表,是操作受限的线性表,它们的基本操作是线性表操作的子集,但从数据类型的角度来讲,它们与线性表又有着巨大的不
我想在 redis + Flask 和 Python 中实现一个队列。我已经用 RQ 实现了这样的查询,如果你有 Flask 应用程序和任务在同一台服务器上工作,它就可以正常工作。我想知道是否有可能创
我正在使用 Laravel 5.1,我有一个大约需要 2 分钟来处理的任务,这个任务特别是生成报告...... 现在,很明显,我不能让用户在我接受用户输入的同一页面上等待 2 分钟,而是我应该在后台处
我正在使用 Azure 队列,并且有多个不同的进程从队列中读取数据。 我的系统的构建方式假设每条消息只读取一次。 这个Microsoft article声称 Azure 队列具有至少一次传送保证,这可
我正在创建一个Thread::Queue元素数组。 我这样做是这样的: for (my $i=0; $i new; } 但是,当我在每个队列中填充这样的元素时 $queues[$index]->enq
我试图了解如何将我的 Mercurial 补丁推送到远程存储库(例如 bitbucket.org),而不必先应用它们(实际上提交它们)。我的动机是在最终完成之前首先对我的工作进行远程备份,并且能够与其
我的本地计算机上有一个 Mercurial 队列补丁,我需要与同事共享该补丁,但我不想将其提交到上游存储库。有没有一种简单的方法可以打包该补丁并与他分享? 最佳答案 mq 将补丁作为不带扩展名的文
Java 中是否有任何类提供与 Queue 相同的功能,但有返回对象的选项,并且不要删除它,只需将其设置在集合末尾? 最佳答案 Queue不直接提供这样的方法。但是,您可以使用 poll 和 add
我在Windows上使用Tortoise svn客户端,我需要能够一次提交来自不同子文件夹的更改文件-一次提交。像在提交之前将文件添加到队列中之类的?我该怎么做? Windows上是否还有另一个svn
好吧,我正在尝试对我的 DSAQueue 类进行单元测试,它显示我的 isEmpty()、isFull() 和 dequeue() 方法失败。 以下是我的 DSAQueue 代码。我认为我的 Dequ
我想尽量减少对传入请求的数据库查询。它目前需要写入 6 个不同的表。在返回响应之前不需要完成处理。因此,我考虑了 laravel 队列,但我想知道我是否也可以摆脱写入队列/作业表所需的单独查询。我可以
我正在学习队列数据结构。我想用链表创建队列。我想编程输出:10 20程序输出:队列为空-1 队列为空-1 我哪里出错了? 代码如下: class Node { int x; Node next
“当工作人员有空时,他们会根据主题的优先级列表从等待请求池中进行选择。在时间 t 到达的所有请求都可以在时间 t 进行分配。如果两名工作人员同时有空,则安排优先权分配给最近的工作最早安排的人。如果仍然
我正在开发一个巨大的应用程序,它使用一些子菜单、模式窗口、提示等。 现在,我想知道在此类应用程序中处理 Esc 和单击外部事件的正确方法。 $(document).keyup(function(e)
所以 如果我有一个队列 a --> b --> NULL; 当我使用函数时 void duplicate(QueueNodePtr pHead, QueueNodePtr *pTail) 它会给 a
我正在尝试为键盘输入实现 FIFO 队列,但似乎无法让它工作。我可以让键盘输入显示在液晶显示屏上,但这就是我能做的。我认为代码应该读取键盘输入并将其插入队列,然后弹出键盘输入并将值读取到液晶屏幕上。有
我正在学习算法和 DS。如何在 JavaScript 中使用队列? 我知道你可以做这样的事情。 var stack = []; stack.push(2); // stack is now
我是一名优秀的程序员,十分优秀!