- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我有一组由每个州键入的个人 ID
people/stateName:VA = {1,2,3,4,5,6}
people/stateName:TX = {7,8,9,10,11}
...
我有一组属于公司 1 的个人的 ID
people/company:1 = {2,6,7,10}
在上面的例子中,如果我想找到所有属于公司 1 并且居住在 VA 和 TX 州的人,我会这样做:
SUNIONSTORE tempkey people/stateName:VA people/stateName:TX
SINTERSTORE tempkey tempkey people/company:1
在数学中:(A ∪ B) ∩ C
但是,在我的例子中,状态的数量是未知的,所以你必须遍历你想要的状态集的列表,将它们组合起来,然后最后将它与公司相交(你会如果您有多家公司,则必须重复该过程)
foreach( state in state_list ){
SUNIONSTORE(tempkey_state,tempkey_state, 'people/stateName:{state}')
}
foreach( companyNumber in company_list ){
SUNIONSTORE(tempkey_company, tempkey_company, 'people/company:{companyName}')
}
SINTERSTORE(resultkey, tempkey_state, tempkey_company);
在我的真实场景中,每个集合都非常大,有 10,000 到 1,000,000 名成员。但是这个过程可能很慢(在某些情况下比 SQL 慢)
据我了解,瓶颈是 SUNIONSTORE
,因为它随着每次迭代而增长,并且 O(N) 的 O 很大
有什么方法可以更快地完成我想做的事情?我想到的一些解决方案
你有什么想法?
最佳答案
集合代数包括交换律和分配律,因此:
(A ∪ B) ∩ C = (C ∩ A) ∪ (C ∩ B)
Redis 使用交换律来优化交集计算:它在应用其算法之前按大小对集合进行排序,以最大限度地减少操作次数。
此外,并集和交集运算的性能主要取决于对象创建的成本(涉及内存分配),而不是实际的并集/交集算法。
在你的例子中,我会说状态有大集合的概率高于公司有大集合的概率,所以我宁愿执行:
MULTI
SINTERSTORE tmp1 people/company:1 people/stateName:VA
SINTERSTORE tmp2 people/company:1 people/stateName:TX
SUNION tmp1 tmp2
DEL tmp1 tmp2
EXEC
在这里,在 Redis 命名空间中实际创建的唯一对象已经是交叉的结果,这可能会产生更少的对象。请注意,最后一个联合不会存储结果,而是直接将结果返回给客户端。
一定要使用管道来最大程度地减少网络往返次数。
如果你有几个公司,你可以在他们的集合之前应用一个联合(如果公司集合的平均大小不是太高),或者你可以每个公司重复这个模式几次(如果公司太大) ).
关于database - 我可以通过哪些方式设计 key 来提高 Redis 集的性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31211926/
我正在比较工作簿中的工作表。该工作簿有两张名为 PRE 和 POST 的工作表,每张工作表都有相同的 19 列。行数每天都不同,但特定一天的两张表的行数相同。该宏将 PRE 工作表中的每一行与 POS
我有一个对象数组,我一次循环遍历该数组一个对象,然后进行几次检查以查看该数组中的每个对象是否满足特定条件,如果该对象满足此条件,则复制一个属性将此对象放入数组中(该属性还包含另一个对象)。 for(v
我正在编写一个必须非常快的应用程序。我使用 Qt 5.5 和 Qt Creator,Qt 的 64 位 MSVC2013 编译版本。 我使用非常困倦的 CS 来分析我的应用程序,我看到占用最多独占时间
我有以下 CountDownTimer 在我的 Android 应用程序中不断运行。 CountDownTimer timer_status; timer_status = new CountDown
有一个优化问题,我必须调用随机森林回归器的预测函数数千次。 from sklearn.ensemble import RandomForestRegressor rfr = RandomForestR
我正在努力提高现有 Asp.Net Web 应用程序的数据访问层的性能。场景是。 它是一个基于 Web 的 Asp.Net 应用程序。 数据访问层使用 NHibernate 1.2 构建并作为 WCF
我在我的 Intel Edison 上运行 Debian,并尝试使用 ffmpeg 通过 USB 网络摄像头捕获视频。我正在使用的命令是: ffmpeg -f video4linux2 -i /dev
我有一个 For循环遍历整数 1 到 9 并简单地找到与该整数对应的最底部的条目(即 1,1,1,2,3,4,5 将找到第三个“1”条目)并插入一个空白行。我将数字与仅对应于此代码的应用程序的字符串“
我有一个带有非规范化架构(1 个表)的 postgresql 数据库,其中包含大约 400 万个条目。现在我有这个查询: SELECT count(*) AS Total, (SELECT c
在 Ltac 中实现复杂的策略时,有一些 Ltac 命令或策略调用我预计会失败以及预期失败(例如终止 repeat 或导致回溯)。这些故障通常在故障级别 0 时引发。 更高级别引发的故障“逃避”周
我正在尝试提高 ansible playbook 的性能。我有一个测试剧本如下: --- - name: Test hosts: localhost connection: local g
我正在使用 axios从 Azure 存储 Blob 下载文件 (~100MB)。 axios({ method: 'get', url: uri, onDownloadProgress:
我有一个 ClojureScript 程序,主要对集合执行数学计算。它是在惯用的、独立于主机的 Clojure 中开发的,因此很容易对其进行基准测试。令我惊讶的是(与答案对 Which is fast
我有一个程序必须在硬件允许的情况下尽快发出数千个 http 请求。在现实世界中,这些连接中的每一个都将连接到一个离散的服务器,但我已经编写了一个测试程序来帮助我模拟负载(希望如此)。 我的程序使用 A
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我正在计算 Clojure 中 3d 点云的边界框。点云表示为 Java 原始浮点数组,点云中的每个点都使用 4 个浮点存储,其中最后一个浮点未使用。像这样: [x0 y0 z0 u0 x1 y1
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我正在尝试使用rayshader 包制作图像。我很高兴能够使用如下代码创建一个 png 文件: library(ggplot2) library(rayshader) example_plot <-
更新 显然,jQuery 模板可以被编译,并且它有助于显示带有 if 语句 的模板的性能 here . 但是如图here ,预编译的 jQuery 模板对我的情况没有多大作用,因为我的模板不包含逻辑
我是编程新手。我有一个启用分页的 ScrollView ,其中包含许多页面(最多十个),并且在每个页面上都有一个自定义按钮。每个自定义按钮都有一个自定义图像。我在 Interface Builder
我是一名优秀的程序员,十分优秀!