- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我有一个 mapreduce 作业,它在一组帖子上运行并计算每个帖子的受欢迎程度。 mapreduce 输出一个集合,其中包含每个帖子的 post_id 和受欢迎程度。该应用程序需要能够获得按受欢迎程度排序的帖子。有数百万条帖子,这些热门信息每 10 分钟更新一次。我能想到的两种方法:
问题
感谢您的帮助!
最佳答案
关于 Map Reduce 的一般建议是让您的应用程序在每次插入时执行一些额外的计算,并尽可能避免执行处理器密集型 Map Reduce 作业。
是否可以向每个“帖子”文档添加一个“流行度”字段,并让您的应用程序在每次查看、点击、投票或以任何方式衡量每个帖子时增加它?然后,您可以为人气字段编制索引,按人气搜索帖子的速度将快如闪电。
如果简单地增加“流行度”字段不是一个选项,并且必须执行 MapReduce 操作,请尝试防止它对集合中的所有文档进行分页。你会发现随着你的收藏的增长,这变得非常慢。听起来您的收藏已经相当多了。
可以执行增量 map reduce,其中最新 map reduce 的结果与前一个 map reduce 的结果集成,而不是仅仅被覆盖。您还可以向 mapReduce 函数提供查询,因此不会读取所有文档。也许添加一个仅匹配自上次 map reduce 以来查看、投票或添加的帖子的查询。
关于增量 mapReduce 操作的文档在这里: http://www.mongodb.org/display/DOCS/MapReduce#MapReduce-IncrementalMapreduce
将新结果与旧结果相结合在“输出选项”部分进行了说明。
我意识到到目前为止我的建议非常笼统,所以我现在将尝试回答您的问题:
1) 如上所述,如果您的 MapReduce 操作必须读取每一个文档,这将无法很好地扩展。
2)MapReduce操作只输出一个集合。创建索引和查询该集合必须以编程方式完成。3) 如果有一个进程正在查询一个集合,而另一个进程正在更新它,那么查询有可能在更新之前返回一个文档。简短的回答是,“是的”4) 如果集合被删除,则必须重建索引。如果集合中的文档被删除,但集合本身没有被删除,那么索引将持续存在。在使用 {out:{replace:"output"}} 选项运行 MapReduce 的情况下,索引 (ex) 将持续存在,并且不必重新创建。
5) 如上所述,如果可能,最好将另一个字段添加到您的“posts”集合并更新它,而不是执行这么多 MapReduce 操作。
希望我能够为您提供一些在构建您的应用程序时需要考虑的额外因素。最后,重要的是要记住每个应用程序都是独一无二的,因此为了最终证明哪种方式“最好”,您将不得不试验所有不同的选项并自行决定哪种方式最有效。祝你好运!
关于mongodb - 直接查询 MongoDB mapreduce 的结果与更新原始集合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9098690/
如果我在 C 中调用一个函数并传入一个结构(对那些 C++ 读者来说不是通过指针或引用),它会复制该对象。如果我传入一个包含数组的结构,它会复制该数组(如教授在类里面所说)。但是,如果我传入一个包含对
在 vim 等中,您可以使用 CTRLA 和 CTRLX 增加或减少光标所在的数字。然而,这会增加总数,但我想简单地增加光标正下方的数字。这有点难以描述,所以这就是我的意思: Ctrl+A usage
我正在将 Spring 4.3.2 项目升级到 Spring 5.1.5。我的一个测试用例开始因错误而失败。 ClassNotFoundException: org.hibernate.propert
我想在 Java 中分配一个直接 IntBuffer,比如说 10 亿个元素(64 位系统)。我知道的唯一方法是创建一个直接 ByteBuffer 并将其视为直接 IntBuffer。但是,4*1,0
我正在寻找特定的打印机或某些打印机上存在的技术(接口(interface)、标准、协议(protocol)),这使得可以使用 AJAX 从 Web 浏览器实现直接打印。 这意味着打印机必须: 网络接口
我正在寻求实现删除确认表单的最佳实践建议。 除其他选项外,以下页面包含删除按钮... /website/features/f/123 ...当点击一个简单的表单时,会在以下 url 下加载: /web
我正在使用直接 Web 远程处理库在我的应用程序中执行一些 ajax 调用。我有一个问题,我认为归结为服务调用的延迟响应。以下是我认为有问题的部分代码。问题出在 getDefaultReviewerT
我想替换 Javascript confirm() 函数以允许自定义按钮而不是 Yes/Cancel。我尝试搜索,但所有解决方案都是事件驱动的,例如 jquery 对话框(代码不等待响应但它是事件驱动
我知道有几个类似的问题,但是,其中的示例并没有说明问题,或者我无法从中获利 - 我真可耻。 所以我的问题是在带有 GUI 的简单应用程序中加载图像。例如: 我在 "D:\javaeclipseprog
我想用不同的颜色为表格的行着色,所以我正在使用它 table#news tr:nth-child(even) { background-color: red; } table#news
下面的测试代码不起作用 from("direct:start").setExchangePattern(ExchangePattern.InOnly).threads(5).delay(2000).b
我在 python 中实现的第一个项目之一是对棒渗流进行蒙特卡罗模拟。代码不断增长。第一部分是棍子渗滤的可视化。在宽度*长度的区域中,使用随机起始坐标和方向绘制具有一定长度的直棒的定义密度(棒/面积)
跟踪直接文件下载的最佳方法是什么?我找到了一些解决方案,例如这个: http://www.gayadesign.com/diy/download-counter-in-php-using-htacce
我在一个线程中有一个直接的 ByteBuffer(堆外),并使用 JMM 给我的一种机制将它安全地发布到另一个线程。 happens-before 关系是否扩展到由 ByteBuffer 包装的 na
当我测试直接 java.nio.ByteBuffer 的读取性能时,我注意到绝对读取平均比相对读取快 2 倍。此外,如果我比较相对读取与绝对读取的源代码,除了相对读取维护和内部计数器外,代码几乎相同。
我知道这个问题已经被问了无数次,并且在很多情况下都得到了答案。我相信我已经阅读了其中的大部分内容。不幸的是,我在这上面能找到的一切 简单说明 ElementRef.nativeElement不好,不要
回到一些 C 语言工作。 我的许多函数看起来像这样: int err = do_something(arg1, arg2, arg3, &result); 根据意图,结果由函数填充,返回值是调用的状态
当我将 XML 提交到 https://secure-test.WorldPay.com/jsp/merchant/xml/paymentService.jsp 时: Personalised
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我的 Angular 路由行为有问题。刷新或输入的 url 像/user 总是将我重定向到/home。我还在 index.html 文件中设置了 。通过单击导航菜单按钮一切正常。但是一旦我尝试刷新页面
我是一名优秀的程序员,十分优秀!