- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我目前有一个 Hadoop 集群,我在其中存储了大量日志,我在这些日志上运行 pig 脚本来计算聚合分析。我还有一个用于存储生产数据的 Mongo 集群。
我最近被安排在一个位置上,我需要做很多一次性的分析查询,或者让其他人去做。这些查询经常需要同时使用生产数据和日志数据,因此无论我使用什么,我都希望将所有内容都放在一个地方。我的日志数据在 json 中,大约是我的产品数据的 10 倍。以下是我看到的 Mongo 和 HBase 的优缺点:
Mongo 优点/HBase 缺点:
HBase 优点/Mongo 缺点:
我目前对 Hbase 知之甚少,我不认为自己是 Mongo 专家,所以我可能遗漏了很多东西。
那么,我缺少什么,哪种适合我的情况?
最佳答案
首先,你应该使用你已经可以处理的东西。因此,Mongo DB 似乎是一个不错的选择,尤其是当数据已经是 json 格式时。
另一方面,我使用 HBase 有一段时间了,虽然有很多行,但读取性能还是惊人的,我真的不知道是否有 Mongo DB 与 Hadoop 的良好和快速集成。HBase是Hadoop数据库,和Hadoop一起工作是命中注定的。
如果日志可以通过(在 HBase Rowkey 中)进行索引:
producing_program_identifier, timestamp, ...
HBase 可以很好地处理这种查询模式。但是,如果您决定使用 HBase,请使用 phoenix framwork ,它将节省您使用熟悉的接口(interface)(如 jdbc 和类似 sql 的查询)的时间。它还提供了可能足够的简单聚合函数(count、avg、max、min)。
关于mongodb - 如果已经在使用 Hadoop,HBase 或 Mongo 用于分析数据库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16555751/
我在 mongo 中有一个查询,看起来像 db.Table_Name.group({ "key": { "Camp": true }, "initial": { "Clicks": 0 }
这是一个示例查询: db.readings.find( {"_id.s": ISODate("2012-11-01T00:05:00Z") }).count() 查询在 mongo shell 中工作
我正在使用 mongo 模板查询基于状态和邮政编码的文档,这是使用以下标准和查询方法实现的: List modelClass = null; Criteria criteria = new Crite
目前,我有一个旧版本的 mongo,即 2.6 在我的系统上运行。我的网站已经投入生产,并且拥有大量客户数据。我正在计划升级到 mongo 3.2。 所以,我的问题是 mongo v3.2 的 mon
我构建了一个 MongoDB。我想通过某些分组进行聚合。我找到了 document ,这将为我做到这一点。一切正常,但确定limitations指出: 管道的输出只能包含 16 兆字节。如果你的结果s
我无法连接到 MongoDB .在 Ubuntu 中它可以工作,但我在 CentOS 工作现在。这是错误信息: MongoDB shell version: 2.4.2 connecting to:
我试图使用mongo运行最简单的mongo-express和docker-compose容器。我遇到了许多错误,这些错误将在以后解释。 我尝试了以下docker-compose配置: 1。 versi
我有一个 mongo 查询,如下所示。 db.Course.find( { $and: [{courseCallNo: {$in : [/^ssoapicall1$/i]} }, {clientId
我想知道为什么我会收到以下 php 通知: ( ! ) Notice: Mongo::__construct(): parsing servers in C:\htdocs\multishop\lib
(问题灵感来自this one) 给定一个数据集: db.mycollection.insert([ {a:1, b:2, c:3}, {a:1, b:3, c:4}, {a:0, b:1
如果我已经使用 PECL 成功安装了 mongoDB,还需要获取 debian 软件包“php5-mongo”吗?有什么不同?(这个问题应该迁移吗?) 最佳答案 区别与从 CPAN 或 debian(
Mongo 一天前还运行良好。然后今天早上我起床并尝试打开我得到这个: MongoDB shell version: 2.6.4 2015-01-06T11:10:54.142-0500 SE
我正在尝试使用 C# Mongo 驱动程序将文件上传到 Mongo Atlas。但我不明白如何连接类 MongoServerSettings。我试过这个: private static MongoSe
我有两个版本的 mongodb,2.4.3 和 2.6.0。我可以在不同的端口上启动这两个版本,但是在使用 ./mongos 运行它时出现错误: BadValue error: no args for
我需要在 不 关闭的情况下进行分片,或者在端口 27017 中重启现有的 mongo 实例。 我尝试了以下操作,(当默认端口正在运行和 mongo 实例时) mongod --shardsvr --d
在无意中升级了 mongodb 包(3.4.9 -> 3.6.1)后,有没有办法升级 mongo 数据库? 根据 mongo 文档,作为 prerequisite在升级过程中,featureCompa
我正在使用 Sails 0.12.3 和 mongo 3.2.7 这是我的 config/connections.js。 mongo: { adapter: 'sails-mongo', host
我正在使用 mongodb 构建一个基本的搜索引擎,我已经验证了基本查询在 mongo shell 中的工作。不过,我不太明白如何将其翻译成 PHP。 输入字符串中的空格表示“和”运算符和 |或管道字
我有一个用 @Document 注释的 Mongo 集合,我希望能够从字符串 (JSON) 中获取该 Java 对象,因为我们正在将这些类作为字符串插入队列。 Spring-Data-Mongo 中是
我正在使用 Linux Debian 9。我已经安装了 JDK 1.8。我使用的maven版本是3.6,springboot的版本是2.1。 mongodb版本是3.6。 下面是我试图保存在 mong
我是一名优秀的程序员,十分优秀!