- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我有一个 Oracle 数据数据库(大约 12 亿条记录),上面有一个生成查询(生成 SQL 代码并返回计数)的 Web 应用程序。基本上,您通过 AJAX UI 以图形方式生成 SQL 查询...并且它在性能方面运行得非常好。
这大约是一个 400 GB 的数据库。我一直在研究 Hadoop 并考虑使用它而不是 Oracle(让我的应用程序生成 HIVE 查询代码),但在我看来这是一个矫枉过正的问题……hadoop 不是更多地针对数十 TB 到 PB 的数据吗规模数据集?它是否适合代替关系数据库(如 Oracle)来完成我正在执行的任务??
最佳答案
没有更多细节很难说。然而,根据我的经验,如果你所有的数据都在 SQL 中,那么你的 SQL 引擎可能比简单的 map reduce 有更多的优化。
如果不知道您想要准确处理什么以及数据的状态,那么除非您在环境中遇到一些主要的边缘情况,否则在您的情况下设置和使用 hadoop 可能会遇到更多麻烦,而且它可能会最终需要更长的时间。
如果您的所有数据都在 Oracle 中,那么它可能都经过解析、索引,并且希望有些规律。如果处理完全存在于该域中(并且您没有尝试处理一些不常见的事情,例如大量 BLOB 或其他奇怪的情况),大多数情况下最好让您的数据库引擎处理它。
故事的寓意:
Hadoop is really awesome but it's not magic and doesn't make regular old SQL faster!
关于hadoop - 什么时候使用 Hadoop 是矫枉过正?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3763078/
我有一个对象需要序列化为 EDI 格式。对于这个例子,我们假设它是一辆汽车。汽车可能不是 b/c 选项随时间变化的最佳示例,但对于真实对象,枚举永远不会改变。 我有很多像下面这样的应用了自定义属性的枚
我正在从 Beginning Javascript 学习 Javascript(很有趣!),书中的一个特定示例似乎有点矫枉过正。我知道他们有时会做一些严格来说不是最佳实践的事情 - 例如使用 docu
我应该使用 NSNumber 还是字符串来保存一个简单的“playerID 号码”,现在它是一个整数,因为我想用 Core Data 保存它? 在我的数据模型中,我将 playerID 设置为整数 1
我目前正在做一些网络相关的事情, public void postData() { HttpClient httpclient = new DefaultHttpClient(); HttpPost
我们正在建立一个我们可以使用的 Laravel 4 基础项目。我想创建一个默认路由规则,让开发人员可以轻松地创建新页面,而不必担心向 Controller 添加路由,但可以为任何更复杂的路由/ Con
已在所有 SO 帖子中努力搜索,但仍找不到答案。我的动画很长,很抱歉发了这么长的帖子! 它在 Chrome 上运行良好,但在 Firefox 30.0 上运行不正常,我不明白为什么。 我真的需要这么多
您好,我目前正在为我的项目使用 channel API。我的客户端是一个标牌播放器,它仅在用户更改媒体内容时才从 App Engine 服务器接收数据。 Appengine 每天只向客户端发送一次或两
我开始将 WebApi 和 OData 集成到测试平台应用程序中。让我们保持简单并坚持使用一个域实体 Customer。显然我会有一个 MVC Controller 。搜索得到它自己的 View 模型
两个问题合而为一... 对于实时视频处理应用程序,我有许多函数每帧调用多次。听取有关 const 和按引用传递的建议,这些函数的签名有点像这样 void processSomething(const
我是一名优秀的程序员,十分优秀!