- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我有点问题。我想了解 Hadoop 以及如何使用它来实时处理数据流。因此,我想围绕它构建一个有意义的 POC,这样当我必须在一些潜在雇主面前证明我对它的了解或在我现在的公司介绍它时,我可以展示它。
我还想提一下,我的硬件资源有限。只有我的笔记本电脑和我自己 :) 我了解 Hadoop 的基础知识并且编写了 2-3 个基本的 MR 作业。我想做一些更有意义或更现实的事情。
请提出建议。
提前致谢。
最佳答案
我想指出几点。
如果您想只用一台笔记本电脑进行 POC,那么使用 Hadoop 就没有什么意义了。
另外,正如其他人所说,Hadoop 不是为实时应用程序设计的,因为运行 Map/Reduce 作业会产生一些开销。
也就是说,Cloudera 发布了 Impala它与 Hadoop 生态系统(特别是 Hive metastore)一起工作以实现实时性能。请注意,要实现此目的,它不会生成 Map/Reduce 作业,目前处于测试阶段,因此请谨慎使用。
所以我真的建议去 Impala,这样你仍然可以使用 Hadoop 生态系统,但如果你也在考虑替代方案,这里还有一些其他可用的框架:
最后,我认为您应该真正分析您的需求,看看使用 Hadoop 是否是您所需要的,因为它只是在实时空间中起步。还有几个其他项目可以帮助您实现实时性能。
如果你想展示项目的想法,我建议查看 this link .她是一些例子:
关于hadoop - POC for Hadoop 实时场景,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14294864/
我希望得到您的指导和建议。我正在尝试为名为“支持请求贡献者”的 Azure RBAC 角色构建概念证明。这些是我在创建非管理员常规用户帐户并将该角色分配给订阅级别的帐户后计划进行的测试。 这个角色可以
关于lazyCSRF lazyCSRF是一款功能强大的Burp Suite插件,该工具可以帮助广大研究人员生成功能强大的CSRF(跨站请求伪造) PoC。Burp Suite是一个拦截HTTP
关闭。这个问题是opinion-based .它目前不接受答案。 想改进这个问题?更新问题,以便 editing this post 提供事实和引用来回答它. 3年前关闭。 Improve this
有没有java的开源PoC服务器和客户端软件(框架)来管理SIP并支持RTP和RTCP,App Packet消息最好支持TBCP? 我们的项目是通过手机发送和接收实时语音和视频,并管理为参与者创建的
谁能举例说明我们为什么要使用线程池。 我从理论上知道如何将线程池与执行器一起使用。 我看了很多教程,但我没有得到任何关于为什么我们应该使用线程池的实际例子,它可以是 newFixedThreadPoo
我有点问题。我想了解 Hadoop 以及如何使用它来实时处理数据流。因此,我想围绕它构建一个有意义的 POC,这样当我必须在一些潜在雇主面前证明我对它的了解或在我现在的公司介绍它时,我可以展示它。 我
基本上,我正在线性回归模型上部署概念验证,以验证基于特定数据集的准确系数百分比。为了高级别的构建我的模型,我在数据集中应用了一种操作,以确保作为输入所需的所有列都是数字且正常。 数据集概述显示所有列都
有很多关于addslashes 和mysql_real_escape 函数如何不安全地防止注入(inject)的讨论。事实是,甚至像 Wordpress 这样的大型框架或 CMS 也在使用这些功能,并
我有一个现有的 ASP.NET MVC3 应用程序,现在想合并 ExtJs 主要用于制图,但以后会使用更多功能。我的架构中已经有一组 POCO 实体,并且希望它们都可用于基于 javascript 的
installing Mesosphere DC/OS on AWS 的说明使用最低配置指示的 CloudFormation 模板: You have the option of 1 or 3 Mes
这是我的路线构建器。在这里,我尝试将文件中的数据插入主题。稍后,我将传递我的主要方法并使用 Camel 上下文运行它。我尝试了几个代码,但没有一个对我有帮助。我正在研究 Apache kafka -
我是一名优秀的程序员,十分优秀!