- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我正在考虑用于数据仓库和商业智能的各种技术,并且想到了这个名为 Hadoop 的激进工具。 Hadoop 似乎并不完全是为 BI 目的而构建的,但有一些引用资料表明它在该领域具有潜力。 (http://www.infoworld.com/d/data-explosion/hadoop-pitched-business-intelligence-488)。
尽管我从 Internet 获得的信息很少,但我的直觉告诉我,hadoop 可以成为传统 BI 解决方案领域的颠覆性技术。关于这个主题的信息确实很少,因此我想在这里收集所有专家关于 Hadoop 作为 BI 工具的潜力的所有想法,与 Oracle Exadata、vertica 等传统后端 BI 基础架构相比。对于初学者,我想问以下问题 -
感谢和问候!
编辑 - 分解为多个问题。将从我认为最有影响力的那个开始。
最佳答案
Hadoop 是成为 BI 解决方案一部分的绝佳工具。它本身不是 BI 解决方案。 Hadoop 所做的是接收 Data_A 并输出 Data_B。 Bi 需要但不是有用形式的任何内容都可以使用 MapReduce 进行处理并输出有用形式的数据。无论是 CSV、HIVE、HBase、MSSQL 还是用于查看数据的任何其他内容。
我认为 Hadoop 应该是 ETL 工具。这就是我们使用它的目的。我们每小时处理数以千计的日志文件并将其存储在 Hive 中,每天进行汇总,这些汇总会加载到 MSSQL 服务器并通过可视化层查看。
我遇到的主要设计注意事项是:
- 数据灵 active :您是希望您的用户查看预先聚合的数据,还是可以灵活地调整查询并按照他们想要的方式查看数据
- 速度:您希望用户等待数据多长时间? Hive(例如)很慢。生成结果需要几分钟,即使是在相当小的数据集上也是如此。遍历的数据越大,生成结果所需的时间就越长。
- 可视化:您想使用哪种类型的可视化?您想定制很多件还是能够使用现成的东西?您的可视化需要哪些限制和灵 active ?可视化需要多灵活多变?
第一个
更新:作为对@Bhat 关于缺乏可视化的评论的回应...
缺乏使我们能够有效利用存储在 HBase 中的数据的可视化工具是重新评估我们的解决方案的一个主要因素。我们将原始数据存储在 Hive 中,并将数据预先聚合并存储在 HBase 中。为了利用这一点,我们将不得不编写一个自定义连接器(完成这一部分)和可视化层。我们研究了我们能够生产什么以及什么可以在市场上买到,然后走商业路线。
我们仍然使用 Hadoop 作为我们的 ETL 工具来处理我们的网络日志,这非常棒。我们只是将 ETL 的原始数据发送到商业大数据数据库,该数据库将在我们的设计中取代 Hive 和 HBase。
Hadoop 并不能真正与 MSSQL 或其他数据仓库存储进行比较。 Hadoop 不做任何存储(忽略 HDFS),它做数据处理。运行 MapReduces(Hive 执行)将比 MSSQL(或类似的)慢。
关于hadoop - 评估和比较 Hadoop 的商业智能设计注意事项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6395495/
我目前正在使用 C# 和 WPF 在 .Net 4.0 中开发一个商业 Windows 应用程序(封闭源代码,免费演示,可用功能有限)。我现在正在寻找具有以下功能的 map 库: 全局在线 map 和
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
作为项目的一部分,我需要评估一些商业 C# 图表组件。我正在寻找功能丰富的组件,这些组件支持缩放/平移,可以处理实时更新,甚至可以为双击某个点等事件生成事件。 如果我需要从 WinForms 迁移到
这个问题在这里已经有了答案: Best solution to protect PHP code without encryption (11 个答案) 关闭 2 年前。 我正在考虑制作一个商业应用
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
抱歉这个愚蠢的问题,因为我是新手。如果我想构建一个商业 Windows 应用程序(我将以 $ 的价格出售),我在嵌入式数据存储方面有哪些选择?我会使用 MSDE 吗?这是我要与我的应用程序捆绑在一起的
我喜欢在 Android 商业(付费)应用程序中使用自定义字体 FiraSans。除了字体目录位置中的 SIL Open Font License.txt ..我是否需要强制添加其他任何内容,例如:
由于许可问题,我们公司几乎禁止我们在我们的商业产品中使用开源库。我们目前正在寻找可以读取和解析 CSV 文件的商业 .NET 库 - 有人有任何想法吗? 就功能而言,我确实需要能够将 CSV 文件读入
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 8 年前。 Improve
目前我希望将 paypal 支付集成到我的应用程序中,所以我下载了 django-paypal (dcramer) 以使用 paypal 沙箱对其进行测试。我尝试将 WPP express check
关闭。这个问题是off-topic .它目前不接受答案。 想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。 9年前关闭。 Improve this q
我正在组装我的第一个商业 PHP 应用程序,它并不大,因为我仍在热切地学习 PHP :) 现在我仍处于规划我的应用程序的概念阶段,但我一直遇到一个问题,该应用程序应该由我的客户在他们自己的服务器上自行
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 8 年前。 Improve
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。 我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便
我的网站是使用 php 文件构建的。我在这些文件中使用了商业 secret 算法,我的数据库根密码也存储在这些 php 文件中。我的数据库用于存储许多客户的私有(private)医疗数据。 这是否被认
我知道如何在 map 上设置点击事件,并且在点击随机位置时效果很好。但是当我点击一个商业地点时,谷歌地图会显示包含商业信息的气球,但不会向我的 JavaScript 引发点击事件。 您可以在此地理编码
有时我必须对 Java 代码做一些分析工作,我想知道为什么我应该让我的老板在商业分析器中进行调查,而不是只使用 Netbeans 或 JConsole 中的分析器? 值得投资的 killer 级功能是
我使用 Airbrake 通知我 Spree Commerce 商店中的错误。现在我想使用 spree 的 API,当我尝试发布到 http://localhost:3000/api/products
为了实现基于 Windows 的翻页应用程序,我需要能够将大量 PDF 页面转换为高质量的 JPG,而不仅仅是缩略图。 目的是为此实现最佳质量/文件大小,类似于 Photoshops Save for
我是一名优秀的程序员,十分优秀!