Hadoop生产实现的好例子-6ren

Hadoop生产实现的好例子

转载作者：行者123 更新时间：2023-12-02 22:05:56

24

4

关闭。这个问题需要更多 focused .它目前不接受答案。

想改进这个问题？更新问题，使其仅关注一个问题 editing this post .

7年前关闭。

Improve this question

我听说过很多关于 Hadoop 的信息，但是当谈到定义它是什么时，我感到很困惑。因为定义推迟了点对点的形式。

Hadoop 是从服务器到客户端提供文件的东西吗？

例如:如果我们为 实现 Hadoop postman 电子邮件存储在哪里，Hadoop 可以帮助访问电子邮件并以超快的速度将其提供给客户端吗？可以这样使用吗？

你能告诉我simple words什么是 Hadoop 及其用途？

最佳答案

伙计，你把这搞砸了。

Hadoop 是一个开源软件框架，用于存储和大规模处理商品硬件集群上的数据集。 Hadoop 是一个由全局贡献者和用户社区构建和使用的 Apache 项目。

Apache Hadoop 框架由以下模块组成

Hadoop Common – 包含其他 Hadoop 模块所需的库和实用程序

Hadoop 分布式文件系统 (HDFS) – 一种分布式文件系统，将数据存储在商品机器上，在集群中提供非常高的聚合带宽。

Hadoop YARN – 一个资源管理平台，负责管理集群中的计算资源并使用它们来调度用户的应用程序。

Hadoop MapReduce——一种用于大规模数据处理的编程模型。

对于最终用户，尽管 MapReduce Java 代码很常见，但任何编程语言都可以与“Hadoop Streaming”一起使用来实现用户程序的“map”和“reduce”部分。Apache Pig、Apache Hive、Apache Spark 等相关项目分别公开了更高级别的用户界面，例如 Pig Latin 和 SQL 变体。 Hadoop 框架本身主要是用 Java 编程语言编写的，有一些用 C 语言编写的 native 代码和作为 shell 脚本编写的命令行实用程序。

Hadoop 分布式文件系统 (HDFS) 是用 Java 为 Hadoop 框架编写的分布式、可扩展和可移植的文件系统。 Hadoop 实例中的每个节点通常都有一个名称节点；一个数据节点集群形成了 HDFS 集群。这种情况很典型，因为每个节点都不需要存在数据节点。每个数据节点使用特定于 HDFS 的 block 协议(protocol)通过网络提供数据 block 。文件系统使用 TCP/IP 套接字进行通信。客户端使用远程过程调用 (RPC) 在彼此之间进行通信。

HDFS 在多台机器上存储大文件(通常在 GB 到 TB 的范围内)。它通过跨多个主机复制数据来实现可靠性，因此理论上不需要主机上的 RAID 存储(但为了提高 I/O 性能，一些 RAID 配置仍然有用)。使用默认复制值 3，数据存储在三个节点上:两个在同一个机架上，一个在不同的机架上。数据节点可以相互通信以重新平衡数据、移动副本并保持数据的高复制。

HDFS 文件系统不限于 MapReduce 作业。它可以用于其他应用程序，包括 HBase 数据库、Apache Mahout 机器学习系统和 Apache Hive 数据仓库系统。 Hadoop 理论上可以用于任何类型的面向批处理而非实时的工作，即数据密集型工作，并且能够并行处理数据片段。

Hadoop的商业应用包括:

各种日志和/或点击流分析

营销分析

机器学习和/或复杂的数据挖掘

图像处理

XML 消息的处理

网络爬取和/或文本处理

一般归档，包括关系/表格数据，例如合规

您可以引用 YDN在理解 hadoop 框架方面有一个好的启动。

关于Hadoop生产实现的好例子，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24816881/

24

4

0

文章推荐： java - 如何运行Hbase和Hadoop mapreduce

文章推荐： ColdFusion 服务器每小时崩溃一次

文章推荐： r - 使用 r 中的核密度估计生成样本

文章推荐： java - 在这种情况下如何编写MapReduce代码？

.net - 生产/测试环境简单问题
我在一个网站上工作，该网站在生产中只有 aspx 文件和 bin 目录和文件。任何人都知道这个网站是如何部署的，我通常有我的网站，我也会提交代码。我的问题 2. 如何在同一台服务器上创建测试网站？我
Git 生产/开发发布分支
您好，我认为这应该是一个相当简单的问题，但我对管理 git 不太熟悉。我使用的是非常流行的 http://nvie.com/posts/a-successful-git-branching-mode
Git 生产/暂存服务器工作流
目前我的网站(生产服务器)已经有很多代码了。现在我想开始在我的项目中使用 Git 并为我的团队设置一个暂存服务器。谁能给我任何建议？这是我脑海中的画面: Production
erlang - 生产 Erlang 部署示例
我目前正在学习 Erlang SO 用户能否提供有关他们的任何 Erlang 应用程序部署的有趣示例？我想深入了解 Erlang 在过去的电信中的常见用途，以及 Erlang 在开发/部署过程中带来
nginx - Rails 生产 - 新部署后所有图片都损坏了
我关注了Ryan's screencast并部署到 VPS。所以我使用 Unicorn + nginx + github + Ubuntu 12.04 LTS + capistrano。我也使用 i1
Azure存储: staging vs .生产
我想在 Azure 中维护临时环境和生产环境。每个都应该有自己的 blob 存储和 sql 存储。实现这一目标的最佳方法是什么？设置临时和生产 SQL Server 以及两个 Blob 存储帐户？最
electron - 如何调试 Electron 生产
我无法使用 Electron 打包程序在内置的 Electron 应用程序中打开chrome开发工具。我已经尝试过mainWindow.webContents.openDevTools()，但这没有
azure - 在同一应用服务环境中进行开发/测试/生产？
我有一个 Azure 应用程序服务环境。可以在同一个 ASE 中运行多个应用服务计划(开发、测试和生产)吗？基本上，我知道他们会共享前端池，我认为这很好，因为那里没有运行应用程序代码，并且它“..
java - 如何用maven管理开发、生产、测试配置？
我是 Maven 新手，有 Rails 背景。在较高级别上，如果我正在运行测试、在本地运行应用程序以及在部署到生产环境时，我希望连接到不同的数据库。这就是我的想法。当我运行 mvn test 时，它
azure - 在同一应用服务环境中进行开发/测试/生产？
我有一个 Azure 应用程序服务环境。可以在同一个 ASE 中运行多个应用服务计划(开发、测试和生产)吗？基本上，我知道他们会共享前端池，我认为这很好，因为那里没有运行应用程序代码，并且它“..
ios - 无法创建此类应用程序/faSTLane 生产
我正在使用 faSTLane\produce 脚本制作一个新应用程序，我收到以下错误消息: in `parse_response': {"data"=>nil, "messages"=>{"warn"
security - 生产、测试、开发环境与安全
使开发人员能够构建包含私有(private)数据的系统的当前做法是什么？谁能指出这类事情的“最佳实践”指南？我们这里有一个 Catch-22，因为开发人员需要编写与具有被认为是“私有(private
Azure - 生产/测试/开发环境
我有一个连接 Azure SQL Server 的 Azure 云服务。当我第一次设置这个时，我真的不太了解自己在做什么，只是想熟悉 Azure。所以现在我想利用我所拥有的东西并将其转变为可靠的部署结
ios - meteor Cordova 生产
我是 Cordova 的新手。抱歉，如果这些是业余问题。我想详细了解典型手机应用程序的设置和架构。我有一个本地版本的 Meteor Cordova 正在运行，它通过 Modulus 连接到远程服务器
java - SymmetricDS 在野外(生产)？
我一直在寻找一些在一些 POS(销售点)设备和服务器之间同步数据的选项。 SymmetricDS似乎是具有商业友好许可证的选项之一。作为一个 Codehaus 项目确实保证了一定程度的质量，所以我同意
java - Tomcat 生产/开发环境
在 PHP 开发中，可以通过服务器的“环境”变量确定应用程序是在生产环境还是开发环境中运行。在 tomcat 服务器上是否有类似的变量可用，或者是否有更好的方法将应用程序用于生产和开发？最佳答案
Java BlockingQueue 生产/消费不正确
我正在做一个项目，我需要使用 TwitterAPI 检索 Twitter 消息，处理它们并将它们存储在数据库中。我正在使用 Producer/Consumer BlockingQueue，其中元素的作
ios - 开发、生产、开发配置文件和分发配置文件之间的区别？
这个问题类似于:iPhone development - what is the difference between a development and distribution provision
php - 根据URL设置各种环境(开发、生产)
我正在尝试根据 URL 在 Drupal 中设置环境。例如，如果我访问 mysite.local，它将使用 localdb 并将站点名称更改为“Local Mysite”；如果我转到 mysite.c
database - magento:生产、登台和开发之间的数据库同步
我今天一直在阅读 Magento 中的数据库同步。我目前正在努力解决的一件事是在开发期间和上传到生产期间需要同步什么。现在假设一批更改将包含对数据库和类似代码的更改，下面是我对模型工作流的理解(我目

首页

博学

6Ren·AI

商城

Hadoop生产实现的好例子