- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我在笔记本电脑和 Oracle VirtualBox VM 上运行 Cloudera Hadoop。我已经从我的 8 核中分配了 5.6 GB,从八核中分配了 6 GB。而且我仍然无法保持它的正常运行。即使没有负载服务也不会保持正常运行,当我尝试查询时至少 Hive 会在 20 分钟内关闭。有时它们像多米诺骨牌一样倒下:一个接一个。
更多的内存似乎对某些人有所帮助:使用 3GB 和所有服务时,当 Hue 本身设法启动时,Hue 正在闪烁红色。重新启动后,我需要 30 到 60 分钟才能使系统启动到足以尝试在其上运行任何东西。
有两个明智的注意事项(我设法找到了):- 交换警告。- 当系统使用 26 GB 的虚拟内存不足时出现崩溃。
我的数据集不到一兆,所以很难理解为什么系统会上升到几十千兆,但不管是什么原因已经过去了:现在系统在 5.6 GB 左右运行得更稳定我在关闭了一些服务后给了它:看看我对自己的回答。
而且它仍然更加稳定。就在我收到交换警告后,Hive 再次关闭。如果 VM 开始交换,导致所有 Hadoop 服务或多或少停止运行的原因可能是什么?
我没有足够的声誉将图片发布到此处,但是当 Hive 再次出现故障时,它每秒交换 13 页并使用 5.9 GB/5.6 GB。所以基本上我的系统在开始交换后或多或少地开始崩溃。 “在过去的 15 分钟内,428 个页面被交换到磁盘”
就硬盘而言,我使用了默认安装选项。唯一增加的是 Windows 和 VM 之间的共享文件夹。这有点奇怪地一直锁定文件,所以我像使用 FTP 一样使用它,并且只用于将文件从一个系统传递到另一个系统。因此,我可以几天不使用它,但系统仍然会崩溃,所以这也不是原因。
现在系统基本正常运行,服务仍然每天崩溃两次:Service Monitor 和 Hive 的崩溃频率相当。紧随其后的是 Activity Monitor 和 Event Server,它们似乎总是一起崩溃。我相信 Yarn 也会崩溃,但它会自行恢复。上次 Hive 先崩溃,然后 Service Monitor、Hive(第二次)、Activity Monitor 和 Event Server 都崩溃了。
由于swap是磁盘,可能是磁盘的问题:
# cat /etc/fstab
# swapoff -a
# badblocks -v /dev/VolGroup/lv_swap
Checking blocks 0 to 8388607
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found.
# badblocks -vw /dev/VolGroup/lv_swap
Checking for bad blocks in read-write mode
From block 0 to 8388607
Testing with pattern 0xaa: done
Reading and comparing: done
Testing with pattern 0x55: done
Reading and comparing: done
Testing with pattern 0xff: done
Reading and comparing: done
Testing with pattern 0x00: done
Reading and comparing: done
Pass completed, 0 bad blocks found.
所以交换磁盘没有问题,我也没有在其他任何地方发现任何磁盘错误。
请注意,您也可以从 Windows 端检查文件系统。但我预计,如果你让 Windows 修复你的 Linux 文件系统,你很有可能会因此而毁掉你的 Linux,所以我进行了一些悲观的检查,因为据我所知,这些命令可以安全执行。
最佳答案
大约一半的服务一直在下降,因此提供更多细节将是一个很长的故事。
我通过关闭flume、hbase、impala、ks_indexer、oozie、spark和sqoop,成功让系统更加稳定。并通过为一些提示没有获得足够内存的剩余服务增加更多内存。
我还修复了 Windows 方面的一些问题,我不确定其中哪一个有帮助: - MsMpEng.exe 让我的硬盘一直忙碌。我没有杀死它的权限,但我将它的优先级降低到尽可能低的水平。 - CcmExec.exe 在我的 DVD 上循环播放并一直阅读它。我通过从驱动器中取出 DVD 解决了这个问题。然后后来我杀死了进程树以防止它暂时被打扰。我使用 Windows 资源管理器找到了这些。
关于hadoop - 5.6 GB 对 Cloudera 来说还不够吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24824064/
是否可以在 impala 中同时执行多个查询?如果是,impala 是如何处理的? 最佳答案 我当然会自己做一些测试,但我无法执行多个查询:我正在使用 Impala 连接,并从 .sql 文件中读取查
我一直在寻找使用 Hortonworks 2.1 安装可用的 Storm,但为了避免在 Cloudera 安装(其中包含 Spark)之外安装 Hortonworks,我试图找到一种在 Clouder
正常情况下,我可以show partitions 在 hive 中。但是当它是 Parquet 表时,hive 无法理解它。我可以转到 hdfs 并检查目录结构,但这并不理想。有没有更好的方法来做到这
我想知道用于停止和启动 cloudera CDH5.2 集群的命令行。 原因,我正在编写一个自动化脚本来运行一些基准测试,并希望在开始每个基准测试之前停止和启动集群。 我已经看到停止 CDH 集群并不
由于嵌入式 PostgreSQL 数据库的问题,我无法访问 Cloudera Manager UI。 Web UI 向我显示: HTTP ERROR 500 Problem accessing /cm
我最近下载了 Cloudera CDH 5.3,现在我需要访问 HUE Web UI 门户。当我提供属于 Cloudera admin/admin 的默认用户名和密码时,它不起作用。我现在无法登录 H
我有两台装有 CentOS 6.5 的 PC client86-101.aihs.net 80.94.86.101 client86-103.aihs.net 80.94.86.103 clouder
当我显示表格时,我在 Impala 中看到一个表格“测试”; 我想复制“test”表,使其完全相同,但命名为“test_copy”。我可以执行 impala 查询来执行此操作吗?如果没有,我该怎么做?
如何在不使用 Cloudera 管理器的情况下在 100 节点集群上安装 Cloudera CDH?在集群中的每个节点上手动安装和配置 CDH 是一项艰巨的任务。使用哪些工具和技术来自动化生产中的任务
我启动了cloudera-scm-agent,但它失败了。我看到来自 /opt/cm-5.7.0/log/cloudera-scm-agent 的日志。它说 /opt/cm-5.7.0/lib64/c
我正在使用 ubuntu 12.04 64 位,我成功地安装并运行了单节点示例 hadoop 程序。 我在我的 ubuntu 上安装 cloudera 管理器时出现以下错误 Refreshing re
我已经关注了这里的博客(如下所述)并下载了包裹并按照要求放置。请告诉我是否有人已安装以及步骤。 (https://www.cloudera.com/documentation/spark2/lates
我正在尝试使用 Cloudera Manager 3.7.x 在具有 RHEL 5.5 的集群上安装 CDH3U5。但是由于以下错误,安装失败 - Error Downloading Packages
我正在尝试在 Ubuntu 12.04 LTS(64 位)中使用 Cloudera Manager 安装 CDH5。我正在按照 Cloudera link 中提到的步骤进行操作.我无法为安装 CDH5
我正在使用 Cloudera Quickstart VM 5.3.0(在 Windows 7 上的 Virtual Box 4.3 中运行)并且我想学习 Spark(在 YARN 上)。 我启动了 C
Cloudera 声称拥有快速启动方法。我注意到这对我不起作用。 当我调用 Spark-shell 时,我得到: ... WARN metastore.ObjectStore: Version inf
我有cloudera 5.7,我也有Cloudera Manager。 在目录/etc/hadoop下,我看到了三个子目录。 /etc/hadoop/conf /etc/hadoop/conf.clo
我是 Docker 和 Hadoop 系统的新手。我已经在 Ubuntu 16.04 中安装了 Docker,并在一个新的 Docker 容器中运行来自 Cloudera 的 Hadoop 镜像。但是
我必须区分 Cloudera 包裹过程和编写 cooking 书或厨师的食谱以在集群中安装包。 因此,我正在寻找 Parcel 与 Chef 之间的优势和劣势,反之亦然。 最佳答案 如果您使用的是 C
我对 impala 中的数据局部性有疑问,假设我有 10 个数据节点的集群(每个数据节点上都有 impalad),如果我在 impala 中执行查询 SELECT * FROM big_table w
我是一名优秀的程序员,十分优秀!