- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
hive 表中的西里尔符号有问题。安装版本:
ambari-server 2.4.2.0-136
hive-2-5-3-0-37 1.2.1000.2.5.3.0-37
Ubuntu 14.04
问题是什么:
将语言环境设置为 ru_RU.UTF-8:
spark@hadoop:~$ locale
LANG=ru_RU.UTF-8
LANGUAGE=ru_RU:ru
LC_CTYPE="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_PAPER="ru_RU.UTF-8"
LC_NAME="ru_RU.UTF-8"
LC_ADDRESS="ru_RU.UTF-8"
LC_TELEPHONE="ru_RU.UTF-8"
LC_MEASUREMENT="ru_RU.UTF-8"
LC_IDENTIFICATION="ru_RU.UTF-8"
LC_ALL=ru_RU.UTF-8
连接到配置单元并创建测试表:
spark@hadoop:~$ beeline -n spark -u jdbc:hive2://spark@hadoop.domain.com:10000/
Connecting to enter code herejdbc:hive2://spark@hadoop.domain.com:10000/
Connected to: Apache Hive (version 1.2.1000.2.5.3.0-37)
Driver: Hive JDBC (version 1.2.1000.2.5.3.0-37)
Transaction isolation: TRANSACTION_REPEATABLE_READ
Beeline version 1.2.1000.2.5.3.0-37 by Apache Hive
0: jdbc:hive2://spark@hadoop.domain.com> CREATE TABLE `test`(`name` string) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' WITH SERDEPROPERTIES ( 'serialization.encoding'='UTF-8');
No rows affected (0,127 seconds)
插入西里尔符号:
0: jdbc:hive2://spark@hadoop.domain.com> insert into test values('привет');
INFO : Tez session hasn't been created yet. Opening session
INFO : Dag name: insert into test values('привет')(Stage-1)
INFO :
INFO : Status: Running (Executing on YARN cluster with App id application_1490211406894_2481)
INFO : Map 1: -/-
INFO : Map 1: 0/1
INFO : Map 1: 0(+1)/1
INFO : Map 1: 1/1
INFO : Loading data to table default.test from hdfs://hadoop.domain.com:8020/apps/hive/warehouse/test/.hive-staging_hive_2017-03-23_13-41-46_215_3133047104896717605-116/-ext-10000
INFO : Table default.test stats: [numFiles=1, numRows=1, totalSize=7, rawDataSize=6]
No rows affected (6,652 seconds)
从表中选择:
0: jdbc:hive2://spark@hadoop.domain.com> select * from test;
+------------+--+
| test.name |
+------------+--+
| ?@825B |
+------------+--+
1 row selected (0,162 seconds)
我在 apache hive 上阅读了很多错误,测试了 unicode、utf-8、utf-16 和一些 isos 编码,但没有运气。
有人可以帮我吗?
谢谢!
最佳答案
Hortonworks 的人帮助我解决了这个问题。看来这是一个错误。
关于hadoop - Ambari Hive UTF-8 问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42973972/
我是一个从apache用ambari学习Hadoop的新手,并且我一直试图在VirtualBox环境中的Ubuntu上安装ambari,但是,遇到问题让我筋疲力尽。 1,系统提醒我“Ambari服务器
我想用ambari服务器安装hadoop集群,但出现以下错误 正在向服务器注册... 向服务器注册失败。 步骤 我在两台从属主机上手动安装了 ambari 代理 然后我在奴隶上运行了代理服务。 在代理
在 Ambari 集群 GUI(版本 2.5.0.3)中,每个服务都有配置按钮 当我们点击配置按钮时,我们可以看到所有相关参数及其值的列表 例如 YARN 服务有参数 - 以 MB 为单位的最小容器大
我刚刚完成了有关Hortonworks数据平台的升级指南: https://docs.hortonworks.com/HDPDocuments/Ambari-2.6.0.0/bk_ambari-upg
我是ambari的新手,我关注了hortronworks关于如何安装ambari的教程。我的问题是在安装选项的步骤中,我应该设置服务器和代理的主机名还是只设置代理? (因为当我只设置代理时它通过否则失
我正在尝试根据 these instructions 在 Centos 7 上构建 ambari 2.7.5 , 比较简单。 但是,当构建到达 ambari-admin 时,它会失败。那里有几篇文章描
亲爱的同学们, friend 们 到目前为止,我们从头开始安装了基于以下版本的 ambari 集群: HDP-2.6.0.3 ambari - 2.5.0 here are the new pkgs
如何在没有Internet连接的情况下在RHEL上安装和配置Apache Ambari?我可以将文件从具有互联网连接的本地计算机复制到此服务器 最佳答案 您可以关注以下文档: http://docs.
我对Ambari上的CPU设置感兴趣,具体地说,我看到如下CPU选项: Percentage of physical CPU allocated for all containers on a nod
我正在尝试使用these instructions和these commands安装自定义服务以添加服务。当我发出curl命令时,没有被添加,而是出现以下错误: HTTP/1.1 400 Bad Re
我一直在尝试在我们的 Ambari 安装中创建自定义应用程序。经过一番玩弄之后,我已经成功地将其配置为使用适当的日志创建\输出和 pid 创建来执行安装和启动操作。我现在正在努力解决的问题是让 Amb
我有一个python脚本,可以为要导入到Hive的目录中的文件生成模式,删除表和加载表命令。然后,我可以在Ambari中运行这些文件以导入文件。可以执行多个“创建表”命令,但是当上传文件导入各自的Hi
017-12-21 13:46:55,297-堆栈功能版本信息:群集堆栈= 2.6,群集当前版本=无,命令堆栈=无,命令版本=无-> 2.6 2017-12-21 13:46:55,317-使用had
我在 Ambari 中配置了一个主机,但该主机已不存在。 Ambari 仍然认为它在那里。当我尝试通过 UI 删除它时,我得到: 400 status code received on DELETE
我试图让 Ambari 在运行 Hortonworks HDP 2.3 沙箱的两台硬件机器之间工作。 两台机器都可以在没有密码的情况下从终端成功地通过 ssh 连接到对方。我正在尝试向主计算机 (sa
我正在尝试在我的集群中的每个节点中设置 Ambari 代理,它几乎适用于我所有的节点,除非有一个节点,当我尝试重新调用 Ambari 向导来修复这个节点的问题时,我得到了这个错误: =========
大家好,对于我的 Hadoop 环境,我正在尝试将 CentOS 客户端设置为充当 Ambari 管理系统的数据节点。 但是,我在数据节点的启动过程中遇到了问题,这是错误日志: Fail: Execu
我尝试使用Ambari来管理Hadoop集群的安装和维护。 启动ambari server后,使用网页搭建Hadoop集群。 但是在第3步--确认hosts时,报错如下 然后我检查了/var/log/
我的集群中运行的 Hive 作业和 Mapreduce 程序很少。我能够在 Ambari 中检查有关一般资源利用率的信息。但我想查看各个应用程序使用的资源。可以通过 Ambari API 实现吗?你能
我已经在我的集群上安装了带有 Hadoop 的 Ambari。我在代理后面,安装过程中没有问题...当我在 Ambari 上启动所有服务时,出现以下错误: HDFS DataNode 进程 -> 连接
我是一名优秀的程序员,十分优秀!