gpt4 book ai didi

hadoop - 从 Hadoop Hue 下载 csv 文件返回不可读代码

转载 作者:可可西里 更新时间:2023-11-01 14:45:19 32 4
gpt4 key购买 nike

我使用 Apache Hue(用户界面)与 Hadoop 和 Hive 交互。

我将配置单元查询的结果保存在 HDFS 目录中。 (结果集真的很大)

然后,我用 hue 文件浏览器下载了结果文件。

一切看起来都很好,但是当我打开 csv 文件时,我发现分隔符是一些不可读的代码,如下所示:

enter image description here

如何解决分隔符问题?

最佳答案

SOH(标题开始)或其 Seq等效的 Ctrl + A 是 Hive 使用的默认字段分隔符。而所有的\N 都代表NULL。

这个问题的解决方案取决于使用的 Hive 版本

As of Hive 0.11.0 the separator used can be specified; in earlier versions it was always the ^A character (\001). However, custom separators are only supported for LOCAL writes in Hive versions 0.11.0 to 1.1.0 – this bug is fixed in version 1.2.0

如果使用 Hive >= 1.2.0,您可以在 INSERT OVERWRITE 语句中指定 FIELDS TERMINATED BY 子句来选择分隔符。

INSERT OVERWRITE DIRECTORY hdfs_directory SELECT statement ... 
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',' ...

引用HIVE-3682HIVE-5672 .

关于hadoop - 从 Hadoop Hue 下载 csv 文件返回不可读代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42032410/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com