gpt4 book ai didi

hadoop - HIVE:应用定界符直到指定的列

转载 作者:可可西里 更新时间:2023-11-01 16:53:56 26 4
gpt4 key购买 nike

我正在尝试将数据从文件移动到配置单元表中。文件中的数据看起来像这样:-

StringA StringB StringC StringD StringE

其中每个字符串由空格分隔。问题是我想要单独的列用于 StringA、StringB 和 StringC,而一列用于 StringD,即 StringD 和 String E 应该属于同一列。如果我使用ROW DELIMITED BY FIELDS TERMINATED BY ' ',Hive 将为 StringD 和 StringE 生成单独的列。 (StringD 和 StringE 本身包含空格,而其他字符串本身不包含空格)

hive 中是否有任何特殊语法来实现此目的,或者我是否需要以某种方式预处理我的数据文件?

最佳答案

使用正则表达式 https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-ApacheWeblogData您可以定义何时使用空格作为分隔符以及何时使用部分数据

关于hadoop - HIVE:应用定界符直到指定的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30985656/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com