gpt4 book ai didi

hadoop - 如何在Hive中将数据从具有不同记录结构的单个文件加载到几个表中?

转载 作者:行者123 更新时间:2023-12-02 20:07:52 25 4
gpt4 key购买 nike

我有一个具有以下结构的文件:

A 1 2 3
A 4 5 6
A 5 8 12
B abc cde
B and fae
B bsd oio
C 1
C 2
C 3

并希望将数据加载到3个简单表中(A(int int int),B(string string)C(int))。

有可能吗?

如果A(string int int int int)等包含在表中的文件的第一列,这对我也很好。

最佳答案

我会按照Praveen的建议使用选项1。我将创建仅包含字符串的外部表,并使用FROM ( ... )语法一次插入多个表中。我认为类似以下的东西会起作用

create external table source_table( line string )
stored as textfile
location '/myfile';

from ( select split( line , " ") as col_array from source_table ) cols
insert overwrite table A select col_array[1], col_array[2], col_array[3] where col_array[0] = 'A'
insert overwrite table B select col_array[1], col_array[2] where col_array[0] = 'B'
insert overwrite table C select col_array[1] where col_array[0] = 'C';

关于hadoop - 如何在Hive中将数据从具有不同记录结构的单个文件加载到几个表中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20686900/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com