gpt4 book ai didi

hadoop - 将多个文件加载到HIVE表中

转载 作者:行者123 更新时间:2023-12-02 22:00:54 27 4
gpt4 key购买 nike

看,我正在尝试将太多文件分析到一个HIVE表中。关键见解,我正在使用json文件,表结构为:

CREATE EXTERNAL TABLE test1
(
STATIONS ARRAY<STRING>,
SCHEMESUSPENDED STRING,
TIMELOAD TIMESTAMP
)
ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
LOCATION '/user/andres/hive/bixihistorical/';

我需要以相同的结构加载大约50个文件。我已经尝试过类似的事情:
LOAD DATA  INPATH '/user/andres/datasets/bixi2017/*.json'
OVERWRITE INTO TABLE test1;

LOAD DATA INPATH '/user/andres/datasets/bixi2017/*'
OVERWRITE INTO TABLE test1;

LOAD DATA INPATH '/user/andres/datasets/bixi2017/'
OVERWRITE INTO TABLE test1;

以上任何一种都有效,关于我应该如何进行的任何构想?
非常感谢

最佳答案

确保文件夹仅包含需要加载到Hive表中的文件。

CREATE EXTERNAL TABLE test1
(
STATIONS ARRAY<STRING>,
SCHEMESUSPENDED STRING,
TIMELOAD TIMESTAMP
)
ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
LOCATION '/user/andres/hive/bixihistorical/';


LOAD DATA INPATH '/user/andres/datasets/bixi2017/'
OVERWRITE INTO TABLE test1;

关于hadoop - 将多个文件加载到HIVE表中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46374971/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com