gpt4 book ai didi

sql - 向 Hive 表中插入数据

转载 作者:可可西里 更新时间:2023-11-01 14:07:44 26 4
gpt4 key购买 nike

我是 hive 的新手。我已成功设置一个用于开发目的的单节点 hadoop 集群,并在其上安装了 hive 和 pig。

我在配置单元中创建了一个虚拟表:

create table foo (id int, name string);

现在,我想向这个表中插入数据。我可以像sql一样一次添加一条记录吗?请用类似的命令帮助我:

insert into foo (id, name) VALUES (12,"xyz);

此外,我还有一个 csv 文件,其中包含以下格式的数据:

1,name1
2,name2
..
..

..


1000,name1000

如何将这些数据加载到虚拟表中?

最佳答案

我认为最好的办法是:
a) 将数据复制到 HDFS(如果它还不存在的话)
b) 像这样在 CSV 上创建外部表

CREATE EXTERNAL TABLE TableName (id int, name string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
LOCATION 'place in HDFS';

c) 您可以通过向它发出查询来开始使用 TableName。
d) 如果要向其他Hive表插入数据:

insert overwrite table finalTable select * from table name;

关于sql - 向 Hive 表中插入数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11053567/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com