gpt4 book ai didi

hadoop - 如何在Hive中创建随机分区的数据

转载 作者:行者123 更新时间:2023-12-02 21:48:34 25 4
gpt4 key购买 nike

我有以下数据:

id INT name STRING

1 a
2 b
3 c

我想在Hive中使用分区CountryID创建一个新表,并将数据加载到表中,并将随机值放入CountryID中。

我正在使用以下命令,但是它不起作用:
Hive> set hive.exec.dynamic.partition.mode=nonstrict
Hive> CREATE TABLE test (id INT, name STRING) PARTITIONED BY (CountryID INT);
Hive> LOAD DATA INPATH '/my_data.txt' INTO TABLE test PARTITION (CountryID = rand());

我收到以下错误:
FAILED: ParseException line 1:76 cannot recognize input near 'rand' '(' ')' in constant

我究竟做错了什么?

最佳答案

我认为您想进行插入覆盖

INSERT OVERWRITE TABLE test PARTITION(CountryId)
SELECT id,name, rand() as CountryId
FROM my_data;

为my_data.txt文件创建外部表之后。

关于hadoop - 如何在Hive中创建随机分区的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23060613/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com