gpt4 book ai didi

hadoop - 执行sqoop时发生错误-合并

转载 作者:行者123 更新时间:2023-12-02 21:02:43 27 4
gpt4 key购买 nike

我试图通过从netezza服务器导入数据来合并两个数据集。
以下是数据集,其数字为,ID为,字母为,名称为:

下表都是使用命令从netezza导入的:

sqoop import --connect neteeza_url --username uname --password pwd --table sqoop_merge_1 --hive-import --warehouse-dir hdfs_pth --create-hive-table sqoop_merge_1 -m 1

sqoop_merge_1:
1,a
2,b
3,c
4,d
5,e

sqoop_merge_2:
4,z
5,y

和命令是:
sqoop merge --new-data hdfs_path/sqoop_merge_2 --onto hdfs_path/sqoop_merge_1 --target-dir hdfs_path/sqoop_merge_output --jar-file jar_file_path/sqoop_merge_class_name.jar --class-name sqoop_merge_class_name --merge-key id

我使用codegen命令创建了jar文件:
sqoop codegen --connect netezza_url --username uname --password -pwd --table sqoop_merge_1

但是我收到以下错误:
java.io.IOException: Cannot join values on null key. Did you specify a key column that exists?

尝试了所有我知道的方法,但仍然出现错误。

请帮忙。

最佳答案

您确定id列的存在时,由于大小写敏感,可能是一个问题。

检查是否在Netezza中指定了ID

如果是,请尝试使用--merge-key ID

关于hadoop - 执行sqoop时发生错误-合并,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42762794/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com