gpt4 book ai didi

hadoop - 当配置单元加载数据本地 inpath 时,由于文件名导致路径无效

转载 作者:可可西里 更新时间:2023-11-01 15:29:05 26 4
gpt4 key购买 nike

文件“/home/hadoop/_user_active_score_small”确实存在。但是当如下运行 load data local 时,得到一个 SemanticException:

hive> load data local  inpath '/home/hadoop/_user_active_score_small' overwrite into table user_active_score_tmp ;
FAILED: SemanticException Line 1:24 Invalid path ''/home/hadoop/_user_active_score_small'': No files matching path file:/home/hadoop/_user_active_score_small

但是,cp/home/hadoop/_user_active_score_small/home/hadoop/user_active_score_small,然后再次运行load data:

hive> load data local  inpath '/home/hadoop/user_active_score_small' overwrite into table user_active_score_tmp ;
Loading data to table user_bg_action.user_active_score_tmp
OK
Time taken: 0.368 seconds

文件的访问类型相同,在同一目录中:

-rw-rw-r-- 1 hadoop hadoop 614 7月   5 13:49 _user_active_score_small
-rw-rw-r-- 1 hadoop hadoop 614 7月 5 11:48 user_active_score_small

我不知道这是怎么回事。 hive 是否不允许以'_'开头的文件名?

最佳答案

以下划线 _ 开头的文件和目录在 MapReduce 中被认为是隐藏的,这可能是观察到的行为的原因。

如果您查看 FileInputFormat 源代码,您会发现:

protected static final PathFilter hiddenFileFilter = new PathFilter(){
public boolean accept(Path p){
String name = p.getName();
return !name.startsWith("_") && !name.startsWith(".");
}
};

关于hadoop - 当配置单元加载数据本地 inpath 时,由于文件名导致路径无效,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38196122/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com