gpt4 book ai didi

hadoop - 如何使用apache pig递归加载文件

转载 作者:可可西里 更新时间:2023-11-01 14:19:52 26 4
gpt4 key购买 nike

我是 Pig 的新手,我有一个非常基本的问题:我可以让 Make Pig 从目录加载所有文件,包括子文件夹中的文件吗?以下是我的处理方式:

records = LOAD '/worldwide/data/' USING PigStorage() AS (event:chararray, user:chararray);

这里,repo/data可能有子文件夹,例如

repo/data/region/cluster1
repo/data/region/cluster2

我能否让它从这些子目录和将来可能添加的任何新目录中加载所有内容?

最佳答案

确认上述语句有效并将子目录中的所有数据加载到 records 变量中。

关于hadoop - 如何使用apache pig递归加载文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22417405/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com