gpt4 book ai didi

hadoop - 使用 Piglatin 加载文本文件时跳过标题

转载 作者:可可西里 更新时间:2023-11-01 14:09:51 25 4
gpt4 key购买 nike

我有一个文本文件,它的第一行包含标题。现在我想对数据做一些操作,但是在使用 PigStorage 加载文件时它也需要 HEADER。我只想跳过标题。是否可以这样做(直接或通过 UDF)?

这是我用来加载数据的命令:

input_file = load '/home/hadoop/smdb_tracedata.csv'
USING PigStorage(',')
as (trans:chararray, carrier:chararray,aainday:chararray);

最佳答案

通常我解决这个问题的方法是对标题中我知道的内容使用 FILTER。例如,考虑以下数据示例:

STATE,NAME
MD,Bob
VA,Larry

我会做:

B = FILTER A BY state != 'STATE';

关于hadoop - 使用 Piglatin 加载文本文件时跳过标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19115298/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com