gpt4 book ai didi

hadoop - Hadoop pig 。不断变化的结构

转载 作者:行者123 更新时间:2023-12-02 22:01:20 26 4
gpt4 key购买 nike

您可以帮助我更改文件的结构吗?

例如:

  • 我有一个带2个定界符的字符串:
    1;2,3,4;2
  • 我想使用1个分隔符将其更改为raws:
    1;2;2
    1;3;2
    1;4;2
  • 最佳答案

    pig 脚本:

     A = LOAD 'a.csv' USING PigStorage(';') AS (value1:chararray,value2:chararray,value3:chararray);
    B = FOREACH A GENERATE value1, FLATTEN(TOKENIZE(value2, ',')), value3;
    DUMP B;

    输入:
    1;2,3,4;2

    输出:
    (1,2,2)
    (1,3,2)
    (1,4,2)

    我们可以使用存储B;作为分隔符。
     STORE B INTO 'requiredOutputLocation' USING PigStorage(';');

    关于hadoop - Hadoop pig 。不断变化的结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31279210/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com