gpt4 book ai didi

hadoop - Pig 字段中的拆分字符

转载 作者:可可西里 更新时间:2023-11-01 16:22:50 25 4
gpt4 key购买 nike

我有一个带有“|”的文本输入分隔符为

0.0000|25000|                    |BM|BM901002500109999998|SZ

我使用 PigStorage 拆分

A = LOAD '/user/hue/data.txt' using PigStorage('|');

现在我需要根据位置将字段 BM901002500109999998 分成不同的字段,例如 0-2 = BM - Field1 等等。所以在这一步之后我应该得到 BM, 90100, 2500, 10, 9999998。Pig 脚本中有什么方法可以实现这一点,否则我打算编写一个 UDF 并将分隔符放在所需位置。

谢谢。

最佳答案

您正在寻找SUBSTRING:

A = LOAD '/user/hue/data.txt' using PigStorage('|');
B = FOREACH A GENERATE SUBSTRING($4,0,2) AS FIELD_1, SUBSTRING($4,2,7) AS FIELD_2, SUBSTRING($4,7,11) AS FIELD_3, SUBSTRING($4,11,13) AS FIELD_4, SUBSTRING($4,13,20) AS FIELD_5;

输出将是:

dump B;
(BM,90100,2500,10,9999998)

您可以找到有关此功能的更多信息 here.

关于hadoop - Pig 字段中的拆分字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30330145/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com