gpt4 book ai didi

tokenize - Pig 中如何将字段转换为行?

转载 作者:行者123 更新时间:2023-12-03 06:41:56 25 4
gpt4 key购买 nike

我想将 Pig 中的字段转换为行。

来自 input.txt

1 2 34 5 67 8 9

字段之间的分隔符是“\t”。

到输出.txt

1234...但我不能使用 TOKENIZER 因为字段的内容可能是一个句子。请帮我。非常感谢。

最佳答案

我认为alexeipab的回答是正确的方向。这是一个简单的例子:

> A = load 'input.txt';
> dump A
(0,1,2,3,4,5,6,7,8,9)
> B = foreach A generate FLATTEN(TOBAG(*));
> dump B
(0)
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)

关于tokenize - Pig 中如何将字段转换为行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11427889/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com