gpt4 book ai didi

hadoop - 改革 pig 拉丁成绩

转载 作者:行者123 更新时间:2023-12-02 21:47:27 25 4
gpt4 key购买 nike

我想改革 pig 拉丁成绩。
对于一些 pig 拉丁,让我们说“ dump table1 ”,可以得到以下结果。
(测试1,1.0,Link1 Link2 Link3),在Link1,Link2,Link3之间存在“\ t”。
我想改革看起来像的结果
(测试1,链接1)
(测试1,Link2)
(测试1,Link3)

有人知道我该如何创建吗?

提前致谢。

最佳答案

您可以使用内置UDF的TOKENIZE,它将为您提供一串字符串中的不同标记。如果您拥有的唯一的非字母数字字符是tab,则可以正常使用。只需FLATTEN生成的包,就可以根据需要在不同的行中使用不同的 token 。

如果您的字符串比显示的要复杂得多,并且需要精确控制它们的拆分方式,则可以使用STRSPLIT,但这会返回一个元组,因此在FLATTEN ing之前,您需要将该元组转换为包。

关于hadoop - 改革 pig 拉丁成绩,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23951767/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com