gpt4 book ai didi

hadoop - 我在 pig 中编程,我将加载以下数据集

转载 作者:行者123 更新时间:2023-12-02 22:07:26 24 4
gpt4 key购买 nike

这是我的数据集
品牌名称,后跟以$符号表示的价格

Apple iPhone 6s Plus 16GB Space Gray T-Mobile Smartphone 2 cases + Box: 
Iphone 6s 16gb rose gold factory unlocked:$280
iPhone 6s 64gb T-Mobile:$350
Iphone 6S Plus 64 GB Space Gray Sprint International Unlocked:$385
iPhone 6s plus 64gb unlocked.:$600

当我使用以下命令加载此数据时:
grunt> scrap1 = LOAD '/user/vickysmartboy15/hadoop-test1/scrap.txt' USING org.apache.pig.piggybank.storage.MyRegExLoader('([^\\:]+):([^\\:])') as (Name:chararray, price:chararray);

使用:转储运算符查看数据后

我的结果是这样的
(Apple iPhone 6s Plus 16GB Space Gray T-Mobile Smartphone 2 cases + Box,$)

(Iphone 6s 16gb rose gold factory unlocked,$)

(iPhone 6s 64gb T-Mobile,$)

(Iphone 6S Plus 64 GB Space Gray Sprint International Unlocked,$)

(BRAND NEW Apple iPhone 6S 32Gb Silver Verizon UNLOCKED Clean ESN,$)

(iPhone 6s plus 64gb unlocked.,$)

仅显示 $,不带数字。

我该如何解决?

最佳答案

scrap1 = LOAD '/var/opt/teradata/home/fsbappdev/ashish/scrap.txt' using PigStorage(':') AS (Name:chararray, price:chararray);

dump scrap1将为您提供以下数据,我希望这是预期的。
(Apple iPhone 6s Plus 16GB Space Gray T-Mobile Smartphone 2 cases + Box, ) (Iphone 6s 16gb rose gold factory unlocked,$280) (iPhone 6s 64gb T-Mobile,$350) (Iphone 6S Plus 64 GB Space Gray Sprint International Unlocked,$385) (iPhone 6s plus 64gb unlocked.,$600)
如果要删除$符号,可以使用下一个关系
scrap2 = foreach scrap1 generate Name, REPLACE(price,'\\\$','')

关于hadoop - 我在 pig 中编程,我将加载以下数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44826421/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com