gpt4 book ai didi

hadoop - 如何逃避 pig 中的角色

转载 作者:行者123 更新时间:2023-12-02 22:05:53 27 4
gpt4 key购买 nike

我是Pig的新手,无法将数据加载到Pig。
我有如下数据:

example.txt

name,id,address,age
basu,1,[73,dvg,india],24
nithi,2,[78,bang,india],24

在这种情况下,定界符是逗号(,),而地址字段本身包含逗号(,)。我需要在地址栏中转义那些逗号。请有人帮助我

提前致谢
巴苏

最佳答案

根据@Basu注释,如果地址可以用“”而不是[]表示,则可以使用以下方法。

pig 脚本:

REGISTER piggybank.jar; 
student_details = LOAD 'student.csv' USING org.apache.pig.piggybank.storage.CSVLoader() AS (name:chararray,id:long,address:chararray, age:long);
student_address = FOREACH student_details GENERATE address;
DUMP student_address;

输入:student.csv
basu,1,"73,dvg,india",24
nithi,2,"78,bang,india",24

输出:DUMP学生地址
(73,dvg,india)
(78,bang,india)

我们可以使用org.apache.pig.piggybank.storage.CSVExcelStorage()或org.apache.pig.piggybank.storage.CSVLoader()。

请参阅下面的API链接以获取详细信息
  • http://pig.apache.org/docs/r0.12.0/api/org/apache/pig/piggybank/storage/CSVExcelStorage.html
  • http://pig.apache.org/docs/r0.9.1/api/org/apache/pig/piggybank/storage/CSVLoader.html
  • 关于hadoop - 如何逃避 pig 中的角色,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30939819/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com