作者热门文章
- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我在 pig 中加载一个文件,分隔符为 '^A^E^A'
我尝试了以下命令,但它不起作用。
data = LOAD 'test.txt' USING PigStorage('\u0001\u0005\u0001') AS (user, time, query);
我错过了什么吗?或者有没有办法直接使用 PigStorage 指定上述分隔符?怎么办?
谢谢。
最佳答案
加载数据为 line:chararray
将“\u0001\u0005\u0001”替换为“|”或','
使用“|”分割结果行或 ',' 以生成所需的列。
data = LOAD 'test.txt' as (line:chararray);
clean_data = foreach data generate REPLACE(line,'\\u0001\\u0005\\u0001','|');
new_data = foreach clean_data generate SPLIT(clean_data.$0,'|');
关于hadoop - 如何使用多个 ctrl 分隔符在 pig 中加载数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40074209/
我正在开发一个需要能够平均三个数字的 Facebook 应用程序。但是,它总是返回 0 作为答案。这是我的代码: $y = 100; $n = 250; $m = 300; $number = ($y
我只是无法弄清楚这一点,也找不到任何对我来说有意义的类似问题。我的问题:我从数据库中提取记录,并在我的网页上以每个面板 12 条的倍数显示它们。因此,我需要知道有多少个面板可以使用 JavaScrip
我是一名优秀的程序员,十分优秀!