- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我试图在将 CSV 文件加载到 Pig 时跳过它的标题。
REGISTER /usr/hdp/2.3.4.0-3485/pig/lib/piggybank.jar;
define CSVExcelStorage org.apache.pig.piggybank.storage.CSVExcelStorage;
transactions = load 'hdfs://vm1.local:8020/user/root/transcations/trans.csv' USING CSVExcelStorage(',','NO_MULTILINE', 'UNIX', 'SKIP_INPUT_HEADER')
但是当我转储 transactions
时,我也得到了 header 。我使用 Apache Pig 0.15谢谢。
最佳答案
解决上述问题的方法是--> 定义 CSVExcelStorage org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'UNIX', 'SKIP_INPUT_HEADER');.--> transactions = load 'hdfs://vm1.local:8020/user/root/transcations/trans.csv' 使用 CSVExcelStorage();
我发现定义 UDF 别名的传统方法在这种情况下不起作用。
关于hadoop - CSVExcelStorage 不跳过带 pig 的 header ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37896659/
我正在将 csv 格式的文件(字段以逗号分隔并用双引号引起来)接收到 HDFS 中,并开发了一个 pig 脚本,该脚本在我使用 HQL 脚本将数据插入 Hive 之前删除了标题行并去掉了双引号。 这个
将以下输入文件与 PiggyBank 的 CSVExcelStorage 一起使用效果很好: Col1,Col2,Col3 1,2,3 "1","2","3" 小 pig 脚本 REGISTER /u
我试图在将 CSV 文件加载到 Pig 时跳过它的标题。 REGISTER /usr/hdp/2.3.4.0-3485/pig/lib/piggybank.jar; define CSVExcelSt
错误 2997:无法从支持的错误中重新创建异常。在这里,我已经解析了 apache 日志文件,但是当我试图将其导出为 csv 格式时,会发生此错误。代码和错误: grunt> STORE logs
我是一名优秀的程序员,十分优秀!