- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我像这样使用 AvroStorage:
STORE alias INTO '$OUTPUT'
USING org.apache.pig.piggybank.storage.avro.AvroStorage('{
"index" : 1,
"schema_uri": "file://path/schema.avsc"}');
因此,从本地文件系统而不是 HDFS 获取 schema.avsc 是明确的。
它在伪分布式集群中工作,但在模式文件的 java.io.FileNotFoundException 的普通集群上失败看起来这是在后端发生的。
我假设这是因为 AvroStorage 在一个节点上的后端调用,与我运行 pig 脚本的节点不同,无法在本地文件系统中找到该文件。为什么它不能使用前端调用的模式文件?这是否意味着我仅限于 schema_uri 的 HDFS 位置或在 AvroStorage 参数中使用嵌入模式字符串?
最佳答案
原来是 piggybank 的 AvroStorage 的限制: http://www.mail-archive.com/user%40pig.apache.org/msg09000.html
现在我正在使用这个解决方法:
%declare WORK_DIR `pwd`
%declare SCHEMA_LITERAL `cat $WORK_DIR/schema.avsc`
...
STORE inputs INTO 'output'
USING com.magnetic.org.apache.pig.piggybank.storage.avro.AvroStorage('{
"index" : 1,
"schema": $SCHEMA_LITERAL}');
关于hadoop - 指向本地文件的 AvroStorage schema_uri 不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20765260/
我使用 AvroStorage 存储 pig 的结果集。有没有一种方法可以将数据存储到一个指定的 avro 文件中……例如 OutputFileGen1? Pig 将数据存储到名为 OutpuFile
我正在尝试用 Java 构建我的第一个 Pig UDF,但在使用 Eclipse 构建时调用该函数时遇到问题我的代码如下所示: REGISTER /home/user2/deb/demo.jar; 注
我尝试使用逗号分隔列表在 Pig 中使用 AvroStorage 加载多个文件。我使用的语句是: test_data= LOAD 'repo_1/part-r-00000.avro,repo_2/pa
我像这样使用 AvroStorage: STORE alias INTO '$OUTPUT' USING org.apache.pig.piggybank.storage.avro.AvroS
我有一个要求,我们需要自定义使用 avrostorage 在 pig 中加载文件的方式: 例如,我有一个具有以下架构的 avro 文件: {"namespace": "avroColorCount",
我在 EMR 上运行一个 pig 脚本,它读取以 Avro 格式存储的数据。它一直在本地工作,但为了让脚本的其他部分在 EMR 上工作,我不得不将我使用的 piggybank.jar 恢复为 0.9.
我在运行 pig 脚本时遇到以下错误 REGISTER /opt/cloudera/parcels/CDH/lib/pig/lib/avro.jar REGISTER /opt/cloudera/pa
我正在使用 Apache PIG 来减少最初以 CSV 格式存储的数据,并希望以 Avro 格式输出。我的 PIG 脚本的一部分调用了一个 java UDF,它将一些字段附加到输入元组并将修改后的元组
我是一名优秀的程序员,十分优秀!