作者热门文章
- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我在使用 kite sdk 导入 json 时遇到问题。
使用命令生成 avro 模式:
./kite-dataset json-schema /vagrant/satyam/kite/restaurant-sample.json -o sample.avsc --record-name HGW
然后通过命令在hdfs文件系统中创建数据集:
./kite-dataset create dataset:hdfs:/user/falcon/datasets/hgw --schema sample.avsc
要导入 JSON 文件,我正在运行以下命令:
./kite-dataset -v json-import /vagrant/satyam/kite/restaurant-sample.json dataset:hdfs:/user/falcon/datasets/hgw
获取错误:
1 job failure(s) occurred:
org.kitesdk.tools.CopyTask: Kite(dataset:file:/tmp/datasets/.temp/3759e9f8-7406-4ced-... ID=1 (1/1)(1): java.io.FileNotFoundException: File does not exist: hdfs://integration.mycorp.kom:8020/tmp/crunch-878994294/p1/REDUCE
at org.apache.hadoop.hdfs.DistributedFileSystem$18.doCall(DistributedFileSystem.java:1122)
at org.apache.hadoop.hdfs.DistributedFileSystem$18.doCall(DistributedFileSystem.java:1114)
at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81)
at org.apache.hadoop.hdfs.DistributedFileSystem.getFileStatus(DistributedFileSystem.java:1114)
at org.apache.hadoop.fs.FileSystem.resolvePath(FileSystem.java:750)
at org.apache.hadoop.mapreduce.v2.util.MRApps.parseDistributedCacheArtifacts(MRApps.java:568)
at org.apache.hadoop.mapreduce.v2.util.MRApps.setupDistributedCache(MRApps.java:460)
at org.apache.hadoop.mapred.LocalDistributedCacheManager.setup(LocalDistributedCacheManager.java:93)
at org.apache.hadoop.mapred.LocalJobRunner$Job.<init>(LocalJobRunner.java:163)
at org.apache.hadoop.mapred.LocalJobRunner.submitJob(LocalJobRunner.java:731)
at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:536)
at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1296)
at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1293)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:415)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1628)
at org.apache.hadoop.mapreduce.Job.submit(Job.java:1293)
at org.apache.crunch.hadoop.mapreduce.lib.jobcontrol.CrunchControlledJob.submit(CrunchControlledJob.java:329)
at org.apache.crunch.hadoop.mapreduce.lib.jobcontrol.CrunchJobControl.startReadyJobs(CrunchJobControl.java:204)
at org.apache.crunch.hadoop.mapreduce.lib.jobcontrol.CrunchJobControl.pollJobStatusAndStartNewOnes(CrunchJobControl.java:238)
at org.apache.crunch.impl.mr.exec.MRExecutor.monitorLoop(MRExecutor.java:112)
at org.apache.crunch.impl.mr.exec.MRExecutor.access$000(MRExecutor.java:55)
at org.apache.crunch.impl.mr.exec.MRExecutor$1.run(MRExecutor.java:83)
at java.lang.Thread.run(Thread.java:745)
任何人都可以帮助我理解出了什么问题吗???提前致谢
最佳答案
我认为您使用的是 Kite SDK 1.1.0 版本。我在做 csv-import 时也遇到了同样的错误。当我切换到 Kite SDK 1.0.0 版本时,没有出现这样的错误。
我建议您切换到 Kite SDK 1.0.0 版本。
而且Kite SDK在1.1.0版本之后就没有新的发布了,而且这次发布也是在2015年6月。
关于json - 风筝SDK : Getting error while Json-import,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32881428/
我们有一个 monorepo,里面有 3 个系统。我想为每个系统创建一个单独的构建。 如何仅当特定文件夹中的文件更改时才触发管道? 我们正在使用github steps: - label: 'Li
我在 Windows 上使用 Docker Toolbox 运行 kitematic/hello-world-nginx 容器。我的 docker-machine ip 是 192.168.99.10
如何连接到具有不同名称(除默认名称外)的 docker 机器。似乎只能使用 Kinematic 在启动时启动的 docker 机器。 最佳答案 这目前在他们的待办事项列表中 https://githu
我是一名优秀的程序员,十分优秀!