hadoop - Sqoop Export Oozie Workflow 因未找到文件而失败，从控制台运行时有效-6ren

hadoop - Sqoop Export Oozie Workflow 因未找到文件而失败，从控制台运行时有效

转载作者：可可西里更新时间：2023-11-01 14:37:21

26

4

我有一个包含 6 个节点的 hadoop 集群。我正在通过 Sqoop 从 MSSQL 中提取数据并返回到 MSSQL 中。 Sqoop 导入命令运行良好，我可以从控制台(在其中一个 hadoop 节点上)运行 sqoop 导出命令。这是我运行的 shell 脚本:

SQLHOST=sqlservermaster.local
SQLDBNAME=db1
HIVEDBNAME=db1
BATCHID=
USERNAME="sqlusername"
PASSWORD="password"


sqoop export --connect 'jdbc:sqlserver://'$SQLHOST';username='$USERNAME';password='$PASSWORD';database='$SQLDBNAME'' --table ExportFromHive --columns col1,col2,col3 --export-dir /apps/hive/warehouse/$HIVEDBNAME.db/hivetablename

当我从 oozie 工作流运行此命令并传递相同的参数时，我收到错误(当从 yarn 调度程序屏幕挖掘实际作业运行日志时):

**2015-10-01 20:55:31,084 WARN [main] org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl: Job init failed
org.apache.hadoop.yarn.exceptions.YarnRuntimeException: java.io.FileNotFoundException: File does not exist: hdfs://hadoopnode1:8020/user/root/.staging/job_1443713197941_0134/job.splitmetainfo
    at org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl$InitTransition.createSplits(JobImpl.java:1568)
    at org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl$InitTransition.transition(JobImpl.java:1432)
    at org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl$InitTransition.transition(JobImpl.java:1390)
    at org.apache.hadoop.yarn.state.StateMachineFactory$MultipleInternalArc.doTransition(StateMachineFactory.java:385)
    at org.apache.hadoop.yarn.state.StateMachineFactory.doTransition(StateMachineFactory.java:302)
    at org.apache.hadoop.yarn.state.StateMachineFactory.access$300(StateMachineFactory.java:46)
    at org.apache.hadoop.yarn.state.StateMachineFactory$InternalStateMachine.doTransition(StateMachineFactory.java:448)
    at org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl.handle(JobImpl.java:996)
    at org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl.handle(JobImpl.java:138)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster$JobEventDispatcher.handle(MRAppMaster.java:1312)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster.serviceStart(MRAppMaster.java:1080)
    at org.apache.hadoop.service.AbstractService.start(AbstractService.java:193)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster$4.run(MRAppMaster.java:1519)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1657)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster.initAndStartAppMaster(MRAppMaster.java:1515)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster.main(MRAppMaster.java:1448)
Caused by: java.io.FileNotFoundException: File does not exist: hdfs://hadoopnode1:8020/user/root/.staging/job_1443713197941_0134/job.splitmetainfo
    at org.apache.hadoop.hdfs.DistributedFileSystem$22.doCall(DistributedFileSystem.java:1309)
    at org.apache.hadoop.hdfs.DistributedFileSystem$22.doCall(DistributedFileSystem.java:1301)
    at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81)
    at org.apache.hadoop.hdfs.DistributedFileSystem.getFileStatus(DistributedFileSystem.java:1301)
    at org.apache.hadoop.mapreduce.split.SplitMetaInfoReader.readSplitMetaInfo(SplitMetaInfoReader.java:51)
    at org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl$InitTransition.createSplits(JobImpl.java:1563)
    ... 17 more**

有没有人见过这个并且能够解决它？它只发生在 oozie 工作流程中。有类似的主题，但似乎没有人解决了这个特定问题。

谢谢!

最佳答案

我能够通过将 oozie 工作流的 job.properties 文件上的 user.name 属性设置为用户 yarn 来解决这个问题。

user.name=yarn

我认为问题在于它没有在/user/root 下创建暂存文件的权限。一旦我将运行用户修改为 yarn，暂存文件就会在/user/yarn 下创建，它确实具有适当的权限。

关于hadoop - Sqoop Export Oozie Workflow 因未找到文件而失败，从控制台运行时有效，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32897524/

26

4

0

文章推荐： windows - 克隆存储库导致超时

文章推荐： windows - 来自 GetRawInputData 的 HID 设备信息结构

javascript - 为什么 `var exports = module.exports = {};` 有效但 `let exports = module.exports = {};` 无效？
在我的项目代码优化期间，我替换了 var 的所有实例关键词 let因为我认为 var 没有特别的用途.为此，我在所有文件中执行了“查找和替换”操作。在一些自定义模块中，我使用了如下语句: var e
reactjs - react : export const + export default vs export default
我遇到过使用“双”导出来创建当前组件的情况。您能否解释一下它是否有真正的用途，或者只是作者的偏好？ import React from 'react' import DuckImage from '.
export - sqoop EXPORT - 在目标表中找不到列
我编写了一个简单的脚本来创建用户 (TestV100)、在该架构中创建表 (Xy100) 并将制表符分隔的平面文件从 hadoop 导出到此 Oracle 表。这是 shell 脚本:-Export
javascript - export const foo、export default foo 和 module.exports = foo 的区别
我真的很困惑: export const foo 导出默认 foo module.exports = foo; 我知道这些是非常基本的，但有人可以区分并向我解释这些。我真的很想明白。最佳答案让我们
angularjs - export/module.exports 有什么用？
今天我在我的 AngularJS 项目中采用了 Browserify，但是我还不清楚。在所有示例和博客文章中，我都看到了这样的东西: /app.js: require('./messages'); a
export - Highcharts : set title on exporting
我正在寻找一种方法: 隐藏 HTML 页面结果上的标题导出时在 highcharts 图表上显示标题(PDF、PNG、JPEG 或打印) 我不知道如何继续。有人可以帮助我吗？最佳答案您可以在导出
android - Activity 机器人 :exported ="true" is not exported
在我的应用程序的首选项中，我调用以特殊方式处理某些参数的 Activity 。到目前为止它运作良好。但是，为了创建试用版和专业版，我刚刚创建了一个包含所有代码的库和一个调用该库的新演示应用程序。除了由
export - pentaho cde export button-如何设置导出文件名？
pentaho cde 导出组件正在为我工作，它导出表数据，文件名为 cda-export.csv，我可以自动设置文件名吗？最佳答案尝试使用参数 {filename : 'myfilename
export - Gephi preview export pdf 在左右边距处截断标签
我想从 Gephi 的预览选项卡中导出 SVG/PDF/PNG。导出的网络包括所有节点，但切断了左右两侧的节点标签。如何获得不切断标签的导出 pdf？最佳答案您必须通过控制选项来调整输出的大小。
perl - 这个错误是什么意思 : "import is not exported by the exporter module"?
如标题所述，我在尝试使用我的 perl 模块时遇到此错误，但我不知道它是什么意思，而且我似乎无法在 Internet 上找到任何明确的结果。我的代码由 3 个文件组成:一个脚本 (myApp.pl)，
json - Firebase: Exporting JSON Unable to export 单个位置导出的数据大小不能超过256MB
我曾经每天下载一个 firebase 实时数据库的节点，通过导出该节点的 .JSON 文件来监控一些输出。 JSON 文件本身大约 8MB。最近，我开始收到一个错误: “导出 JSON 无法导出在单
javascript - export * as bar VS export { 默认为 bar }
之间有什么区别 export * as bar from 'foo' 和 export { default as bar } from 'foo' 在我的特殊情况下，我尝试了以下两种方法，它们都有效，
ecmascript-6 - 我可以使用 `export` 将对象导出为 "` module.export`"
我想我要求的是不可能的OOB，但我想确认一下。我们正在升级到 ES6(使用 Babel)。项目是一个网站，使用 AMD (requirejs)。我想将实用程序模块 (foolib) 转换为 ES6，
javascript - export default 和 export { default } 的区别
我一直在我的 React 中广泛使用命名导出和默认导出，我遇到了这 2 个相似的语法。从'./Button'导出默认值； export { default } from './Button'; 有人
javascript - CommonJs模块系统中 "module.exports"和 "exports"之间的区别
在此页面 ( http://docs.nodejitsu.com/articles/getting-started/what-is-require ) 上，它指出“如果要将导出对象设置为函数或新对象，
javascript - CommonJs模块系统中 "module.exports"和 "exports"之间的区别
在此页面 ( http://docs.nodejitsu.com/articles/getting-started/what-is-require ) 上，它指出“如果要将导出对象设置为函数或新对象，
javascript - 不能将 exports 用作类型，因为 exports 是一个值
我在运行 flow check 时收到此错误，但我不确定这是什么意思。 Cannot use exports as a type because exports is a value. To get
node.js - module.export 和 export 有什么区别
module.export和export有什么区别？如果module.export对象中有一些属性怎么办？export.xx 会无效吗？最佳答案首先是 exports 和 module.expo
Typescript 声明文件 - "export declare"和 "export"之间的区别
我正在学习 typescript 。在研究一些源文件时，我发现声明文件 .d 中有时有 export declare ... 有时只有 export ... .ts. 经过一些测试，在我看来它们是等价
Javascript ES6 export const 与 export let
假设我有一个要导出的变量。有什么区别 export const a = 1; 对比 export let a = 1; 我理解const 和let 之间的区别，但是当你导出它们时，有什么区别？最佳答

首页

博学

6Ren·AI

商城

hadoop - Sqoop Export Oozie Workflow 因未找到文件而失败，从控制台运行时有效