gpt4 book ai didi

amazon-web-services - 使用YARN运行分布式xgboost的问题

转载 作者:行者123 更新时间:2023-12-02 21:09:39 24 4
gpt4 key购买 nike

我在关于YARN上的xgboost分布式模式的教程中遇到了一些问题。

我按照他们的指示进行操作,但是有一些我无法解决的问题。

我正在使用Hadoop 2.6.0(似乎已正确配置)运行2个EC2实例。

当我使用以下命令运行他们的演示时:

cd xgboost/demo/distributed-training
# Use dmlc-submit to submit the job.
../../dmlc-core/tracker/dmlc-submit --cluster=yarn --num-workers=2 --worker-cores=2\
../../xgboost mushroom.aws.conf nthread=2\
data=s3://${BUCKET}/xgb-demo/train\
eval[test]=s3://${BUCKET}/xgb-demo/test\
model_dir=s3://${BUCKET}/xgb-demo/model

我从Hadoop容器中收到以下错误:
Traceback (most recent call last):
File "./launcher.py", line 82, in <module>
main()
File "./launcher.py", line 77, in main
ret = subprocess.call(args=sys.argv[1:], env=env)
File "/usr/lib/python2.7/subprocess.py", line 523, in call
return Popen(*popenargs, **kwargs).wait()
File "/usr/lib/python2.7/subprocess.py", line 711, in __init__
errread, errwrite)
File "/usr/lib/python2.7/subprocess.py", line 1343, in _execute_child
raise child_exception
OSError: [Errno 2] No such file or directory

显然, subprocess函数似乎无法找到某些文件。所以我试图看看python试图调用什么。 subrpocess的两个参数是:
['../../xgboost', './mushroom.aws.conf', 'nthread=1', 'data=s3://awstest.xgboost/xgb-demo/train', 'eval[test]=s3://awstest.xgboost/xgb-demo/test', 'model_dir=s3://awstest.xgboost/xgb-demo/model']

和环境字典。环境字典调用 ${PYTHONPATH}变量,但是它似乎是空的,或者至少当我从终端回显它时它是空的。

您有什么问题的线索吗?

谢谢。

最佳答案

我在您的代码中看到的主要问题是您正在使用相对路径。 dmlc-submit命令未在它将使用的每个节点中设置当前目录。
这导致python子进程告诉您它找不到../.../xgboost二进制文件,因为路径不相同。

我使用绝对路径来克服此问题。

关于amazon-web-services - 使用YARN运行分布式xgboost的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40684808/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com