作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 spark 中编写了一个 python 代码,我想在 Amazon 的 Elastic Map reduce 上运行它。
我的代码在我的本地机器上运行良好,但我对如何在亚马逊的 AWS 上运行它有点困惑?
更具体地说,我应该如何将我的 python 代码转移到主节点?我是否需要将我的 Python 代码复制到我的 s3 存储桶并从那里执行它?或者,我应该 ssh 进入 Master 并将我的 python 代码 scp 到 Master 中的 spark 文件夹吗?
现在,我尝试在我的终端上本地运行代码并连接到集群地址(我通过读取 spark 的 --help 标志的输出来做到这一点,所以我可能在这里遗漏了几个步骤)
./bin/spark-submit --packages org.apache.hadoop:hadoop-aws:2.7.1 \
--master spark://hadoop@ec2-public-dns-of-my-cluster.compute-1.amazonaws.com \
mypythoncode.py
-i permissionsfile.pem
Exception in thread "main" java.lang.IllegalArgumentException: AWS Access Key ID and Secret Access Key must be specified as the username or password (respectively) of a s3n URL, or by setting the fs.s3n.awsAccessKeyId or fs.s3n.awsSecretAccessKey properties (respectively).
at org.apache.hadoop.fs.s3.S3Credentials.initialize(S3Credentials.java:66)
at org.apache.hadoop.fs.s3native.Jets3tNativeFileSystemStore.initialize(Jets3tNativeFileSystemStore.java:49)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
......
......
最佳答案
Spark
,如果您不需要这些附加程序,则可以取消选中其他框。 S3
,然后选择新上传的 S3 文件的路径。一旦运行,它将成功或失败。如果失败,请稍等片刻,然后单击步骤列表中该步骤行的“查看日志”。不断调整你的脚本,直到你让它工作。关于amazon-web-services - 如何在 Amazon Aws 上运行 Python Spark 代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40443659/
我是一名优秀的程序员,十分优秀!