amazon-s3 - Spark的S3角色授权？-6ren

amazon-s3 - Spark的S3角色授权？

转载作者：行者123 更新时间：2023-12-02 01:15:40

29

4

在 AWS 内的 Cloudera 上使用 pyspark2(版本 2.0.0.cloudera1)

我正在尝试将数据帧从 Spark 写入 S3 存储，但由于身份验证而失败:

pyspark.sql.utils.IllegalArgumentException: u'AWS Access Key ID and Secret Access Key must be specified by setting the fs.s3n.awsAccessKeyId and fs.s3n.awsSecretAccessKey properties (respectively).'

我的 pyspark 代码是:

utp.coalesce(1).write.format('com.databricks.spark.csv').save('s3n://my_bucket/tmr_xfers/test_output')

我们使用角色来访问 S3，即“aws_iam_role=arn:aws:iam::123456789012:role/RoleName”——而不是单独的 AccessKeyID

我需要在 Spark 代码中进行哪些更改，以便使用角色而不是单独的 AccessKeyId 和 SecretAccessKey 将我的 csv 写入 S3？

最佳答案

我遇到了同样的问题，并通过使用 s3a:// 解决了它相反，无论如何，这显然更加现代和高效。

问题在于负责访问 S3 文件系统的 Hadoop 驱动程序代码(我认为是 hadoop-aws.jar )。显然 s3n 'native' 协议(protocol)使用一些难以使用的旧 jets3t 驱动程序，每个人都不敢乱用。新s3a协议(protocol)实现直接使用AWS SDK，并支持实例配置文件等。

看看这些HADOOP-9680和 HADOOP-9384看看他们为什么 WONTFIXed 这个问题。

关于amazon-s3 - Spark的S3角色授权？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42788777/

29

4

0

文章推荐： tinymce-4 - TinyMCE 在 iframe 中剥离了 allowfullscreen 属性？

文章推荐： string - Delphi:字符串网格的自动滚动

文章推荐： assembly - 最简单的链式加载引导管理器

授权:根据用户授权过滤数据
我们需要实现如下授权规则。如果用户是 super 管理员，则向他提供所有客户信息。比如订单信息。如果用户是客户管理员，只提供他自己的客户信息。等等我们计划在 DAO 层实现过滤。创建通用设计来处
curl 授权
我有 https 设置的 Spring Security。尝试以安全方式在 URL 上运行 curl GET 时，我看到了意外行为。当 curl 第一次向服务器发送请求时，它没有授权数据(为什么？
soa - 微服务之间是否应该有身份验证/授权？
关闭。这个问题是 opinion-based 。它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它。 1年前关闭。 Improve thi
security - 单页应用程序中的安全身份验证/授权
我正在构建以下内容: 一个 JavaScript 单页应用程序；一个暴露 RESTful API 的 Node.js 后端，它将存储用户数据；用户凭据(电子邮件/密码)可以通过单页应用程序创建并存
通过REST端点进行Spring Security身份验证/授权
在带有RESTful Web服务的Spring Boot应用程序中，我已将Spring Security与Spring Social和SpringSocialConfigurer一起配置。现在，我有
architecture - RESTful 授权
我正在为真实世界组织的成员在 Rails 中构建一个基于社区的站点。我正在努力遵循 RESTful 设计的最佳实践，其中大部分或多或少是书本上的。使我的大脑在整洁的 RESTful 圈子中运转的问题是
kubernetes - 是否可以在Google容器引擎中打开ABAC模式(授权)？
我想启用 ABAC mode对于我在 Google 容器引擎中使用的 Kubernetes 集群。 (更具体地说，我想限制自动分配给所有 Pod 的默认服务帐户对 API 服务的访问)。但是，由于 -
gitosis 授权 key
奇怪的事情 - 在 git push gitosis 上不会将新用户的 key 添加到/home/git/.ssh/authorized_keys。当然-我可以手动添加 key ，但这不好:( 我能做
.NET 授权。顺序或允许和拒绝元素重要吗？
我很好奇您提供的顺序是否正确和元素中的元素重要吗？最佳答案是的，顺序很重要。本页介绍了基本原理:http://msdn.microsoft.com/en-us/library/wce3kxhd
django - 默认解析器的身份验证/授权
我阅读了如何使用 @login_required 的说明以及其他带有解析器的装饰器。但是，如果不使用显式解析器(而是使用默认解析器)，如何实现类似的访问控制？就我而言，我将 Graphite 烯与
php - Facebook 授权
我用 php 开发了一个审核应用程序，通过它我可以审核所有帖子和评论。我还可以选择在 Facebook 粉丝页面墙上发布帖子。但是，当我尝试这样做时，会引发异常，显示“用户尚未授权应用程序执行此操作”
jQuery 'POST' 授权
我使用 jquery-ajax 方法 POST 来发布授权 header ，但 Firebug 显示错误“401 Unauthorized” header 作为该方法的参数。我做错了什么？我该怎么办
c# - 如何正确使用【授权】
我有两组用户，一组正在招聘，一组正在招聘。我想限制每个用户组对某些页面的访问，但是当我在 Controller 中使用 [Authorize] 时，它允许访问任何已登录的用户而不区分他们来自哪个组？
mysql - 授权 - 如何检查网络应用程序中的用户权限？
我有一个简单直接的授权实现。好吧，我只是认为我这样做，并且我想确保这是正确的方法。在我的数据库中，我有如下表:users、roles、user_role、permissions、 role_perm
java - SOAP 授权
我的 soap 连接代码: MessageFactory msgFactory = MessageFactory.newInstance(); SOAPMessage message
表或列上的 Mysql 授权
我想知道是否可以将 mysql 用户设置为只对数据库中的特定表或列具有读取权限？最佳答案是的，您可以使用 GRANT 为数据库在细粒度级别执行此操作。见 http://dev.mysql.com/
iOS Facebook 授权
我试图获得发布流和离线访问的授权，但出现此错误。而且它没有显示我想要获得的权限。我的代码如下: self.fb = [[Facebook alloc] initWithAppId:@"xxxxxxx
javascript - 数据和盐参数需要错误(授权)
我是 NodeJS 的初学者，我尝试使用 NodeJS + Express 制作身份验证表单。我想对我的密码进行验证(当“confirmpassword”与“password”不同时，它应该不返回任何
Paypal 授权 header
我能够为测试 paypal 帐户成功生成访问 token 和 TokenSecret。然而，下一步是为调用创建授权 header 。在这种情况下，我需要提供我不确定的 Oauth 签名或 API 签
c# - Steam 授权
我正在尝试获取授权 steam 页面的 html 代码，但我无法登录。我的代码是 public string tryLogin(string EXP, string MOD, string TIME)

首页

博学

6Ren·AI

商城

amazon-s3 - Spark的S3角色授权？