amazon-web-services - Pyspark 数据帧从一个存储桶读取并在同一作业中使用不同的 KMS key 写入另一个存储桶-6ren

amazon-web-services - Pyspark 数据帧从一个存储桶读取并在同一作业中使用不同的 KMS key 写入另一个存储桶

转载作者：行者123 更新时间：2023-12-04 07:48:36

30

4

几乎不需要帮助就可以为下面的用例找到更好的解决方案。
我有包含输入数据的 S3 存储桶，它用 加密KMS key 1
所以我可以使用 "spark.hadoop.fs.s3.serverSideEncryption.kms.keyId" 将 KMS KEY 1 设置为我的 spark session
并且能够读取数据，
现在我想将数据写入另一个 S3 存储桶，但它是用 加密的KMS key 2 *
所以我目前正在做的是，使用 Key1 创建 Spark session 并读取数据帧并将其转换为 Pandas 数据帧并终止 Spark session 并使用 KMS KEY2 在同一 AWS 胶水作业中重新创建 Spark session 并转换 Pandas 数据在上一步中创建以触发数据帧并写入输出 S3 存储桶。
但这种方法有时会导致数据类型问题。有没有更好的替代解决方案来处理这个用例？
提前致谢，非常感谢您的帮助。

最佳答案

您不需要声明使用什么 key 来解密用 S3-KMS 加密的数据；要使用的 keyID 作为属性附加到文件中。 AWS S3 读取加密设置，查看 key ID，将 KMS 加密的对称 key 发送到 AWS KMS，要求使用要求解密的用户/IAM 角色对其进行解密。如果用户/角色具有正确的权限，S3 会取回未加密的 key ，解密文件并将其返回。
要从使用 KMS-1 加密的存储桶中读取数据，您应该能够将 key 设置为 key2 值(或根本不加密)，并且仍然可以取回数据
免责声明:我没有用 EMR s3 连接器测试过这个，只是用 apache S3A 连接器测试过这个，但由于 S3-KMS 在任何地方都一样，我希望这能成立。使用客户端提供的 key S3-CSE 进行加密是另一回事。您确实需要正确配置客户端，这就是 S3A 支持每个存储桶配置的原因。

关于amazon-web-services - Pyspark 数据帧从一个存储桶读取并在同一作业中使用不同的 KMS key 写入另一个存储桶，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67086696/

30

4

0

文章推荐： stata - r(109) 错误消息代码迭代字符串中的数字

文章推荐： javascript - 在 React 中根据索引和颜色词过滤文本

文章推荐： chainlink - 在 Brownie 中 fork 主网时如何处理链链接请求？

aws-kms - AWS KMS 解密错误 Credstash
我的 aws 帐户位于 us-west-2 区域。并且在该账户中创建的 KMS key 具有 ARN arn:aws:kms:us-east-1::key/。在我的节点模块中，我使用 Credstas
google-cloud-kms - 获取解密密文时使用的Google KMS key 版本
当encrypting symmetrically使用 Google Cloud 的 KMS，Google Cloud automatically选择主键版本: Each symmetric encr
javascript - 由于 KMS 使用 AES，您可以在客户端上使用 AES 加密并在服务器上使用 KMS 加密吗？
我需要使用客户端 key 加密一些文本字符串，然后使用与客户端加密相同的 key 在服务器端解密此加密字符串。据我了解，AWS KMS 是建立在 AES 之上的。那么我可以使用 CryptoJS
google-cloud-kms - Google Cloud KMS 错误 - 无法从您所在的地区访问此 API。 (HTTP 状态 - 403)
我已经创建了一个谷歌云项目并启用了谷歌云 key 管理服务 (KMS) API。我创建了两个 key 圈。 keyring1位于us-east1，keyring2位于global。我创建了以下 ja
amazon-web-services - 使用 Cloudformation 创建 KMS key 时出现消息 "Did not have IAM permissions to process tags on AWS::KMS::Key resource"
使用 Cloudformation 创建新的 KMS key 时，我在“状态原因”列中看到此消息: Did not have IAM permissions to process tags on AW
security - 不推荐使用Hadoop KMS？
在阅读Cloudera KMS Installation procedure时，我发现 Cloudera strongly recommends not using Java Keystore KMS
amazon-kms - 关键管理服务
Amazon Key Management Services 背后使用哪些算法或加密方法？我搜索了它，但只找到了与配置相关的信息，而不是集成信息。最佳答案我会在这个答案的开头说，如果你真的感兴趣
kubernetes - 如何从Kubernetes Engine访问Google KMS？
我必须将.Net Core应用程序从Google App Engine移至Google Kubernetes Engine，因为我需要静态IP，可惜Google App Engine没有该选项。我设
ios - 以编程方式将默认加密 KMS 添加到存储桶
我使用 AWS SDK iOS v2.6.21 以编程方式将 KMS (SSE-KMS) 加密添加到 AWS S3 存储桶。我使用以下 Objective-C 代码执行此操作: AWSS3 *awsC
hadoop - 使用 KMS 在配置单元中进行列级加密
我正在寻求帮助，使用 KMS 在 Hive 中实现列级加密(与 https://issues.apache.org/jira/browse/HIVE-7934 完全相似)。虽然我清楚所引用 URL 中
hadoop - KMS Hadoop 的身份验证问题
我是 hadoop KMS 的新手，我已经使用 hadoop 启动了 KMS。现在我尝试运行这个 curl 命令 curl -i --header "Accept:application/json"
java - 为什么我们需要 Hadoop KMS？
我不确定为什么我们需要这个 Hadoop KMS 正是为了？我浏览了 Apache Hadoop 的官方文档，并没有确切提到为什么我们需要这个概念。我唯一清楚的是，使用此 client 和 serve
linux - 使用 KMS 设置控制台视频分辨率
我搜索了 Google 结果，这似乎是不可能的，所以:有人知道如何使用 KMS 在控制台中更改或设置特定的视频分辨率吗？我没有使用任何图形服务器或图形子系统，所以这个问题只与控制台有关。我使用的是
javascript - 关于使用 Cloud KMS 进行签名验证的问题
我正在尝试验证使用 Google 的云 KMS 生成的签名，但我不断收到无效响应。这是我测试它的方式: const versionName = client.cryptoKeyVersionPath
java - AWS KMS 如何使用解密函数 Java
我的问题可能听起来太明显了，但我是 Amazon KMS 的新手。在阅读了 AWS 上的大量文档后，我了解到，如果我直接使用 CMK 进行加密和解密，我可以直接通过创建加密和解密请求来完成。但我不清楚
url - 有没有办法使用亚马逊 KMS key 签署云端 URL？
我已经能够使用私钥签署云端 URL，但很难保证私钥的安全。我正在考虑使用 KMS 来保证私钥的安全，有没有办法使用存储在亚马逊 KMS 中的 key 对 URL 进行签名？最佳答案答案是否定的，C
amazon-web-services - CloudFormation KMS 加密问题
给定一个定义了以下内容的 CloudFormation 模板: KMS key KMS key 别名一个 S3 存储桶如果由于某种原因我需要删除 CloudFormation 堆栈并重新部署，删除
google-cloud-kms - 从控制台编辑或删除 key 环
这是一个新手安全/控制台问题......我在我的项目中在欧洲的一个特定(错误)位置创建了一个 key 环。我在控制台中看不到任何编辑甚至删除 key 环的方法。 key 圈完全是空的……里面没有 k
python - 从 S3 读取 KMS 加密文件
如何使用 boto3 资源从 S3 存储桶读取 KMS 加密文件？下面是我用来读取非加密文件的片段 - s3 = boto3.resource('s3') obj = s3.Object(bucke
amazon-web-services - kms :GenerateDataKey in AWS的目的是什么
我正在 AWS Lambda 上编写无服务器函数。在某些情况下，我需要使用 kms:GenerateDataKey*权限。这样做的目的究竟是什么。我检查了 AWS 文档，但它太神秘了。有人可以举一

首页

博学

6Ren·AI

商城

amazon-web-services - Pyspark 数据帧从一个存储桶读取并在同一作业中使用不同的 KMS key 写入另一个存储桶