- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 S3 备份对我的业务至关重要的大型文件。我能否确信这些文件在上传后已通过完整性验证且完好无损?
有很多关于可伸缩性和可用性的文档,但我找不到任何关于完整性和/或校验和的信息。
最佳答案
当上传到 S3 时,有一个可选的请求 header (我认为它不是是可选的,但我跑题了),Content-MD5
。如果您将此值设置为请求正文的 MD5 哈希的 base64 编码,S3 将在不匹配的情况下完全拒绝您的上传,从而防止上传损坏的数据。
ETag
header 将设置为对象的十六进制编码 MD5 哈希值,用于单部分上传(某些类型的服务器端加密除外)。
对于分段上传,Content-MD5
header 设置为相同的值,但对于每个部分。
当 S3 将分段上传的各个部分合并到最终对象中时,ETag
header 设置为每个分段的串联二进制编码(原始字节)MD5 哈希的十六进制编码 MD5 哈希部分,加上 -
加上部分的数量。
当您要求 S3 执行合并分段上传的各个部分的最后一步时,您必须将其在原始部分上传期间提供给您的 ETag 还给它,这应该确保 S3 正在合并的内容是你认为它正在结合的东西。不幸的是,有一个 API 请求,你可以向 S3 询问你上传的部分,一些懒惰的开发人员只会向 S3 询问这个列表,然后立即将它发回,这是 documentarion 警告的,但是嘿,它“似乎去工作,”对吧?
超过 5GB 的对象需要分段上传,超过 5MB 的上传可选。
如果使用得当,这些功能可以保证上传完好无损。
如果您使用的是 Signature Version 4,它在较早的地区也是可选的,那么还有一个额外的完整性机制,而这个机制不是可选的(如果您实际上使用的是 V4):上传必须有一个请求 header x-amz-content-sha256
,设置为负载的十六进制编码的 SHA-256 哈希值,如果此处也存在不匹配,请求将被拒绝。
我的看法:由于其中一些功能是可选的,除非您审核它们的代码,否则您不能相信任何工具都能正确地执行此操作。
我不信任任何人使用我的数据,因此为了我自己的目的,我编写了自己的实用程序,内部称为“pedantic uploader”,它不使用 SDK 并直接与 REST API 对话。它计算文件的 sha256 并将其添加为 x-amz-meta-...
元数据,以便可以将其与对象一起获取以进行比较。当我上传压缩文件 (gzip/bzip2/xz) 时,我将压缩文件和未压缩文件的 sha 存储在元数据中,并将压缩文件和未压缩文件的大小以八位字节的形式存储在元数据中。
请注意,Content-MD5
和 x-amz-content-sha256
是请求 header 。它们不会随下载返回。如果您想将此信息保存在对象元数据中,如我在此处所述。
在 EC2 中,您可以轻松下载对象而无需将其实际保存到磁盘,只是为了验证其完整性。如果 EC2 实例与存储桶位于同一区域,则如果您使用具有公共(public) IPv4 或 IPv6 地址的实例、NAT 实例、S3 VPC 端点或通过 IPv6 导出网关,则无需支付数据传输费用. (如果您通过 NAT 网关访问基于 IPv4 的 S3,您将需要为 NAT 网关数据吞吐量付费)。显然有一些方法可以自动执行此操作,但是手动操作,如果您在控制台中选择对象,选择下载,右键单击并复制生成的 URL,然后执行以下操作:
$ curl -v '<url from console>' | md5sum # or sha256sum etc.
只需将来自控制台的 URL 包裹在单个 '
引号中,因为它将被预签名并且将在查询字符串中包含 &
,这是您不想要的要解释的 shell。
关于amazon-web-services - AWS S3 上传完整性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42208998/
我想知道 Amazon CloudSearch 和 Kendra 之间的主要区别是什么?为什么同一家公司的产品有两种不同的工具相互竞争?两者看起来都一样,我不确定功能有何不同。它是如何相互区分的。 A
我在一家小型电子商务网站工作,我们希望迁移到所有 Amazon 托管服务,但我不确定 RDS 和 SimpleDB 的确切区别。 RDS可以用MySQL,SimpleDB不行吗? 最佳答案 RDS 基
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 7年前关闭。 Improve t
任何人都知道如何 ELB如果我注册多个 EC2 将分发请求不同大小的实例。说一 m1.medium , 一 m1.large和一个 m1.xlarge . 如果我注册EC2会不会不一样相同大小的实例?
Amazon EventBridge 使开发人员能够将第 3 方事件驱动的应用程序与 Amazon 服务连接起来。 Amazon AppFlow 还提供与第 3 方应用程序的事件驱动集成。 对于事件驱
我想通过电子邮件或短信向特定用户(只有一个)发送验证码。我已经通过 Amazon SES 成功地做到了。但我没有尝试通过Amazon SMS然而。我发现自己陷入了调查的兔子洞AWS Pinpoint
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
我想使用 Amazon Glacier 镜像 S3 存储桶。 Glacier FAQ状态: Amazon S3 now provides a new storage option that enabl
我正在尝试在 Amazon RDS 上托管数据库,而数据库将存储信息的实际内容(视频)将托管在 Amazon S3 上。我对这个过程有一些疑问,希望有人能帮助我。 Amazon RDS 上托管的数
我刚刚开始使用 AWS EC2。我知道 EC2 就像一台远程计算机,我几乎可以在其中完成我想做的所有事情。后来我知道了ECS。我知道它使用 Docker,但我对这两者之间的关系感到困惑。 ECS 只是
什么时候我会使用 SNS 和 SQS,为什么它们总是耦合在一起? 最佳答案 SNS是一个分布式发布-订阅系统。当发布者将消息发送到 SNS 时,消息就会被推送给订阅者。 SQS是分布式排队系统。消息不
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a software
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭10 年前。 Improve th
我计划在 amazon EC2 中拥有一个多服务器架构,其中服务器需要相互通信。这些服务器需要位于不同的亚马逊地区(不同的数据中心)。我可以只使用亚马逊ec2的内部网络吗?有哪些安全问题?我是否应该在
我在帐户 B 中有 S3 存储桶“跨存储桶”。现在我希望帐户 A 中存在的 EC2 访问帐户 B 中的此存储桶“跨存储桶”。 我需要使用 IAM 角色来实现此目的,因为我们不允许创建用户。 我已使用以
我有使用 Backbone.js 构建的单页应用程序。 我在 Amazon S3 上托管应用程序(应用程序仅包含静态文件)。 我使用 CloudFront 作为 Bucket CDN。 应用程序通过
我可以连接到 ElastiCache来自 EC2 实例 的 VPC 中的 Redis 实例。但我想知道是否有办法连接到 Amazon EC2 实例之外的 ElastiCache Redis 节点,例如
我有几个微实例可以正常工作数周。两者都在运行WordPress博客。在过去的24小时内,其中一个已经停止。即使重新启动,我也无法插入。另一个实例工作正常。 ssh: connect to host e
我尝试了以下方法: SELECT * FROM generate_series(2,4); generate_series ----------------- 2
如何使用PHP API将包含子文件夹和文件的文件夹复制/复制到S3存储桶中的另一个目录中? $s3->copy_object仅复制文件夹,而不复制其中的文件和子文件夹。 我是否必须使用$s3->lis
我是一名优秀的程序员,十分优秀!