amazon-web-services - 寻求有关将大文件从带宽受限的服务器下载到 AWS S3 存储桶的方法的建议-6ren

amazon-web-services - 寻求有关将大文件从带宽受限的服务器下载到 AWS S3 存储桶的方法的建议

转载作者：行者123 更新时间：2023-12-04 03:13:16

24

4

对于我正在处理的项目，需要提取一个每天更新并在特定客户 URL 上可用的大型文本文件，并将其存储在 AWS S3 中，然后触发文件的下游处理(细节不重要)。

我正在考虑让 CloudWatch 每 24 小时触发一次 AWS Lambda 在 S3 中完成下载和存储，这可行，但有一个问题:文件大小为 36MB，由限制下载的主机提供服务到 100kB/s(我无法控制)。这意味着至少需要 360 秒(即 6 分钟)才能完全下载文件。然而，AWS Lambda 函数的运行时间上限为 300 秒，这实际上使得无法用于此任务，因为 Lambda 在文件完全下载之前超时并退出。

我正在寻找解决 AWS Lambda 的 300 秒运行时间限制以实现此目标的方法的建议。

只要我坚持使用 AWS，我看到的唯一选择就是在 EC2 实例上设置一个 cron 作业，但这似乎很昂贵/矫枉过正，特别是如果我最终不需要一个永远在线的 EC2其他任何东西。

谢谢!

最佳答案

我会让 Lambda 启动一个运行复制作业的小型 EC2 实例。您可以为 EC2 实例使用自定义 AMI，也可以使用 cloud-init 脚本来设置所有内容。让 EC2 上的程序运行一下，请记住，无论您需要多少时间，都会按一小时收费。但是，如果整个过程需要 15 分钟(因为无法保证不会出现某些交通拥堵)并且您使用的是 t2.nano，则您需要支付 0.006 美元(十分之六美分)外加一些 I/O 费用，并且，可能，EBS 空间。我敢打赌你会花很少的钱。

作业完成后，它会终止正在运行的 EC2 实例。

我意识到这有点麻烦 - CloudWatch 触发 Lambda，Lambda 触发 EC2。但仅靠 CloudWatch 无法满足您对 EC2 的需求。

关于amazon-web-services - 寻求有关将大文件从带宽受限的服务器下载到 AWS S3 存储桶的方法的建议，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43256240/

24

4

0

文章推荐： image - Ridgelet 和 Curvelet 图像处理包

文章推荐： django - “帐户”对象没有属性 'get_absolute_url'

文章推荐： entity-framework - 有了EF，学习DataSet有意义吗

文章推荐： angular - Plotly 工具提示位置应根据光标位置动态变化

gnuradio - 带宽 USRP2
USRP2 可以处理的最大带宽是多少？最佳答案 100MS/s I & Q 下的 USRP2 A/D 样本被缩减为 25MS/s 复杂。我们使用 16 位 I & Q。这在 USRP2 的千兆以太
Javascript - 检测互联网速度/带宽
使用下面的脚本来检测连接到网络的系统的互联网速度。引用javascript to detect internet speed 但是，https://fast.com/ 的速度结果和 http://ww
java - 用Java测量内部网络速度/带宽
我需要能够使用java监视内部网络的速度。我当时想我可以使用一个包含服务器和客户端的两部分系统。我不需要响应时间（例如使用ping生成的响应时间），但不需要上载和下载时的mbps实际速度。我的想法是
c# - 如何获取用于调用网页的网页总返回大小/带宽
我正在使用 HttpWebRequest 调用页面并使用 HttpWebResponse 获取结果，我的问题是如何获取或计算返回页面的总大小(以字节为单位)。此外，我还想知道我用来调用该页面的流量/
firebase - 通过缩短字段名称来节省 Firebase 带宽？
使用 Firebase，我为字段指定易于理解的名称，例如“timestamp”、“last_changed”、“message_direction”等。字段名称是每个“行”数据交换的一部分吗？意思
firebase - 通过缩短字段名称来节省 Firebase 带宽？
使用 Firebase，我为字段指定易于理解的名称，例如“timestamp”、“last_changed”、“message_direction”等。字段名称是每个“行”数据交换的一部分吗？意思
java - Android Wifi 带宽
最近我接到了一项任务，要在 Nexus 7 平板电脑上开发 Android 应用程序，该应用程序将使用 wifi 通过 tcp 套接字与电脑连接。特别是我必须将图像流(例如未压缩的 BMP)传递给平
c# - 以太网端口上的 throttle 带宽
我正在编写一个在服务器上运行的应用程序，我需要能够为每个以太网端口设置最大带宽(最多有 6 个端口)。显然我可以限制我的应用程序使用的带宽，但我还没有找到任何关于限制计算机上实际以太网端口带宽的信息
go - 测量每个流的 gRPC 带宽
我有一个 gRPC用 Go 编写的服务，它有很长的运行流。我想要一种方法来测量每个流的网络/带宽使用情况，并将该信息提供给 prometheus . 我找到了 grpc.StreamServerInt
OpenCL 传输速率超过 PCI-e 带宽
我制作了一个 OpenCL 程序并使用固定内存 (CL_MEM_ALLOC_HOST_PTR) 来获得从设备到主机的更高传输速率。传输速率按我的预期增加(使用 AMD APP Profiler 2.
xcode - 在 Xcode 中检查连接速度(带宽)
有什么方法可以在 Xcode 中以编程方式检查互联网连接速度或带宽。我正在尝试这样做，因为慢速连接给某些图像上传带来了问题。最佳答案如果你真的需要知道，你将不得不测试它。设置与具有低延迟的已知服
git - 如何重置 Git LFS 带宽？
我已将大小为 876MB 的文件推送到 git lfs，这分别显示了我总共 0.9 的可用存储空间和带宽，但是，然后我做了一些更改，例如删除了旧存储库并卸载了 git lfs，因为我将图像大小从 90
azure - 如何防止恶意带宽吸血鬼请求滥用 Azure CDN 带宽？
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 8 个月前关闭。 Improve this ques
c++ - 如何在 vc++ 中以编程方式检查互联网速度/带宽
这个问题在这里已经有了答案: How to programmatically check Internet bandwidth in VC++? (3 个答案) 关闭 8 年前。我想在 vc++
linux - 一小部分用户的页面加载速度非常慢。 CPU/带宽/等未处于负载状态
这让我发疯，所以我想看看是否有人能给我一个线索。我有一个小型 VPS，运行 Centos 5、最新的 Apache、MySQL 和 PHP。大约 1% 的用户报告页面加载速度非常慢，即使对于静态 H
c++ - 在不传输数据的情况下确定网络接口(interface)带宽/类型
在 Win32 中有没有什么方法可以在不实际传输任何数据的情况下以编程方式确定给定网络接口(interface)的带宽？我只想区分不同类型的接口(interface)(例如拨号 vs DSL vs L
networking - 定义做某事所需的时间(延迟、吞吐量、带宽)
我了解延迟 - 消息从发件人到收件人所需的时间 - 和带宽 - 在给定时间内可以传输的最大数据量 - 但我正在努力寻找合适的术语来描述相关事物: 如果协议(protocol)是基于对话的——负载在端点
logging - GoLang 数据记录器(带宽)内存泄漏
我试图找到内存泄漏，我已将其归零到这部分代码，但我找不到内存泄漏的位置或如何修复它，当我让一些人调查时他们建议它与此处提到的“代码”有关: https://golang.org/src/time/ti
wcf - 在 .net/WCF 中检测连接速度/带宽
我正在使用 WCF 编写客户端和服务器代码，我需要知道客户端和服务器之间的“感知”流量带宽。我可以使用 ping 统计信息单独收集此信息，但我想知道是否有一种方法可以在 WCF 中配置 channel
javascript - 从客户端(浏览器)限制 WebRTC 带宽
我知道可以在对等连接上使用“setParameter”来限制上传(发送)带宽。我正在寻找一种方法来限制下载(已接收)但找不到。(我没有控制权我错过了这个概念吗？或者有办法做到这一点？谢谢最佳答案

首页

博学

6Ren·AI

商城

amazon-web-services - 寻求有关将大文件从带宽受限的服务器下载到 AWS S3 存储桶的方法的建议