- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我的目标是创建一个大的 gzip 文本文件并将其放入 S3。
文件内容由我从另一个来源循环读取的 block 组成。
由于此文件的大小,我无法将所有数据保存在内存中,因此我需要以某种方式同时将其直接流式传输到 S3 和 ZIP。
我了解如何使用 Node.JS 中的常规 fs
执行此技巧,但我很困惑是否可以使用 AWS Lambda 中的 S3 执行相同的技巧?我知道 s3.putObject
can consume streamObject
,但在我看来,当我执行 putObject
操作时,这个流应该已经完成,这会导致超出允许的内存。
最佳答案
您可以使用 multipart upload functions 将文件 (>5mb) 以 block 的形式流式传输到 S3 存储桶中在 NodeJs aws-sdk .
这不仅对于将大文件流式传输到存储桶中很有用,还可以让您重试失败的 block (而不是整个文件)和并行上传单个 block (使用多个上传 lambda,这在无服务器 ETL 设置中很有用)。只要您跟踪它们并在所有上传完成后完成流程,它们到达的顺序并不重要。
要使用分段上传,您应该:
createMultipartUpload
初始化进程并存储返回的 UploadId
( block 上传需要它)uploadPart
之前以足够大的 block 缓冲数据的流将它们推送到 S3(在步骤 1 返回的 UploadId
下)ETags
和 PartNumbers
ETags
和 PartNumbers
使用 completeMultipartUpload
在 S3 上组装/完成文件这是 gist of it在从 iso.org 流式传输文件的工作代码示例中,通过 gzip 将其通过管道传输到 S3 存储桶中。不要忘记更改存储桶名称并确保在 Node 6.10 上使用 512mb 内存运行 lambda。由于没有外部依赖项,您可以直接在 Web GUI 中使用代码。
注意:这只是我为了演示目的而放在一起的概念证明。对于失败的 block 上传没有重试逻辑,并且几乎不存在错误处理,这实际上会让您付出代价(例如 abortMultipartUpload
应该在取消整个过程时调用以清理上传的 block ,因为它们保持存储状态并且不可见 在 S3 上,即使最终文件从未组装过)。输入流正在暂停,而不是排队上传作业并利用 backpressure流机制等
关于node.js - 从 AWS Lambda Node.JS 流式传输并压缩到 S3,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46812992/
可以使用 lambda 和函数创建有序对(Lisp 中的缺点),如 Use of lambda for cons/car/cdr definition in SICP 所示。 它也适用于 Python
我正在尝试从另一个调用一个 AWS lambda 并执行 lambda 链接。这样做的理由是 AWS 不提供来自同一个 S3 存储桶的多个触发器。 我创建了一个带有 s3 触发器的 lambda。第一
根据以下源代码,常规 lambda 似乎可以与扩展 lambda 互换。 fun main(args: Array) { val numbers = listOf(1, 2, 3) f
A Tutorial Introduction to the Lambda Calculus 本文介绍乘法函数 The multiplication of two numbers x and y ca
我想弄清楚如何为下面的表达式绘制语法树。首先,这究竟是如何表现的?看样子是以1和2为参数,如果n是 0,它只会返回 m . 另外,有人可以指出解析树的开始,还是一个例子?我一直找不到一个。 最佳答案
在 C++0x 中,我想知道 lambda 函数的类型是什么。具体来说: #include type1 foo(int x){ return [x](int y)->int{return x * y
我在其中一个职位发布中看到了这个问题,它询问什么是 lambda 函数以及它与高阶函数的关系。我已经知道如何使用 lambda 函数,但不太自信地解释它,所以我做了一点谷歌搜索,发现了这个:What
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
Evaluate (((lambda(x y) (lambda (x) (* x y))) 5 6) 10) in Scheme. 我不知道实际上该怎么做! ((lambda (x y) (+ x x
我正在处理 MyCustomType 的实例集合如下: fun runAll(vararg commands: MyCustomType){ commands.forEach { it.myM
Brian 在他对问题 "Are side effects a good thing?" 的论证中的前提很有趣: computers are von-Neumann machines that are
在 Common Lisp 中,如果我希望两个函数共享状态,我将按如下方式执行 let over lambda: (let ((state 1)) (defun inc-state () (in
Evaluate (((lambda(x y) (lambda (x) (* x y))) 5 6) 10) in Scheme. 我不知道实际上该怎么做! ((lambda (x y) (+ x x
作为lambda calculus wiki说: There are several possible ways to define the natural numbers in lambda cal
我有一个数据类,我需要初始化一些 List .我需要获取 JsonArray 的值(我使用的是 Gson)。 我做了这个函数: private fun arrayToList(data: JsonAr
((lambda () )) 的方案中是否有简写 例如,代替 ((lambda () (define x 1) (display x))) 我希望能够做类似的事情 (empty-lam
我在 Java library 中有以下方法: public void setColumnComparator(final int columnIndex, final Comparator colu
我正在研究一个函数来计算国际象棋游戏中棋子的有效移动。 white-pawn-move 函数有效。当我试图将其概括为任一玩家的棋子 (pawn-move) 时,我遇到了非法函数调用。我已经在 repl
考虑这段代码(在 GCC 和 MSVC 上编译): int main() { auto foo = [](auto p){ typedef decltype(p) p_t;
我正在阅读一个在 lambda 内部使用 lambda 的片段,然后我想通过创建一个虚拟函数来测试它,该函数从文件中读取然后返回最大和最小数字。 这是我想出来的 dummy = lambda path
我是一名优秀的程序员,十分优秀!