javascript - Node.js 进程在中间退出，没有错误(使用流)-6ren

javascript - Node.js 进程在中间退出，没有错误(使用流)

转载作者：太空宇宙更新时间：2023-11-04 01:39:29

25

4

我正在编写一个 Lambda 函数，该函数给出 S3 上的文本文件列表，并将它们连接在一起，然后压缩生成的文件。由于某种原因，该函数在进程中间崩溃，没有错误。

发送到 Lambda 函数的负载如下所示:

{
  "sourceFiles": [
    "s3://bucket/largefile1.txt",
    "s3://bucket/largefile2.txt"
  ],
  "destinationFile": "s3://bucket/concat.zip",
  "compress": true,
  "omitHeader": false,
  "preserveSourceFiles": true
}

该功能完全正常工作的场景:

这两个文件都很小，并且compress === false
两个文件都很小，并且compress === true
两个文件都很大，并且compress === false

如果我尝试让它压缩两个大文件，它会在中间退出。连接过程本身工作正常，但当它尝试使用 zip-stream 将流添加到存档时，它会失败。

这两个大文件总共有 483,833 字节。当 Lambda 函数失败时，它会读取 290,229 或 306,589 字节(随机)，然后退出。

这是函数的主要入口点:

const packer = require('zip-stream');
const S3 = require('aws-sdk/clients/s3');
const s3 = new S3({ apiVersion: '2006-03-01' });
const { concatCsvFiles } = require('./csv');
const { s3UrlToParts } = require('./utils');

function addToZip(archive, stream, options) {
  return new Promise((resolve, reject) => {
    archive.entry(stream, options, (err, entry) => {
      console.log('entry done', entry);
      if (err) reject(err);
      resolve(entry);
    });
  });
}

export const handler = async event => {
  /**
   * concatCsvFiles returns a readable stream to pass to either the archiver or
   * s3.upload.
   */
  let bytesRead = 0;

  try {
    const stream = await concatCsvFiles(event.sourceFiles, {
      omitHeader: event.omitHeader,
    });
    stream.on('data', chunk => {
      bytesRead += chunk.length;
      console.log('read', bytesRead, 'bytes so far');
    });
    stream.on('end', () => {
      console.log('this is never called :(');
    });
    const dest = s3UrlToParts(event.destinationFile);
    let archive;

    if (event.compress) {
      archive = new packer();

      await addToZip(archive, stream, { name: 'concat.csv' });
      archive.finalize();
    }

    console.log('uploading');
    await s3
      .upload({
        Body: event.compress ? archive : stream,
        Bucket: dest.bucket,
        Key: dest.key,
      })
      .promise();

    console.log('done uploading');

    if (!event.preserveSourceFiles) {
      const s3Objects = event.sourceFiles.map(s3Url => {
        const { bucket, key } = s3UrlToParts(s3Url);

        return {
          bucket,
          key,
        };
      });

      await s3
        .deleteObjects({
          Bucket: s3Objects[0].bucket,
          Delete: {
            Objects: s3Objects.map(s3Obj => ({ Key: s3Obj.key })),
          },
        })
        .promise();
    }

    console.log('## Never gets here');

    // return {
    //   newFile: event.destinationFile,
    // };
  } catch (e) {
    if (e.code) {
      throw new Error(e.code);
    }

    throw e;
  }
};

这是串联代码:

import MultiStream from 'multistream';
import { Readable } from 'stream';
import S3 from 'aws-sdk/clients/s3';
import { s3UrlToParts } from './utils';

const s3 = new S3({ apiVersion: '2006-03-01' });

/**
 * Takes an array of S3 URLs and returns a readable stream of the concatenated results
 * @param {string[]} s3Urls Array of S3 URLs
 * @param {object} options Options
 * @param {boolean} options.omitHeader Omit the header from the final output
 */
export async function concatCsvFiles(s3Urls, options = {}) {
  // Get the header so we can use the length to set an offset in grabbing files
  const firstFile = s3Urls[0];
  const file = s3UrlToParts(firstFile);
  const data = await s3
    .getObject({
      Bucket: file.bucket,
      Key: file.key,
      Range: 'bytes 0-512', // first 512 bytes is pretty safe for header size
    })
    .promise();
  const streams = [];
  const [header] = data.Body.toString().split('\n');

  for (const s3Url of s3Urls) {
    const { bucket, key } = s3UrlToParts(s3Url);

    const stream = s3
      .getObject({
        Bucket: bucket,
        Key: key,
        Range: `bytes=${header.length + 1}-`, // +1 for newline char
      })
      .createReadStream();
    streams.push(stream);
  }

  if (!options.omitHeader) {
    const headerStream = new Readable();
    headerStream.push(header + '\n');
    headerStream.push(null);
    streams.unshift(headerStream);
  }

  const combinedStream = new MultiStream(streams);
  return combinedStream;
}

最佳答案

明白了。问题实际上出在 zip-stream 库上。显然它不适用于 S3 + 流媒体。我尝试了 yazl 并且它工作得很好。

关于javascript - Node.js 进程在中间退出，没有错误(使用流)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53385050/

25

4

0

文章推荐： c - 使用枚举时 c 中出现奇怪的编译错误

文章推荐： python - argparse 模块 - 如何在运行时更改帮助格式？

node.js - backbone.js + node.js - express.js
我正在学习构建单页应用程序 (SPA) 所需的所有技术。总而言之，我想将我的应用程序实现为单独的层，其中前端仅使用 API Web 服务(json 通过 socket.io)与后端通信。前端基本上是
node.js - Sequelize js/express js/node js 如何更改日期格式
当我看到存储在我的数据库中的日期时。这是正常。日期和时间就是这样。但是当我运行 get 请求来获取数据时。此格式与存储在数据库中的格式不同。为什么会发生这种情况？最佳答案我认为您可以将
history.js - Sammy.js/History.js/Nav.js 之间的比较
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
backbone.js - Mustache.js/Hogan.js 和 Backbone.js
我正在尝试使用backbone.js 实现一些代码和 hogan.js (http://twitter.github.com/hogan.js/) Hogan.js was developed ag
node.js - Backbone.js Node.js Express.js 中的用户功能
我正在使用 Backbone.js、Node.js 和 Express.js 制作一个 Web 应用程序，并且想要添加用户功能(登录、注销、配置文件、显示内容与该用户相关)。我打算使用 Passpor
node.js - Angular.js/D3.js/Node.js 之间有什么区别和相似之处
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
node.js - d3.js、queue.js 和 node.js
我尝试在 NodeJS 中加载数据，然后将其传递给 ExpressJS 以在浏览器中呈现 d3 图表。我知道我可以通过这种方式加载数据 - https://github.com/mbostock/q
node.js - node.js 中 app.js、index.js 和 server.js 的约定？
在 node.js 中，我似乎遇到了相同的 3 个文件名来描述应用程序的主要入口点: 使用 express-generator 包时，会创建一个 app.js 文件作为生成应用的主要入口点。通过 n
backbone.js - amplify.js 和backbone.js
最近，我有机会观看了 john papa 关于构建单页应用程序的精彩类(class)。我会喜欢的。它涉及服务器端和客户端应用程序的方方面面。我更喜欢客户端。在他的实现过程中，papa先生在客户端有类
backbone.js - Mustache.js、Handlebars.js 和 Underscore.js 有什么区别？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
d3.js - Pixi.js vs Konva.js vs D3.js
我是一个图形新手，需要帮助了解各种 javascript 2D 库的功能。 . . 我从 Pixi.js 中得到了什么，而我没有从 Konva 等基于 Canvas 的库中得到什么？我从 Konva
node.js - Ember.js:将选项传递给node.js
我正在尝试将一些 LESS 代码(通过 ember-cli-less)构建到 CSS 文件中。 1) https://almsaeedstudio.com/ AdminLTE LESS 文件2) Bo
node.js - 尝试在 Express.js Node.js Passport.js 中查看所有登录用户
尝试查看 Express Passport 中所有登录用户的所有 session ，并希望能够查看当前登录的用户。最好和最快的方法是什么？我在想也许我可以在登录时执行此操作并将用户模型数据库“在线”
node.js - React.js 渲染完成后运行客户端 JS
我有一个 React 应用程序，但我需要在组件加载完成后运行一些客户端 js。一旦渲染函数完成并加载，运行与 DOM 交互的 js 的最佳方式是什么，例如 $('div').mixItUp() 。对
node.js - 使用 vue.js、node.js 和express.js 上传原始文件
请告诉我如何使用bodyparser.raw()将文件上传到express.js服务器客户端 // ... onFilePicked(file) { const url = 'upload/a
node.js - 由于 js 错误过多，Gulp.js 无法编译 angular.js 项目？
我正在尝试从 Grunt 迁移到 Gulp。这个项目在 Grunt 下运行得很好，所以我一定是在 Gulp 中做错了什么。除脚本外，所有其他任务均有效。我现在厌倦了添加和注释部分。我不断收到与意外
node.js - sails.js(使用 node.js 和 express.js)的标题或应用名称在哪里？
我正在尝试更改我的网站名称。找不到可以设置标题或应用程序名称的位置。最佳答案您可以在 config/ 目录中创建任何文件，例如 config/app.js 包含如下内容: module.expor
node.js - 将 ember.js 与 node.js + express.js 结合使用
经过多年的服务器端 PHP/MySQL 开发，我正在尝试探索用于构建现代 Web 应用程序的新技术。我正在尝试对所有 JavaScript 内容进行排序，如果我理解得很好，一个有效的解决方案可以是服
node.js - Node.js 中 app.js 和 index.js 的区别
我是 Nodejs 的新手。我在 route 目录中有一个 app.js 和一个 index.js。我有一个 app.use(multer....)。我还定义了 app.post('filter-re
javascript - AngularJS 种子 : putting JavaScript into separate files (app. js、controllers.js、directives.js、filters.js、services.js)
我正在使用 angular-seed用于构建我的应用程序的模板。最初，我将所有 JavaScript 代码放入一个文件 main.js。该文件包含我的模块声明、 Controller 、指令、过滤器和

首页

博学

6Ren·AI

商城

javascript - Node.js 进程在中间退出，没有错误(使用流)