node.js - 在nodejs中分割和重建文件会改变某些格式的长度-6ren

node.js - 在nodejs中分割和重建文件会改变某些格式的长度

转载作者：太空宇宙更新时间：2023-11-03 23:57:28

24

4

我正在编写一个脚本来将文件分割成 block 并从 block 中重建这些文件。

这适用于 .txt 文件和 .js 文件

但是，当我尝试使用更“复杂”的文件(例如图像 .png、.pdf 或 .docx)的脚本时，该文件未正确重建。

例如，对于原始 2 057 字节 长的图像，我检索到一个 3 387 字节 长的文件，该文件无法被任何东西读取。

我不知道如何调试这个。因此，我希望有人指出我的工作出了什么问题，或者如何发现我的工作有问题。

这是到目前为止我的脚本:

const fs = require('fs');
const fileName = "sample.png";
var fileBuffer = fs.readFileSync(fileName);
var bufferLength = fileBuffer.length;
var chunkSize = 10;
var chunkQtt = bufferLength / chunkSize;
var result = splitBuffer(fileBuffer, chunkSize);

result.forEach(writeFileFromBuf);
var resFromChunk = [];

for (let i = 0; i < result.length; i++) {
    resFromChunk.push(fs.readFileSync('./chunks/fileChunk' + i));
}


fs.createWriteStream("rebuilt_" + fileName).write(Buffer.concat(resFromChunk).toString());

console.log("quantity of chunks: " + chunkQtt);
console.log("buffer length " + bufferLength);
console.log("chunks size " + chunkSize);

function splitBuffer(buffer, csize) {
    let pointer = 0;
    var result = [];
    var currentSize = 0;

    for (let i = 0; i < chunkQtt; i++) {
        result[i] = buffer.slice(pointer, pointer + csize);
        console.log("length " + result[i].length + " data: " + result[i].toString());
        currentSize += result[i].length;
        pointer += csize;
    }
    console.log("retrieved size " + currentSize)
    return result
}

function writeFileFromBuf(element, index, array) {
    var fileName = "./chunks/fileChunk" + index;
    fs.writeFileSync(fileName, element);
}

最佳答案

一切都很好，直到您尝试将所有读入 block 粘合在一起并将结果写入重新组装的文件“rebuilt_sample.png”。在此之前的所有步骤(读取原始文件，将其分解为 block ，将 block 写入单个文件，读回 block 文件)将文件数据处理为包含尚未以任何方式检查或解释的字节的缓冲区。

但随后发生了这种情况:

fs.createWriteStream("rebuilt_" + fileName).write(Buffer.concat(resFromChunk).toString());

在该语句中，toString() 调用导致连接缓冲区中的字节被解释(或“解码”)为字符，然后在 write() 操作期间，这些字符被转换(或“编码”)回字节流，然后写入文件。解码和编码事件是根据程序区域设置的规则执行的，该区域设置可能是 UTF-8 区域设置。 UTF-8 是一种将 Unicode 字符与字节序列相互转换的方法。

如果缓冲区中的字节都可以按照 UTF-8 规则成功解码为字符，那就没问题了。当输入文件是文本文件(例如 .txt 或 .js 文件)时，很可能会出现这种情况。但是，当文件是非文本文件(通常称为“二进制”文件)时，文件中的某些字节序列可能不是合法的 UTF-8 字节序列，因此这些字节将无法转换为字符。几乎所有值大于十进制 127、十六进制 0x7F 的字节都会发生这种情况。您的 sample.png 是这些二进制文件之一，其中包含一些无法转换为字符的字节。

程序可以通过多种方式对不可翻译的字节使用react。例如，它可能会崩溃，它可能会默默地跳过这些字节，它可能会跳过它们并发出错误报告，它可能会在看到坏字节后停止翻译，它可能会产生一个完全空的字符串。在这种情况下，Node 会默默地将每个非法字节转换为生成字符串中的 Unicode 替换字符“�”。然后，当在 write() 操作期间将该字符串编码回字节时，每个替换字符都会根据 UTF-8 规则进行转换，并成为重建文件中的三字节序列 0xEF 0xBF 0xFD。

这就是为什么重建的文件比原始文件大的原因。原始文件中值大于 0x7F 的几乎每个字节都被重建文件中的三个字节替换。

解决这个问题很简单。只需摆脱该行中的 .toString() 调用，让您的程序将连接的缓冲区视为未解释的字节集合:

fs.createWriteStream("rebuilt_" + fileName).write(Buffer.concat(resFromChunk))

关于node.js - 在nodejs中分割和重建文件会改变某些格式的长度，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56428727/

24

4

0

文章推荐： c - 如何检测机器上是否存在互联网连接？

文章推荐： javascript - 在子元素上应用悬停效果

文章推荐： c - 初始化窗口代码 Mac OS X

文章推荐： html - 当按钮直接放置在文本区域下方时会创建额外的空间

node.js - backbone.js + node.js - express.js
我正在学习构建单页应用程序 (SPA) 所需的所有技术。总而言之，我想将我的应用程序实现为单独的层，其中前端仅使用 API Web 服务(json 通过 socket.io)与后端通信。前端基本上是
node.js - Sequelize js/express js/node js 如何更改日期格式
当我看到存储在我的数据库中的日期时。这是正常。日期和时间就是这样。但是当我运行 get 请求来获取数据时。此格式与存储在数据库中的格式不同。为什么会发生这种情况？最佳答案我认为您可以将
history.js - Sammy.js/History.js/Nav.js 之间的比较
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
backbone.js - Mustache.js/Hogan.js 和 Backbone.js
我正在尝试使用backbone.js 实现一些代码和 hogan.js (http://twitter.github.com/hogan.js/) Hogan.js was developed ag
node.js - Backbone.js Node.js Express.js 中的用户功能
我正在使用 Backbone.js、Node.js 和 Express.js 制作一个 Web 应用程序，并且想要添加用户功能(登录、注销、配置文件、显示内容与该用户相关)。我打算使用 Passpor
node.js - Angular.js/D3.js/Node.js 之间有什么区别和相似之处
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
node.js - d3.js、queue.js 和 node.js
我尝试在 NodeJS 中加载数据，然后将其传递给 ExpressJS 以在浏览器中呈现 d3 图表。我知道我可以通过这种方式加载数据 - https://github.com/mbostock/q
node.js - node.js 中 app.js、index.js 和 server.js 的约定？
在 node.js 中，我似乎遇到了相同的 3 个文件名来描述应用程序的主要入口点: 使用 express-generator 包时，会创建一个 app.js 文件作为生成应用的主要入口点。通过 n
backbone.js - amplify.js 和backbone.js
最近，我有机会观看了 john papa 关于构建单页应用程序的精彩类(class)。我会喜欢的。它涉及服务器端和客户端应用程序的方方面面。我更喜欢客户端。在他的实现过程中，papa先生在客户端有类
backbone.js - Mustache.js、Handlebars.js 和 Underscore.js 有什么区别？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
d3.js - Pixi.js vs Konva.js vs D3.js
我是一个图形新手，需要帮助了解各种 javascript 2D 库的功能。 . . 我从 Pixi.js 中得到了什么，而我没有从 Konva 等基于 Canvas 的库中得到什么？我从 Konva
node.js - Ember.js:将选项传递给node.js
我正在尝试将一些 LESS 代码(通过 ember-cli-less)构建到 CSS 文件中。 1) https://almsaeedstudio.com/ AdminLTE LESS 文件2) Bo
node.js - 尝试在 Express.js Node.js Passport.js 中查看所有登录用户
尝试查看 Express Passport 中所有登录用户的所有 session ，并希望能够查看当前登录的用户。最好和最快的方法是什么？我在想也许我可以在登录时执行此操作并将用户模型数据库“在线”
node.js - React.js 渲染完成后运行客户端 JS
我有一个 React 应用程序，但我需要在组件加载完成后运行一些客户端 js。一旦渲染函数完成并加载，运行与 DOM 交互的 js 的最佳方式是什么，例如 $('div').mixItUp() 。对
node.js - 使用 vue.js、node.js 和express.js 上传原始文件
请告诉我如何使用bodyparser.raw()将文件上传到express.js服务器客户端 // ... onFilePicked(file) { const url = 'upload/a
node.js - 由于 js 错误过多，Gulp.js 无法编译 angular.js 项目？
我正在尝试从 Grunt 迁移到 Gulp。这个项目在 Grunt 下运行得很好，所以我一定是在 Gulp 中做错了什么。除脚本外，所有其他任务均有效。我现在厌倦了添加和注释部分。我不断收到与意外
node.js - sails.js(使用 node.js 和 express.js)的标题或应用名称在哪里？
我正在尝试更改我的网站名称。找不到可以设置标题或应用程序名称的位置。最佳答案您可以在 config/ 目录中创建任何文件，例如 config/app.js 包含如下内容: module.expor
node.js - 将 ember.js 与 node.js + express.js 结合使用
经过多年的服务器端 PHP/MySQL 开发，我正在尝试探索用于构建现代 Web 应用程序的新技术。我正在尝试对所有 JavaScript 内容进行排序，如果我理解得很好，一个有效的解决方案可以是服
node.js - Node.js 中 app.js 和 index.js 的区别
我是 Nodejs 的新手。我在 route 目录中有一个 app.js 和一个 index.js。我有一个 app.use(multer....)。我还定义了 app.post('filter-re
javascript - AngularJS 种子 : putting JavaScript into separate files (app. js、controllers.js、directives.js、filters.js、services.js)
我正在使用 angular-seed用于构建我的应用程序的模板。最初，我将所有 JavaScript 代码放入一个文件 main.js。该文件包含我的模块声明、 Controller 、指令、过滤器和

首页

博学

6Ren·AI

商城

node.js - 在nodejs中分割和重建文件会改变某些格式的长度