- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我们有一个大约 6 GB 的大文件,它被解压缩到 64 GB 大小(OS 镜像),我们需要使用 http 下载它。我们正在使用 Node 的请求库或 axios。使用以下代码即时下载和解压(管道)文件:
const downloadUsingHttp = (downloadUrl, destinationPath) => {enter code here
return new Promise((resolve, reject) => {
const unpackedPathWriteStream = fs.createWriteStream(destinationPath);
let totalDownloadSize = 64023257088;
let downloadedSize = 0;
let lastProgressSent = 0;
axios({
method: 'get',
url: downloadUrl,
responseType: 'stream',
auth: {
username: 'user',
password: 'pass'
},
withCredentials: true
}).then(function (response) {
response.data
.on('data', chunk => {
if (totalDownloadSize === 0) {
return;
}
downloadedSize += chunk.length;
const progress = Math.floor((downloadedSize / totalDownloadSize) * 100);
if (progress % 5 !== 0) {
return;
}
if (lastProgressSent === progress) {
return;
}
lastProgressSent = progress;
console.log('Copy progress ', progress + ' %')
})
.pipe(zlib.createUnzip())
.pipe(unpackedPathWriteStream)
}).catch((err) => {
console.log(err.message)
});
unpackedPathWriteStream
.on('error', err => {
console.log(err);
reject(err);
}).on('end', () => {
resolve();
})
})
};
downloadUsingHttp(
'https://example.com/storage/file.raw.gz',
'/data/downloaded-and-unziped.raw'
);
我们运行此代码的机器有 2 GB 的 RAM。运行这段代码时,出现的问题是机器内存不足,进度大约为 15%, Node 应用程序崩溃。有时甚至整台机器都没有反应,需要重启。
所以看起来像back pressure handling在这种情况下,在流上实现的 .pipe() 槽不起作用。例如,当不通过 http(使用请求或 axios 库)下载文件时,而是使用可读和可写流进行下载时,使用管道方法进行复制和解压缩的相同操作是有效的,并且没有内存耗尽。
另外需要说明的是,这个问题只有在本地网络(本地开发环境)中进行http下载时才会出现。
如有任何帮助,我们将不胜感激。
更新
我们已经尝试将流的速度限制为 100 KB/s,并且它似乎在没有增加 RAM 内存使用量的情况下起作用。当更改为 1 MB/s 时,使用量会增加,最终会停止应用程序。我们使用 stream-throttle
库来尝试这个。
最佳答案
我对管道没有太多经验,但是如何分块加载文件并将它们一次一个地送入管道呢?然后加载下一个 block 。因此管道一次只需要处理几 MB 的数据。
我想象的是这样的:
const downloadUsingHttp = (downloadUrl, destinationPath, chunkSize = 10<<20) => {
const writeStream = fs.createWriteStream(destinationPath);
const unzip = zlib.createUnzip();
const auth = {
username: 'user',
password: 'pass'
};
const nextChunk = () => axios({
method: 'get',
url: downloadUrl,
responseType: 'stream',
auth: auth,
withCredentials: true,
headers: {
Range: `bytes=${offset}-${(offset += chunkSize)}`
}
}).then(downThePipe);
const downThePipe = response => {
console.log("progress %i%% ( %i / %i bytes )", offset / length * 100, offset, length);
response.data.pipe(unzip).pipe(writeStream);
return offset < length ? nextChunk() : null;
};
let offset = 0, length;
return axios({
method: "HEAD",
url: downloadUrl,
auth: auth,
withCredentials: true,
}).then(response => {
length = response.headers["Content-Length"];
return nextChunk();
});
};
downloadUsingHttp(
'https://example.com/storage/file.raw.gz',
'/data/downloaded-and-unziped.raw'
);
也许,如果下载仍然太快,您可能希望延迟加载 nextChunk()
直到 pipe()
工作完成。但同样,我使用这些管道已经有一段时间了。
关于javascript - 将 Node 请求或 axios 与流一起使用来下载和解压缩文件未按预期处理背压?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58101164/
我有点想做 the reverse of this. 我不想解压缩并将收集文件添加到 S3 应用户要求: 生成一堆xml文件 使用一些图像(托管在 s3 上的预先存在的图像)压缩 xml 文件 下载
将此添加到域的虚拟主机后 AddOutputFilterByType DEFLATE application/javascript text/javascript text/css 响应头不包含任何内
在 Apache Im 中,通过将以下内容添加到我的 .htaccess 文件来启用输出压缩: # compress text, html, javascript, css, xml: AddOutp
是否可以以压缩格式将请求数据从浏览器发送到服务器? 如果是,我们该怎么做? 最佳答案 压缩从浏览器发送到服务器的数据是不受 native 支持 在浏览器中。 您必须找到一种解决方法,使用客户端语言(可
我正在寻找可以压缩JavaScript源代码的工具。我发现一些网络工具只能删除空格字符?但也许存在更好的工具,可以压缩用户的函数名称、字段名称、删除未使用的字段等。 最佳答案 经常用来压缩JS代码的工
使用赛马博彩场景,假设我有许多单独的投注来预测比赛的前 4 名选手 (superfecta)。 赌注如下... 1/2/3/4 1/2/3/5 1/2/4/3 1/2/4/5 1/2/5/3
我是一名实习生,被要求对 SQL 2008 数据压缩进行一些研究。我们想将 Outlook 电子邮件的几个部分存储在一个表中。问题是我们想将整个电子邮件正文存储在一个字段中,然后又想压缩它。使用 Ch
我目前有一个系统,用户可以在其中上传 MP4 文件,并且可以在移动设备上下载该文件。但有时,这些视频的大小超过 5MB,在我国,大多数人使用 2G。因此,下载大型视频通常需要 15-20 分钟。 有什
假设我有一个带有类型列的简单文档表: Documents Id Type 1 A 2 A 3 B 4 C 5 C 6 A 7 A 8 A 9 B 10 C 用户
我有一个较大字符串中的(子)字符串位置的 data.frame。数据包含(子)字符串的开头及其长度。可以很容易地计算出(子)字符串的结束位置。 data1 start length end #>
我想知道是否 文件加密算法可以设计成它也可以执行文件压缩的事件(任何活生生的例子?)。 我也可以将它集成到移动短信服务中,我的意思是短信吗? 另外我想知道二进制文件...如果纯文本文件以二进制编码
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
我们有几个具有大量 JavaScript 的 Java 项目,目前我们使用的是旧版本的 YUICompressor (2.4.2)。然而,我在这篇博文中发现 YUICompressor 正在 depr
从之前关于尝试提高网站性能的文章中,我一直在研究 HTTP 压缩。我读过有关在 IIS 中设置它的信息,但它似乎是所有 IIS 应用程序池的全局事物,我可能不允许这样做,因为还有另一个站点在其上运行。
我有一个 REST 服务,它返回一大块 XML,大约值(value) 150k。 例如http://xmlservice.com/services/RestService.svc/GetLargeXM
我正在尝试获取一个简单的 UglifyJS (v2.3.6) 示例来处理压缩。 具体来说,“未使用”选项,如果从未使用过,变量和函数将被删除。 这是我在命令行上的尝试: echo "function
我正在开发一个项目,如果我的磁盘出现问题,我将在使用 ZLIB 压缩内存块后将其发送到另一个磁盘。然后我计划下载该转储并用于进一步调试。这种压缩和上传将一次完成一个 block - 比如说 1024
LZW 压缩算法在压缩后增加了位大小: 这是压缩函数的代码: // compression void compress(FILE *inputFile, FILE *outputFile) {
我的问题与如何在 3D 地形上存储大量信息有关。这些信息应该是 secret 的,因为它们非常庞大,也应该被压缩。我选择了文件存储,现在我想知道将对象数据加密/压缩(或压缩/加密)到文件的最佳做法。
我使用以下代码来压缩我的文件并且效果很好,但我只想压缩子文件夹而不是在压缩文件中显示树的根。 public boolean zipFileAtPath(String sourcePath, Strin
我是一名优秀的程序员,十分优秀!