javascript - 为什么在这种情况下 v8 会耗尽内存？-6ren

javascript - 为什么在这种情况下 v8 会耗尽内存？

转载作者：数据小太阳更新时间：2023-10-29 05:29:12

26

4

根据 node.js 文档，一个 Node 在 32 位版本上有 512meg 的限制，在 64 位版本上有 1.4gig 的限制。 Chrome AFAICT 的限制类似。 (+/- 25%)

那么，为什么这段代码从不使用超过 ~424meg 的内存却会耗尽内存？

这是代码(代码是废话。这个问题不是关于代码在做什么，而是关于代码为什么失败)。

var lookup = 'superCaliFragilisticExpialidosiousThispartdoesnotrealllymattersd';
function encode (num) {
  return lookup[num];
}

function makeString(uint8) {
  var output = '';

  for (var i = 0, length = uint8.length; i < length; i += 3) {
    var temp = (uint8[i] << 16) + (uint8[i + 1] << 8) + (uint8[i + 2]);
    output += encode(temp >> 18 & 0x3F) + encode(temp >> 12 & 0x3F) + encode(temp >> 6 & 0x3F) + encode(temp & 0x3F);
  }

  return output;
}

function test() {
  var big = new Uint8Array(64 * 1024 * 1024 + 2); // multiple of 3
  var str = makeString(big);
  console.log("big:", big.length);
  console.log("str:", str.length);
}

test();

如您所见，makeString 通过一次附加 4 个字符来构建一个字符串。在这种情况下，它将构建一个长度为 89478988 (180meg) 的大字符串。由于 output 被追加，最后一次追加字符时，内存中将有 2 个字符串。旧的有 89478984 个字符，最后一个有 89478988 个字符。GC 应该收集任何其他使用的内存。

因此，64meg(原始数组)+ 180meg * 2 = 424meg。远低于 v8 限制。

但是，如果您运行示例，它将因内存不足而失败

<--- Last few GCs --->

    3992 ms: Scavenge 1397.9 (1458.1) -> 1397.9 (1458.1) MB, 0.2 / 0 ms (+ 1.5 ms in 1 steps since last GC) [allocation failure] [incremental marking delaying mark-sweep].
    4450 ms: Mark-sweep 1397.9 (1458.1) -> 1397.9 (1458.1) MB, 458.0 / 0 ms (+ 2.9 ms in 2 steps since start of marking, biggest step 1.5 ms) [last resort gc].
    4909 ms: Mark-sweep 1397.9 (1458.1) -> 1397.9 (1458.1) MB, 458.7 / 0 ms [last resort gc].

$ node foo.js    
<--- JS stacktrace --->

==== JS stack trace =========================================

Security context: 0x3a8521e3ac1 <JS Object>
    2: makeString(aka makeString) [/Users/gregg/src/foo.js:~6] [pc=0x1f83baf53a3b] (this=0x3a852104189 <undefined>,uint8=0x2ce813b51709 <an Uint8Array with map 0x32f492c0a039>)
    3: test(aka test) [/Users/gregg/src/foo.js:19] [pc=0x1f83baf4df7a] (this=0x3a852104189 <undefined>)
    4: /* anonymous */ [/Users/gregg/src/foo.js:24] [pc=0x1f83baf4d9e5] (this=0x2ce813b...

FATAL ERROR: CALL_AND_RETRY_LAST Allocation failed - process out of memory
Abort trap: 6

Node 4.2.4和5.6.0都试过了

那么，问题是为什么内存不足？

一些我尝试过的东西。

我尝试加入 block
我没有无限期地附加到 output，而是尝试检查它是否大于某个大小(如 8k)。如果是这样，我把它放在一个数组中，然后将输出重置为空字符串。
通过执行此操作，输出 永远不会超过 8k。该阵列持有180meg + 簿记。所以 180meg + 8k 比 180meg + 小很多180兆。它仍然耗尽内存。现在，在那个过程的最后，我加入数组，此时它实际上会使用更多内存(180meg + 180meg + 簿记)。但是，v8 在到达之前就崩溃了行。
我尝试将编码更改为
```
function encode(num) {
  return 'X';
}
```
在这种情况下，它实际上运行到完成!所以我想，“啊哈!该问题必须与 lookup[num] 生成相关每次调用一个新字符串？所以我尝试了...

将 lookup 更改为字符串数组

var lookup = Array.prototype.map.call(
    'superCaliFragilisticExpialidosiousThispartdoesnotrealllymattersd', 
    function(c) {
      return c;
    });

内存不足

这似乎是 v8 中的错误？由于此代码，它无法以某种奇怪的方式对未使用的字符串进行 GC，尽管 #2 与 #3 很奇怪，因为它们在内存使用方面看起来是等效的。

为什么 v8 在这些情况下会耗尽内存？ (是否有解决方法)

最佳答案

TL;DR:您的示例是 v8 内部字符串表示之一的病态案例。您可以通过偶尔索引到 output 来修复它(有关原因的信息如下)。

首先，我们可以使用heapdump查看垃圾收集器在做什么:

上面的快照是在 Node 内存不足之前不久拍摄的。如您所见，大多数事情看起来都很正常:我们看到两个字符串(非常大的 output 和要添加的小块)，三个对同一数组 big 的引用(大约 64MB，与我们的预期相似)，以及许多看起来并不异常的小项目。

但是，有一件事很突出:output 是一个惊人的 1.4+ GB。在拍摄快照时，它大约有 8000 万个字符长，因此假设每个字符 2 个字节，大约 160 MB。这怎么可能？

也许这与 v8 的内部字符串表示有关。引用 mraleph :

There are two types [of v8 strings] (actually more, but for the problem at hand only these two are important):

flat strings are immutable arrays of characters

cons strings are pairs of strings, result of concatenation.

If you concat a and b you get a cons-string (a, b) that represents result of concatenation. If you later concat d to that you get another cons-string ((a, b), d).

Indexing into such a "tree-like" string is not O(1) so to make it faster V8 flattens the string when you index: copies all characters into a flat string.

那么 v8 是否可以将 output 表示为一棵巨树？一种检查方法是强制 v8 压平字符串(如上面 mraleph 所建议的)，例如通过在 for 循环内定期索引到 output:

if (i % 10000000 === 0) {
  // We don't do it at each iteration since it's relatively expensive.
  output[0];
}

果然，程序成功运行了!

仍然存在一个问题:为什么上面的版本 2 可以运行？在那种情况下，v8 似乎能够优化大多数字符串连接(所有右侧的连接，它们都转换为 4 元素数组上的按位运算)。

关于javascript - 为什么在这种情况下 v8 会耗尽内存？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35354801/

26

4

0

文章推荐： javascript - 如何在浏览器中使用 npm 安装的 cesium

文章推荐： javascript - Gulp-inject 说 "Nothing to inject into index.html"

文章推荐： ios - WKWebView 没有加载 url

Azure SNAT 耗尽 - 我如何知道它何时发生？
我们认为 Cloud Foundry 中的一组虚拟机存在 Azure SNAT 耗尽问题。这些机器不经过负载平衡器。我已经浏览过这份文件: https://learn.microsoft.com/e
java - GLES2 TouchEventPool 耗尽
我正在使用 onSceneTouchEvent 在 TMX map 上移动玩家: @Override public Scene onCreateScene() { ...
Python 子进程引用导致 fd 耗尽
关于这篇文章:Python del Statement , 我最近遇到了以下片段: # custom_process.py import threading import subprocess myL
python - 保留文件描述符以防止 FD 耗尽
我有一个具有多个线程的 python 应用程序，其中线程 2 到 n 可能会打开任意数量的文件。我想确保当线程 1 尝试打开文件时，它绝对不会因为文件描述符耗尽而失败。简而言之，我想保留文件描述符而不
c# 多线程应用程序中的 TCP 耗尽
我开发了一个 c# .net 4 应用程序，它每天对组织中的每台计算机(超过 70,000 台)执行 WMI 查询。由于与此线程无关的原因，我无法从服务器运行该应用程序，而是从我的 Windows X
python - pytorch 耗尽 GPU 内存
我正在尝试在 pytorch 中实现 Yolo-v2。但是，我似乎只是通过网络传递数据而耗尽了内存。该模型很大，如下所示。但是，我觉得我在用我的网络做一些愚蠢的事情(比如不在某处释放内存)。网络在 c
android - 如何在 Android 中进行应用程序明智的电池使用/耗尽
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 9 年前。 Improve this qu
Python Postgres psycopg2 ThreadedConnectionPool 耗尽
我在这里查看了几个与“太多客户”相关的主题，但仍然无法解决我的问题，所以我必须针对我的具体情况再次询问。基本上，我设置了本地 Postgres 服务器并需要进行数万次查询，所以我使用了 Python
c++ - 耗尽 std::random_device 的熵
我正在使用 std::random_device 并想检查它的剩余熵。根据 cppreference.com: std::random_device::entropy double entropy()
macos - docker 卷上的 inode 耗尽
我有以下 docker-compos.yml 文件: web: build: . ports: - "4200:4200" - "35729:35729" vo
linux - Linux 中的进程 ID 耗尽
如果 Linux 操作系统用完进程 ID 会怎样？是否会删除较旧的进程以释放空间以适应 future 的请求？最佳答案我假设您问的是达到进程限制时会发生什么。在这种情况下，系统不允许创建新进程，直
azure-sql-database - 创建新索引时防止 DTU 耗尽
我们将 Azure SQL 用作单个数据库并在 DTU 定价模型下使用。我们有一个包含约 50M 条记录的表，我们想在单个字符串属性上添加一个新的非聚集索引。问题是这是一个生产数据库。如果我使用简单
c# - Azure 服务总线监听器打开太多 TCP 连接(耗尽)
我们有多个服务总线监听器在应用服务内作为连续的 Azure Webjobs 运行。总共有 12 个监听器 Web 作业在同一个 S1 应用服务计划上运行。环境很小，每天总共大约有~1000-10000
Azure WebApp SNAT 耗尽 - 私有(private)终结点能否改进
Der Azure 网络专家，我们的 Web 应用程序经常耗尽出站 TCP 连接。大多数出站连接实际上是 Azure 内部连接(SQL、BlobStore、后端服务)。但我们还没有虚拟网络和专用端点
c++ - 为什么需要 sleep(1) 来让 socket 耗尽？
我下载了一个简单的静态网络服务器的源代码 http://www.ibm.com/developerworks/systems/library/es-nweb/sidefile1.html 但是，我对第
ruby-on-rails - Rails Puma 耗尽 Redis 连接
我已经查看了有关 SO 的其他类似问题，但无法很好地将所有内容拼凑在一起。我有一个 Rails 应用程序(在 Heroku 上)，它使用具有多进程和多线程的 Puma。我的应用程序还使用 Redis
go - 为什么 request.ParseForm() 耗尽 request.Body？
在此代码中，如果我对 ParseForm() 调用进行注释，请求将按预期工作 package main import ( "fmt" "net/http" "net/url"
PHPExcel 耗尽 256、512 和 1024MB RAM
我不明白。 XSLX 表大约有 3MB 大，但即使是 1024MB 的 RAM 也不足以让 PHPExcel 将其加载到内存中吗？我这里可能做错了什么: function ReadXlsxTable
spring-integration - 使用 WebSphere MQ 耗尽 JMS 连接
我已配置 CachingConnectionFactory包装了一个 MQTopicConnectionFactory和 MQQueueConnectionFactory每个缓存大小设置为 10。这
php - 为什么 PHP Allowed memory size of 134217728 bytes 耗尽？
我正在检查 CodeEval 中的一些问题并在 PHP 中遇到这个奇怪的错误。我没有用其他语言遇到过这样的事情，所以我不知道为什么会发生这种情况。不包括整个答案(请不要帮我找到解决方案，除了 PHP

首页

博学

6Ren·AI

商城

javascript - 为什么在这种情况下 v8 会耗尽内存？