- html - 我的下拉菜单的内容关闭得太快
- c# - 使用 Html Agility Pack 从网页中的表中获取值而不使用 "SelectNode'
- html - 内容容器下的 CSS 下拉菜单
- html - 如何停止嵌套列表重叠父列表?
程序正在从网络摄像机接收以字节为单位的图像数据,然后处理图像。程序第一次启动时使用470Mb RAM,每1秒增加到15Mb,一直持续到没有足够的空间而计算机挂起。
方法 getImage()
每 100 毫秒调用一次
我做了一些实验,将在这里分享。原始代码是这样的:(其中缓冲区只创建一次,之后就可以重复使用)
private static final int WIDTH = 640;
private static final int HEIGHT = 480;
private byte[] sJpegPicBuffer = new byte[WIDTH * HEIGHT];
private Mat readImage() throws Exception {
boolean isGetSuccess = camera.getImage(lUserID, sJpegPicBuffer, WIDTH * HEIGHT);
if (isGetSuccess) {
return Imgcodecs.imdecode(new MatOfByte(sJpegPicBuffer), Imgcodecs.CV_LOAD_IMAGE_UNCHANGED);
}
return null;
}
在上面的代码中,RAM 上升到计算机挂起(99% 10Gb)。然后我像这样更改了代码:(在每个循环中它将创建一个新的缓冲区)
private static final int WIDTH = 640;
private static final int HEIGHT = 480;
private Mat readImage() throws Exception {
byte[] sJpegPicBuffer = new byte[WIDTH * HEIGHT];
boolean isGetSuccess = camera.getImage(lUserID, sJpegPicBuffer, WIDTH * HEIGHT);
if (isGetSuccess) {
return Imgcodecs.imdecode(new MatOfByte(sJpegPicBuffer), Imgcodecs.CV_LOAD_IMAGE_UNCHANGED);
}
return null;
}
在上面的代码中,RAM 上升到大约 43% (5Gb),然后释放。
现在的问题是,第一段代码似乎得到了优化,可以重用缓冲区,避免在每次调用中创建新的内存空间,但结果不是我们想要的。 为什么?
在第二个代码块中,代码似乎没有第一个代码块那么优化,但比第一个代码块运行得更好。
但总的来说,为什么在第一种情况下 RAM 增加到 10Gb,在第二种情况下增加到 5Gb。我们如何控制这种情况?
最佳答案
这只是一个猜测,尽管我在现实生活中见过几次类似的场景。
您的 Java 代码正在与 native 相机 SDK (dll) 交互。 native 代码就像在非 JVM 内存中分配缓冲区并使用一些内部 Java 对象来访问该缓冲区。常见(非常糟糕)的做法是,如果不再使用 native 缓冲区,则依赖 Java 对象终结器释放 native 缓冲区。
终结器依赖垃圾收集器来触发它们,这就是模式经常失败的原因。虽然终结器保证最终会运行,但实际上只要 Java 堆中有足够的空间并且 native 内存不会及时释放,这种情况就不会发生。
Java 堆大小有硬性限制,但只要操作系统允许增长,C/C++ 使用的 native 内存池就可以增长。
关于您的问题
我假设在你的第一个代码片段中,Java 堆流量很低。 GC 处于空闲状态,并且没有执行终结器,因此 Java 堆外部分配的内存不断增长。
在第二个片段中,您正在对 Java 堆施加压力,迫使 GC 频繁运行。作为 GC 终结器的副作用,执行并释放 native 内存。
您的相机 SDK 可以依赖 Java 直接内存缓冲区(这些内存是 C 代码直接访问的,因此可以方便地通过 JVM 边界传递数据),而不是在 native 代码中分配终结器和缓冲区。尽管效果大致相同,因为 Java 直接缓冲区实现使用相同的模式(使用幻像引用而不是终结器)。
建议
-XX:+PrintGCDetails
和-XX:+PrintReferenceGC
options 将打印有关引用处理的信息,以便您可以验证是否确实使用了终结器/虚拟引用。-XX:MaxDirectMemorySize=X
如果您的相机的 SDK 依赖于它们,则可用于限制直接缓冲区的使用。虽然它不是一个解决方案,但它是一个安全网,可以让您的应用程序在操作系统内存耗尽之前 OOMSystem.gc()
)。这是另一个糟糕的选择,因为 System.gc()
的行为依赖于 JVM。附注
This is my post关于使用终结器和幻像引用进行资源管理。
关于java - 运行此 Java 程序时 RAM 迅速增加,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45026460/
如果我们想访问数组的元素 i,我们会这样做:i *(每个元素的大小)+ 数组的起始地址 = 我们需要访问的元素的内存位置。然后 CPU 直接访问 RAM 中的该位置。这是怎么发生的? 假设我要定位的内
考虑以下 python 代码 with open(sys.argv[2], 'r') as fin, \ open(sys.argv[3], 'w') as fout:
基本上我在 Centos 6.2 16GB 系统上运行我的世界服务器 我通过 rtoolkit 引导来启动我的服务器,现在我分配它使用 12GB,但它使用的 muc 比这多,我不知道为什么。我运行此命
我正在开发一个小型 x86 内核。我正在访问并尝试读取 GRUB 在多重引导 header 中提供的内存映射。我有一个 Intel i3 cpu 和 4 GiB 的 RAM。在这台机器上运行时,我正在
我有 3 GB 内存。有没有办法只为 C++ 应用程序分配 512MB 的 RAM? 否则 有没有办法暂时将我的 RAM 减少到 512MB 以进行测试? 谢谢,阿肖克 最佳答案 使用SetProce
我的一个 friend 告诉我,在 x86 架构上,DMA Controller 无法在两个不同的 RAM 位置之间传输。它只能在RAM和外设(如PCI总线)之间传输。 这是真的吗? 因为 AFAIK
做一些分析(内存和速度) 我一直被 win7 似乎分配的 RAM 正好是我要求的两倍这一事实所困扰...注意这是我第一次在 win7 上进行这样的主动分析,所以我真的不知道会发生什么。 我在 win7
我经常玩 retrofit 版的 Minecraft。这样做的一个缺点是,每当我启动 Minecraft 时,编译所有模组都需要花费大量时间。这可能需要大约 15 分钟左右的时间,在我看来,这太长了。
我想编写一个内核模块,可以通过 DMA 将数据从 RAM 传输到 RAM。有一些帖子讨论这个,但我真的不明白。有人说可能,也有人说不可能。 如果我对 ldd3 的理解是正确的,RAM 到 RAM 的复
我正在寻找一种方法来查找总内存和正在使用的内存的单个熟值输出。 gwmi Win32_OperatingSystem | select TotalVisibleMemorySize, FreePhys
我在 Heroku 上有一个网络应用程序,我试图了解添加具有 1GB RAM 的 Memcached 实例与向我的 Postgres 服务器添加 1GB RAM 之间的区别/权衡。 如果我添加一个 M
在我的例子中,我有一个包含大约 6000 个实例化类的字典,其中每个类都有 1000 个属性变量,所有类型都是字符串或字符串列表。当我建立这本字典时,我的 RAM 变得非常高。有没有一种方法可以在将字
我的问题是:如果您用完了所有可用的视频内存,并尝试创建新纹理 (SDL),是否会自动使用普通内存而不是视频内存?或者,您是否必须尝试使用使用普通 ram 的表面 (SDL)?如果您出于任何原因无法
我在从 ram 地址获取值时遇到问题。 我有一些限制,即它必须是 C 代码,并且存储信息的地址由 u32 值给出,例如 0x001c0080。 环境是ARM的,我用的是eclipse sdk。我怎样才
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a software
我正在尝试使用 GCC 编译器(标准 C)编译裸机应用程序。我使用 Cyclone V SoC 和 Cortex-A9 处理器。 eclipse DS-5。我收到这些错误 - “Region ram
如果 RAM 不是问题(我的服务器上有接近 200GB),是逐行读取更快还是将所有内容读入 RAM 并访问它?每行将是大约 200-500 个 unicode 字符的字符串。每个文件有近 200 万行
我在我的两台机器上运行以下命令: import os, sqlite3 import pandas as pd from feat_transform import filter_anevexp db
我正在尝试在我的一个项目中引入一些 CUDA 优化。但我认为我在这里做错了什么。我想实现一个简单的矩阵 vector 乘法 (result = matrix * vector)。但是当我想将结果复制回
#include #include #include #include #include #include using namespace std; char randomLetter()
我是一名优秀的程序员,十分优秀!