- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我需要使用半径为 17 或更大的 3D 结构元素来计算形状为 (400,401,401)、大小为 64320400 字节的 3D 数组的形态学开度。结构元素ndarray的大小为
42875 字节。使用 scipy.ndimage.morphology.binary_opening
,整个过程消耗8GB RAM。
我已阅读 scipy/ndimage/morphology.py
在 GitHub 上,据我所知,形态侵 eclipse 算子是用纯 C 语言实现的。我很难理解 ni_morphology.c
源,所以我没有发现这段代码的任何部分会导致如此巨大的内存利用率。添加更多 RAM 不是一个可行的解决方案,因为内存使用可能会随着结构元素半径呈指数增长。
要重现问题:
import numpy as np
from scipy import ndimage
arr_3D = np.ones((400,401,401),dtype="bool")
str_3D = ndimage.morphology.generate_binary_structure(3,1)
big_str_3D = ndimage.morphology.iterate_structure(str_3D,20)
arr_out_3D = ndimage.morphology.binary_opening(arr_3D, big_str_3D)
最佳答案
我也做粒度增加半径的开口,我遇到了同样的问题。事实上,内存使用量大约增加了 R^6,其中 R 是球形内核的半径。这是一个相当大的增长率!我做了一些内存分析,包括将开孔拆分为腐 eclipse ,然后是膨胀(开孔的定义),发现大量内存使用来自 SciPy 的二进制文件,并在结果返回到调用 Python 脚本后立即清除. SciPy 的形态代码大部分是用 C 实现的,因此修改它们是一个困难的前景。
无论如何,OP 的最后一条评论是:“经过一些研究,我转向使用卷积的 Opening 实现 -> 傅立叶变换的乘法 - O(n log n),并且没有那么大的内存开销。”帮我找出解决方案,所以谢谢你。然而,实现起初并不明显。对于遇到此问题的任何其他人,我将在此处发布实现。
我将开始谈论膨胀,因为二值腐 eclipse 只是二值图像的补码(逆)的膨胀,然后将结果反转。
简而言之:根据this white paper by Kosheleva et al ,膨胀可以被视为数据集 A 与结构元素(球核)B 的卷积,阈值高于某个值。卷积也可以在频率空间中完成(通常快得多),因为频率空间中的乘法与实际空间中的卷积相同。因此,通过首先对 A 和 B 进行傅立叶变换,将它们相乘,然后对结果进行逆变换,然后对大于 0.5 的值进行阈值处理,就可以得到 A 与 B 的膨胀。(请注意,我链接的白皮书说阈值高于 0,但大量测试表明,这给出了许多工件的错误结果;another white paper by Kukal et al . 将阈值设为 >0.5,这对我来说给出了与 scipy.ndimage.binary_dilation 相同的结果。我不知道为什么差异,我想知道我是否错过了引用文献 1 命名法的一些细节)
正确的实现涉及填充大小,但对我们来说幸运的是,它已经在 scipy.signal.fftconvolve(A,B,'same')
中完成了。 - 此函数执行我刚刚描述的操作并为您处理填充。将第三个选项设为“相同”将返回与 A 大小相同的结果,这正是我们想要的(否则它将被 B 的大小填充)。
所以膨胀是:
from scipy.signal import fftconvolve
def dilate(A,B):
return fftconvolve(A,B,'same')>0.5
from scipy.signal import fftconvolve
import numpy as np
def erode_v1(A,B,R):
#R should be the radius of the spherical kernel, i.e. half the width of B
A_inv = np.logical_not(A)
A_inv = np.pad(A_inv, R, 'constant', constant_values=1)
tmp = fftconvolve(A_inv, B, 'same') > 0.5
#now we must un-pad the result, and invert it again
return np.logical_not(tmp[R:-R, R:-R, R:-R])
from scipy.signal import fftconvolve
import numpy as np
def erode_v2(A,B):
thresh = np.count_nonzero(B)-0.5
return fftconvolve(A,B,'same') > thresh
关于python - Scipy ndimage 形态学运算符使我的计算机内存 RAM (8GB) 饱和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25034259/
我是一名优秀的程序员,十分优秀!