- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我正在尝试使用 Scipy 径向基函数 (Rbf) 插入一个表示 2D 表面的不太大(约 10.000 个样本)的点云。我得到了一些不错的结果,但是对于我最后的数据集,我一直得到 MemoryError
,即使错误在执行过程中几乎立即出现(RAM 显然没有被吃掉)。
我决定从 Scipy 破解 rbf.py
文件的副本,首先在其中填充一些非常有用的打印语句。通过逐行分解 _euclidean_norm
方法,如下所示:
def _euclidean_norm(self, x1, x2):
d = x1 - x2
s = d**2
su = s.sum(axis=0)
sq = sqrt(su)
return sq
我在第一行得到错误:
File "C:\MyRBF.py", line 68, in _euclidean_norm
d = x1 - x2
MemoryError
该范数在数组 X1 上调用,格式为 [[x1, y1], [x2, y2], [x3, y3], ..., [xn, yn]] 和 X2,即 X1由 Rbf
类中的以下方法转置,已被我出于调试目的破解:
def _call_norm(self, x1, x2):
print x1.shape
print x2.shape
print
if len(x1.shape) == 1:
x1 = x1[newaxis, :]
if len(x2.shape) == 1:
x2 = x2[newaxis, :]
x1 = x1[..., :, newaxis]
x2 = x2[..., newaxis, :]
print x1.shape
print x2.shape
print
return self._euclidean_norm(x1, x2)
请注意我打印了输入的形状。使用我当前的数据集,这就是我得到的(我手动添加了评论):
(2, 10744) ## Input array of 10744 x,y pairs
(2, 10744) ## The same array, which is to be "reshaped/transposed"
(2, 10744, 1) ## The first "reshaped/transposed" form of the array
(2, 1, 10744) ## The second "reshaped/transposed" form of the array
根据文档,基本原理是获得“从 x1 中的每个点到 x2 中的每个点的距离矩阵”,这意味着,由于数组是相同的,因此每对之间的距离矩阵入口数组(包含 X 和 Y 维度)。
我用小得多的数组(例如形状 (2,5,1) 和 (2,1,5))手动测试了操作,并且减法有效。
我怎样才能找出为什么它不适用于我的数据集?还有其他明显的错误吗?我应该检查我的数据集的某种形式的病态,还是对其进行一些预处理?我认为它的条件很好,因为我可以在 3D 中绘制它,并且浊点在视觉上形成得非常好。
非常感谢任何帮助。
感谢阅读。
最佳答案
您的数据集应该没问题:出现错误是因为您没有足够的 RAM 来存储减法结果。
根据广播规则,结果会有形状
(2, 10744, 1)
-(2, 1, 10744)
------------------
(2, 10744, 10744)
假设这些是 dtype float64 的数组,您需要 2*10744**2*8 = 1.72 GiB 的可用内存。如果没有足够的可用内存,numpy 将无法分配输出数组,并会立即失败并显示您看到的错误。
关于Scipy径向基函数(scipy.interpolate.rbf)中的Python MemoryError,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11865378/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!