- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我的程序中有一个计算相关系数的函数。它采用两个平面(一维)numpy 数组并对它们执行必要的计算以计算出两个数字列表(它们是货币,类型为 float)之间的相关性。只要程序运行,此函数每个循环执行 136 次,每个循环大约需要 0.05 秒。以下代码按预期计算系数:
def CC(a, b):
a = a - np.mean(a)
b = b - np.mean(b)
ab = np.sum(a*b)
asq = np.sum(a**2)
bsq = np.sum(b**2)
cc = round(ab / sqrt(asq * bsq), 5)
return cc
然而,它最终会导致内存泄漏。解决此内存泄漏的方法是将函数更改为:
def CC(a, b):
cc = round(np.sum((a - np.mean(a)) * (b - np.mean(b))) / sqrt(np.sum(a**2) * np.sum(b**2)), 5)
return cc
它在一行中完成所有工作并且不会创建任何新列表,因此可以节省内存并避免泄漏。
但是,由于某些奇怪的原因,当使用方法 2 时,返回值从 0.1 ish 开始,然后在大约 20 秒的过程中下降到 0,然后从那时起保持在 0。每次都会发生这种情况。我也尝试过方法 2 的替代方法,即 1 或 2 个额外的计算步骤 - 结果相同。我已经通过消除过程隔离了所有可能的错误来源,并且所有错误都归结为函数本身内部发生的事情,所以它一定是那里的问题。到底是什么原因造成的?就好像函数 CC 忽略了给定的输入...如果它以某种方式设置...?
最佳答案
您的代码不相等,第一个代码在第一步中重新分配了 a
和 b
:
a = a - np.mean(a)
b = b - np.mean(b)
所有后续操作都使用更新后的a
和b
。但是,您的第二种方法只是忽略了 sqrt
-term 中的这些:
sqrt(np.sum(a**2) * np.sum(b**2))
它应该与:
sqrt(np.sum((a-a.mean())**2) * np.sum((b-b.mean())**2))
一些额外的评论:
Which works it all out in one line and doesn't create any new lists, hence saving memory.
那不是真的(至少不总是),它仍然会产生新的数组。但我可以看到两个可以避免创建中间数组的地方:
np.subtract(a, a.mean(), out=a)
# instead of "a = a - np.mean(a)"
# possible also "a -= a" should work without temporary array, but I'm not 100% sure.
同样适用于 b = b - np.mean(b)
However it eventually results in a memory leak.
我在第一个函数中找不到任何内存泄漏的证据。
如果你关心中间数组,你总是可以自己做操作。我用 numba 显示它但这可以很容易地移植到 cython或类似的(但我不需要添加类型注释):
import numpy as np
import numba as nb
from math import sqrt
@nb.njit
def CC_helper(a, b):
sum_ab = 0.
sum_aa = 0.
sum_bb = 0.
for idx in range(a.size):
sum_ab += a[idx] * b[idx]
sum_aa += a[idx] * a[idx]
sum_bb += b[idx] * b[idx]
return sum_ab / sqrt(sum_aa * sum_bb)
def CC1(a, b):
np.subtract(a, a.mean(), out=a)
np.subtract(b, b.mean(), out=b)
res = CC_helper(a, b)
return round(res, 5)
并将性能与您的两个函数进行比较:
def CC2(a, b):
a = a - np.mean(a)
b = b - np.mean(b)
ab = np.sum(a*b)
asq = np.sum(a**2)
bsq = np.sum(b**2)
cc = round(ab / sqrt(asq * bsq), 5)
return cc
def CC3(a, b):
cc = round(np.sum((a - np.mean(a)) * (b - np.mean(b))) / sqrt(np.sum((a - np.mean(a))**2) * np.sum((b - np.mean(b))**2)), 5)
return cc
并确保结果相同并计时:
a = np.random.random(100000)
b = np.random.random(100000)
assert CC1(arr1, arr2) == CC2(arr1, arr2)
assert CC1(arr1, arr2) == CC3(arr1, arr2)
%timeit CC1(arr1, arr2) # 100 loops, best of 3: 2.06 ms per loop
%timeit CC2(arr1, arr2) # 100 loops, best of 3: 5.98 ms per loop
%timeit CC3(arr1, arr2) # 100 loops, best of 3: 7.98 ms per loop
关于使用 numpy 数组输入的 Python 函数给出了意想不到的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41926586/
我在使用带有 vector STL 的迭代器时遇到了这个错误。 代码:- #include #include void print_vec(std::vector vec) { auto
JAVA:两个引用“p”&&“pp”之间有区别吗? PrintStream p = new PrintStream(System.out); p.println("lol");
我尝试从主分支中拉出,但收到错误消息: $ git --no-optional-locks -c color.branch=false -c color.diff=false -c color.sta
我面临着一个让我抓狂的问题! 我有一个函数,这个: void load_weapons3(t_env *e, char *name, int x, t_weapon *w) { char
我正在尝试使用 CUDA 中的最小值、最大值、总和和平均值实现并行归约。 这是我目前的主要代码片段。 int main() { const auto count = 8; const
我知道 double free 或 corruption 错误通常是对 big 3 的违规,但在这种情况下,我找不到违规发生的地方。我有一个复制构造函数、析构函数和赋值运算符,适用于任何处理指针的东西
GTK+ 中的“focus”和“focus-in(out)-event”信号有什么区别?哪个先发射?它们与键盘(TAB)和鼠标点击有什么关系。他们互相依赖吗? 我问这个是因为我想在顶层窗口中跟踪当前聚
*** glibc detected *** /home/ghoshs/workspace/Simulator/Debug/Simulator: double free or corruption (
#include #include #include #include using namespace std; #define MAX_WEIGHT 1000000 class Set {
我在服务器上有两个分支一个叫 R2 的分支和一个叫 DEV 的分支我无意中登录了错误的服务器,进入了存储库并执行了GIT pull 源开发但是存储库在 R2 上。所以我意识到我的错误然后尝试通过做一个
我有一个包含循环的大约 1000 个顶点和 3000 个边的有向图。 我试图从给定的顶点找到所有下游(出)路径。 使用以下 Gremlin 查询时 g.V(45712).repeat(out().si
使用 Delphi XE 2 我试图确定缩放方向以将缩放效果应用于图像(TImage),但没有找到执行此操作的函数,并且图像的 OnGesture 事件中的 EventInfo 属性没有此信息. 我见
我正在尝试创建一个 Zoom_image 函数,它使用离散傅里叶变换来缩放灰度图像。如果图像大小小于或等于 4*4 但大小增加,我包含的代码可以工作。它给出“双重释放或损坏(出)中止(核心转储)”错误
当我执行 popAll 函数时,出现以下错误: 双重释放或腐败(出)中止(核心转储) 我想我已经将错误来源缩小到了这个函数。 IntegerStack 是我制作的一个简单的 ADT,其中包含一个名为
我有网络开发背景,我正在尝试创建类似于 this technique 的东西适用于 iOS(使用 Cocoa/Obj C)。我在谷歌搜索资源时遇到了很多困难,因为 iOS 中的“视差”往往指的是 iO
我想实现一个 faceted search对于我的一个项目。我正在使用 PHP5、Mysql 和 Symfony 1.4。显然社区指向Apache Solr这似乎正是我想要完成的。 问题是该网站将在不
我知道有 questions floating around当您没有提供明确的分支名称时,关于来自特定分支的 git pull,但是我想知道即使用户确实指定了不同的分支,是否也可以强制 pull 分支
我正在尝试将我的更改推送到 NAS 上的存储库。它以我无法理解的方式失败。 documentation声明默认情况下 push 仅适用于快进更新。很公平。所以我做了一个 git pull(我的 Rem
我刚开始使用 Oracle 的 Coherence 缓存,我注意到这一点:如果我在缓存中放入一个 ConcurrentHashMap 对象,当我检索它时,我可以看到它被转换为一个普通的 HashMap
我尝试创建一个连接到数据库的线程,从那里获取一些数据并打印到控制台。问题是当该线程完成时抛出异常: 双重免费或腐败(出局)中止(核心转储) 我尝试使用 sqlite3 和 pthread,但这两个并不
我是一名优秀的程序员,十分优秀!