python - numpy.dot -> MemoryError, my_dot -> 非常慢，但有效。为什么？-6ren

python - numpy.dot -> MemoryError, my_dot -> 非常慢，但有效。为什么？

转载作者：太空宇宙更新时间：2023-11-03 11:02:57

25

4

我正在尝试计算大小分别为 (162225, 10000) 和 (10000, 100) 的两个 numpy 数组的点积。但是，如果我调用 numpy.dot(A, B) 会发生 MemoryError。然后，我尝试编写我的实现:

def slower_dot (A, B):
    """Low-memory implementation of dot product"""
    #Assuming A and B are of the right type and size
    R = np.empty([A.shape[0], B.shape[1]])
    for i in range(A.shape[0]):
        for j in range(B.shape[1]):
            R[i,j] = np.dot(A[i,:], B[:,j])
    return R

它工作得很好，但当然很慢。知道 1) 这种行为背后的原因是什么以及 2) 我如何规避/解决问题吗？

我在配备 64 位、16GB 内存、运行 Ubuntu 14.10 的计算机上使用 Python 3.4.2(64 位)和 Numpy 1.9.1。

最佳答案

您遇到内存错误的原因可能是因为 numpy 试图在对 dot 的调用中复制一个或两个数组。对于中小型阵列，这通常是最有效的选择，但对于大型阵列，您需要对 numpy 进行微观管理以避免内存错误。您的 slower_dot 函数很慢主要是因为 python 函数调用开销，您遭受了 162225 x 100 次。当您想要平衡内存和性能限制时，这是处理这种情况的一种常用方法。

import numpy as np

def chunking_dot(big_matrix, small_matrix, chunk_size=100):
    # Make a copy if the array is not already contiguous
    small_matrix = np.ascontiguousarray(small_matrix)
    R = np.empty((big_matrix.shape[0], small_matrix.shape[1]))
    for i in range(0, R.shape[0], chunk_size):
        end = i + chunk_size
        R[i:end] = np.dot(big_matrix[i:end], small_matrix)
    return R

您需要选择最适合您的特定数组大小的 chunk_size。只要所有内容都适合内存，通常较大的 block 大小会更快。

关于python - numpy.dot -> MemoryError, my_dot -> 非常慢，但有效。为什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27668462/

25

4

0

文章推荐： python - 使用隐式授权类型的 Django oauth 工具包

文章推荐： c# - 反射 : can't get List "ElementAt" MethodInfo

文章推荐： python - 日志记录 - 如何忽略导入的模块日志？

SwiftUI 向动画文本添加不必要的 "dot dot dot"
我正在使用 XCode 中的 SwiftUI 为 iPhone 编写应用程序。在其中一个 View 中，有一个 Text 标签，每当按下按钮时都会更改其文本。整个 View 是 Spring 动画
Javascript 'Dot Dot Dot' 计算时
我有一个功能可以在生成报告时在弹出窗口中显示点点点。我想显示文本: 正在生成报告。生成报告..正在生成报告... ...重复，直到报告准备好。到目前为止，我只能在弹出窗口中获取三个点，而无法获取其他文
r - 我可以删除 ... (dot-dot-dot) 中的元素并将其传递吗？
是否可以从 ... 中删除元素并将 ... 传递给其他函数？我的前两次尝试失败了: parent = function(...) { a = list(...) str(a) a$t
java - 为什么Java的main方法使用String[]而不是String dot dot dot
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
html - 带 "dot dot dot"动画的居中可变宽度文本
http://pastebin.com/index/9M2rA8cx那有我所有的代码。您会注意到这两个 div 在 large.css 中居中。但是，文本在每个“。”之后重新居中。被申请;被应用。如
linux - Unix和Linux中的 ‘dot’和 ‘dot dot’文件是真实文件吗？
特殊文件 . 和 .. 是否实际存在并作为普通文件存储/位于文件系统中，或者它们是否仅在访问时解释/创建文件系统处理程序？ .(当前目录) ..(父目录) 我的假设是它们不存在——否则，当您创建符号链
r - 使用 dot dot dot (...) 表示从自定义函数返回的列，用于 data.table 对象
我想用...指示我想从 data.table 的自定义函数返回的变量目的。这是一个最小的可复制示例: library(data.table) d = data.table(mtcars) getvar
javascript - 正则表达式问题 : not allow a single dot (allow only if have digit before dot or digit after dot)
我想允许用户输入以下十进制或整数值 (A) .5 0.500 3 0 0.0 30 500000 4000.22 0. 这是我使用的以下正则表达式: factor: /^-?\d*[.]??\d*$/
dns - `domain dot tld` 和 `domain dot tld dot` 一样吗？ (TLD 后的点)
我似乎明白 TLD 后的点无关紧要，例如: http://example.com/somepage/ == http://example.com./somepage/ (注意 TLD 后面的点) 我的
dot - 如何使用 GraphViz DOT 创建循环图？
我试图用这个 DOT 输入文件创建一个简单的循环图: digraph { rankdir=LR; node0 [label = "0", group="bottom"]; n
dot - 如何在不引入重叠的情况下使 DOT/neato 图更紧凑？
我的问题与 this one 基本相同但给出的答案对我不起作用。这是一个示例渲染 (source)和 compound=true; overlap=scalexy; splines=true; la
dot - Graphviz Dot 将节点放置在子图中，即使它是在其他地方定义的
我正在尝试为作业问题制作一个点脚本生成器，它进行得很顺利，但我遇到了这个问题，其中一些未在子图中定义的节点被放置在其中。例如以下点脚本: digraph dg { compound=true;
dot - 将节点定位到 graphviz 中 DOT 中边的左侧和右侧
我写了下面的 DOT 来生成图表。除了定义和布置的节点外，我想在标记为 L 的边缘的左侧和右侧放置一个节点，它们应该靠近 L，并且在 NODE3 和 NODE6 之间。我尝试了一些不可见的节点。新节
python matplotlib dash-dot-dot - 如何？
我正在使用 python 和 matplotlib 来生成图形输出。有没有一种简单的方法来生成点划线样式？我知道 '--'、'-.' 和 ':' 选项。不幸的是，'-..' 不会产生点划线。我查
java - 当且仅当前后字符不是 'dot' 时，如何在 'dot' 上拆分字符串
给定以下字符串: "foo.bar.baz" 使用 Java String split 可以很容易地在“点”上分割它: split("foo.bar.baz", "\.") 但是，如果我想保留该点(如
python - numpy.dot 和 a.dot(b) 的区别
有区别吗 import numpy as np np.dot(a,b) 和 a.dot(b) 内部？我找不到关于后一种方法的任何文档。最佳答案如果a 是一个数组，它们是等价的。您找不到关于 dot
python - 矩阵-矩阵乘法的函数 numpy.dot()、@ 和方法 .dot() 之间有什么区别？
有区别吗？如果不是，按惯例首选什么？性能似乎几乎相同。 a=np.random.rand(1000,1000) b=np.random.rand(1000,1000) %timeit a.dot(b)
graph - 如何使用 GVPR 将具有多个图形的 DOT 文件拆分为多个 DOT 文件？
如何使用 gvpr 将 DOT 语言中包含多个图形的文件拆分为多个 DOT 文件? 输入(1 个文件): # single.dot digraph one { a -> b; } digraph
php 递归目录迭代器 : how to exclude directory paths with a dot and double dots?
RecursiveDirectoryIterator 似乎从本地主机和实时服务器给我两个不同的结果， define ('WEBSITE_DOCROOT', str_replace('\\', '/',
java - 在 Java 中如何将 "space and dot"替换为 "dot"？
我有这样的例子: "hello . world . thanks ." 我想得到这个: "hello. world. thanks." 我试过了 text = text.replaceAll(" ."

首页

博学

6Ren·AI

商城

python - numpy.dot -> MemoryError, my_dot -> 非常慢，但有效。为什么？