python - 有效地累积稀疏 scipy 矩阵的集合-6ren

python - 有效地累积稀疏 scipy 矩阵的集合

转载作者：太空狗更新时间：2023-10-29 21:40:37

24

4

我有一个 O(N) NxN scipy.sparse.csr_matrix 的集合，每个稀疏矩阵都有 N 个元素集的顺序。我想将所有这些矩阵加在一起以获得一个常规的 NxN numpy 数组。 (N 大约为 1000)。矩阵中非零元素的排列使得结果总和肯定不是稀疏的(实际上几乎没有零元素)。

目前我正在做

reduce(lambda x,y: x+y,[m.toarray() for m in my_sparse_matrices])

虽然有效，但速度有点慢:当然，那里正在进行的大量无意义的零处理绝对是可怕的。

还有更好的办法吗？在 docs 中对我来说没有什么明显的.

更新:根据 user545424 的建议，我尝试了对稀疏矩阵求和以及将稀疏矩阵求和到稠密矩阵的替代方案。下面的代码显示了在可比时间运行的所有方法(Python 2.6.6 on amd64 Debian/Squeeze on a quad-core i7)

import numpy as np
import numpy.random
import scipy
import scipy.sparse
import time

N=768
S=768
D=3

def mkrandomsparse():
    m=np.zeros((S,S),dtype=np.float32)
    r=np.random.random_integers(0,S-1,D*S)
    c=np.random.random_integers(0,S-1,D*S)
    for e in zip(r,c):
        m[e[0],e[1]]=1.0
    return scipy.sparse.csr_matrix(m)

M=[mkrandomsparse() for i in xrange(N)]

def plus_dense():
    return reduce(lambda x,y: x+y,[m.toarray() for m in M])

def plus_sparse():
    return reduce(lambda x,y: x+y,M).toarray()

def sum_dense():
    return sum([m.toarray() for m in M])

def sum_sparse():
    return sum(M[1:],M[0]).toarray()

def sum_combo():  # Sum the sparse matrices 'onto' a dense matrix?
    return sum(M,np.zeros((S,S),dtype=np.float32))

def benchmark(fn):
    t0=time.time()
    fn()
    t1=time.time()
    print "{0:16}:  {1:.3f}s".format(fn.__name__,t1-t0)

for i in xrange(4):
    benchmark(plus_dense)
    benchmark(plus_sparse)
    benchmark(sum_dense)
    benchmark(sum_sparse)
    benchmark(sum_combo)
    print

然后退出

plus_dense      :  1.368s
plus_sparse     :  1.405s
sum_dense       :  1.368s
sum_sparse      :  1.406s
sum_combo       :  1.039s

虽然您可以通过扰乱 N、S、D 参数来获得一种或另一种方法的结果领先 2 倍左右……但是没有什么比您希望从中看到的数量级改进更好的了考虑到零添加的数量，应该可以跳过。

最佳答案

如果您的矩阵非常稀疏，我想我已经找到了将其速度提高约 10 倍的方法。

In [1]: from scipy.sparse import csr_matrix

In [2]: def sum_sparse(m):
   ...:     x = np.zeros(m[0].shape)
   ...:     for a in m:
   ...:         ri = np.repeat(np.arange(a.shape[0]),np.diff(a.indptr))
   ...:         x[ri,a.indices] += a.data
   ...:     return x
   ...: 

In [6]: m = [np.zeros((100,100)) for i in range(1000)]

In [7]: for x in m:
   ...:     x.ravel()[np.random.randint(0,x.size,10)] = 1.0
   ...:     

        m = [csr_matrix(x) for x in m]

In [17]: (sum(m[1:],m[0]).todense() == sum_sparse(m)).all()
Out[17]: True

In [18]: %timeit sum(m[1:],m[0]).todense()
10 loops, best of 3: 145 ms per loop

In [19]: %timeit sum_sparse(m)
100 loops, best of 3: 18.5 ms per loop

关于python - 有效地累积稀疏 scipy 矩阵的集合，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11254248/

24

4

0

文章推荐： c# - 从 C# 中的加权列表中选择 x 个随机元素(无需替换)

文章推荐： c# - 如何在 Autofac 注册中返回 NULL？

文章推荐： c++ - SPOJ SUMFOUR.....TLE 在测试用例 9 上

mysql - WHERE(集合)IN(集合)
编辑:我似乎问错了这个问题。我正在尝试寻找一种方法来查询一个集合是否在另一个集合中可用。例如: SELECT * FROM something WHERE (1, 3) IN (1, 2, 3, 4
jquery - $.each([集合]) 与 $([集合]).each()
这两种方法似乎 produce the same results ，但我一直很难真正说服人们第二种方法有效，因为它显然并不为人所知。 // Create some data var foo = { '
kotlin - 为什么我们在Kotlin中仅使用[列表， map ，集合]集合？
我一直在学习Kotlin，并且遇到过Collections API。在Kotlin之前，我一直在学习Java，并且我知道Java中有很多不同类型的Collections API。例如，我们使用List
Java addAll(集合)与 new ArrayList(集合)
为什么我会得到不同的行为: Collection col2 = new ArrayList(col); 集合 col2 = new ArrayList(); col2.addAll(col) 我正在与
javascript: 集合[id][prop] = 集合[id][prop] || []//将空数组分配给对象时出现问题
所以我有一个代表专辑信息的 JSON 对象。给定“function updateRecords(id, prop, value)”我希望能够更新每个条目。正确的完成代码如下。我得到了指示，粗体部分，
java - 我需要哪种 Java 对象类型(集合/列表/集合/其他)？
我想存储一个对象集合，这些对象根据它们所代表的值进行键控。这些键可以重复。例如: [4] => Bob [5] => Mary [5] => Sue [9] => Steve [10] =>
collections - ArrayList(集合 c)VS HashSet(集合 c)
在检查 ArrayList API 时，我注意到一些看起来很奇怪的东西。确实，这里是 ArrayList 构造函数实现，其中 Collection 作为参数传递: public ArrayList(
collections - 如何在我的 YAML Swagger 定义中将属性类型定义为字符串列表(列表、集合、数组、集合)
我正在为 API 编写一个 swagger 定义文件。 API 是用于 GET 请求的 /path/to/my/api: get: summary: My Custom API d
java - 如何将 Scala 集合 Seq[(Int, Seq[String])] 转换为 Java 集合 List[(int, List[String])]？
我知道scala.collection包中有两个非常有用的对象，可以帮助我们实现这个目标: JavaConverters(如果我想明确说明并准确说明我要转换的内容) JavaConversions(如
Automapper 集合
我已经阅读了无数其他帖子，但似乎无法弄清楚发生了什么，所以是时候寻求帮助了。我正在尝试将包含集合的域实体映射到也包含集合的 dtos。这是一个原始示例； (我提前为代码墙道歉，我尽量保持简短):
Java:集合
我正在创建一个具有 ArrayList 的类，因此当我调用构造函数时，它会初始化该数组: public class ElementsList { private ArrayList list;
polymer this.$ 集合
我正在阅读事件指南和指南的开头，它说: You can also add an event listener to any element in the this.$ collection using
Python - 集合
我是 Python 新手，想知道如何使用键在字典中存储不同数据类型的列表例如 - {[Key1,int1,int1,String1] , [Key2,int2,int2,String2], [Key
C# 集合
int[] mylist = { 2, 4, 5 }; IEnumerable list1 = mylist; list1.ToList().Add(1); // why 1 does not get
Java 集合
我在 UI 表单中的每一行之后将以下内容添加到 HashMap 集合中声明 Map> map = new HashMap>(); List valSetOne = new ArrayList();
Java - 集合
我正在开发我的第一个 Java 项目，我有一个问题。问题应该很简单(虽然代码不是那么短，但没有理由被吓倒:))。我创建了一个基本的角色扮演游戏，并且有一个定义每个角色的抽象类“Character”。在
MongoDB 集合
我正在开发一款应用程序，可以为用户收集推文、Facebook 状态和 Facebook 照片。目前，用户确切地设定了他们希望这种收获发生的时间和时间，并且蜘蛛会在此期间拉取数据。 when 和 to
C# 集合？
有谁知道在 C# 中是否有与 Java 的 Set 集合等效的好方法？我知道您可以通过填充但忽略值来使用 Dictionary 或 HashTable 在某种程度上模仿集合，但这不是一种非常优雅的方式
oracle 集合
EXISTS 该函数返回集合中第一个元素的索引，如果集合为空，返回NULLNULLNULL Collecti
07、RDF 集合
RDF集合是通过属性 rdf:parseType="Collection" 来描述仅包含指定成员的组 rdf:parseType="Collection" 属

首页

博学

6Ren·AI

商城

python - 有效地累积稀疏 scipy 矩阵的集合