- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试找出如何加速以下 Python 代码。
基本上,该代码构建了矩阵 C
的外部乘积矩阵,并将其存储为 block 对角稀疏矩阵。
我使用numpy.repeat()
在 block 对角线中构建索引。
分析代码显示对numpy.repeat()
的调用> 占用大约 50% 的执行时间。
import numpy as np
import scipy.sparse as spspar
L = 1000
K = 100
C = np.random.randn(L,K)
# From the matrix of outter products of C and store in block_diagonal
# sparse matrix
CCt = np.einsum('ij...,i...->ij...',C,C)
# create indices into the block diagonal sparse coo matrix
i = np.tile(np.tile(np.arange(K),K),L) + K*np.repeat(np.arange(L),K*K)
j = np.tile(np.repeat(np.arange(K),K),L) + K*np.repeat(np.arange(L),K*K)
# store as block diagonal sparse coo matrix
BlckCCt = spspar.coo_matrix((CCt.flatten(),(j,i)),shape=(K*K*L,K*K*L))
最初,我按如下方式构建稀疏矩阵
BlckCCt = spspar.block_diag(CCt,"coo")
这太慢并且占用内存。
感谢您的任何意见。
编辑:我使用 ipython timeit 比较了 @hjpaul 的建议。这是我可以报告的内容
timeit K*np.repeat(np.arange(L),K*K)
10 loops, best of 3: 82.1 ms per loop
timeit (np.zeros((K*K,),int)+np.arange(L)[:,None]).flatten()*K
10 loops, best of 3: 89.9 ms per loop
timeit np.tile(np.arange(L)*K,K*K).reshape(K*K,L).T.flatten()
10 loops, best of 3: 85.5 ms per loop
所以看起来它们都花费了大约相同的数量(我是 ipython 分析的新手,所以也许我没有以正确的方式比较它们)。
最佳答案
仅供引用,您的
CCt = np.einsum('ij...,i...->ij...',C,C)
与
相同CCt1=C[:,None,:]*C[:,:,None]
生成一个(L,K,K)
数组。对于我的较小测试用例,np.einsum
速度提高了 2 倍。
sparse.block_diag
将每个子矩阵转换为 coo
,并将它们传递给 sparse.bmat
。 bmat
将所有子矩阵的 rows
、cols
、data
收集到一个类似于您的 的大数组中>j, i
,并用它们调用 coo_matrix
。
在不同的部分上执行ipython
timeit
,我同意K*np.repeat(np.arange(L),K*K)
是最慢的代码块。例如,比 tile
片段慢得多。
既然你对i
和j
做同样的repeat
,你不能只做一次,然后使用该变量两次吗?
kk= K*np.repeat(np.arange(L),K*K)
ii=np.tile(np.tile(np.arange(K),K),L) + kk
jj=np.tile(np.repeat(np.arange(K),K),L) + kk
我会再看一下那篇文章,但这只是一个开始。
这是对重复
的轻微改进(20%):
(np.zeros((K*K,),int)+np.arange(L)[:,None]).flatten()*K
更好 (>2x)
np.tile(np.arange(L)*K,K*K).reshape(L,K*K).T.flatten()
我将 *K
移至较小的 arange(L)
,并使用更快的 tile
。 .T.flatten
负责更改顺序。
根据评论, reshape 应该是(K*K,L)
。我正在用无关紧要的值进行测试。这些替代方案的相对速度随 K
和 L
的相对大小而变化。
如果 kk
(第二部分)形状为 (L,K),则 i
和 j
的第一部分的平铺是可选的,K)(如CCt
)。是否能节省时间尚不清楚。跨步比完全平铺版本 (0,4,0)
v. (4,)
.)
i = (np.arange(K)[None,None,:] + kk.reshape(L,K,K)).flatten()
j = (np.arange(K)[None,:,None] + kk.reshape(L,K,K)).flatten()
我们可以对 kk
做同样的事情
k1 = K*np.arange(L)[:,None,None]
np.arange(K)[None,None,:] + k1
是 (L,1,K),所以我们需要平铺它
i = np.tile( np.arange(K)[None,None,:] + k1, (1,K,1)).flatten()
j = np.tile( np.arange(K)[None,:,None] + k1, (1,1,K)).flatten()
<小时/>
生成这些数组的另一种方法是使用 np.ix_
reshape 范围,然后对值进行求和。
i = np.sum(np.ix_(K*np.arange(L), np.arange(K), np.zeros(K)))
j = np.sum(np.ix_(K*np.arange(L), np.zeros(K), np.arange(K)))
(根据需要添加.flatten
)。我已经在小尺寸上对此进行了测试,看起来不错。我不知道速度。
关于python - numpy.repeat() 创建 block 对角线索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30738941/
我的 blockly.js 文件中有以下代码 Blockly.Blocks['account_number'] = { // Other type. init: function() {
首先抱歉我的英语不好,我正在开发 Image Splitter 应用程序并且已经完成,但是现在的要求是当图像被分割(分成几 block /chunks)那么图像 block 的每一 block (ch
#value: 消息的返回值,当发送到一个 block 时,是该 block 中最后一句话的值。所以 [ 1 + 2. 3 + 4. ] value 计算结果为 7。我发现有时很难使用。有没有办法显式
我想构建一个包含 3 div 的响应式导航栏相同的 width和 height . 我申请了 inline-block到每个 block ,我得到一个我不理解的行为。 问题是,第三 block 由 2
我希望使用 Blockly 来允许非技术人员用户指定测试脚本。 它的一部分需要一个文件选择器,但是,我看不到 Blockly 有一个。是吗? 实际上,我找不到完整的标准 block 列表。谁有网址?
仅当您位于父 block 内部时,父 block 的 props.isSelected 才为 true,但当您在该 block 的 innerBlocks 内进行编辑时则不然。 如何从父 block
仅当您位于父 block 内部时,父 block 的 props.isSelected 才为 true,但当您在该 block 的 innerBlocks 内进行编辑时则不然。 如何从父 block
我想创建一个具有不同背景颜色 block 和不同悬停颜色 block 的导航栏 block 。我可以分别创建不同的悬停颜色 block 或不同的背景颜色 block ,但不能一起创建。所以请告诉我如何
我正在使用看到的代码 here定期执行代码: #define DELAY_IN_MS 1000 __block dispatch_time_t next = dispatch_time(DISPATC
为什么 block 必须被复制而不是保留?两者在引擎盖下有什么区别?在什么情况下不需要复制 block (如果有)? 最佳答案 通常,当您分配一个类的实例时,它会进入堆并一直存在,直到它被释放。但是,
我想弄清楚我这样做是否正确: 如果我有一个 block ,我会这样做: __weak MyClass *weakSelf = self; [self performBlock:^{
我想制作一个 4 block 导航菜单,虽然我已经显示了一个 block ,然后单击打开第二个 block ,从第二个开始选择并再次单击出现第三个 block ,第四个 block 相同...这是我的
例如,这样更好吗? try { synchronized (bean) { // Write something } } catch (Int
我想让一只乌龟检查前方小块的颜色并决定移动到哪里。如果前面的补丁不是白色的,那么乌龟向左或向右旋转并移动。我的 If 决策结构中出现错误,显示“此处应为 TRUE?FALSE,而不是 block 列表
我想创建一个 block 对角矩阵,其中对角 block 重复一定次数,非对角 block 都是零矩阵。例如,假设我们从一个矩阵开始: > diag.matrix [,1] [,2] [
我是区 block 链新手。突然我有一个问题,我们是否可以通过区 block 号来访问以太坊区 block 链上之前的区 block 数据。 例如我创建了一个block1、block2。 block
我是区 block 链新手。突然我有一个问题,我们是否可以通过区 block 号来访问以太坊区 block 链上之前的区 block 数据。 例如我创建了一个block1、block2。 block
我创建了一个等距环境,全部使用 Javascript 和 HTML5 (2D Canvas),大部分情况下工作正常。我面临的问题是使用不同高度的图 block ,然后对图 block 上的对象索引进行
这是令我困惑的代码: public Integer getInteger(BlockingQueue queue) { boolean interrupted = false; try
我有一个基于 TPL 数据流的应用程序,它仅使用批处理 block 和操作 block 就可以正常工作。 我已经添加了一个 TransformBlock 以尝试在发布到批处理 block 之前从源中转
我是一名优秀的程序员,十分优秀!