- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
嘿,所以我正在查看矩阵移位代码,并且需要使其缓存友好(尽可能少的缓存未命中)。代码如下所示:
int i, j, temp;
for(i=1;, i< M; i++){
for(j=0; j< N; j++){
temp = A[i][j];
A[i][j] = A[i-1][j];
A[i-1]][j] = temp;
}
}
假设 M 和 N 是函数的参数,注意 M 是行数,N 是列数。现在为了使缓存更友好,本书给出了两个优化问题。当矩阵为4x4时,s=1,E=2,b=3,当矩阵为128x128时,s=5,E=2,b=3。(s = # of set index bits (S = s^2 is the number of sets, E = number of lines per set, and b = # of block bits (so B = b^2 is block size))
因此使用分块方法,我应该按 block 大小访问矩阵,以避免丢失,并且缓存必须从更高级别的缓存中获取信息。所以这就是我的假设:
每个 block 大小为 9 个字节
对于 4x4 矩阵,均匀地适合一个 block 的元素数量为: block 大小*(列数/ block 大小) = 9*(4/9) = 4因此,如果每一行都适合一个 block ,为什么缓存不友好?
对于 128x128 矩阵,使用与上述相同的逻辑,每个 block 将包含 (9*(128/9)) = 128。
很明显,经过计算,这个等式是错误的。我正在查看此页面中的代码 http://csapp.cs.cmu.edu/public/waside/waside-blocking.pdf
一旦我达到这一点,我就知道我迷路了,这就是你们进来的地方!是否就像说每个 block 包含 9 个字节一样简单,而 8 个字节(两个整数)是均匀地放入其中的?抱歉,这些东西真的让我很困惑,我知道我到处都是。需要明确的是,这些是我的担忧:
您如何知道一个 block 中可以容纳多少个元素?行数或集合数会影响这个数字吗?如果是这样,如何?对链接页面上发布的代码的任何深入解释。
真的只是想了解这一点。
更新:好的,这就是我要处理 4x4 矩阵的地方。
我一次可以读取8个字节,也就是2个整数。原始函数将有缓存未命中,因为 C 加载到行优先顺序,所以每次它想要 A[i-1][j] 时它都会丢失,并加载包含 A[i-1][j] 的 block 要么是 A[i-1][0] 和 A[i-1][1],要么是 A[i-1][2] 和 A[i-1][3]。
因此,解决这个问题的最佳方法是创建另一个临时变量,并执行 A[i][0] = temp、A[i][1] = temp2,然后加载 A[i-1] [0] A[i-1][1] 并将它们设置为 temp,以及 temp2 并将循环设置为 j<2?对于这道题,专门针对描述的矩阵;我知道这不适用于所有尺寸。
最佳答案
这个问题的解决方案是以列主序而不是行主序来考虑矩阵。
希望这对将来的人有所帮助。感谢@Michael Dorgan 让我思考。
128x128 矩阵的最终结果:原文:16218未命中优化:8196 次未命中
关于c - "Blocking"使代码缓存友好的方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37061337/
我的 blockly.js 文件中有以下代码 Blockly.Blocks['account_number'] = { // Other type. init: function() {
首先抱歉我的英语不好,我正在开发 Image Splitter 应用程序并且已经完成,但是现在的要求是当图像被分割(分成几 block /chunks)那么图像 block 的每一 block (ch
#value: 消息的返回值,当发送到一个 block 时,是该 block 中最后一句话的值。所以 [ 1 + 2. 3 + 4. ] value 计算结果为 7。我发现有时很难使用。有没有办法显式
我想构建一个包含 3 div 的响应式导航栏相同的 width和 height . 我申请了 inline-block到每个 block ,我得到一个我不理解的行为。 问题是,第三 block 由 2
我希望使用 Blockly 来允许非技术人员用户指定测试脚本。 它的一部分需要一个文件选择器,但是,我看不到 Blockly 有一个。是吗? 实际上,我找不到完整的标准 block 列表。谁有网址?
仅当您位于父 block 内部时,父 block 的 props.isSelected 才为 true,但当您在该 block 的 innerBlocks 内进行编辑时则不然。 如何从父 block
仅当您位于父 block 内部时,父 block 的 props.isSelected 才为 true,但当您在该 block 的 innerBlocks 内进行编辑时则不然。 如何从父 block
我想创建一个具有不同背景颜色 block 和不同悬停颜色 block 的导航栏 block 。我可以分别创建不同的悬停颜色 block 或不同的背景颜色 block ,但不能一起创建。所以请告诉我如何
我正在使用看到的代码 here定期执行代码: #define DELAY_IN_MS 1000 __block dispatch_time_t next = dispatch_time(DISPATC
为什么 block 必须被复制而不是保留?两者在引擎盖下有什么区别?在什么情况下不需要复制 block (如果有)? 最佳答案 通常,当您分配一个类的实例时,它会进入堆并一直存在,直到它被释放。但是,
我想弄清楚我这样做是否正确: 如果我有一个 block ,我会这样做: __weak MyClass *weakSelf = self; [self performBlock:^{
我想制作一个 4 block 导航菜单,虽然我已经显示了一个 block ,然后单击打开第二个 block ,从第二个开始选择并再次单击出现第三个 block ,第四个 block 相同...这是我的
例如,这样更好吗? try { synchronized (bean) { // Write something } } catch (Int
我想让一只乌龟检查前方小块的颜色并决定移动到哪里。如果前面的补丁不是白色的,那么乌龟向左或向右旋转并移动。我的 If 决策结构中出现错误,显示“此处应为 TRUE?FALSE,而不是 block 列表
我想创建一个 block 对角矩阵,其中对角 block 重复一定次数,非对角 block 都是零矩阵。例如,假设我们从一个矩阵开始: > diag.matrix [,1] [,2] [
我是区 block 链新手。突然我有一个问题,我们是否可以通过区 block 号来访问以太坊区 block 链上之前的区 block 数据。 例如我创建了一个block1、block2。 block
我是区 block 链新手。突然我有一个问题,我们是否可以通过区 block 号来访问以太坊区 block 链上之前的区 block 数据。 例如我创建了一个block1、block2。 block
我创建了一个等距环境,全部使用 Javascript 和 HTML5 (2D Canvas),大部分情况下工作正常。我面临的问题是使用不同高度的图 block ,然后对图 block 上的对象索引进行
这是令我困惑的代码: public Integer getInteger(BlockingQueue queue) { boolean interrupted = false; try
我有一个基于 TPL 数据流的应用程序,它仅使用批处理 block 和操作 block 就可以正常工作。 我已经添加了一个 TransformBlock 以尝试在发布到批处理 block 之前从源中转
我是一名优秀的程序员,十分优秀!