- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我一直在使用 perf stat
和 cpufreq-set
在 odroid-xu3 上做一些小实验,这是一个带有 Exynos 芯片(A7 的异构处理器)的嵌入式设备和 A15 ARM 内核)。我使用 BLAS lvl3 基准测试来运行我的实验,并且我一直使用 taskset
实用程序将任务固定到 A15 内核。我也仔细检查了它是一个单线程实现。
希望在高频率或低频率下运行时的周期数应该相同,但我可以看到一个小的变化,例如分别在 400MHz、1000MHz 和 1600MHz 下运行 GEMM 内核(矩阵乘法,100 次运行)我得到结果如下:
7166620830 cycles
17.923790714 seconds time elapsed
7235173436 cycles
7.237463382 seconds time elapsed
7428037080 cycles
4.643897351 seconds time elapsed
您可以看到,即使持续时间与频率也不是真正线性的(这至少与测量的周期数一致......)。一种假设是该任务有点受内存限制,但我在单精度实现中得到了类似的结果……您知道这可能是什么原因吗?
编辑:矩阵有 400 个样本大,我使用环境变量 OPENBLAS_LOOP(openblas 基准)运行它 100 次。我尽量避免运行其他应用程序,我看不出负载为 0%,但已经接近了。你建议我停止一些特别的事情吗?因为它已经是超过 100 次实验的平均值,所以相同频率的变化非常低(<0.1%),当我改变频率时有大约 4% 的差异,并且对于最高频率它总是有更大的周期数,所以它确实如此看起来不像是更“嘈杂”,它看起来像是在高频发生了其他事情。
最佳答案
CPU 周期不仅用于计算,还用于等待来自内存的数据。 (是的,GEMM 是 BLAS3,在 Roofline model scale 上具有非常好的算术强度和低内存读/写量,但仍然存在内存访问,并且它们的延迟与 CPU 频率不是线性关系。)
不仅要检查 CPU 周期,还要检查应该更稳定的指令计数器(如果为您的 CPU 实现了这个性能计数器),还要排除内核模式(它可能每 100 Hz 或 300 Hz 有一些周期性任务,如调度程序) 从用 :u
后缀计数:
perf stat -e cycles:u,instructions:u,task-clock:u ./program
(也尝试找到一些为您的核心实现的缓存未命中事件或内存访问事件,也检查核心文档中的原始编码并使用 -e rHHHH
找到的十六进制代码)
当您更改 CPU 时钟频率时,您可能(也可能不会)影响内存 Controller /内存总线频率(这特定于您的 SoC 和启动配置)。 DRAM 内存(可能是“exynos 5422”SoC 中的 LPDDR3)有许多时序是根据内存总线频率计算的,但实际上它们来自真实内存数据库频率和延迟。
大多数时序在绝对 (ns) 时序中将相同(或接近),但有一个会影响您的代码周期:memory refresh timing - DRAM 内存仅在短时间内保留数据(电荷从数据单元泄漏),例如每 32 微秒 (ms) 或 64 ms 完全刷新一次(这随高温而变化,通常有两个值 - 低温和高温).使用完整的数据库刷新命令,它将在时间的某些部分无法访问,例如 2% 或 5%(我没有确切的值)。
更改 CPU 频率时,不会更改刷新频率(数据应始终稳定并按照内存芯片数据表的要求进行刷新)。但是使用 400 MHz 的 CPU,您的计算时间会更长,并且会看到更多的刷新;并且 1600 MHz 的计算时间很短,刷新次数也较少。其他影响 - 一些内存请求可能会停止等待刷新结束。
因此,有一些非线性元素具有不同的贡献(对于低频循环,一些是负的,另一些是正的):
在您的结果中,最后一个效果看起来是最显着的 - 低 MHz 的低周期,高 MHz 的高周期。使用高频 CPU 可能会停止更多的周期以等待从内存到预充电/激活行/选择列的几十纳秒。在低频率下,相同 ns 的内存延迟将转换为少量的慢速 CPU 周期。
关于linux - perf stat 周期数和频率缩放,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36313983/
我在 div 和 jquery ui slider 中有一个图像列表,当用户滑动栏时,图像应该调整大小/缩放(无论你想怎么调用它),我尝试选择所有图像并更改 css 的宽度和使用 jquery 的高度
我正在制作一张具有缩放和平移功能的世界地图。我在某些城市上画了圆圈,圆圈的半径由数据决定。当鼠标悬停在这些圆圈上时,将出现一个工具提示来显示数据。 代码结构为 //在此选择上调用缩放行为 - 让我们调
我正在使用 jquery UI slider (http://jqueryui.com/slider/)。 我需要对整个站点进行缩放。使用 css 样式在 IE+Chrome im 中缩放 - “缩放
我花了很多时间试图找到一种使用 CGAffineScale 将 View 转换为给定点的方法,包括摆弄 anchor 、在转换前后移动 View 的中心以及全面的谷歌搜索。我知道使用 UIScroll
我希望能够用手指旋转和缩放/缩放我的位图,我已经为此寻找了所有示例项目,但它们都与我的代码不匹配。这是我的 onTouchListener 代码。 public class MyView extend
在我的页面中间,我有一个 div 元素,其中包含一些内容(其他 div、图像等)。 before something inside another something
我一直在尝试使用 google maps API V3 的绘图管理器(绘制矩形)。使用 -webkit-transform 缩放谷歌地图 Canvas (包含 div)后像这样 var transf
这个问题在这里已经有了答案: How to resize the iPhone/iPad Simulator? (12 个答案) 关闭 5 年前。 我正在编写 iOS 应用 我使用 Xcode 6.
这几天一直在研究微服务,我想知道人们是如何着手自动化负载平衡和扩展这些东西的? 我心中有一个特定的场景,我想实现什么,但不确定是否可行,或者我的想法有误。就这样吧…… 假设我有一个由 3 台名为 A、
我正在使用 ffmpeg for android 来制作 mp4 格式的视频。我无法让这个命令在 FFMPEG 中工作,基本上我正在尝试添加两个图像,缩放它们,添加缩放效果,最后将结果连接到一个视频文
使用 OpenGL 我正在尝试绘制我校园的原始 map 。 谁能向我解释一下平移、缩放和旋转通常是如何实现的? 例如,通过平移和缩放,这仅仅是我调整我的视口(viewport)吗?所以我绘制并绘制了构
我需要在 iphone sdk 界面生成器中将按钮旋转 30 度,该怎么做? 最佳答案 您无法在 Interface Builder 中执行此操作,但代码非常简单。 确保您已将 IB 中的按钮连接到
假设默认级别等于“1”,是否可以检测触摸设备的捏合(缩放)级别?原因是我希望根据捏合级别禁用页面元素(显示:无)。 如果可以将其放在一个设置缩放级别值的函数中,那就太好了,例如: var ZOOM =
我正在努力找出并确定如何根据这个例子放大我的鼠标位置。 (https://stackblitz.com/edit/js-fxnmkm?file=index.js) let node, scal
我已将 UIWebView 的“scalesPageToFit”属性设置为 YES。 它正在缩放,但是当页面加载时,内容的字体很小,不捏就无法阅读。我们可以将缩放比例设置为默认值吗? 最佳答案 这更多
我仍在学习 jQuery mobile 的技巧,并且在 data-role="page"上放大和缩小图片/图像时遇到问题。有没有办法使用 jquery mobile 在 iPhone 上的图像上进行捏
给定一组 n 个维度为 d 的向量,存储在 (n,d) 数组中,以及第二组 m 相同维度的向量(存储在 (m,d) 数组中)我想计算向量之间的平方点距离,由大小为 的某个矩阵 A 缩放>(d,d)。
我想知道是否有人可以指出我正确的方向。 我使用 CSS3 过渡创建了缩放效果。将鼠标悬停在该对象上,它会转换为更大的版本。这看起来很棒并且效果很棒,但问题是这种效果在 IE 中不起作用,所以我需要在
mapbox-gl-js 版本:0.38.0在 ionic 2.2.11 上通过 npm repo 使用 正如您在这张 gif 上看到的 https://giphy.com/gifs/ionic-an
所以我花了几个小时在网上搜索帮助,但所有论坛和文档都没有向我正确解释我应该采取的最佳方式。 目前我有一个具有 XML 相对布局的 Activity (背景设置为 map 图片),我想实现多手势缩放功能
我是一名优秀的程序员,十分优秀!