- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用带有 Cortex M4 的 STM32F407,并且通过在调用我实现的函数(C 语言)之前和之后直接读取 DWT_CYCCNT
来测量函数的周期计数集会。我想了解我得到的结果。
08000610 <my_function>:
8000610: f04f 20ff mov.w r0, #4278255360 ; 0xff00ff00
8000614: f04f 11ff mov.w r1, #16711935 ; 0xff00ff
8000618: ea81 0100 eor.w r1, r1, r0
800061c: ea81 0100 eor.w r1, r1, r0
8000620: ea81 0100 eor.w r1, r1, r0
8000624: ea81 0100 eor.w r1, r1, r0
8000628: 4770 bx lr
800062a: bf00 nop
执行上述(包括函数调用)需要21个周期。当我添加一条 eor
指令时:
08000610 <my_function>:
8000610: f04f 20ff mov.w r0, #4278255360 ; 0xff00ff00
8000614: f04f 11ff mov.w r1, #16711935 ; 0xff00ff
8000618: ea81 0100 eor.w r1, r1, r0
800061c: ea81 0100 eor.w r1, r1, r0
8000620: ea81 0100 eor.w r1, r1, r0
8000624: ea81 0100 eor.w r1, r1, r0
8000628: ea81 0100 eor.w r1, r1, r0
800062c: 4770 bx lr
800062e: bf00 nop
这突然变成了 28 个周期。
添加另一个 eor
不会改变周期计数(仍然是 28)。再添加 1 会使周期计数器按预期增加 1(即 29)。
为什么?
eor
应该始终为 1 个周期。有什么想法吗? :)
(这个问题有点类似于 #18960524 ,但没有 mul
和加载指令,可能会弄乱事情。)
最佳答案
核心没有缓存*,但系统肯定有 - 即 ST 的“ART Accelerator”。
如 the TRM 第 3.5.2 节所述,这个东西位于总线路径中,从闪存中进行全宽(128 位)读取,然后根据请求将这些指令提供给核心的 ICode 接口(interface)。
第 3.5.1 节记录了闪存等待状态数量与时钟速度和电压配置的关系,这对于 STM32F407 来说意味着最坏情况下最多为 7 个周期。我将从问题的本质猜测您可能尚未启用加速器的预取或指令缓存功能,这意味着您将暂停每 16 字节的指令 n 在从闪存中拖入下一个 block 时循环这些等待状态。
数学变得比我现在想要计算的更尴尬,但足以说明 21 个周期是至少 7 个执行周期、2 个管道重新填充的重叠组合(每个周期 1-3 个周期)调用并返回)和至少 2*n 个等待状态以从闪存获取至少 2 个 block 。
现在,值得注意的是,第一个函数的长度为 28 字节,而第二个函数的长度为 32 - 即两个 16 字节的 block 。第二个值得注意的事实是:M4 的 ICode 接口(interface)仅执行 32 位读取,然后从该读取阶段为管道的获取阶段提供数据(我假设当管道仅消耗第一个半字时,它只是简单地转动拇指一个周期)。我非常有信心,您在第二个示例中看到的是两者之间不愉快的交互 - 通过一些有根据的猜测,我想象了这样的情况:
bx lr
并从同一指令字获取 0x800062e 时,ICode 接口(interface)稍作喘息,但加速器现在正在等待闪存传送 0x8000630-0x8000640 的读取数据.lr
持有的任何地址(然后再等待 n 个周期才能实际获取它)。 如果您确实想尝试考虑每个周期,那么查看 FLASH_ACR 似乎应该可以更清楚地了解您的配置是什么 - 除非您将整个时钟精确到 ARM 的零等待状态配置核心时序假设( note the first paragraph ),您将不得不考虑的不仅仅是核心。更一般地说,我建议“在不彻底研究供应商文档的情况下对微 Controller 进行编程”与“简单地走进魔多”一样;)
* Cortex-M7 是第一个真正拥有自己的内部缓存的 ARM M 级内核。
关于assembly - 了解 Cortex M4 上的周期计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34725105/
我开始在 Ethereum blockchain 上了解如何开发智能合约以及如何写 web-script用于与智能合约交互(购买、销售、统计......)我得出了该怎么做的结论。我想知道我是否正确理解
我正在 UIView 中使用 CATransform3DMakeRotation,并且我正在尝试进行 45º,变换就像向后放置一样: 这是我拥有的“代码”,但显然没有这样做。 CATransform3
我目前正在测试 WebRTC 的功能,但我有一些脑逻辑问题。 WebRTC 究竟是什么? 我只读了“STUN”、“P2P”和其他...但是在技术方面什么是正确的 WebRTC(见下一个) 我需要什么
我在看 DelayedInit在 Scala in Depth ... 注释是我对代码的理解。 下面的 trait 接受一个非严格计算的参数(由于 => ),并返回 Unit .它的行为类似于构造函数
谁能给我指出一个用图片和简单的代码片段解释 WCF 的资源。我厌倦了谷歌搜索并在所有搜索结果中找到相同的“ABC”文章。 最佳答案 WCF 是一项非常复杂的技术,在我看来,它的文档记录非常少。启动和运
我期待以下 GetArgs.hs打印出传递给它的参数。 import System.Environment main = do args main 3 4 3 :39:1: Coul
private int vbo; private int ibo; vbo = glGenBuffers(); ibo = glGenBuffers(); glBindBuffer(GL_ARRAY_
我正在尝试一个 for 循环。我添加了一个 if 语句以在循环达到 30 时停止循环。 我见过i <= 10将运行 11 次,因为循环在达到 10 次时仍会运行。 如果有设置 i 的 if 语句,为什
我正在尝试了解 WSGI 的功能并需要一些帮助。 到目前为止,我知道它是一种服务器和应用程序之间的中间件,用于将不同的应用程序框架(位于服务器端)与应用程序连接,前提是相关框架具有 WSGI 适配器。
我是 Javascript 的新手,我正在尝试绕过 while 循环。我了解它们的目的,我想我了解它们的工作原理,但我在使用它们时遇到了麻烦。 我希望 while 值自身重复,直到两个随机数相互匹配。
我刚刚偶然发现Fabric并且文档并没有真正说明它是如何工作的。 我有根据的猜测是您需要在客户端和服务器端都安装它。 Python 代码存储在客户端,并在命令运行时通过 Fabric 的有线协议(pr
我想了解 ConditionalWeakTable .和有什么区别 class ClassA { static readonly ConditionalWeakTable OtherClass
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 5年前关闭。 Improve this questi
我还没有成功找到任何可以引导我理解 UIPickerView 和 UIPickerView 模型的好例子。有什么建议吗? 最佳答案 为什么不使用默认的 Apple 文档示例?这是来自苹果文档的名为 U
我在看foldM为了获得关于如何使用它的直觉。 foldM :: Monad m => (a -> b -> m a) -> a -> [b] -> m a 在这个简单的例子中,我只返回 [Just
答案What are _mm_prefetch() locality hints?详细说明提示的含义。 我的问题是:我想要哪一个? 我正在处理一个被重复调用数十亿次的函数,其中包含一些 int 参数。
我一直在读这个article了解 gcroot 模板。我明白 gcroot provides handles into the garbage collected heap 然后 the handle
提供了一个用例: 流处理架构;事件进入 Kafka,然后由带有 MongoDB 接收器的作业进行处理。 数据库名称:myWebsite集合:用户 并且作业接收 users 集合中的 user 记录。
你好 我想更详细地了解 NFS 文件系统。我偶然发现了《NFS 图解》这本书,不幸的是它只能作为谷歌图书提供,所以有些页面丢失了。有人可能有另一个很好的资源,这将是在较低级别上了解 NFS 的良好开始
我无法理解这个问题,哪个更随机? rand() 或: rand() * rand() 我发现这是一个真正的脑筋急转弯,你能帮我吗? 编辑: 凭直觉,我知道数学答案是它们同样随机,但我忍不住认为,如果您
我是一名优秀的程序员,十分优秀!