- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
据我了解,Cortex M0/M3 处理器只有一个存储空间来保存指令和数据,并且只能通过内存总线接口(interface)进行访问。因此,如果我理解正确,处理器必须在每个时钟周期读取一条新指令才能进入流水线,但这意味着总线将始终忙于读取指令,因此如何同时读取数据(对于加载字/存储字指令例子)?
此外,从内存中读取指令的延迟是多少?因为如果不是单个周期,那么处理器必须不断地自行停止,直到获取下一条指令,那么它是如何处理的呢?
谢谢
最佳答案
是的,这就是它的发生方式,处理器停顿很多,这种情况在大型处理器和小型处理器上都存在,充其量难以为流水线处理器提供数据(尽管其中一些管道在 cortex-ms 上很浅,但仍然是流水线的)。
我使用过的许多部件,我接触过大多数供应商,闪存的时钟速度是内核的一半,所以即使在零等待状态下,你也只能每隔一个时钟得到一条指令(平均自然会产生开销) ) 如果一次取一个半字,如果一次取一个许多内核提供的字,那么理想情况下是每两个时钟两条指令或每一条指令。 thumb2 当然你会受到打击。 ST 肯定有一个预取器/缓存器的东西,它有一个很好的营销名称,做得很好。其他人也可能会提供这种服务,或者只是依赖于 arm 提供的各种不同的服务。
不同的 cortex-ms 具有不同的总线混合。我讨厌 von-Neumann/Harvard 的引用资料,因为实际的哈佛建筑几乎没有实际用途,因此“修改过的”形容词意味着他们可以做任何事情,并试图吸引在学校教授哈佛意味着表现的人。总线可以有多个传输中的事务,并且有不同数量的总线,这在您进入并释放外围设备的时钟时有些明显,apb1 时钟控制 ahb2 时钟控制等。外围设备,闪存等。但我们可以运行来自 sram 的代码,所以它不是哈佛。忘记哈佛和冯诺依曼术语,只关注实际实现。
总线文档与核心文档一样容易获得。如果您购买了正确的 fpga 板,您可以请求对内核进行免费评估,然后您可以近距离和个人地了解它是如何工作的。
一天结束时会有一些并行性,但在许多芯片上,闪存的速度是一半,所以如果您没有每次获取两个或有其他解决方案,那么如果您有其他相同的总线访问,您几乎无法做到并且经常停滞不前。同样,在许多这些芯片上,外设不能像内核一样快地运行,因此仅此一项就会导致停顿,但即使外设在相同的时钟上运行并不意味着它可以像 sram 一样快地绕过 csr 或数据访问,所以你也会在那里摆摊。
没有理由假设您将从这些部件中获得每个时钟性能的一条指令,而不是全尺寸的 arm 或 x86 或其他。
虽然有一些重要的细节没有记录在案,只有在您获得核心时才能看到,但每个核心和总线上都有文档,以便大致了解如何调整代码以更好地执行或调整您对它的实际执行方式的期望.我知道我已经在这里和其他地方证明了这一点,即使使用 ST 也很容易看到闪存和 sram 之间的性能差异,并看到执行基准测试所需的时钟比指令多。
你的问题在某些方面太宽泛了,cortex-m0 和 m3 完全不同,一个是第一个出来的,有很多功能,另一个是针对尺寸调整的,一般来说东西较少,不一定要竞争这边走。然后延迟多长时间等,严格来说是芯片公司和芯片公司内部的家族,所以问题非常广泛,所有的 cortex-m 产品,对这个问题有几十种不同的答案。 ARM制造内核而不是芯片,芯片供应商制造芯片并从各个地方购买IP并自己制造一些,该芯片的一小部分可能是他们从处理器供应商那里购买的一些IP。
关于arm - cortex M处理器中如何获取指令,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64068303/
Cortex M23/33 的 TrustZone 和 Cortex A 的 TrustZone 有什么区别?我可以开始在 Cortex A 处理器上构建我的 Cortex M23 应用程序原型(pr
Cortex-M3 的初始堆栈指针值位于 0x0 且复位处理程序位于 0x4 的原因是什么?这样做的设计理由是什么? 为什么 ARM 人员不能像对待 Cortex-A 那样将 0x0 留给重置处理程序
为一家公司构建的 Cortex A5 编写的代码能否轻松移植到另一家公司构建的 Cortex A9 上? 我想编写一些在 Atmel 的 SAMA5D4 上运行的裸机 C 代码(Cortex A5),
我决定按照本指南在 XU4 上编译 Qt5.8: http://freecode.hu/sbcomp/2016/08/15/compiling-qt-5-8-on-odroid-xu4/但在第 4 步
我正在使用 Sourcery CodeBench Lite 2012.03-56 编译器和 gdb 套件 texane gdb server . 今天我想尝试使用便宜的 STM32VLDISCOVER
我想知道ARM内核(Cortex-A系列处理器)访问内存的顺序?从内核生成的虚拟地址到内存,再从内存传输指令/数据到内核。考虑核心已经为一些数据/指令生成了一个虚拟地址并且 TLB 有一个未命中,那么
据我了解,Cortex M0/M3 处理器只有一个存储空间来保存指令和数据,并且只能通过内存总线接口(interface)进行访问。因此,如果我理解正确,处理器必须在每个时钟周期读取一条新指令才能进入
Cortex-A57 优化指南指出,大多数在 128 位向量数据上运行的整数指令可以双发出(第 24 页,整数基本 F0/F1,逻辑 F0/F1,执行吞吐量 2)。 然而,根据我们的内部(综合)基准测
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我正在使用 Cortex管理一些用于 React 应用程序的数据。 Cortex's API listing列出了一些只存在于数组上的方法,即 filter 和 find。 给定一个对象: var s
我有一个 KL17,我正在尝试编写一个引导加载程序以允许 OTA 更新。我无法跳转到用户应用程序,这就是我正在尝试的。 void JumpToUserApplication(uint32_t user
我正在尝试调试基于运行 FreeRTOS 的 STM32F3 uC 的应用程序。我已在应用程序的线程上下文中的随机位置手动将 PSP 设置为无效值(例如 0),希望触发 memManageFault/
我有一个关于在 cortex m3 中使用信号量的问题。我发现了一个线程“ARM cortex:mutex using bit banding”ARM cortex: mutex using bit
我已经阅读了有关 Cortex-M3(或 M0)的 ARM 文档,它说它可以用作 NVIC Controller 内的电平感应或脉冲(边沿)中断。问题是,如果这是通过软件完成的,那么如何做到这一点相当
Cortex M架构,典型就是STM32系列,比如STM32F103(Cortex M3)。 Cortex A架构,可以细分为Cortex A7,Cortex A8,Cortex A9,Cor
我正在尝试通过编写自己的启动代码和链接器脚本来学习 ARM 处理器的启动过程。我使用的芯片是LPC810,我遵循了http://midibel.com/blink0.html中的示例, 两个例子都在我
有一个比较: if( val0 > val1 ) 其中val0和val1是双变量。 Apple LLVM编译器生成的代码是 +0x184 vcmpe.f64
在 ARM documentation ,它提到 The Cortex-M4 processor supports ARMv7 unaligned accesses, and performs all
我或多或少有关于 Cortex-M 异常(IRQ 中断)的理论问题。假设我们有两个由同一外部信号触发的外部中断 PINT0 和 PINT1。两个中断(在 NVIC 寄存器 IPR0 中)设置相同的优先
我编写了(IMO)几乎最简单的 ARM 应用程序,但它不起作用:)可能出什么问题了?错过了什么? 闪存写入和 CPU 复位后,寄存器中存在垃圾。 请友善,如果你知道,请告诉我必须做什么才能运行最简单的
我是一名优秀的程序员,十分优秀!