- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个评估套件,它具有 ARM Cortex-A8 内核的实现。处理器数据表指出它具有
ARM Cortex A8™ core, which operates at speeds as high as 800MHz and Up to 200MHz DDR2 RAM.
最佳答案
处理器与内部缓存(实际上是几个)一起工作,它可以“全速”访问。缓存很小(通常为 8 到 32 KB)并且由来自外部 RAM 的块(“缓存线”)填充(缓存线将是几十个连续字节)。当代码需要一些当前不在缓存中的数据时,处理器将不得不从主 RAM 中获取该行;这称为缓存未命中。
从主 RAM 获取缓存行的速度由两个参数描述,称为延迟和带宽。延迟是从处理器发出请求到收到第一个缓存行字节之间的时间量。典型的延迟约为 30ns。在 800 MHz 时,30ns 意味着 24 个时钟周期。带宽描述了每纳秒可以在总线上发送多少字节。 “200 MHz DDR2”意味着总线时钟将以 200 MHz 运行。 DDR2 RAM 每个周期可以发送两个数据元素(因此每秒可以发送 4 亿个元素)。带宽则取决于 CPU 和 RAM 之间有多少线:使用 64 位总线和 200 MHz DDR2 RAM,在理想条件下您可能希望达到 3.2 GBytes/s。因此,虽然获取第一个字节需要相当长的时间(相对于 CPU 可以执行的操作而言延迟很高),但缓存行的其余部分被读取得非常快。
在另一个方向:CPU 将一些数据写入其缓存,并且一些电路会在空闲时将修改传播到主 RAM。
上面的描述过于简单;缓存和缓存管理是一个复杂的领域。底线如下:如果您的代码使用内存中的大数据表并以看似随机的方式访问它们,那么应用程序将会很慢,因为大部分时间处理器只会等待来自主内存的数据。另一方面,如果您的代码可以在很少的 RAM 下运行,不到几十 KB,那么它很可能大部分时间都在最内部的缓存中运行,而外部 RAM 速度将不重要。以与缓存一起运行良好的方式进行内存访问的能力称为引用的局部性。
见 Wikipedia page on caches有关缓存问题的介绍和指针。
(大型预计算表在 80 年代是一种常见的优化技巧,因为当时处理器并不比 RAM 快,而且单周期内存访问是规则。这就是为什么 8 MHz 摩托罗拉 68000 CPU 没有缓存的原因。但是现在早就不见了。)
关于memory - 澄清 : Processor operates at 800 Mhz and 200Mhz DDR RAM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4096049/
\Processor(_Total)\% Processor Time 是什么意思。基本假设是什么? 描述:因为这是来自 WAD 性能表计数器的性能计数器;因为这是 Azure,是否有任何测量相同的假
我有一个执行有限差分计算的 CUDA 代码。该代码在 Tesla M2090 处理器上运行良好,没有错误。相同的代码会在 Tesla T10 处理器中导致大量错误。我的结果中有很多零。 有谁知道这两种
我有一个执行有限差分计算的 CUDA 代码。该代码在 Tesla M2090 处理器上运行良好,没有错误。相同的代码会在 Tesla T10 处理器中导致大量错误。我的结果中有很多零。 有谁知道这两种
我正在尝试让 QueryDSL 用于 Spring Roo 项目。 这是我的插件配置: com.mysema.maven maven-
关注 this question ,我正在尝试从 this tutorial 组装示例代码 #include "p10f200.inc" ; CONFIG __CONFIG _WDT_OFF
我是qemu的新手,我读到它允许单步模式仿真。这很有用,因为我试图在每个周期中转储物理内存的某些地址。不幸的是,qemu文档非常糟糕。我知道如何从qemu监视器启用单步模式,但是我不知道将要在每个步骤
我的问题来自 Mystical's answer .据我了解,您有一条分支指令,它可以转到另一条指令,例如 0x123344或者它可以继续执行。 如果分支预测器根据过去的模式从其中任何一个进行猜测,它
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
是否由地址总线的大小确定?如果是,那么8086是20位处理器吗?如果没有,为处理器分配8位,16位,32位之类的位的标准是什么? 最佳答案 它的定义不明确。正如xtofl所指出的,广义上讲,它是原子计
我一直在寻找用于撰写技术论文的文字处理器,但我还没有真正找到。拥有一个可以很好地处理数学表达式、代码和伪代码的编辑器真的很不错。我还没有找到一种效果很好的。 有人有什么建议吗? 最佳答案 我个人相信
这个问题看起来太简单了,但我是在看了几个 ppt 后才问的。 这两种方法都提高了指令吞吐量。 super 扩展几乎也总是利用管道。 super 缩放有多个执行单元,管道也是如此,还是我错了? 最佳答案
我目前正在 LogiSim 中开发 6502 的一个子集,在当前阶段我正在确定要实现哪些部分以及可以删除哪些部分。我的主要资源之一是Hanson's Block Diagram . 我目前正在尝试确定
我目前正在 LogiSim 中开发 6502 的子集。我的主要资源之一是Hanson's Block Diagram . 我正在尝试确定应该如何以及在哪里构建电路来更新处理器状态寄存器。在下面的处理器
我对 Apache-airflow 非常陌生,刚开始在 udemy (this course) 中学习类(class)。 我们已收到 YAML 文件,并被要求按照说明安装 Airflow 。我相信我已
对于大学中期项目,我必须设计一个可配置的处理器,用 VHDL 编写代码,然后在 Digilent 的 Spartan 3E FPGA 板上进行综合。我是一个初学者,所以你能指点我一些关于可配置处理器的
我正在尝试获取处理器信息,特别是像 这样的名称Intel(R) Core(TM) i5-7200U CPU @ 2.50GHz . 搜索网络我发现了一个函数,它使用 for-each 为我提供了处理器
我们的项目中有两个注释,我想收集带注释的类并基于两个类列表创建合并的输出。 只用一个 Processor 可以吗?实例?我怎么知道 Processor每个带注释的类都调用了实例? 最佳答案 框架调用
我有以下插入语句: 插入 temp1 值 (test1, test2) 插入 temp2 值 (test3) 预期结果: 插入 temp1 值 (100, 200) 插入 temp2 值 (300)
C99 标准第 7.23.1 节第 1 段定义了几个“时间”术语: Many functions deal with a calendar time that represents the curre
我正在编写注释处理器,我需要 TreeTranslator.visitIdent 来放置静态方法调用。我想我应该使用 TreeMaker.Call 或 TreeMaker.Create,还是应该使用
我是一名优秀的程序员,十分优秀!