- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
ENQCMD
和 MOVDIR64B
是 Intel DSA 中的两条指令。
MOVDIR64B
reads 64-bytes from the source memory address and performs a 64-byte direct-store operation to the destination address. TheENQCMD
instruction allows software to write commands to enqueue registers, which are special device registers accessed using memory-mapped I/O (MMIO).
我的问题是 - 设计这两条指令的目的是什么?
根据我的理解,设置内存映射IO区(寄存器)需要操作系统支持,即设备驱动程序。设置MMIO区域后,我们可以使用write()
系统调用来访问它,这也是在设备驱动程序中实现的。对于一般架构,Linux 支持iowrite64()
一次写入8 个字节的值。因此,如果我们要写入 64 个字节,需要调用 iowrite64()
8 次。
在 MOVDIR64B
的帮助下,对于 Intel DSA,一个 new API已创建 - __iowrite512()
以原子方式写入 64 个字节。
我同意后一种至少比前一种更有效率,但我对传输数据所需的时间感到困惑。
考虑以下情况:如果给定一个支持MOVDIR64B
和ENQCMD
的设备(Intel DSA),假设我们要将 64 字节的数据从内存传输到MMIO 寄存器。有两种选择:iowrite64()
8次(使用循环);或 __iowrite512()
一次。后一个会比前一个快8倍吗?
我的想法是8倍差的可能性较小,但后者会更快。我可以知道它会多快吗?它记录在任何地方吗?我没有英特尔 DSA,所以我不确定如何测试它。
除此之外,ENQCMD
还有哪些其他好处?会不会分解成几个微操作?如果是,那么执行 ENQCMD
的微操作是什么?
最佳答案
iowrite64 使用 UC 访问 MMIO 空间,因此写入是序列化的,而不是流水线。也就是说,单个 CPU 线程一次只能执行一个 UC 写入,并且 CPU 不会继续执行,直到 MMIO 写入完成。
MOVDIR64B 有可能比单个 iowrite64 更快,因为它使用 WC 内存类型而不是 UC(即使目标地址是 UC)。 CPU发出write后,就可以继续执行了。多个直接商店可以流式传输到设备。这意味着多个直接存储可以从单个 CPU 线程同时运行。 MOVDIRI 也有这种行为。
据我所知,无论大小(1 到 64 字节),实际将数据传输到目的地的时间都是相同的。当然,这取决于 SoC 内数据路径的宽度,对于不同的实现可能会有所不同。
MOVDIR64B 的主要优点是描述符一次全部到达设备,而不是分段到达。设备不必担心接收部分描述符或接收交错的两个描述符的部分。事实上,英特尔 DSA 会忽略对门户的小于 64 字节的写入。
为了充分发挥流式写入的优势,来自单个 CPU 线程的每个 MOVDIR64B 的目标地址应该不同。每个英特尔 DSA 门户都是一个 4096 字节的页面,因此每个门户内有 64 个唯一地址。来自单个 CPU 的描述符写入可以跨 64 个地址 strip 化。 (来自多个 CPU 的写入使用相同地址还是不同地址并不重要,但通常您不会期望多个 CPU 在 DSA 中使用相同的专用 WQ。)
ENQCMD 允许设备响应软件,无论它是否接受描述符。这允许多个应用程序使用相同的共享 WQ,而不会有描述符因共享 WQ 已满而丢失的风险。应用程序可以在没有任何驱动程序参与(设置后)的情况下提交描述符,并且应用程序之间没有任何锁定或通信。
关于linux - ENQCMD 指令的好处和微操作是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72506541/
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve th
使用微 Controller 时,通常您必须对寄存器进行写入和读取,为了使代码更具可读性,您需要定义寄存器地址及其位。这有点好,但是当您的寄存器名称彼此非常相似时,它很快就会变得困惑,例如此处所示 #
微 Controller 背景下的“原子操作”是什么? 我正在研究 TI F28027 MCU。 The data sheet says that its operations are atomic
我正在用 PIC 微 Controller 做一个项目。我有一个 ADC 采样并将数据保存到 RAM 存储器,一旦 RAM 被填满,我需要使用 PIC 微 Controller 通过蓝牙发送它。 我的
如何确定微 Controller 中特定程序所需的堆栈内存? 例如,假设我有一个内部可能有许多子例程或线程的程序。在我开始执行程序之前,我想修复这个程序的堆栈大小。我如何标记堆栈的终点。 最佳答案 我
我知道 printf 和 sprintf 之间的基本功能差异。但是,我想知道它们之间一些与时间/延迟相关的差异。显然,我想在我的一个自定义构建 RTOS 的任务中使用它。你怎么看 ?我想知道更多它会如
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 5 年前。
我有一个一般性的问题。我在微 Controller 上记录错误。但是微 Controller 的资源比 Windows 计算机更有限。在我的例子中,我将 64 个错误代码保存在一个队列中,由 Free
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 6 年前。 Improve th
假设我有一个时钟速度为 20 Mhz 的 8 位定时器。计时器在多少时间内可以计数多远而不溢出。或者1秒内溢出多少次?我知道它可以数到 255 并且会溢出 最佳答案 时间和频率之间的关系是t = 1/
我正在开展一个全面的长期 C 编程项目,该项目需要模块化编程方法。作为设计的一部分,将创建库,因此我想确认头文件组织的正确/错误解释: 问题 假设您正在创建一个库。经过深思熟虑,您决定您希望构想的最终
1. #define timers ((dual_timers *)0x03FF6000) 这是 ARM 微 Controller 中使用的内存映射定义 结构定义在哪里 2. struct dua
我购买了 LinkSprite JPEG 彩色相机和 LPC1768 mbed 微 Controller 。通过“LinkSprite”相机,我可以拍摄 jpeg 格式的图像,根据他们提供的教程,我可
我有很多不同的时间来跟踪我的设计,但没有什么是 super 关键的。 10 毫秒 +/- 几毫秒根本不是什么大问题。但是可能有 10 个不同的定时器同时在不同的周期进行计数,显然我没有足够的专用定时器
是否可以通过串行端口与 PIC 单片机通信 Android 应用程序?我可以使用哪些低成本手机?对不起,我是哥伦比亚人。 最佳答案 不确定 PIC,但是 Arduino可能是一个很好的引用点,并且有一
今天我一直在思考以下问题: 在一台普通的 pc 中,当你分配一些内存时,你向操作系统请求它,它会跟踪哪些内存段被占用,哪些内存段没有被占用,并且不要让你弄乱其他程序的内存等。但是微 Controlle
我已经为微 Controller 的键盘开发了一个 c 驱动程序。我想改变它,例如,当我按下 1 时,它会显示 1,直到我按下另一个数字。截至目前,数字只有在我按下数字时才会改变,这意味着一旦我松开键
我有一个在线程之间共享的 volatile unsigned char array LedState[5] 变量。数组中的每个索引表示一个状态。根据每个状态,LED 将以不同的顺序闪烁。一个线程设置数
我有一个项目要对微 Controller PIC18F 进行编程,我必须将一个开关电路连接到微 Controller 板上,这个开关电路有一个电锁和一个蜂鸣器要连接到它。 锁最初是通电的。假设当我发送
我是一名优秀的程序员,十分优秀!