linux - 映射 MMIO 区域回写不起作用-6ren

linux - 映射 MMIO 区域回写不起作用

转载作者：太空狗更新时间：2023-10-29 11:11:54

25

4

我希望对 PCIe 设备的所有读写请求都由 CPU 缓存缓存。然而，它并没有像我预期的那样工作。

这些是我对回写 MMIO 区域的假设。

写入 PCIe 设备仅在缓存回写时发生。
TLP 负载的大小是缓存 block 大小 (64B)。

但是，捕获的 TLP 不符合我的假设。

每次写入 MMIO 区域时都会写入 PCIe 设备。
TLP 负载大小为 1B。

我使用以下用户空间程序和设备驱动程序将 8 字节的 0xff 写入 MMIO 区域。

用户程序的一部分

struct pcie_ioctl ioctl_control;
ioctl_control.bar_select = BAR_ID;
ioctl_control.num_bytes_to_write = atoi(argv[1]);
if (ioctl(fd, IOCTL_WRITE_0xFF, &ioctl_control) < 0) {
    printf("ioctl failed\n");
}

部分设备驱动

case IOCTL_WRITE_0xFF:
{
    int i;
    char *buff;
    struct pci_cdev_struct *pci_cdev = pci_get_drvdata(fpga_pcie_dev.pci_device);
    copy_from_user(&ioctl_control, (void __user *)arg, sizeof(ioctl_control));
    buff = kmalloc(sizeof(char) * ioctl_control.num_bytes_to_write, GFP_KERNEL);
    for (i = 0; i < ioctl_control.num_bytes_to_write; i++) {
        buff[i] = 0xff;
    }
    memcpy(pci_cdev->bar[ioctl_control.bar_select], buff, ioctl_control.num_bytes_to_write);
    kfree(buff);
    break;
}

我修改了 MTRRs 使相应的 MMIO 区域回写。 MMIO区域从0x0c7300000开始，长度为0x100000(1MB)。以下是不同策略的 cat/proc/mtrr 结果。请注意，我将每个区域设为独占。

不可缓存

reg00: base=0x080000000 ( 2048MB), size= 1024MB, count=1: uncachable
reg01: base=0x380000000000 (58720256MB), size=524288MB, count=1: uncachable
reg02: base=0x0c0000000 ( 3072MB), size=   64MB, count=1: uncachable
reg03: base=0x0c4000000 ( 3136MB), size=   32MB, count=1: uncachable
reg04: base=0x0c6000000 ( 3168MB), size=   16MB, count=1: uncachable
reg05: base=0x0c7000000 ( 3184MB), size=    1MB, count=1: uncachable
reg06: base=0x0c7100000 ( 3185MB), size=    1MB, count=1: uncachable
reg07: base=0x0c7200000 ( 3186MB), size=    1MB, count=1: uncachable
reg08: base=0x0c7300000 ( 3187MB), size=    1MB, count=1: uncachable
reg09: base=0x0c7400000 ( 3188MB), size=    1MB, count=1: uncachable

写合并

reg00: base=0x080000000 ( 2048MB), size= 1024MB, count=1: uncachable
reg01: base=0x380000000000 (58720256MB), size=524288MB, count=1: uncachable
reg02: base=0x0c0000000 ( 3072MB), size=   64MB, count=1: uncachable
reg03: base=0x0c4000000 ( 3136MB), size=   32MB, count=1: uncachable
reg04: base=0x0c6000000 ( 3168MB), size=   16MB, count=1: uncachable
reg05: base=0x0c7000000 ( 3184MB), size=    1MB, count=1: uncachable
reg06: base=0x0c7100000 ( 3185MB), size=    1MB, count=1: uncachable
reg07: base=0x0c7200000 ( 3186MB), size=    1MB, count=1: uncachable
reg08: base=0x0c7300000 ( 3187MB), size=    1MB, count=1: write-combining
reg09: base=0x0c7400000 ( 3188MB), size=    1MB, count=1: uncachable

回写

reg00: base=0x080000000 ( 2048MB), size= 1024MB, count=1: uncachable
reg01: base=0x380000000000 (58720256MB), size=524288MB, count=1: uncachable
reg02: base=0x0c0000000 ( 3072MB), size=   64MB, count=1: uncachable
reg03: base=0x0c4000000 ( 3136MB), size=   32MB, count=1: uncachable
reg04: base=0x0c6000000 ( 3168MB), size=   16MB, count=1: uncachable
reg05: base=0x0c7000000 ( 3184MB), size=    1MB, count=1: uncachable
reg06: base=0x0c7100000 ( 3185MB), size=    1MB, count=1: uncachable
reg07: base=0x0c7200000 ( 3186MB), size=    1MB, count=1: uncachable
reg08: base=0x0c7300000 ( 3187MB), size=    1MB, count=1: write-back
reg09: base=0x0c7400000 ( 3188MB), size=    1MB, count=1: uncachable

以下是不同策略下 8B 写入的波形捕获。我使用集成逻辑分析仪 (ILA) 来捕获这些波形。请在设置 pcie_endpoint_litepcietlpdepacketizer_tlp_req_valid 时观看 pcie_endpoint_litepcietlpdepacketizer_tlp_req_payload_dat。您可以通过计算这些波形示例中的 pcie_endpoint_litepcietlpdepacketizer_tlp_req_valid 来计算数据包的数量。

不可缓存:link -> 正确，1B x 8 包
写入合并:link -> 正确，8B x 1 包
回写:link -> 意外，1B x 8 数据包

系统配置如下。

CPU:Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz
操作系统:Linux内核4.15.0-38
PCIe 设备:使用 litepcie 编程的 Xilinx FPGA KC705

相关链接

最佳答案

简而言之，似乎映射 MMIO 区域回写在设计上不起作用。

如果有人认为可行，请上传答案。

我是来寻找 John McCalpin 的文章和答案的。首先，映射 MMIO 区域回写是不可能的。其次，在某些处理器上可以使用变通方法。

映射 MMIO 区域回写是不可能的
Quote from this link

FYI: The WB type will not work with memory-mapped IO. You can program the bits to set up the mapping as WB, but the system will crash as soon as it gets a transaction that it does not know how to handle. It is theoretically possible to use WP or WT to get cached reads from MMIO, but coherence has to be handled in software.

Quote from this link

Only when I set both PAT and MTRR to WB does the kernel crash
在某些处理器上可能有解决方法
Notes on Cached Access to Memory-Mapped IO Regions, John McCalpin

There is one set of mappings that can be made to work on at least some x86-64 processors, and it is based on mapping the MMIO space twice. Map the MMIO range with a set of attributes that allow write-combining stores (but only uncached reads). Map the MMIO range a second time with a set of attributes that allow cache-line reads (but only uncached, non-write-combined stores).

关于linux - 映射 MMIO 区域回写不起作用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53311131/

25

4

0

文章推荐： java - Spring Boot - Docker 日志

文章推荐： Objective-C - 只读变量不可分配？

文章推荐： css - 使用作用域 CSS 创建 SVG 组件

实例分析Try {} Catch{} 作用
今天有小伙伴给我留言问到，try{...}catch(){...}是什么意思？它用来干什么？简单的说他们是用来捕获异常的下面我们通过一个例子来详细讲解下
html - 列表社交媒体链接的 ARIA 作用
我正在努力提高网站的可访问性，但我不知道如何在页脚中标记社交媒体链接列表。这些链接指向我在 facecook、twitter 等上的帐户。我不想用 role="navigation" 标记这些链接，因
java.util.Timer SystemTime 作用？
说现在是 6 点，我有一个 Timer 并在 10 点安排了一个 TimerTask。之后，System DateTime 被其他服务(例如 ntp)调整为 9 点钟。我仍然希望我的 TimerTas
php - 什么是 Doctrine hydration 作用？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
python入门:argparse浅析 nargs='+'作用
我就废话不多说了，大家还是直接看代码吧~ ? 1
Maven是什么?Maven的概念+作用+仓库的介绍+常用命令的详解
Maven系列1 1.什么是Maven？ Maven是一个项目管理工具，它包含了一个对象模型。一组标准集合，一个依赖管理系统。和用来运行定义在生命周期阶段中插件目标和逻辑。核心功能 Mav

首页

博学

6Ren·AI

商城

linux - 映射 MMIO 区域回写不起作用