- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在开发 Linux 驱动程序,发现在某些情况下 copy_to_user()
花费的时间比预期的要长得多。我想它可能正在等待 mm->mmap_sem 信号量
,也许吧?在不利情况下似乎还有额外的 CPU 事件。
如果您能提供有关如何进一步调查此问题和/或如何处理的建议,我将不胜感激。
更多细节:
该平台有一个 I7 和 2 个以 2.5GHz 运行的物理内核,32 位 X86 构建 Linux 2.6.32 .驱动程序通过 PCI Express 接受数据,并通过字符设备将其提供给用户空间。测试进程以高优先级运行,读入我认为已分页的缓冲区。目标是支持相当高的数据速率,目前为每秒几百兆比特,最终约为 1Gbps,持续至少几秒钟。
我的测试涉及在一秒左右读取 25MB 数据。有了正确的数据集,驱动程序可以以 100Mbps 或 400Mbps 可靠地接收。对于略有不同的 100Mbps 数据,它偶尔会失败。驱动程序和测试工具都不关心数据的内容,所以我希望它不会有什么不同。到达时间和突发性可能存在统计差异,但在阅读时间戳列表时没有大到足以脱颖而出的程度。
问题的直接原因是接收缓冲区溢出(大约 1MB)。这是由于进程读取速度太慢,进而是copy_to_user()
耗时过长的结果。一个副本通常传输几百个字节。对于良好的 100Mbps 输入,此函数相当快地返回,根据循环计数判断,通常低于一微秒。对于有问题的 100Mbps 数据,一些调用需要长达 10 毫秒,而且这种情况可能会发生多次,而不仅仅是一次性的。
I7Z 工具 ( link here ) 指示 CPU 事件的差异。在处理良好的 100Mbps 数据时,一个内核大部分时间处于电源状态 C1
,另一个主要处于 C6
(低功耗)。对于坏数据,一个核心主要处于 C0
(最活跃状态),另一个核心可能将 0% 到 70% 的时间花费在 C1
中,其余主要在 C6
中。所以它看起来像是在进行正常处理加上大量额外的 C0
。也许旋转很多?
驱动和测试工具相关部分的伪代码总结:
pseudo_interrupt_handler()
{
if(DMA finished) {
advance head;
wake_up_interruptible();
}
if(new data && no DMA in progress) {
start DMA into head;
}
}
pseudo_file_read(filp, user buf, size)
{
wait_event_interruptible(head != tail);
while(head != tail && space in user buf) {
copy_to_user(from tail);
advance tail;
}
return total copied;
}
pseudo_test_process()
{
buffer = malloc(25MB);
write to each page in buffer; // page in
while(buffer not full) {
read(STDIN_FILENO, position in buffer, 4000B);
advance position in buffer
}
}
我目前没有令人满意的解决方法。我可以在驱动程序中缓冲更多数据,但这只能帮助解决暂时的延迟。这个问题似乎正在系统地减慢速度并限制整体数据速率。如果没有其他解决方案,mmap 是可能的,但这需要对现有应用软件进行大量更改。
更新(一月)。感谢您的建议。我现在正在通过扩大和重组缓冲区来解决这个问题。我们现在使用较少数量的较大 copy_to_user()
操作,因此一小部分较慢的操作影响较小。
更新(六月)。正如建议的那样,我已经实现了一个 mmap() 接口(interface),它确实绕过了这个问题。没有更多的 copy_to_user() 瓶颈。
最佳答案
copy_to_user() 和 copy_from_user() 总是涉及复制数据,这本质上是一个缓慢的过程(当然,取决于观点)。为了获得最佳性能,唯一方法是“mmap”。请参阅以下来自 here 的摘录!
Memory mapping is the only way to transfer data between user and kernel spaces that does not involve explicit copying, and is the fastest way to handle large amounts of data.
关于Linux驱动开发: how to investigate copy_to_user() timing?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20365114/
我正在尝试为基于 arm 的板交叉编译驱动程序。在 make 文件中,包含文件的搜索路径是主机内核的路径,即它指向 ubuntu 附带的 linux 头文件。我在主机系统(i7/ubuntu)上也有目
1、准备材料 开发板(正点原子stm32f407探索者开发板V2.4) 。 STM32CubeMX软件(Version 6.10.0) 。 野火DAP仿真器 。 keil µVis
是否可以通过 c# 应用程序“驱动”excel(即从 excel gui 下拉列表中选择某些内容,按下按钮并读取特定单元格的内容)? 这并不是真正用于测试,而是用于类似于 selenium 的数据报废
给定任何具有超过 5 个 View 和 View 模型的中间 MVVM 应用程序,是否有任何推荐的设计模式来说明如何为此类应用程序搭建脚手架? 现在我通常有一个在 App.OnStartup 中创建的
我想知道如何使用曼哈顿距离启发式来驱动 NxN 二维数组中的搜索。我有以下曼哈顿距离: private int manhattan(int[] pos, int tile) { int
我试图了解 CUmodule 在 CUDA 驱动程序 API 函数中实际上代表什么。 许多 CUDA 驱动程序 API 函数都有一个 CUmodule 句柄,但它是什么?它是引导驱动程序调用过程的 d
我正在尝试创建一个 java 程序,它将创建 excel 文件并将其上传到谷歌驱动器中。上传后我需要它来授予权限。我已经完成了所有这些,但问题在于尝试将 excel 文件转换为 google 文件,以
我正在拼命尝试从 Linux(Raspbian 内核 4.4.12-v7+)与使用 TIUSB3410 USB 部件的设备进行通信。 这是 dmesg 的输出: [ 2730.016013] usb
我有一个关于在 PCIe 上使用突发读写的问题。我有一个 fpga,它通过 PCIe 连接到 cpu。我有一个简单的驱动程序,仅用于测试。驱动程序向 FPGA 写入数据以及从 FPGA 读取数据。 f
我有大约 500 条通往特定页面的可能路径,我需要测试所有这些路径。该页面的每个路径看起来都类似于此(使用 PHP 网络驱动程序;通常有大约 10 个步骤): // Navigate to form
如果chrome驱动的版本和当前的chrome版本不同,我想写一个python代码,下载并运行与当前chrome版本匹配的chrome驱动。 这就是我一直在寻找的东西 driver = webdriv
我在 Centos 7 Linux 机器上尝试通过 pyodbc 连接到 SQL 数据库。我了解到您需要设置 DSN,您可以通过安装 freetds 驱动程序并执行以下操作来实现: import py
是否可以使用 NUnit 通过 NDepend 运行 CQL 查询?如果能够将 NDepend dll 包含在 UnitTests 库中并编写如下测试,那就太好了: [Test] public voi
我在 cassandra 中有巨大的表,超过 20 亿行并且还在增加。这些行有一个日期字段,它遵循日期桶模式以限制每一行。 即便如此,对于某个特定日期,我也有超过一百万条条目。 我想尽快读取和处理每一
考虑以下示例,其中一个模块的输出 (inner::out) 应该驱动两个输出(outer::out 和 outer::out2) 的上层层次: #include SC_MODULE(inner) {
我不确定是否可以有一个具有多个 MySQL 根的连接器。当我尝试只使用一根根时,它效果完美。我的有 2 个根的代码如下所示: [ 'locale' => 'es_ES.UTF-8',
我的桌面APP无法注册Mysql JDBC驱动 我下载mysql-connector-java-5.1.16.zip 解压mysql-connector-java-5.1.16-bin.jar并将其放
我有一个无限循环等待输入的 python 脚本,然后输入发生时做一些事情。我的问题是制作 python告诉 emacs 做某事。我只需要一些方法来发送 emacs 输入并让 emacs 评估该输入。
我最初问的没有明确说明我的问题/问题,所以我会更好地解释它。我有一个将 JDialog 设置为可见的 JButton。 JDialog 有一个 WindowListener 将其设置为在 window
假设“doc”是我想插入到 MongoDB 集合中的一些文档,而“collection”是我要将文档插入到的集合。 我有如下内容: try { WriteConcern wc = new Wr
我是一名优秀的程序员,十分优秀!