- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个线程需要将数据从内存缓冲区写入磁盘数千次。我对每次写入需要多长时间有一些要求,因为需要清除缓冲区以使单独的线程再次写入该缓冲区。
我已经用dd测试了磁盘。我没有在其上使用任何文件系统,而是直接写入磁盘(使用direct标志打开它)。我能够以32K的块大小获得约100 MB/s的速度。
在我的应用程序中,我注意到我几乎无法以这种速度将数据写入磁盘。因此,我调查了正在发生的事情,发现有些写入需要很长时间。我的代码块看起来像(顺便说一下,这是在C中):
last = get_timestamp();
write();
now = get_timestamp();
if (longest_write < now - last)
longest_write = now - last;
最佳答案
我假设您正在使用连接到标准计算机中内置磁盘 Controller 的ATA或SATA驱动器。这是一个正确的假设,还是您使用了任何非常规的东西(硬件RAID Controller ,SCSI驱动器,外部驱动器等)?
作为在工作中进行大量磁盘I/O性能测试的工程师,我想说这听起来很像您的写入内容被缓存在某个地方。您的“高延迟” I/O是最终清除了该缓存的结果。即使没有文件系统,也可以将I/O操作缓存在I/O Controller 或磁盘本身中。
为了更好地了解正在发生的情况,不仅要记录最大延迟,还要记录平均延迟。考虑记录最大10-15个延迟样本,这样您可以更好地了解这些高延迟样本的频率。另外,丢弃测试前两到三秒记录的数据,然后开始记录数据。在磁盘测试开始时可能会看到高延迟的I/O操作,这些操作并不能指示磁盘的真实性能(可能是由于磁盘必须恢复到全速,磁头必须这样做较大的初始搜寻,磁盘写入缓存被刷新等)。
如果要对磁盘I/O性能进行基准测试,建议您使用IOMeter之类的工具,而不要使用dd
或自己滚动。 IOMeter使您可以轻松查看更改I/O大小,对齐方式等有什么不同,此外,它还跟踪许多有用的统计信息。
要求在一定时间内进行I/O操作是一件危险的事情。首先,系统上的其他应用程序可以与您竞争磁盘访问或CPU时间,几乎不可能预测它们对您的I/O速度的确切影响。您的磁盘可能遇到坏块,在这种情况下,它必须做一些额外的工作才能在处理I/O之前重新映射受影响的扇区。这引入了不可预测的延迟。您也无法控制OS,驱动程序和磁盘 Controller 的功能。由于许多不可预见的原因,您的I/O请求可能会在这些层之一中进行备份。
如果您对I/O时间有硬限制的唯一原因是因为您的缓冲区正在被重用,请考虑改用算法。尝试使用循环缓冲区,以便您可以在写入数据时从其中清除数据。如果发现填充的速度快于刷新的速度,则可以降低缓冲区使用率。另外,您也可以创建多个缓冲区并在它们之间循环。当一个缓冲区已满时,将该缓冲区写入磁盘并切换到下一个。即使第一个缓冲区仍在写入中,也可以写入新缓冲区。
对评论的回复:
您无法真正“摆脱内核”,它是系统中的最低级别,您必须经历一个或另一个程度。您可能能够为磁盘 Controller 构建驱动程序的自定义版本(前提是它是开源的),并为应用程序使用“高优先级” I/O路径。您仍然受制于磁盘 Controller 的固件以及驱动器本身的固件/硬件,您不一定可以预测或做任何事情。
传统上,硬盘驱动器在执行大型顺序I/O操作时性能最佳。驱动程序,设备固件和OS I/O子系统将这一点考虑在内,并尝试将较小的I/O请求分组在一起,以便它们仅需生成对驱动器的单个大型I/O请求。如果一次仅刷新32K,则您的写操作可能会被缓存在某个级别,合并并一次全部发送到驱动器。通过克服这种结合,您应该减少I/O延迟“尖峰”的数量,并看到更统一的磁盘访问时间。但是,这些访问时间将比您通常看到的中等时间更接近“峰值”中的大时间。延迟峰值对应于一个I/O请求,该请求未与其他任何请求合并,因此不得不吸收磁盘查找的全部开销。请求合并是有原因的;通过 bundle 请求,您可以分摊多个命令上的驱动器查找操作的开销。击败合并将导致您执行比通常更多的查找操作,从而使总体I/O速度降低。这是一个折衷方案:您可以减少平均I/O延迟,但要以偶尔执行异常的高延迟操作为代价。但是,这是一个有益的折衷,因为与禁用合并相关联的平均等待时间的增加几乎总是比具有更一致的访问时间更有利的缺点。
我还假设您已经尝试调整线程优先级,并且这不是您的高带宽生产者线程因CPU时间而耗尽缓冲区刷新线程的情况。你确认了吗?
您说您不想打扰也在系统上运行的高带宽线程。您是否实际测试了各种输出缓冲区的大小/数量并测量了它们对另一个线程的影响?如果是这样,请分享您测量的一些结果,以便我们在集思广益时可以使用更多信息。
考虑到大多数计算机具有的内存量,从32K缓冲区移动到可循环通过4个32K缓冲区的系统对内存使用来说是无关紧要的。在具有1GB内存的系统上,缓冲区大小的增加仅代表系统内存的0.0092%。尝试移至交替/旋转缓冲区的系统(为简单起见,从2开始),并测量对高带宽线程的影响。我敢肯定,额外的32K内存不会对其他线程产生任何明显的影响。这不应该“破坏生产者线程的缓存”。如果您一直在使用这些内存区域,则应始终将它们标记为“正在使用”,并且永远不要从物理内存中交换出来。要刷新的缓冲区必须保留在物理内存中才能使DMA工作,并且第二个缓冲区将在内存中,因为您的生产者线程当前正在对其进行写入。的确,使用额外的缓冲区会减少生产者线程可用的物理内存总量(尽管只是很小的一部分),但是如果您正在运行需要高带宽和低延迟的应用程序,则应将系统设计为它有很多超过32K的可用内存。
与其尝试通过强制硬件和低级软件执行特定性能测试来解决问题,更简单的解决方案是调整软件以适合硬件。如果将最大写入延迟测量为1秒(为了获得更好的整数),请编写程序,以使刷新到磁盘的缓冲区至少需要重用2.5-3秒。这样,您可以覆盖最坏的情况,并提供安全余量,以防万一确实发生了意外情况。如果您使用的系统会旋转3-4个输出缓冲区,则不必担心在刷新缓冲区之前重新使用缓冲区。您将无法过于紧密地控制硬件,并且如果您已经在写入原始卷(没有文件系统),那么您与硬件之间就没有太多可以操纵或消除的东西。如果您的程序设计不灵活,并且看到 Not Acceptable 延迟峰值,则可以始终尝试更快的驱动器。固态驱动器不必“寻求”进行I/O操作,因此您应该看到相当均匀的硬件I/O延迟。
关于c - 实时写入磁盘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3525329/
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 此帖子已于 8 个月
除了调试之外,是否有任何针对 c、c++ 或 c# 的测试工具,其工作原理类似于将独立函数复制粘贴到某个文本框,然后在其他文本框中输入参数? 最佳答案 也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法,例如将分辨率加倍或输入负值,但它永远无法将窗口放在我的第二台显示器上。 关于如何在 C/C++/c# 中执行此操作的任何线索 最
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。 我正在尝试编写一个 C# 程序,它将使用 DES 算法进行加密和解密。我需要一些实
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
有没有办法强制将另一个 窗口置于顶部? 不是应用程序的窗口,而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
假设您可以在 C/C++ 或 Csharp 之间做出选择,并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例,那么构建套接字服务器应用程序的最明智选择是什么? 最佳答案 如
你们能告诉我它们之间的区别吗? 顺便问一下,有什么叫C++库或C库的吗? 最佳答案 C++ 标准库 和 C 标准库 是 C++ 和 C 标准定义的库,提供给 C++ 和 C 程序使用。那是那些词的共同
下面的测试代码,我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端 我想也许我应该使用
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码,但我不想与雇主共享该函数的代码。相反,我只想让他有权在他自己的代码中调用该函数。是否可以?我想到了这两种方法 - 在
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等,
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一些 C 代码,将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6
我是一名优秀的程序员,十分优秀!