gpt4 book ai didi

c++ - fwrite 比 Windows 中的 WriteFile 快吗?

转载 作者:可可西里 更新时间:2023-11-01 16:27:43 25 4
gpt4 key购买 nike

我一直认为 WriteFile 比 fwrite 更高效,因为 fwrite 内部调用了 WriteFile,但下面的测试代码表明 fwrite 比 WriteFile 快得多。

fwrite 花费 2 毫秒,而 WriteFile 需要 27000(FILE_ATTRIBUTE_NORMAL),两者都在每次写入调用后刷新。如果我用 FILE_FLAG_WRITE_THROUGH 调用 WriteFile,并注释 FlushFileBuffers(wfile) 行,WriteFile 会更快,它花费 800。

那么 fwrite 真的调用了 WriteFile 吗?是什么造成如此巨大的差异? fwrite 在内部是如何工作的?如何使用 API 比 fwrite 更有效地将数据写入文件?(无缓冲,同步)。

   #include <Windows.h>
#include <stdio.h>
#include <iostream>

int main() {
FILE* cfile = fopen("file1.txt", "w");
HANDLE wfile = CreateFile("file2.txt", GENERIC_WRITE, FILE_SHARE_READ, NULL, CREATE_ALWAYS,
/*FILE_ATTRIBUTE_NORMAL*/FILE_FLAG_WRITE_THROUGH, NULL);
DWORD written = 0;

DWORD start_time, end_time;
char * text = "test message ha ha ha ha";
int size = strlen(text);
int times = 999;

start_time = timeGetTime();
for(int i = 0; i < times; ++i) {
fwrite(text, 1, size, cfile);
fflush(cfile);
}
end_time = timeGetTime();
std::cout << end_time - start_time << '\n';

start_time = timeGetTime();
for(int i = 0; i < times; ++i) {
WriteFile(wfile, text, size, &written, NULL);
//FlushFileBuffers(wfile);
}
end_time = timeGetTime();
std::cout << end_time - start_time << std::endl;

system("pause");
return 0;
}

更新:感谢您的回答,这里是答案:查看VS目录\VS\crt\src\fflush.c:

    //fflush.c
int __cdecl _fflush_nolock (FILE *str) {
//irrelevant codes
if (str->_flag & _IOCOMMIT) {
return (_commit(_fileno(str)) ? EOF : 0);
}
return 0;
}

所以这里有一个_IOCOMMIT标志,然后看...\src\fdopen.c

    FILE * __cdecl _tfdopen (int filedes, const _TSCHAR *mode) {
//irrelevant codes
while(*++mode && whileflag)
switch(*mode) {
//...
case _T('c'):
if (cnflag)
whileflag = 0;
else {
cnflag = 1;
fileflag |= _IOCOMMIT;
}
break;
//...
}

_tfopen是fopen内部调用的,引用fopen的文档,我发现是这样的:

"模式:'c'

启用关联文件名的提交标志,以便在调用 fflush 或 _flushall 时将文件缓冲区的内容直接写入磁盘。"因此,只有在调用 fopen 时设置了 'c' 标志时,才会调用 _commit。

_commit 函数最终会调用 FlushFileBuffers。

除此之外,我发现当我只写少量数据到文件时(不超过缓冲区大小),如果没有fflush的fwrite,显然不会写文本,而对于API,WriteFile之后即使我不写' t 调用 FlushFileBuffers,当我打开文件(程序处于 sleep 状态)时,内容会自动写入文件,这也是我对 flush 感到困惑的原因之一,这个操作可能是由操作系统完成的,WriteFile 将数据复制到系统缓存,其文件缓冲区由操作系统管理,因此 fflush() 只在内部调用 WriteFile 而没有真正刷新是合理的,系统知道何时刷新它们,可能是在文件句柄关闭时,或者当另一个 I/O 访问此文件时发生。所以我将基准修改为:

      start_time = timeGetTime();
for(int i = 0; i < times; ++i) {
fwrite(text, 1, size, cfile);
fflush(cfile);
}
end_time = timeGetTime();
std::cout << end_time - start_time << '\n';

start_time = timeGetTime();
for(int i = 0; i < times; ++i) {
WriteFile(wfile, text, size, &written, NULL);
}
end_time = timeGetTime();
std::cout << end_time - start_time << std::endl;

结果是次数:99999fwrite:217写入文件:171

所以,总而言之,要加快API文件的写入操作:

  1. 不要显式调用FlushFileBuffers,系统缓存中的数据会在需要时刷新到磁盘。

  2. 为 WriteFile 获取一个缓冲区,就像 fwrite 一样,因为 API 调用比简单的 memcpy 花费更多的时间,当缓冲区已满时调用 WriteFile。

最佳答案

使用类似 Process Monitor (procmon) 的工具从 Sysinternals 中,您会看到对 fflush() 的调用与 FlushFileBuffers(wfile)(或 FILE_FLAG_WRITE_THROUGH 标记为 CreateFile())。

fwrite() 会将数据写入缓冲区,直到缓冲区填满,这将导致它将缓冲区中的数据发送到 WriteFile() 调用。当您调用 fflush() 时,所发生的只是缓冲区中当前的数据被传递给对 WriteFile() 的调用 - fflush() 不调用 FlushFileBuffers():

1:21:32.9391534 AM  test.exe    6132    WriteFile   C:\temp\file1.txt   SUCCESS Offset: 0, Length: 24
1:21:32.9392200 AM test.exe 6132 WriteFile C:\temp\file1.txt SUCCESS Offset: 24, Length: 24
1:21:32.9392340 AM test.exe 6132 WriteFile C:\temp\file1.txt SUCCESS Offset: 48, Length: 24
1:21:32.9392436 AM test.exe 6132 WriteFile C:\temp\file1.txt SUCCESS Offset: 72, Length: 24
1:21:32.9392526 AM test.exe 6132 WriteFile C:\temp\file1.txt SUCCESS Offset: 96, Length: 24
1:21:32.9392623 AM test.exe 6132 WriteFile C:\temp\file1.txt SUCCESS Offset: 120, Length: 24

为了比较,这里有一个来自 fwrite() 循环的跟踪示例,没有 fflush() 调用:

1:27:28.5675034 AM  test.exe    3140    WriteFile   C:\temp\file1.txt   SUCCESS Offset: 0, Length: 1,024
1:27:28.5676098 AM test.exe 3140 WriteFile C:\temp\file1.txt SUCCESS Offset: 1,024, Length: 1,024
1:27:28.5676399 AM test.exe 3140 WriteFile C:\temp\file1.txt SUCCESS Offset: 2,048, Length: 1,024
1:27:28.5676651 AM test.exe 3140 WriteFile C:\temp\file1.txt SUCCESS Offset: 3,072, Length: 1,024

下面是 WriteFile() 循环的跟踪片段(带有 FILE_ATTRIBUTE_NORMAL 标志和对 FlushFileBuffers() 的显式调用 -因为 FlushFileBuffers() 调用显示在跟踪中,而不是仅显示为第二个 4KB WriteFile() 调用,所以它只是使跟踪中发生的事情更容易看到。

1:21:29.0068503 AM  test.exe    6132    WriteFile   C:\temp\file2.txt   SUCCESS Offset: 0, Length: 24, Priority: Normal
1:21:29.0069197 AM test.exe 6132 FlushBuffersFile C:\temp\file2.txt SUCCESS
1:21:29.0069517 AM test.exe 6132 WriteFile C:\temp\file2.txt SUCCESS Offset: 0, Length: 4,096, I/O Flags: Non-cached, Paging I/O, Synchronous Paging I/O, Priority: Normal
1:21:29.0087574 AM test.exe 6132 WriteFile C:\temp\file2.txt SUCCESS Offset: 24, Length: 24
1:21:29.0087798 AM test.exe 6132 FlushBuffersFile C:\temp\file2.txt SUCCESS
1:21:29.0088087 AM test.exe 6132 WriteFile C:\temp\file2.txt SUCCESS Offset: 0, Length: 4,096, I/O Flags: Non-cached, Paging I/O, Synchronous Paging I/O, Priority: Normal
1:21:29.0102260 AM test.exe 6132 WriteFile C:\temp\file2.txt SUCCESS Offset: 48, Length: 24
1:21:29.0102428 AM test.exe 6132 FlushBuffersFile C:\temp\file2.txt SUCCESS
1:21:29.0102701 AM test.exe 6132 WriteFile C:\temp\file2.txt SUCCESS Offset: 0, Length: 4,096, I/O Flags: Non-cached, Paging I/O, Synchronous Paging I/O, Priority: Normal
1:21:29.0113444 AM test.exe 6132 WriteFile C:\temp\file2.txt SUCCESS Offset: 72, Length: 24
1:21:29.0113602 AM test.exe 6132 FlushBuffersFile C:\temp\file2.txt SUCCESS
1:21:29.0113848 AM test.exe 6132 WriteFile C:\temp\file2.txt SUCCESS Offset: 0, Length: 4,096, I/O Flags: Non-cached, Paging I/O, Synchronous Paging I/O, Priority: Normal

所以您的基准测试显示出 WriteFile() 循环的严重劣势的原因仅仅是因为您对 FlushFileBuffers() 进行了大约一千次调用在 fwrite() 循环中。

关于c++ - fwrite 比 Windows 中的 WriteFile 快吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14290337/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com