gpt4 book ai didi

C++连续读取文件

转载 作者:塔克拉玛干 更新时间:2023-11-03 07:30:47 25 4
gpt4 key购买 nike

我有一个生产者/消费者设置:我们的客户端向我们提供服务器处理的数据,而我们的客户端通过不断写入文件将数据提供给我们的服务器。我们的服务器使用 inotify 来查找任何文件修改,并处理新数据。

问题:服务器中的文件读取器有一个大小为 4096 的缓冲区。我有一个模拟上述情况的单元测试。测试不断地写入一个打开的文件,文件读取器不断地尝试读取一个进程。但是,我注意到在读取第一个比 4096 小得多的记录后,在 ifstream 对象中设置了一个错误标志。这意味着不会处理任何到达的新数据。一个简单的解决方法似乎是在每次读取后调用 ifstream::clear,这确实解决了问题。但是,这是怎么回事?这是正确的解决方案吗?

最佳答案

首先,根据您的系统,它可能会或可能不会读取另一个进程写入的文件:在 Windows 上,打开文件时的正常设置是独占访问。我对 Window 了解不够,无法判断是否还有其他设置。在 POSIX 系统上,具有适当权限的文件可以被不同的进程打开以进行读写。听起来您正在使用 Linux,即遵循 POSIX 规范的东西。

不过,根据更改轮询文件的方法并不完全理想:正如您所注意到的,每次到达当前文件的末尾时都会出现“错误”。实际上,到达文件末尾并不是真正的错误,但试图解码超出文件末尾的内容是错误的。此外,超出文件末尾的读取仍将设置 std::ios_base::eofbit,因此流不会是 good()。如果您坚持使用这种方法,除了读取文件末尾并以某种方式处理不完整的读取之外别无选择。

但是,如果您可以控制文件的创建,您可以做一个简单的技巧:不是让文件成为普通文件,而是可以创建 mkfifo 来创建 命名管道 使用写入程序将写入的文件名:在 POSIX 系统上打开文件时,如果已有文件,它不会创建新文件,而是使用现有文件。好吧,文件或其他任何由文件名寻址的内容(除了文件和命名管道之外,您还可能看到目录、字符或 block 特殊设备,以及可能的其他内容)。

命名管道是一种奇怪的野兽,旨在让两个进程相互通信:一个进程写入一端的内容在另一端可由另一个进程读取!命名管道本身没有任何内容,也就是说,如果您既需要文件的内容又需要与另一个进程的通信,您可能需要在某处复制内容。打开一个命名管道进行读取,只要它到达文件的当前末尾就会阻塞,即最初读取会阻塞直到有一个写入器。类似地,对命名管道的写入将阻塞,直到有读取器为止。一旦有两个进程通信,在另一个进程退出后读取或写入命名管道时,各自的另一端将收到错误。

关于C++连续读取文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12535381/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com