- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
假设您正在构建一个日记/预写日志存储系统。您能否通过(针对每个事务)附加数据(使用 write(2))、附加提交标记,然后 fsync-ing 来简单地实现这一点?
要考虑的场景是,如果您对该日志进行大量写入,然后对其进行 fsync,并且 在 fsync 期间 出现故障。 inode 直接/间接 block 指针是否仅在所有数据 block 都被刷新后才被刷新,或者是否不能保证 block 被按顺序刷新?如果是后者,那么在恢复期间,如果您在文件末尾看到一个提交标记,您就不能相信它与前一个提交标记之间的数据是有意义的。因此,您必须依赖另一种机制(至少涉及另一个 fsync)来确定日志文件的一致范围(例如,写入/fsyncing 数据,然后写入/fsyncing 提交标记)。
如果它有所不同,主要是想知道 ext3/ext4 作为上下文。
最佳答案
注意linux和mac os的fsync和fdatasync默认是不正确的。 Windows 默认是正确的,但可以模拟 linux 以进行基准测试。
此外,如果您追加到文件末尾,fdatasync 会发出多次磁盘写入,因为它需要用新长度更新文件 inode 。如果您希望每次提交都写入一次,最好的办法是预先分配日志空间,将日志条目的 CRC 存储在提交标记中,并在提交时发出单个 fdatasync()。这样,无论操作系统/硬件在您背后重新排序多少,您都可以找到实际命中磁盘的日志前缀。
如果您想将日志用于持久提交或预写,事情会变得更难,因为您需要确保 fsync 确实有效。在 Linux 下,您需要使用 hdparm 禁用磁盘写缓存,或者将 barrier 设置为 true 来挂载分区。 [编辑:我被纠正了,屏障似乎没有给出正确的语义。 SATA 和 SCSI 引入了许多原语,例如写屏障和 native 命令队列,这使得操作系统可以导出启用预写日志记录的原语。从我从联机帮助页和在线内容中可以看出,Linux 只将这些公开给文件系统开发人员,而不是用户空间。]
自相矛盾的是,禁用磁盘写入缓存有时会带来更好的性能,因为您可以更好地控制用户空间中的写入调度;如果磁盘排队一堆同步写请求,您最终会向应用程序暴露奇怪的延迟峰值。禁用写入缓存可防止这种情况发生。
最后,真实系统使用组提交,并在并发工作负载下每次提交执行 < 1 次同步写入。
关于linux - 可以通过每次提交使用单个 fsync 来实现日志记录吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3800108/
我通过 C API 使用 RocksDB。 我有一个测试程序,它打开数据库,执行 1,000 次写入(收集启动写入和回调之间的计时数据),执行 1,000 次读取,然后关闭。 这有效。平均写入时间约为
我想问一个基本的问题,即使用fsync之类的系统调用何时有用?我是初学者,我总是给人以写足以写入文件的印象,而使用write的示例实际上在末尾写入了文件。 那么像fsync这样的系统调用的目的是什么?
我对大文件 ftruncate 和 fsync 操作感到惊讶。我编写了一个程序,在 Linux 64 位系统上创建一个空文件,将其截断为 0xffffffff 字节,然后 fsync 它。 在所有操作
我有两个 (POSIX) 线程写入这样的日志文件: pthread_mutex_lock(&log_mutex); fprintf(LOG, "something...\n"); fsync(file
我正在尝试fsync目录,以确保重命名操作发生。我遇到的问题是 Python 不断返回权限错误,即使我对我尝试过的各个文件夹拥有完全权限。 directory = r'C:\Random\Path'
我正在尝试创建一个文件。在这个文件中,我将所有需要处理的文件放在一个脚本中,并将该文件作为参数传递。我的问题是有时列表的长度不足以填满缓冲区,并且没有任何内容写入磁盘。我尝试刷新和 fsync 临时文
假设我将一些文件和目录写入 USB 拇指驱动器。 /media/drive1/newFolder1/ /media/drive1/newFolder1/newfile1 /media/drive1/n
我很难确定将 fsync() 实现到实时系统中的最佳方法是什么。我需要满足的唯一要求是 fsync() 不能中断帧(每帧 100 Hz - 10 ms)。我做了一些初始基准测试,目前我倾向于在每次固定
我们需要一个应用程序尽可能地保证当它报告记录时确实存在。我知道要执行此操作,您需要使用 fsync(fd)。然而,由于某些奇怪的原因,使用 fsync() 似乎加快了写入磁盘的代码,而不是像人们预期的
我有多个线程,每个线程都接受请求,进行一些处理,将结果存储在提交日志中,然后返回结果。为了保证最多 x 秒的数据丢失,这个提交日志需要每 x 秒 fsync 一次。 我想避免线程之间的同步,这意味着他
是否有类似于fsync但使用文件路径而不是文件描述符的linux系统调用?我使用utime修改文件修改时间,文件在U盘中,我需要确保设置utime后时间刷入usb。 最佳答案 据我所知没有。 为此你需
fsync 的联机帮助页说: If the underlying hard disk has write caching enabled, then the data may not really b
假设您正在构建一个日记/预写日志存储系统。您能否通过(针对每个事务)附加数据(使用 write(2))、附加提交标记,然后 fsync-ing 来简单地实现这一点? 要考虑的场景是,如果您对该日志进行
我使用以下函数将一些数据写入文件: def WriteTo1File(self, output_file, text): output_file.write(text) output_
我有一个禁用了写入缓存的 SATA 硬盘: hdparm -W0 /dev/foo 我在一个 ext4 分区上使用这些挂载选项(以及其他): data=ordered auto_da_alloc Li
我知道当我使用 write() 写文件时+ fsync() (或 O_SYNC + write() ,我认为它们是相同的 ref #1 ref #2 ),这意味着我正在使用阻塞同步 I/O,如果 wr
执行以下代码时出现错误,请您帮我解决此错误 public fun getEntityManager(): EntityManager { val tm: TransactionManager
我正在使用 C# 开发一个与数据库相关的项目。每次提交事务后,我希望数据库将所有缓冲数据移动到磁盘上。在 Linux 中,fflush() + fsync() 会提供我想要的。要达到同样的效果,我应该
Boost library提供类似于 fsync() 的内容? 动机:超越 POSIX 的可移植性 - 例如以便在 Windows 上使用类似的功能。 最佳答案 不,boost 没有这样的东西。正如
目录上的 fsync() 是否保证目录和所有子目录也被刷新? 假设我有 foo |- bar |- baz | |--file 如果我写'file'然后在foo上进行fsyn
我是一名优秀的程序员,十分优秀!