gpt4 book ai didi

文件的磁盘扇区和 block 分配

转载 作者:行者123 更新时间:2023-12-04 00:08:00 30 4
gpt4 key购买 nike

我对 Disk Sector 和 Block 有疑问。扇区是一个单位,通常为 512 字节或 1k、2k、4k 等取决于硬件。文件系统 block 大小是一组扇区大小。

假设我正在存储一个 5KB 的文件,如果扇区为 512 字节, block 为 4KB,如何将其写入磁盘?

该文件的 4KB 被写入一个 block ,另一个 1KB 文件被写入另一个 4KB block 。现在,第二个 block 的 3KB 不可用。

以后是有用还是被浪费了?如果我将 10 个 5KB 的文件写入磁盘,30KB 的大小将被浪费,或者这 30KB 被用于磁盘使用?

最佳答案

文件以“ block ”大小的倍数存储在磁盘上是一个公认的事实。

File-size ~ Linux

File-size on disk ~ Linux

File size vs. File-size on disk ~ Windows

block 的概念最初是作为 physical sectors on disk 的一种简单方法在文件系统中逻辑地表示。每个扇区都有自己的标题、数据区和ECC。这使它成为可以在逻辑上独立表示的最小磁盘。

随着时间的推移,随着 HDD Controller 上缓存的出现,拥有多个物理扇区大小的逻辑 block 变得更加容易。这种方式增加了磁盘顺序 I/O,从而提高了吞吐量。

如今, block 是可用的最小磁盘空间。通常,文件使用 1 个或多个 block 存储在磁盘上。

Files stored in blocks on disk

对于每个文件,只要对文件进行更改并且它“增长”,就会使用最后一个 block 中的剩余空间(如果有的话),需要额外的磁盘空间来存储新添加的内容。

通过在磁盘上请求额外的 block 并在逻辑上链接新的 block 集以继续跟随文件的当前最后一个 block 来满足额外的空间需求(超出当前最后一个 block 中的可用空间可以容纳的空间)。 文件 A 说明了上述情况。

提前分配 block 的优点是减少了碎片。考虑在磁盘上没有 block 概念并且根据需要分配磁盘空间的替代方案,即分配的磁盘空间量恰好是文件大小。

在这样的设置中,每次向文件中添加一个字符时,都需要:

  • 分配额外的内存(多 1 个字符)。
  • 在包含文件初始区域的区域和这个新字节之间建立链接。

所有这些元数据,即关于“链接”的额外结构也需要磁盘空间。这构成了每个此类“链接”的固定开销,因此必须将此类“链接”保持在最小数量。以“ block ”为单位分配磁盘大小的概念将开销限制在预先确定的数量。

Guaranteed number of files on disk = Raw disk-space / block-size

这种随机搜索也会降低吞吐量,因为重新定位磁盘头是磁盘 I/O 中最耗时的任务。频繁的随机搜索也可能会更快地磨损磁盘(还记得跳舞的 HDD 吗?)并且必须尽可能避免。


这种方法的其他优点:

1。读取速度更快

使用 block ,磁盘读取是连续的,直到 block 大小。更少的查找 = 更高的读取吞吐量。

2。更快的写入

block 提供了一个简单的实现,可以映射到 pages 这也会导致更高的写入吞吐量。

关于文件的磁盘扇区和 block 分配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13799183/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com