- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我知道读取 block 大小是文件系统 block 大小倍数的文件会更好。
1)为什么会这样?我的意思是,假设 block 大小为 8kb,而我读取了 9kb。这意味着它必须获取 12kb,然后去掉另外的 3kb。是的,它确实做了一些额外的工作,但是除非你的 block 大小真的很大,否则这会有很大的不同吗?
我的意思是,如果我正在读取 1tb 文件,这肯定会产生影响。
我能想到的另一个原因是 block 大小是指硬盘上的一组扇区(请纠正我)。所以它可能指向 8、16、32 或者只是一个扇区。那么如果该 block 指向更多扇区,您的硬盘本质上就必须做更多工作?我说得对吗?
2) 假设 block 大小为 8kb。我现在一次读取 16kb 吗? 1MB? 1GB?我应该使用什么作为 block 大小?我知道可用内存是一个限制,但除此之外还有哪些其他因素影响我的选择?
提前非常感谢您的所有回答。
最佳答案
理论上,当缓冲区处于空闲状态时,可能会出现最快的 I/O页对齐,并且当其大小是系统 block 的倍数时尺寸。
如果文件连续存储在硬盘上,最快的I/O吞吐量可以通过逐个柱面读取来获得。 (那里甚至可能没有任何延迟,因为当你读取整个轨道时你不需要从头开始,你可以从中间开始,并循环)。不幸的是,现在几乎不可能这样做,因为硬盘固件隐藏了物理布局扇区,并且可以使用需要甚至寻找的替换扇区读取单个轨道。操作系统文件系统也可能尝试传播文件 block 遍布整个磁盘(或者至少遍布整个柱面)组),以避免在时对大文件进行长时间查找访问小文件。
因此,您可以尝试考虑物理轨道,而不是考虑考虑硬盘缓冲区大小。大多数硬盘的缓冲区大小为8 MB,一些 16 MB。因此以最大 1 MB 或 2 MB 的 block 读取文件应该让硬盘固件优化吞吐量而无需停止它的缓冲区。
但是,如果上面有很多层,例如 RAID,那么所有的赌注都是关闭。
实际上,您能做的最好的事情就是对您的特定进行基准测试情况。
关于linux - 读取大文件时如何选择 block 大小?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49852060/
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
Linux 管道可以缓冲多少数据?这是可配置的吗? 如果管道的两端在同一个进程中,但线程不同,这会有什么不同吗? 请注意:这个“同一个进程,两个线程”的问题是理论上的边栏,真正的问题是关于缓冲的。 最
我找到了here [最后一页] 一种有趣的通过 Linux 启动 Linux 的方法。不幸的是,它只是被提及,我在网上找不到任何有用的链接。那么有人听说过一种避免引导加载程序而使用 Linux 的方法
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我试图了解 ld-linux.so 如何在 Linux 上解析对版本化符号的引用。我有以下文件: 测试.c: void f(); int main() { f(); } a.c 和 b.c:
与 RetroPie 的工作原理类似,我可以使用 Linux 应用程序作为我的桌面环境吗?我实际上并不需要像实际桌面和安装应用程序这样的东西。我只需要一种干净简单的方法来在 RaspberryPi 上
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
有什么方法可以覆盖现有的源代码,我应该用 PyQt、PyGTK、Java 等从头开始构建吗? 最佳答案 如果您指的是软件本身而不是它所连接的存储库,那么自定义应用程序的方法就是 fork 项目。据我所
我的情况是:我在一个磁盘上安装了两个 linux。我将第一个安装在/dev/sda1 中,然后在/dev/sda2 中安装第二个然后我运行第一个系统,我写了一个脚本来在第一个系统运行时更新它。
我在 i2c-0 总线上使用地址为 0x3f 的系统监视器设备。该设备在设备树中配置有 pmbus 驱动程序。 问题是,加载 linux 内核时,这个“Sysmon”设备没有供电。因此,当我在总线 0
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve thi
我正试图在 linux 模块中分配一大块内存,而 kalloc 做不到。 我知道唯一的方法是使用 alloc_bootmem(unsigned long size) 但我只能从 linux 内核而不是
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
我有 .sh 文件来运行应用程序。在该文件中,我想动态设置服务器名称,而不是每次都配置。 我尝试了以下方法,它在 CentOS 中运行良好。 nohup /voip/java/jdk1.8.0_71/
我是在 Linux 上开发嵌入式 C++ 程序的新手。我有我的 Debian 操作系统,我在其中开发和编译了我的 C++ 项目(一个简单的控制台进程)。 我想将我的应用程序放到另一个 Debian 操
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
我使用4.19.78版本的稳定内核,我想找到带有企鹅二进制数据的C数组。系统启动时显示。我需要在哪里搜索该内容? 我在 include/linux/linux_logo.h 文件中只找到了一些 Log
我知道可以使用 gdb 的服务器模式远程调试代码,我知道可以调试针对另一种架构交叉编译的代码,但是是否可以更进一步,从远程调试 Linux 应用程序OS X 使用 gdbserver? 最佳答案 当然
是否有任何可能的方法来运行在另一个 Linux 上编译的二进制文件?我知道当然最简单的是在另一台机器上重建它,但假设我们唯一能得到的是一个二进制文件,那么这可能与否? (我知道这可能并不容易,但我只是
我是一名优秀的程序员,十分优秀!