gpt4 book ai didi

使用快速磁盘存储 (SSD) 进行优化的算法?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:27:25 26 4
gpt4 key购买 nike

鉴于固态硬盘 (SSD) 的价格正在下降,并且很快将作为系统驱动器变得更加普遍,并且鉴于它们的访问率明显高于旋转磁介质,哪些标准算法将通过使用用于本地存储的 SSD?例如,SSD 的高随机读取速度使得基于磁盘的哈希表之类的东西成为大型哈希表的可行性; 4GB 的磁盘空间随时可用,这使得散列到 32 位整数的整个范围是可行的(尽管查找比填充更多,这仍然需要很长时间);虽然由于访问速度的原因,这种大小的哈希表无法与旋转介质一起使用,但对于 SSD 来说应该不是什么大问题。

是否还有任何其他领域即将过渡到 SSD 将提供算法性能的潜在 yield ?我宁愿看到关于一件事将如何运作的推理,而不是意见;我不希望这引起争议。

最佳答案

您的哈希表示例确实是将受益的关键数据库结构。不必将整个 4GB 或更多文件加载到内存中来探测值,可以直接探测 SSD。 SSD 仍然比 RAM 慢几个数量级,但在磁盘上有一个 50GB 的哈希表是非常合理的,但在 RAM 中则不然,除非你花大钱买大铁。

一个例子是国际象棋位置数据库。我有超过 50GB 的散列位置。有复杂的代码试图在散列中将彼此靠近的相关位置分组,所以我可以一次分页 10MB 的表,并希望将其中的一些重新用于多个类似的位置查询。要使其高效,需要大量代码和复杂性。

用 SSD 代替,我能够放弃集群的所有复杂性,只使用非常愚蠢的随机哈希。我的性能也得到了提升,因为我只从磁盘中获取我需要的数据,而不是 10MB 的大数据 block 。延迟确实更大,但净加速显着......而且 super 干净的代码(20 行,而不是 800 多行)可能更好。

关于使用快速磁盘存储 (SSD) 进行优化的算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1004153/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com