algorithm - 随机更新磁盘是否在标准和仅附加数据库中受限？-6ren

algorithm - 随机更新磁盘是否在标准和仅附加数据库中受限？

转载作者：塔克拉玛干更新时间：2023-11-03 05:11:33

25

4

如果我有大型数据集并进行随机更新，那么我认为更新主要受磁盘限制(如果仅附加数据库，我认为与搜索无关，而与带宽有关)。当我稍微更新记录时，必须更新一个数据页，所以如果我的磁盘可以写入 10MB/s 的数据并且页面大小为 16KB，那么我每秒最多可以进行 640 次随机更新。仅附加数据库每秒约 320，因为一次更新可能占用两页 - 索引和数据。在其他数据库中，由于 ranom 试图就地更新页面可能更糟，例如每秒 100 次更新。

我假设缓存中的一页在写入前只有一次更新(随机更新)。在所有数据页周围随机插入(例如，不是按时间排序的 UUID)或什至更糟。

我指的是脏页(更新后)必须刷新到磁盘并同步(不能再留在缓存中)的情况。那么每秒更新计数在这种情况下磁盘带宽是否有限？我的计算可能是每秒 320 次更新吗？也许我遗漏了什么？

最佳答案

“这取决于。”

为了完整起见，还有其他事情需要考虑。

首先，随机更新与追加的唯一区别是涉及的寻头。随机更新会使整个盘子的头部都在跳舞，而理想情况下，追加只会像电唱机一样进行跟踪。这还假设每个磁盘写入都是完整写入并且完全独立于所有其他写入。

当然，那是在一个完美的世界里。

对于大多数现代数据库，每次更新通常至少涉及 2 次写入。一个用于实际数据，另一个用于日志。

在典型情况下，如果您更新一行，数据库将在内存中进行更改。如果您提交该行，数据库将通过在日志中做一个注释来确认这一点，同时将实际的脏页保留在内存中。稍后，当数据库检查点时，它会将脏页正确写入磁盘。但是当它这样做时，它会对 block 进行排序并尽可能按顺序写入它们。然后它将一个检查点写入日志。

在恢复期间，当数据库崩溃并且无法检查点时，数据库读取日志直到最后一个检查点，“前滚”并将这些更改应用到实际磁盘页面，标记最终检查点，然后使系统可用于服务。

日志写入是顺序的，数据写入大多是顺序的。

现在，如果日志是普通文件的一部分(今天很典型)，那么您将写入日志记录，它会附加到磁盘文件中。 FILE SYSTEM 然后(可能)将您刚刚所做的更改附加到 ITS 日志，以便它可以更新其本地文件系统结构。稍后，文件系统还将提交其脏页并使其元数据更改永久化。

因此，您可以看到，即使是简单的追加也可以调用多次写入磁盘。

现在考虑像 CouchDB 这样的“仅附加”设计。 Couch 会做的是，当您进行简单的写入时，它没有日志。该文件是它自己的日志。 Couch DB 文件无休止地增长，并且在维护期间需要压缩。但是当它进行写入时，它不仅会写入数据页，还会写入任何受影响的索引。并且当索引受到影响时，Couch 将重写索引更改的整个 BRANCH 从根到叶。因此，在这种情况下，简单的写入可能比您最初想象的要昂贵。

现在，当然，您加入了所有随机读取来破坏您的随机写入，这一切很快就会变得非常复杂。不过我学到的是，虽然流带宽是 IO 操作的一个重要方面，但每秒的整体操作更为重要。您可以拥有 2 个具有相同带宽的磁盘，但盘片和/或磁头速度较慢的磁盘每秒的操作次数较少，这仅来自磁头行程时间和盘片寻道时间。

理想情况下，您的数据库使用专用原始存储而不是文件系统进行存储，但现在大多数都没有这样做。基于文件系统的存储在操作上的优势通常超过性能优势。

如果您在文件系统上，那么预分配的顺序文件是一个好处，这样您的“仅追加”就不会简单地跳过文件系统上的其他文件，从而变得类似于随机更新。此外，通过使用预分配的文件，您的更新只是在写入期间更新数据库数据结构，而不是在文件扩展时更新数据库和文件系统数据结构。

将日志、索引和数据放在不同的磁盘上，可以让多个驱动器同时工作，干扰更少。与与随机数据读取或索引更新作斗争相比，您的日志实际上只能追加。

因此，所有这些因素都会影响数据库的吞吐量。

关于algorithm - 随机更新磁盘是否在标准和仅附加数据库中受限？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4904249/

25

4

0

文章推荐： java - 基于位置的数据抓取算法

文章推荐：具有动态字段的 Java 类

文章推荐： java - 碧 Jade 报告 : How to add font not in the application classpath

文章推荐： algorithm - 人工智能/规则来猜测用户对服装/服装的品味

数据库
我的问题是如何在 python 中创建一个简单的数据库。我的例子是: User = { 'Name' : {'Firstname', 'Lastname'}, 'Address' : {'Street
mysql - iOS开发。数据库？数据库？什么是最好的方法？
我需要创建一个与远程数据库链接的应用程序! mysql 是最好的解决方案吗？ Sqlite 是唯一的本地解决方案吗？我使用下面的方法，我想知道它是否是最好的方法! NSString *evento
java 应用程序无法连接到远程 MySQL 数据库，但可以连接到本地 MySQL 数据库
给定两台 MySQL 服务器，一台本地，一台远程。两者都有一个包含表 bohica 的数据库 foobar。本地服务器定义了用户 'myadmin'@'%' 和 'myadmin'@'localhos
java - 灵活查询适用于 HANA 数据库，但不适用于 HSQL 数据库
我有以下灵活的搜索查询 Select {vt:code},{vt:productcode},{vw:code},{vw:productcode} from {abcd AS vt JOIN wxyz
mysql - 从原始数据文件恢复 MySQL 数据库 [XAMPP | MySQL |数据库]
好吧，我的电脑开始运行有点缓慢，所以我重置了 Windows，保留了我的文件。因为我的大脑还没有打开，所以我忘记事先备份我的 MySQL 数据库。我仍然拥有所有原始文件，因此我实际上仍然拥有数据库，但
android - 如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)？
如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)？请，任何帮助将不胜感激。最佳答案 1)如果要转换 db 的结构，则应使用任何 DB 建模工具:
django - 实际上我将我的 django 数据库 sqlite3 连接到 Mysql 数据库，每当我迁移时我都会收到此错误
系统检查发现了一些问题: 警告:？:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
django - 实际上我将我的 django 数据库 sqlite3 连接到 Mysql 数据库，每当我迁移时我都会收到此错误
系统检查发现了一些问题: 警告:？:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
android - 如何在 phonegap 数据库中使用 android 数据库/作为 phonegap 数据库
我想在相同的 phonegap 应用程序中使用 android 数据库。更多说明: 我创建了 phonegap 应用程序，但 phonegap 应用程序不支持服务，所以我们已经在 java 中为 a
javascript - 将日期插入 mysql 数据库 [我正在使用 php 和 xampp mysql 数据库]
Time Tracker function clock() { var mytime = new Date(); var seconds
php - MySQL如何从年份(参数)、weekOfYear(参数)、时间(数据库)和dayofweek(数据库)创建时间戳？
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。在我的 Controller 中，我(从 ajax 请求)传递了一个时间戳，并且我需要显示之前的 8 个事件。因此，如果时间戳是(转换后)
performance - : {REST API, 网站} --> {数据库} 或 {网站} --> {REST API} --> {数据库} 哪个更好？
我有一个可以收集和显示各种测量值的产品(不会详细介绍)。正如人们所期望的那样，显示部分是一个数据库+建立在其之上的网站(使用 Symfony)。但是，我们可能还会创建一个 API 来向第三方公开数据
sql-server - Azure SQL 数据库 - 查询速度明显慢于 Azure VM 上的 SQL 数据库
我们将 SQL Server 从 Azure VM 迁移到 Azure SQL 数据库。 Azure VM 为 DS2_V2、2 核、7GB RAM、最大 6400 IOPS Azure SQL 数据
java - MongoDB 如何在 Java 本地测试 MongoDB 数据库，比如 H2 和 sql 数据库？
我正在开发一个使用 MongoDB 数据库的程序，但我想问在通过 Java 执行 SQL 时是否可以使用内部数据库进行测试，例如 H2？最佳答案你可以尝试使用Testcontainers Test
sql - 如何从 unix 终端连接到 Microsoft SQL Server 数据库？我必须连接 SQL Server 2008 数据库
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。已关闭 9 年前。此问题似乎与 a specific programming problem, a sof
python - 尝试使用 MSI 身份验证从 Azure ML 服务连接 Azure SQL 数据库(无需用户名和密码即可连接 Azure 数据库)
我正在尝试使用 MSI 身份验证(无需用户名和密码)从 Azure 机器学习服务连接 Azure SQL 数据库。我正在尝试在 Azure 机器学习服务上建立机器学习模型，目的是我需要数据，这就是我
数据库；空场似乎不空
我在我的 MySQL 数据库中使用这个查询来查找 my_column 不为空的所有行: SELECT * FROM my_table WHERE my_column != ""; 不幸的是，许多行在
数据库 |选择不同的记录
我有那个基地:http://sqlfiddle.com/#!2/e5a24/2这是 WordPress 默认模式的简写。我已经删除了该示例不需要的字段。如您所见，我的结果是“类别 1”的两倍。我喜欢
数据库。提取过滤列的数据
我有一张这样的 table : mysql> select * from users; +--------+----------+------------+-----------+ | userid
数据库 |高级分面搜索
我有表: CREATE TABLE IF NOT EXISTS `category` ( `id` int(11) NOT NULL, `name` varchar(255) NOT NULL

首页

博学

6Ren·AI

商城

algorithm - 随机更新磁盘是否在标准和仅附加数据库中受限？