知其然更要知其所以然，聊聊SQLite软件架构-6ren

知其然更要知其所以然，聊聊SQLite软件架构

转载作者：qq735679552 更新时间：2022-09-27 22:32:09

27

4

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章知其然更要知其所以然，聊聊SQLite软件架构由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

SQLite是一个非常受欢迎的数据库，在数据库排行榜中已经进入前十的行列。这主要是因为该数据库非常小巧，而且可以支持Linux、Windows、iOS和Andriod的主流的操作系统.

SQLite非常简单，是一个进程内的动态库数据库。其最大的特点是可以支持不同的语言来使用，比如C、C++、Java等等。同时，SQLite还是一个开源的数据库，也就是开发者可以根据自己的需求来修改数据的功能特性.

SQLite虽然非常小巧，但功能却非常丰富，正所谓“麻雀虽小，五脏俱全”。SQLite不仅具备基本的SQL特性，还具备索引、触发器、视图和事务等特性.

SQLite的主要API 。

SQLite提供两种访问接口，一种是通过sqlite命令行工具，另外一种是通过动态库，也就是API函数。在学习SQLite架构之前，我们有必要对其API进行一个简要的介绍。其实SQLite的API很简单，主要包括三个，分别是sqlite3_open、sqlite3_exec和sqlite3_close三个函数。其中sqlite3_exec则是用于执行SQL语句的函数.

也就是说sqlite3_exec是SQLite功能的关键入口，我们后面分析代码也应该以此函数作为突破点。其它函数相对简单，也没那么重要.

SQLite整体架构。

首先我们从整体架构上介绍一下SQLIte。其架构如图所示，包括接口层、SQL命令处理器和存储后端等.

最为核心的不是就是SQLite内核了。其中包括接口层、SQL命令处理器和虚拟机三部分。SQL命令处理器负责对用户的SQL进行预处理，最终生成适用于虚拟机执行的代码.

其下是后端部分，后端部分相当于存储引擎。下面我们简要的介绍一下每个模块的功能.

(1) 接口。

SQLIte库的使用通过函数调用实现。为了避免与其它库出现冲突，SQLite的函数都以sqlite3作为前缀。接口部分的实现在文件main.c,legacy.c和vdbeapi.c中。其中main.c中包含其主要的接口，包括sqlite3_open、sqlite3_config和sqlite3_close等等。SQLite中最终的函数不在main.c中，而是在legacy.c中，该文件中只包含这一个接口的实现.

(2) 词法分析器。

词法分析器对SQL语句字符串进行解析，最终生成单词(token)序列。并且将生成的单词序列传给解析器进行下一步的动作。该功能的具体实现在文件tokenize.c中，核心入口函数为sqlite3RunParser.

(3) 解析器。

SQLite的解析器基于Lemon实现，它实现将SQL语句字符串解析成语法树。Lemon是一个与YACC/BISON类似的词法分析库。该库的源代码在tool目录中.

(4) 代码生成器。

代码生成器用于生成与SQL语句对应，可以在虚拟机执行的代码。代码生成器实现比较复杂，包含的文件有：build.c, delete.c, attach.c, expr.c, insert.c, pragma.c, select.c, auth.c等等。通过文件名可以看出，这里很多文件其实分别对应着一个SQL语句，比如delete，insert和select等.

(5) 虚拟机。

SQL的具体执行在一个称为虚拟机的组件中进行的，这个在前面架构图中已经有所展示。虚拟机执行的代码有前面代码生成器产生。虚拟机的实现在文件vdbe.h和vdbe.c中.

(6) B-树。

SQLite的数据通过B树进行组织管理。每个表或者索引都有一个对应的B树。所有的B树存储在一个数据库文件中。B树的具体实现在btree.c和btree.h文件中.

(7) 页缓存。

SQLite的文件被划分为等份大小，B树也是以该大小为粒度来对数据进行管理。页缓存是该粒度对应的内存内容，通过该内存实现对数据块的读写等访问。页缓存相关的实现在pager.c和pcache.c等文件中.

(8) 操作系统接口。

SQLite是一个跨平台的数据库，其存储数据需要兼容Windows和Linux的文件系统API。为了方便，SQLite实现了一个抽象层。这样对于SQLite业务逻辑来说，只需要调用该抽象层的接口即可，而不用关心操作系统.

(9) 基础库。

包含一个被各个模块都可能使用到的基础库，比如内存分配，字符串处理等.

SQLite文件格式。

前文我们简要的介绍了一下SQLite的软件架构以及每个组件的基本功能。接下来我们介绍一下数据库文件的相关功能.

在SQLite中一个文件承载着一个数据库实例，这个文件称为主库文件(main database file)。除了主库文件外，还可能有一些其它文件，比如用于事务的日志文件等。本文主要集中介绍主库文件，其它文件后续介绍.

(1) 页。

数据库文件由多个页构成，每个页的大小在512到65536字节之间，且大小必须是2的幂。页通过编号进行标记，起始值为1，最大编号为2的31次幂-2。页的默认大小是4KB，本文以默认大小为例进行介绍.

在数据库中的每个页都有一个特定的用途，这些用途包括:

锁字节页(Lock-byte page)
剩余页
B树页
指针映射页
有效负载溢出页

数据库文件的第一个页是比较特殊的，它包含整个数据库文件的描述信息，这里称为数据库头信息.

(2) 数据库头。

数据库头包含100个字节的内容，其中每一个成员的偏移，大小和功能如下图所示.

我们可以创建一个数据库实例，然后对照文件内容与数据库头的格式进行理解。比如数据库头的第一个成员为一个魔数，用于标识该文件为SQLite数据库文件及版本。在下图中可以找到该信息，可以看出两者完全匹配(SQLite format 3).

除了上述数据库头的格式外，每个不同的页都有不同的布局.

最后此篇关于知其然更要知其所以然，聊聊SQLite软件架构的文章就讲到这里了,如果你想了解更多关于知其然更要知其所以然，聊聊SQLite软件架构的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

27

4

0

文章推荐：运维必备：Zookeeper集群“脑裂”问题处理大全

文章推荐： php+js iframe实现上传头像界面无跳转

文章推荐： ibatis学习之搭建Java项目

一键清理Maven失效依赖-脚本+软件
前言在进行Maven开发时，往往需要下载大量jar包，而由于网络不稳定等其他因素可能导致jar未下载完毕，然后保留了lastUpdated文件，导致无法更新失效的jar包。本文分享 bat脚本，自
string - 软件/操作系统中存储的字母表顺序是什么级别？
按字母顺序排序并不是我们花太多时间担心的事情。我们在很小的时候就学习了字母表，现在我们知道它(拉丁文)以 A 开头，然后是 B，然后是 C 等等，一直到 Z。但是这个订单究竟存储在计算机系统中的什么
matlab - 如何证明二维DFT的信号可分离性？软件
我尝试使用可分离为 2 个一维向量的二维矩阵来证明二维傅里叶变换的信号属性的可分离性。地点: f(x,y) = f(x)*f(y) 那么 F(u,v) = F(u)*F(v) 使用以下代码: % Se
sqlite - SQLite数据库文档模板/软件？
我需要为几个小型sqlite数据库编写文档。想描述数据的使用方式，包括表和行说明以及示例数据。是否可以使用MySQL Workbench？如果没有其他选择，或者我可以使用任何模板？ TIA！最佳答
Homebrew 软件 - 如何安装旧版本
我正在尝试使用旧版本(例如:1.4.5)安装 memcached，但我不知道该怎么做。 brew install memcached安装最新的。我也试过 brew install memecache
用于大型数据集分类的 NLP 软件
背景多年来，我一直使用自己的类似贝叶斯方法，根据大型且不断更新的训练数据集对来自外部来源的新项目进行分类。每个项目都有三种类型的分类: 30 个类别，其中每个项目必须属于一个类别，且最多属于两个类
matlab - 如何确定两个数字中更多的数字是否相等？软件
嗨，我需要确定 4 个数字是否相等。数字是 size(A,1)、size(B,1)、size(C,1) 和 size(D,1)，其中，例如A = [1 2; 3 4], B=[1 2 3, 4 5 6
frameworks - 软件/编程框架的实际定义是什么？
Wikipedia 中的文章似乎太冗长了。我将框架理解为一组精心设计的库和工具。 Qt 框架为跨平台 GUI 提供了一组库/工具。 cocoa 框架为 Mac 做了同样的事情。软件框架的实际定义是
jQuery CAD 软件
我们的客户最近发现了这个网站: http://mydeco.com/3d-planner/ 它有一个非常非常奇特且组合良好的 3d CAD Web 应用程序，似乎是使用 jQuery 编写的，而不是
calendar - 独立日历应用程序/软件
我们正在寻找一种独立的(非 cms)日历解决方案来显示在网络上。它可以是开源的或付费服务。我们主要是在寻找一种在 Web 上显示日历的方法，其中包含事件发生的时间和事件的名称。如果它可以按周、月、年
testing - 软件:质量保证VS质量科学？
我想知道与软件相关的“质量保证”和“质量科学”之间的区别。我在Google上进行了研究，但未找到有关“质量科学”的任何信息。最佳答案 Based on the link you have prov
c++ - 你在哪里下载C++软件？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，
软件 |基于均值和概率区间计算gamma dist的参数
我有一个由 2 个方程和 2 个未知数组成的系统，我想使用 MATLAB 求解，但不知道如何编程。我得到了一些有关 Gamma 分布的信息(平均值为 1.86，90% 的间隔介于 1.61 和 2.1
matlab - 获取矩阵子集的边界单元格的索引。软件
给定一个矩阵，其中 1 是当前子集 test = 0 0 0 0 0 0 0 0 0 0 0 0
matlab - 如何合并重复值和重复值组并保持顺序？软件
我在组合 Matlab“数据”变量的重复元素时遇到问题。我可以使用 unique 和 sort 轻松组合这些值。 [sorted,idx] = sort(data); [~,ij] = unique(
performance - 矢量化代码比循环慢？软件
我在做的问题中有这么一段代码，如下图。定义部分只是为了向您展示数组的大小。下面我粘贴了矢量化版本 - 它慢了 2 倍以上。为什么会这样？我知道如果矢量化需要大的临时变量，我就会发生，但(看起来)这里不
matlab - 如何将一个矩阵存储在另一个矩阵的一行中？软件
我有一个 3D 矩阵，我想将它的每个 2D 分量存储在另一个 2D 矩阵的行中，该 2D 矩阵有许多行作为 3D 矩阵的第 3 维。我该怎么做？最佳答案与 permute & reshape -
c++ - 有什么好的方法可以指示计算机是否可以运行特定的程序/软件？
如果计算机能够使用纯 JavaScript(Google V8)、C++(Windows、Mac OS 和 Linux)运行程序/软件而没有任何性能问题，是否有任何好的方法可以通过要求尽可能少尽可能从
Linux Kiosk 软件？
我的团队的任务是将用于播放媒体文件的全屏、信息亭式应用程序从 Windows 迁移到嵌入式 ARM Linux(瘦客户端)。我们需要在 sd/1080p 中支持 mpeg-2 播放以及 HTML、SW
java - 我需要批量后台删除服务/软件
我们有数以千计的具有白色或黑色或渐变背景的产品图片。我们正在寻找可以去除图片背景的软件或服务。我们需要一款能够很好地完成这项工作的智能软件。最佳答案在 photoshop 中，您可以记录 Acti

首页

博学

6Ren·AI

商城

知其然更要知其所以然，聊聊SQLite软件架构