gpt4 book ai didi

programming-languages - 数据检索-数据库VS编程语言

转载 作者:行者123 更新时间:2023-12-01 13:47:30 27 4
gpt4 key购买 nike

我最近一直在使用数据库,在此之前,我正在开发不使用数据库的独立组件。
在完成所有数据库工作后,我遇到了一些问题。
为什么数据库查询比从文件中检索编程语言数据快?

为了进一步阐述我的问题-

假设我有一个名为Employee的表,其中包含名称,ID,DOB,电子邮件和性别。为简单起见,我们还将假定它们都是固定长度的字符串,并且没有任何索引或主键或任何其他约束。

假设我们表中有一百万行数据。最终,该表将存储在磁盘上的某个位置。当我写一个查询Select Name,ID from Employee,其中DOB =“12/12/1985”时,DBMS从文件中提取数据,对其进行处理,对其进行过滤,并给出一个结果,该结果是一百万个子集的一部分数据行。

现在,假设我将相同的一百万行存储在一个平面文件中,为简单起见,每个字段都类似地使用固定长度的字符串。数据在磁盘上的文件上可用。
当我用C++或C或C#或Java编写程序并执行相同的查找名称和ID的任务(其中DOB =“12/12/1985”)时,我将逐条记录读取文件记录并检查每行数据如果DOB =“12/12/1985”,如果匹配,则将当前行存储给用户。

与SQL查询返回结果的速度相比,程序执行此操作的速度太慢。

我假设DBMS也是用某种编程语言编写的,并且解析查询还有其他开销,而其他方面则没有。

那么,与通过编程语言相比,使DBMS更快地检索数据会发生什么?

如果此问题在此论坛上不合适,请删除,但请提供一些指示,以帮助我找到答案。

如果有帮助,我会使用SQL Server。

最佳答案

有很多技术可以加快各种访问速度。正如@Oded所说,索引是您特定示例的最佳解决方案:如果数据库已设置为按日期维护索引,则它可以直接转到该日期的条目,而不用读取整个文件。 (请注意,维护索引确实会占用空间和时间,但这不是免费的!)

另一方面,如果尚未建立这样的索引,并且未按日期顺序存储数据库,则按日期查询将需要遍历整个数据库,就像平面文件程序一样。

当然,您可以编写自己的程序来维护和使用文件日期索引,这将像数据库一样加快日期查询。而且,您可能会发现您想要添加其他索引,以加快其他类型的查询的速度,或者删除一个索引,该索引原来占用的资源超出了价值。

最终,管理已添加到文件管理器中的所有功能可能会成为一项复杂的任务。您可能希望将这种配置存储在自己的文件中,而不是将其硬编码到程序中。至少,您将需要一些功能来确保更改配置不会损坏文件...

换句话说,您将编写自己的数据库。

关于programming-languages - 数据检索-数据库VS编程语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10031910/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com