- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
DBMS 中的阻塞因子是什么,
我看到的那个位表示它是每条记录的 block 的底值(所以 B/R floor),其中 B 是 block 大小,R 是记录。我只是想知道,有人可以告诉我它被使用的主要原因,以及它是否真的被 FLOORED?
对于任何想知道的人,我对 FLOORED 的理解是 1.5 被降低到 1.0。
最佳答案
Yes, it means how many whole records fit into a block.
( block 是底层存储系统(hdd、san fs 等)愿意处理的最小数据单位。对于硬盘驱动器,它的大小通常为 512 字节。)
它是地板的,因为如果 100 条半记录可以容纳,那么每个 block 只能存储 100 条记录。
在许多与 dbms 相关的计算中,分块因子被大量使用。
例如:
我们有 10 000 000 条记录。每条记录的长度为 80 个字节。每条记录都包含一个唯一的 key (比方说社会安全号码)。我们希望通过社会安全号码快速查找某人。
我们需要一些东西来衡量性能。花费最多时间的事情是从硬盘请求一个 block 。你知道,它是一种机械装置。它必须重新定位它的头,然后 blabla,所以与 CPU 的速度相比,它确实是一个缓慢的操作,或与操作内存 (RAM) 访问的速度相比。好的,假设我们通过访问磁盘的次数来衡量操作的性能。我们希望最小化磁盘访问次数。好的,现在我们知道如何判断某件事是慢了还是快了。
许多磁盘访问 -> 坏
磁盘访问很少 -> 好
假设在我们想象的硬件上,每个 block 是 5000 字节。我们要计算我们需要多少 block 。首先,我们需要知道有多少条记录适合一个 block :
block 因子
= floored(( block 大小)/(记录大小))
= floored(5000/80)
= floored(62.5)
= 62 条记录/ block
我们有 10000000 条记录,所以我们需要 ceiled(10000000/62)=ceiled(161290.32)=161291
block 来存储所有这些数据。
如果要读取所有 block 以通过键(社会安全号码)找到一条记录,那么这将需要 161291 次磁盘访问。不好。
我们可以做得更好。让我们构建一个索引文件。我们将构建一个 sparse index .
A sparse index in databases is a file with pairs of keys and pointers for every block in the data file. Every key in this file is associated with a particular pointer to the block in the sorted data file. In clustered indices with duplicate keys, the sparse index points to the lowest search key in each block.
好的,所以我们将在每个 block 的索引文件中有一个指针和一个键。假设在我们想象的硬件上,一个指针有 4 个字节长,而在我们想象的世界中,一个社会安全号码( key )占用 6 个字节。
因此我们将为索引中的每个 block 存储一个 10 字节长的键指针对。这些对中有多少对适合一个 block ?
Blocking factor of the index file = floored(5000/10) = 500
... 所以这意味着 500 个关键指针对适合一个 block 。而我们需要存储其中的 161291 个,因此索引文件将占用 ceiled(161291/500)=323
block
索引文件是按键排序的,所以我们可以在其中进行二进制搜索以找到指向包含记录的 block 的指针。在索引文件中进行二进制搜索最多花费 ceiled(log2(323))=9
磁盘访问。我们还需要 +1
磁盘访问权限来实际读取索引记录指向的数据 block 。
哇,我们的查找在 10 次磁盘访问中工作。太棒了。我们甚至可以做得更好。 :)
好的,所以您可以看到在这个计算中使用了大量的分块因子。
关于database - DBMS 中的阻塞因子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15859070/
对于一个简单的聊天程序,我使用了一个通过 boost::python 包装的 c 库。 使用 PyQT 编写了一个简单的 GUI。接收消息是通过阻塞调用完成的lib说。对于独立刷新的 GUI,通信部分
当我创建以下内容时,我试图创建一个可以被异常终止的线程类(因为我试图让线程等待一个事件): import sys class testThread(threading.Thread): def
我正在用 Haskell 编写服务器,我想在客户端断开连接后显式关闭它们。当我调用 hClose ,线程将阻塞,直到客户端关闭其一侧的句柄。有没有办法让它在不阻塞的情况下关闭? 提前致谢! 最佳答案
这个问题已经有答案了: 已关闭12 年前。 Possible Duplicate: garbage collection Operation 我有几个相关问题。 1.JAVA垃圾收集器运行时,是否占用
我有一个 Angular 函数,它在初始 URL 中查找“列表”参数,如果找到,就会出去获取信息。否则我想获得地理位置。如果存在 URL 参数,我不想获取地理位置。我使用的术语是否正确? constr
我读了很多关于锁定数据库、表和行的文章,但我想要较低的锁定,比如只锁定“操作”,我不知道如何调用它,假设我在 php 中有函数: function update_table() { //que
在我的多线程 mfc 应用程序中,m_view->SetScrollPos 处于阻塞状态并且所有应用程序都被卡住。 View 是在另一个线程中创建的,这是这种行为的原因吗? //SetScrollPo
FreeSwitch 软件在几天内运行良好(~3 - 5 天),然后由于 FreeSwitch 被阻止,新的来电请求被接受!!正在进行的调用继续他们的 session ,他们的调用似乎没有受到影响,但
我有一组按钮,当鼠标悬停在这些按钮上时,它们会改变颜色。这些的 CSS 以这种方式运行: #navsite ul li button { height: 60px; width: 60
由于某些原因,当我调用 WSARecvFrom 时,该函数在接收到某些内容之前不会返回。 _socket = WSASocket(AF_INET, SOCK_DGRAM, IPPROTO_UDP, N
我了解一些关于 Oracle 阻塞的知识——更新如何阻塞其他更新直到事务完成,写入者如何不阻塞读取者等。 我理解悲观和乐观锁定的概念,以及有关丢失更新等典型银行教科书示例。 我也理解 JDBC 事务隔
在两个代码点之间,我是否可以判断进程是否已被内核抢占,或者更确切地说,当时是否有任何其他代码在同一处理器上运行? //Point A some_type capture = some_capture(
这是我在 Oracle 的面试问题。 有一个堆栈,即使堆栈已满,push 操作也应该等到它完成,即使堆栈为空,pop 操作也应该等到它完成。 我们怎样才能做到这一点? 我的回答 让一个线程做push
我想知道是否有人可以告诉我如何有效地使用循环平铺/循环阻塞进行大型密集矩阵乘法。我正在用 1000x1000 矩阵做C = AB。我按照 Wikipedia 上的循环平铺示例进行操作,但使用平铺得到的
我正在阅读有关绿色线程的内容,并且能够理解这些线程是由 VM 或在运行时创建的,而不是由操作系统创建的,但我无法理解以下语句 When a green thread executes a blocki
我正在创建的 JavaScript API 具有以下结构: var engine = new Engine({ engineName: "TestEngine", engineHost
ChildWindow 是一个模态窗口,但它不会阻塞。有没有办法让它阻塞?我基本上想要一个 ShowDialog() 方法,该方法将调用 ChildWindow.Show() 但在用户关闭 Child
我需要一些关于如何调试 10.6 版本下的 Cocoa 并发问题的指导。我正在将“for”循环转换为使用 NSOperations,但大多数时候,代码只是在循环的某个时刻卡住。我可以在控制台中看到 N
我正在使用 ReportViewer 控件和自定义打印作业工作流程,这给我带来了一些问题。我的代码看起来有点像这样: ids.ForEach(delegate(Guid? guid)
我有以下成功复制文件的代码。但是,它有两个问题: progressBar.setValue() 之后的 System.out.println() 不会打印 0 到 100 之间的间隔(仅打印“0”直到
我是一名优秀的程序员,十分优秀!