- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
深度优先搜索是一种可怕的文件系统搜索方式——在实践中,可能位于非常靠近根目录下的文件可能需要很长时间才能使用 DFS 找到,因为 DFS 会分散注意力另一个深层的、不相关的目录层次结构。
然而,它的资源需求非常好——它需要保持打开状态的文件句柄数量只与层次结构的深度成正比,而不是它的大小。
广度优先搜索是显而易见的解决方案——它非常快。
(我上次测量时,它与我系统上的 DFS 花费的时间大致相同,大约 8 秒。)
然而 BFS 有其自身的问题 -- BFS 需要保持打开非常大量的目录句柄,可能有数百万。 (在我的系统上,它大约有 100,000 个句柄,这高得离谱。它很可能会更多。)
这会导致几个问题:
保持打开如此多的句柄不仅会消耗内存(无论如何相对便宜),还会消耗许多其他类型的资源,例如虚拟文件系统(网络、挂载目录等)中文件的句柄,以及可能是其他有限的内核级资源。
它还会给用户带来其他实际问题:例如,一个一直处于打开状态的虚拟目录无法再关闭!这意味着,例如,用户可能无法关闭程序、弹出某些设备或关闭某种外部连接。这种方法可能会出现各种各样的问题。
这似乎是迭代深化,然后才是解决方案。
问题是什么?实践起来很慢。
我的麻烦是大型目录(例如 Windows 中的 WinSxS)被重新枚举每个深度级别,即使它们不需要这样做。上次我尝试这样做时,迭代加深在我的系统上比 DFS 慢约 15 倍。所以 8 秒的搜索大约需要 120 秒左右,这是 Not Acceptable 。
当然,试图跟踪您不应该打开的目录(也许是因为您注意到您不再需要打开它们)违背了使用迭代深化的初衷,因为它揭示了我们的所有资源问题有 BFS。
所以,问题很简单:
如果您正在搜索一个您不熟悉的文件系统,您应该如何着手在速度和可用性之间取得可接受的平衡?有比 BFS 更好的选择吗?
最佳答案
如果您真的对文件的位置没有任何指导,那么我认为您无能为力。您应该尝试使用一些技巧来尽量减少寻道和寻道时间,但是文件系统会变得支离 splinter 并且您无法了解这一点,因此很难在那里做很多事情。在许多文件系统上,在搜索子目录之前搜索目录中的文件应该更快,尤其是当您正在寻找可能已内联的小文件时。使用完整的 BFS 不耗尽内核资源也是一件好事。
即使您只是知道文件可能在哪里,这也会有很大帮助。例如,如果它是用户放在某处然后忘记位置的文件,则从主目录、临时目录和驱动器的根目录开始,并执行 DFS 直到合理的递归限制(例如 6- 8 会在我的 Windows 或 OS X 机器上找到任何手动放置的文件或自动下载的文件),理论上用户通常不会意外地得到很深的树,但自动生成的层次结构可能会很深。如果该搜索失败,请返回并搜索您之前跳过的深层目录。如果文件就是丢失了,无论如何搜索都会很慢,所以为了安全起见,回退到 DFS 并且不会在用户继续使用机器时造成太多问题。
最重要的是,如果系统有任何类型的搜索索引,请先检查它,即使这意味着要编写更多代码来支持它。
关于language-agnostic - 如何有效地搜索文件系统(算法方面)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12831668/
在嵌入式系统编程的上下文中是否存在普遍差异? 最佳答案 这些不是正式的术语,所以这是相当主观的。 迁移意味着将您的代码库移动到另一个系统(无意返回)。这也可能意味着切换到另一个工具链或编程语言。 移植
听说任何递归算法都可以用栈来表示。最近,我一直在一个可用调用堆栈非常小的环境中编写程序。 我需要做一些深度递归,所以我想知道如何重新设计任何递归算法以使用显式堆栈。 例如,假设我有这样一个递归函数 f
这个问题与语言无关,但受到这些 c/c++ 问题的启发。 How to convert a single char into an int Char to int conversion in C 假设
我最接近汇编的是构建我自己的 Java 类库,它加载类文件并允许您创建、编译和反编译类。在努力完成这个项目时,我想知道 Java 虚拟机实际上是如何在 JIT 优化期间在运行时生成 native 机器
如标题所说的简单问题。我在 StackOverflow(和互联网)上看到了一些关于半字节用例的问题,但我不明白为什么我们需要使用半字节。我的意思是字节是计算中最小的内存单位,因此对它执行操作来操作它的
这真是一个详细的格式问题,但我每次都被它绊倒...... 对于多行条件表达式,逻辑运算符的首选位置是什么? 备选方案 1:每行末尾的逻辑运算符 if (value1 == comparision1 &
计算“2021-01-01 12:56:23.423 UTC”和“2001-01-01 00:00:00.000 UTC”之间的 SI 秒数” 为例。 最佳答案 C++20 可以用下面的语法来完成:
我正在读一本名为“干净的代码”的书,当作者试图讲述我们如何编写一个高效的函数时卡住了。他说,“为了确保我们的函数做”一件事, “我们需要确保我们函数中的语句都处于同一抽象级别”。那么作者究竟想通过抽象
我的网站上有一张相当大的图片(大约 200kb)。我没有计划在不久的将来改变它。我如何告诉浏览器缓存它? 最佳答案 设置正确的标题对您有很大帮助。 过期时间:2012 年 4 月 15 日星期四 20
一般来说,重构工具的优缺点是什么? 最佳答案 优势 如果工具对您有帮助,您更有可能进行重构。 一个工具更有可能在第一次正确地进行“重命名”类型重构。 一个工具可以让您在代码库上进行重构,而无需手动进行
当我第一次开始自学编程时,在完成教程后,我会觉得我仍然无法用语言做任何事情。所以,我环顾四周,想找点事情做。由于我刚刚学习了一些基础知识,因此查找、阅读和添加到一个开源项目中所涉及的工作量似乎是无法克
在我工作的公司,最近要求所有“高度可见”的 bool 逻辑必须以析取范式表示。 例如(尽管这个概念与语言无关), #if (defined(A) || defined( B )) || (define
我想知道我们如何在 mathematica 中设计一个魔方。这可能吗?我们如何使用它。我们如何决定立方体的 6 个面上的较小立方体的不同分隔。 最佳答案 您问的是如何定义数据结构。您的选择是任意的,只
对于具有系统托盘图标的应用程序的行为方式,是否有任何标准? 我最近编写了一个应用程序,它大部分时间都位于系统托盘中。我把它交给了一个 friend ,她的第一 react 是双击图标进入主窗口(工作正
一个商业可分发软件的文本长度和/或音频片段长度是多少才能通过合理使用的阈值并侵犯所包含作品的版权?归属是否可以免除开发者的侵权行为?一个例子是在启动屏幕上使用的小说中的引用。 最佳答案 不幸的是,没有
我是一名经验丰富的 C/C++/C#/Objective-C 桌面、Web 和移动程序员,我已经习惯于从头开始构建我的大部分软件。我已经使用 ASP.NET 从头开始构建了我的所有网站。对于我想测
我一直在阅读有关使用矩阵转换 Vector3 的内容,并且正在努力深入研究数学并自己编写代码而不是使用现有代码。无论出于何种原因,我的学校类(class)从未包括矩阵,所以我正在填补我的知识空白。谢天
所以我目前正在尝试掌握递归的概念,我理解我遇到的大部分问题,但我觉得它的使用似乎不适用于太多计算问题。不过,这只是一个新手的假设,所以我问,作为程序员,递归有很多实际用途吗?还有,用它可以解决哪些典型
我正在学习递归。我已经使用递归解决了一些其他问题,例如创建二叉树、汉诺塔等。所以,我明白什么是递归,但我发现自己很难规划和实现正确的递归解决方案。 是否有任何关于规划、思考或实现问题递归解决方案的一般
每次我需要移动到一台新机器,或者买一台笔记本电脑,或者通过不断的安装和卸载搞砸我的注册表时,我开始变得非常厌烦和厌倦设置我的所有开发工具。 这么新的计划。我听说有人虚拟化他们的开发环境,这听起来是个好
我是一名优秀的程序员,十分优秀!