gpt4 book ai didi

algorithm - 如何从 50000 个 html 文件中删除行

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:12:39 26 4
gpt4 key购买 nike

这个问题是在面试中问到的,不确定堆栈溢出是否适合问这个问题。

Given 50000 html files we need to delete all occurrences of phone number.

我回答,我会读取文件,解析它并在过滤后写入另一个没有电话号码的文件。

例如:

while ( line = br.readline != null) {
if line does not have phone number
write line to another file.
}

另外既然我们有50000个文件,是否应该涉及多线程的元素?

有什么更好的主意吗?标准解决方案?

最佳答案

面试问题主要分为两大类 - 一种是测试您对特定技术的了解,另一种是了解您的思维过程。这个问题听起来像是第二种。

一旦你给出了解决方案,面试官可能会问更多关于你的代码的问题:

  • 它会捕获电话号码的所有实例吗? - 您可能会认为"is"
  • 拆分成多条线路的电话号码怎么样? HTML 不关心,对吧? - 你应该解释如何修改你的解决方案以适应中间带有 '\n' 的电话号码
  • 关于标记,您会在电话号码中间找到带有 HTML 标记的电话号码吗? - 您应该解释如何更改解决方案以处理标记。 HTML 解析器可能有助于正确完成此任务。
  • 如果只有 20% 的文件包含电话号码怎么办? - 您应该解释该程序将受 I/O 限制,以及您将如何通过搜索第一个文件来优化写入在开始写作之前发生。

谈话可以继续下去。最后,面试官应该很好地了解您在 HTML、文件 I/O 和字符串处理方面的技能。一个好的答案可能包括上面提到的大部分技术。

关于algorithm - 如何从 50000 个 html 文件中删除行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38710573/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com