N路合并算法-6ren

N路合并算法

转载作者：塔克拉玛干更新时间：2023-11-03 02:11:56

24

4

作为合并排序算法的一部分，双向合并被广泛研究。但我有兴趣找出执行 N 路合并的最佳方法？

比方说，我有 N 个文件，每个文件都对 100 万个整数进行了排序。我必须将它们合并到一个文件中，该文件将包含 1 亿个排序的整数。

请记住，此问题的用例实际上是基于磁盘的外部排序。因此，在实际场景中也会有内存限制。因此，一次(99 次)合并 2 个文件的天真方法是行不通的。假设我们只有一个小的滑动内存窗口可用于每个数组。

我不确定这个N路合并是否已经有一个标准化的解决方案。 (谷歌搜索并没有告诉我太多信息)。

但是如果你知道一个好的 n-way 合并算法，请发布算法/链接。

时间复杂度:如果我们大大增加要合并的文件数量 (N)，这将如何影响您的算法的时间复杂度？

感谢您的回答。

我在任何地方都没有被问到这个问题，但我觉得这可能是一个有趣的面试问题。因此标记。

最佳答案

下面的想法怎么样:

创建一个优先级队列
遍历每个文件f
1. 使用第一个值作为优先键对 (nextNumberIn(f), f) 进行排队
当队列不为空时
1. 出列队列头 (m, f)
2. 输出m
3. 如果 f 没有耗尽
  1. 入队 (nextNumberIn(f), f)

由于向优先级队列添加元素可以在对数时间内完成，因此第 2 项是O(N × log N)。由于 while 循环的(几乎所有)迭代都会添加一个元素，因此整个 while 循环是 O(M × log N)，其中 M 是数字的总数排序。

假设所有文件都有一个非空的数字序列，我们有 M > N，因此整个算法应该是 O(M × log N)。

关于N路合并算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5055909/

24

4

0

文章推荐： algorithm - 多项式时间和指数时间

文章推荐： c++ - 如何防止使用尚未构造的类成员？

文章推荐： c++ - 在 C++ 中清除 cin

文章推荐： algorithm - 计算点在圆上的位置

angularjs - AngularJS 中的 1 路、2 路、3 路……或更多数据绑定(bind)？
粗略地说，单向数据绑定(bind)只是与 ng-model 绑定(bind)。当涉及 Controller 时，在页面内和 2-way 内。有人可以向我解释这个概念，以便我真正了解如何看待它吗？还有什
authentication - 2 路 SSL 的替代方案
我想知道是否有任何替代 2 向 SSL 的方法。 2 向 SSL 是确保客户端和服务器可信通信的唯一选择吗？我有一个自签名证书供我的客户使用，我能否将自签名证书重新用于 2 种 SSL 方式，还是应该
java - 有没有办法通过浏览器测试 2 路 ssl？
如果是这样，你如何设置认证证书，你需要什么文件？是 .pfx 吗？您将如何在浏览器中安装它？一直试图通过浏览器测试 2 路 ssl。我有一个网络服务，尝试连接时总是返回认证身份验证失败。最佳答案扩
xml - 3 路 XML 合并算法
我希望能够对 XHTML 文档进行三向合并: 从文档的一些原始副本开始一个用户编辑原始文档的副本另一个用户编辑原始文档的单独副本需要一个工具来合并(自动和/或可视化)两个用户所做的更改。注意:
php - 包含计数的 4 路 SQL 查询
我有 4 张 table : ad (id, ...) website (id, title, URL, ...) space (id, website_id, ...) ad_space_count
java - 2 路 ssl tomcat 无状态服务规模
我在 java 中有一个无状态服务，部署在 tomcat 网络服务器中，我还配置了 2 路 ssl 验证。到目前为止，一切正常。当我有一个新客户端时，我只需要将新客户端证书放入我的 trustore
java - 2 路 SSL::SSL 握手失败错误
我已经创建了一个带有证书的信任库和带有私钥的 keystore 。我已经放置了以下代码，加载了 trsustore 管理器和 keystore 管理器，然后创建了 SSL 上下文的实例。每当我向网络
ssl - 2 路 SSL/TLS 配置
如果我在仅服务器身份验证中正确理解 SSL/TLS，握手后，服务器会向客户端发送它的公钥和由 CA 签名的数字签名证书。如果客户端有这个 CA 的公钥，它就可以解密证书并与服务器建立信任。如果它不信任
ssl - Nginx DataPower 2 路 TLS
我有 Nginx，它使用双向 TLS 代理从客户端到 IBM DataPower 的请求。从 Nginx 向 IBM DP 发送消息时出现错误:sll server (SERVER) ssl pee
Java - 2 路 'Has A' 关系
我刚刚开始了一个项目，让我的雇主成为一个管理软件。我有一个琐碎但可能很简单的查询，我似乎找不到任何相关信息。在对象之间建立“具有”关系的两种方式是否谨慎/良好做法。例如，Client 对象“有一个”
ssl - WSO2 EI - 2 路 SSL - handshake_failure
我在设置双向 SSL 身份验证时遇到问题。我需要从 wso2 企业集成商访问 HTTPS 端点。服务提供商给了我一个 pfx keystore ，其中包含我必须提供给服务器的证书和私钥。我在我的
java - AWS Lambda 中的相互身份验证(2 路 SSL)
我正在为小型 PoC 构建 AWS Lambda 服务。 PoC 中的流程是: 通过 POST 获取(文本)输入，执行小字符串操作 + 将操纵值存储到 DynamoDB 中，然后通过 HTTP P
java - 带有 CA 签名证书的 2 路 TLS
我的任务是在 Java 上下文中实现双向 TLS。我找到了一个示例 ( https://www.opencodez.com/java/implement-2-way-authentication-us
Android 简单 2 路 IM 问题(可运行)
我正在尝试测试一个非常简单的双向 IM 应用程序。客户端在 android 上，服务器在我的 PC(java)上。我已经在 PC 到 PC 之间用 java 测试了这个应用程序，它工作正常。但是在我
用于 2 路 ssl 身份验证的 Ruby 客户端
我有 java web 服务支持2-way ssl auth。所以我有客户端 keystore (client.p12)，服务器证书在受信任的存储区中，服务器 keystore 中的客户端证书在受信任
java - 使用 Web 服务和 2 路 SSL
通过 HTTPS 使用 Web 服务我们有一个我们正在使用的网络服务。 Webservice 可以在 HTTP 和 HTTPS 协议(protocol)上运行。使用 HTTP 没问题，但如何使用 H
node.js - nginx 和后端服务器之间的 2 路 SSL
我在 Node.js 上有一个后端服务器，我正在尝试在 Nginx 和这个后端服务器之间设置 2 路 SSL。但是我得到一个错误:2015/11/02 06:51:02 [错误] 12840#128
java - 启用 2 路 SSL 的端点的 handshake_failure
我一直在尝试连接到启用了 2 路 SSL 的服务端点。我正在使用 Spring resttemplate。我已将证书添加到 keystore 中，但出现以下错误: >org.springframewo
ssl - 使用 CherryPy 的 2 路 SSL
从 CherryPy 3.0 开始，只需指向服务器证书和私钥即可启用单向 SSL，如下所示: import cherrypy class HelloWorld(object): def ind
MySQL Pad 空月汇总报告。 (那里的 3/4 路)
这个问题来自:MySQL Number of Days inside a DateRange, inside a month (Booking Table) 我有一个包含以下数据的表: CREATE

首页

博学

6Ren·AI

商城

N路合并算法