- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
无向图有 4,000,000,000(四十亿)条边。它们在一个大文本文件中表示为成对的节点 ID。我想计算这个图的连通分量。不幸的是,一旦您将带有边缘的节点 ID 加载到内存中,这将占用超过我可用的 128GB RAM。
是否有一种用于查找连接组件且实现起来相对简单的非核心算法?或者更好的是,它可以与 Unix 命令工具和现有的 (python) 库拼凑在一起吗?
最佳答案
根据您提供的问题描述和您在评论中提供的答案,我认为最简单的方法可能是使用@dreamzor 描述的方法。这是该答案的更充实的版本。
基本思想是将数据转换为更适合内存的压缩格式,对该数据运行常规连通分量算法,然后将其解压缩。请注意,如果您为每个节点分配一个 32 位数字 ID,那么存储所有节点所需的总空间最多为 40 亿个节点和 80 亿条边(假设您存储每条边的两个副本)的空间,即120 亿个 32 位整数的空间,只有大约 48GB 的空间,低于您的内存阈值。
首先,编写一个读取边文件的脚本,为每个节点分配一个数字 ID(可能按它们出现的顺序依次分配)。让此脚本将此映射写入一个文件,然后写入一个新的边缘文件,该文件使用节点的数字 ID 而不是字符串名称。完成后,您将拥有一个将 ID 映射到名称的名称文件和一个比以前占用更少空间的边缘文件。你在评论中提到你可以将所有节点名称放入内存,所以这一步应该是非常合理的。请注意,您不需要将所有边都存储在内存中 - 您可以通过程序流式传输它们 - 所以这不应该成为瓶颈。
接下来,编写一个程序,将边文件(而不是名称文件)读取到内存中,并使用任何合理的算法(BFS 或 DFS 在这里会很好)找到连接的组件。如果您小心使用您的内存(在这里使用 C 或 C++ 之类的东西会是一个很好的选择),这应该很适合主内存。完成后,通过数字 ID 将所有簇写入外部文件。您现在有一个按 ID 列出的所有 CC。
最后,编写一个程序,从名称文件中读取 ID 到节点的映射,然后流入集群 ID,并将每个集群中所有节点的名称写入最终文件。
这种方法实现起来应该相对简单,因为关键思想是保留您习惯的现有算法,但只需更改图形的表示形式以提高内存效率。过去,我在处理巨大的图形时使用过类似的方法 (Wikipedia),即使在内存比您少的系统上,它也能很好地工作。
关于algorithm - 核外连通分量算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38660534/
我试图弄清楚如何为聊天气泡制作外 Angular 圆形设计,以获得所需的结果: 我必须使用气泡作为不同背景的组件,没有相同和纯色,但有一些设计元素,所以气泡周围的空间必须是透明的: 我试过将元素添加为
我尝试了 display:table-cell 但它没有用。我怎样才能在div中显示这个词。现在它显示溢出了 div。我在我的网页上使用 CSS2。提前致谢。 Visit W3Schools
我有一个使用 CSS 隐藏在 View (对于移动设备)之外的菜单: #filter-column { position:absolute; left:-400px; } 当用户单击链
我想创建一个这样的问题行 http://imageshack.us/photo/my-images/200/questionh.png/ 此时我的html源是: question label
我要mock a class with Ruby . 如何编写处理样板代码的方法? 以下代码: module Mailgun end module Acani def self.mock_mail
请不要担心循环,但我的问题是关于这些关键字:outer、middle 和 inner。它们不是声明为实例变量,为什么IDE让代码编译?我在谷歌上搜索了一下,这是java标签吗? Java中的某种关键字
我有一个数据框(df),看起来像, Id Name Activity. 1 ABC a;sldkj kkkdk 2 two
Elasticsearch内存中有哪些东西可以使搜索如此快速? 是所有json本身都在内存中,还是仅倒排索引和映射将在内存中24 * 7? 最佳答案 这是一个很好的问题,然后简而言之就是: 不仅仅是数
我正在尝试添加用户在用户界面上选择的值。对于数据库中的特定列,我已经与数据库建立了连接,当我按“保存”时,新的 id 会添加到数据库中,控制台中不会显示任何错误,但我要提交的值不会放入数据库,我怎样才
我不确定这个问题是否应该涉及电子领域,但由于它是关于编程的,所以我在这里问了它。 我正在制作一个数字时钟,使用由移位寄存器供电的 LED,而不是 7 段显示器。无论如何,当使用 CCS 编译代码时,我
我希望用户在 div 中选择文本 (html)。然而,这样做会在浏览器中显示选择背景,也在 div 之外。 我可以用(参见 http://jsfiddle.net/lborgman/aWbgT/)来防
我有以下 Razor View @{ ViewBag.Title = "UserCost"; }
我使用 KineticJS 和 D3.js 制作了以下内容。当用户将鼠标悬停在其中一个点上时,我使用 KineticJS 让我弹出工具提示。但是,由于 Canvas 的边界,工具提示似乎被切断了。有没
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 2 年前。 Improve this qu
我正在使用 primefaces 学习 Java Web 和 jsf。 我的项目当前只有一个index.xhtml 文件,当我访问localhost:8080/appname/时,index.xhtm
我是 ios 新手。 我有一个 View ,其中我使用 Quarts 核心绘制了一个圆圈。 我在该圆圈中放置了一个 UIButton,并赋予了拖放该按钮的功能。 现在我想要限制按钮不能被拖出那个圆圈区
这个问题已经有答案了: How to add two strings as if they were numbers? [duplicate] (20 个回答) How to force JS to
我正在创建简单的文本从右侧滑动到页面的 css 动画。我正在使用 jQuery 通过向元素添加一个类来触发动画。但是起始位置必须在视口(viewport)之外,这会触发底部滚动条出现。如何预防? 这是
我编写了一个简单的代码来评估一段代码并将输出写入文件。这样它减少了我的一些,因为我需要很多很多文件,每一行都包含返回值! 无论如何,我正在使用的代码是: #!/usr/bin/ruby -w def
所以我试图在我的一款游戏中加入一个非常基本的“手电筒”式的东西。 我让它工作的方式是在我的游戏屏幕顶部有一个层,这个层会绘制一个黑色矩形,不透明度约为 80%,在我的游戏场景顶部创建黑暗的外观。 cc
我是一名优秀的程序员,十分优秀!