- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个二分图,我正在寻找最有效的迭代方法将其划分为连接的组件。我的递归版本已经开始在大数据集上溢出堆栈。我愿意从任何语言/伪代码移植,但为了完整起见,我将使用 C# 进行编码。
我现有的代码专用于我的数据类型。一个分区是蛋白质,另一个是光谱。 Map 和 Set 是 C++ stdlib workalikes。
void recursivelyAssignProteinToCluster (long proteinId,
long clusterId,
Set<long> spectrumSet,
Map<long, Set<long>> spectrumSetByProteinId,
Map<long, Set<long>> proteinSetBySpectrumId,
Map<long, long> clusterByProteinId)
{
// try to assign the protein to the current cluster
var insertResult = clusterByProteinId.Insert(proteinId, clusterId);
if (!insertResult.WasInserted)
return;
// recursively add all "cousin" proteins to the current cluster
foreach (long spectrumId in spectrumSet)
foreach (var cousinProteinId in proteinSetBySpectrumId[spectrumId])
{
if (proteinId != cousinProteinId)
{
Set<long> cousinSpectrumSet = spectrumSetByProteinId[cousinProteinId];
recursivelyAssignProteinToCluster(cousinProteinId,
clusterId,
cousinSpectrumSet,
spectrumSetByProteinId,
proteinSetBySpectrumId,
clusterByProteinId);
}
}
}
Map<long, long> calculateProteinClusters (NHibernate.ISession session)
{
var spectrumSetByProteinId = new Map<long, Set<long>>();
var proteinSetBySpectrumId = new Map<long, Set<long>>();
var query = session.CreateQuery("SELECT pi.Protein.id, psm.Spectrum.id " + GetFilteredQueryString(FromProtein, ProteinToPeptideSpectrumMatch));
foreach (var queryRow in query.List<object[]>())
{
long proteinId = (long) queryRow[0];
long spectrumId = (long) queryRow[1];
spectrumSetByProteinId[proteinId].Add(spectrumId);
proteinSetBySpectrumId[spectrumId].Add(proteinId);
}
var clusterByProteinId = new Map<long, long>();
int clusterId = 0;
foreach (var pair in spectrumSetByProteinId)
{
long proteinId = pair.Key;
// for each protein without a cluster assignment, make a new cluster
if (!clusterByProteinId.Contains(proteinId))
{
++clusterId;
recursivelyAssignProteinToCluster(proteinId,
clusterId,
pair.Value,
spectrumSetByProteinId,
proteinSetBySpectrumId,
clusterByProteinId);
}
}
return clusterByProteinId;
}
正如 ShinTakezou 建议的那样,我重构了将堆栈放在堆上的方法,效果很好。我使用了 digEmAll 示例中的 DepthFirstSearch 方法。
var clusterByProteinId = new Map<long, long>();
int clusterId = 0;
var clusterStack = new Stack<KeyValuePair<long, Set<long>>>();
foreach (var pair in spectrumSetByProteinId)
{
long proteinId = pair.Key;
if (clusterByProteinId.Contains(proteinId))
continue;
// for each protein without a cluster assignment, make a new cluster
++clusterId;
clusterStack.Push(new KeyValuePair<long, Set<long>>(proteinId, spectrumSetByProteinId[proteinId]));
while (clusterStack.Count > 0)
{
var kvp = clusterStack.Pop();
// try to assign the protein to the current cluster
var insertResult = clusterByProteinId.Insert(kvp.Key, clusterId);
if (!insertResult.WasInserted)
continue;
// add all "cousin" proteins to the current cluster
foreach (long spectrumId in kvp.Value)
foreach (var cousinProteinId in proteinSetBySpectrumId[spectrumId])
if (!clusterByProteinId.Contains(cousinProteinId))
clusterStack.Push(new KeyValuePair<long, Set<long>>(cousinProteinId, spectrumSetByProteinId[cousinProteinId]));
}
}
最佳答案
下面是一个辅助类的示例,它包含一个无向图并允许(迭代地)获取它的连接组件:
public class Graph<T>
{
public Dictionary<T, HashSet<T>> nodesNeighbors;
public IEnumerable<T> Nodes
{
get { return nodesNeighbors.Keys; }
}
public Graph()
{
this.nodesNeighbors = new Dictionary<T, HashSet<T>>();
}
public void AddNode(T node)
{
this.nodesNeighbors.Add(node, new HashSet<T>());
}
public void AddNodes(IEnumerable<T> nodes)
{
foreach (var n in nodes)
this.AddNode(n);
}
public void AddArc(T from, T to)
{
this.nodesNeighbors[from].Add(to);
this.nodesNeighbors[to].Add(from);
}
public bool ContainsNode(T node)
{
return this.nodesNeighbors.ContainsKey(node);
}
public IEnumerable<T> GetNeighbors(T node)
{
return nodesNeighbors[node];
}
public IEnumerable<T> DepthFirstSearch(T nodeStart)
{
var stack = new Stack<T>();
var visitedNodes = new HashSet<T>();
stack.Push(nodeStart);
while (stack.Count > 0)
{
var curr = stack.Pop();
if (!visitedNodes.Contains(curr))
{
visitedNodes.Add(curr);
yield return curr;
foreach (var next in this.GetNeighbors(curr))
{
if (!visitedNodes.Contains(next))
stack.Push(next);
}
}
}
}
public Graph<T> GetSubGraph(IEnumerable<T> nodes)
{
Graph<T> g = new Graph<T>();
g.AddNodes(nodes);
foreach (var n in g.Nodes.ToList())
{
foreach (var neigh in this.GetNeighbors(n))
g.AddArc(n, neigh);
}
return g;
}
public IEnumerable<Graph<T>> GetConnectedComponents()
{
var visitedNodes = new HashSet<T>();
var components = new List<Graph<T>>();
foreach (var node in this.Nodes)
{
if (!visitedNodes.Contains(node))
{
var subGraph = GetSubGraph(this.DepthFirstSearch(node));
components.Add(subGraph);
visitedNodes.UnionWith(subGraph.Nodes);
}
}
return components;
}
}
用法:
static void Main(string[] args)
{
var g = new Graph<long>();
g.AddNodes(new long[] { 1, 2, 3, 4, 5, 6, 7, 8, 9 });
g.AddArc(1, 2);
g.AddArc(1, 3);
g.AddArc(9, 6);
g.AddArc(6, 7);
g.AddArc(6, 8);
g.AddArc(4, 5);
var subGraphs = g.GetConnectedComponents();
}
您可以使用 Graph<>
class 而不是你的 map ,或者如果你想坚持使用你的 map ,请查看非常容易理解的代码(在类中它使用 Dictionary<T,HashSet<T>>
来保存节点和弧,因此与你的非常相似方法)
关于c# - 迭代连通分量算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10032940/
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 此帖子已于 8 个月
除了调试之外,是否有任何针对 c、c++ 或 c# 的测试工具,其工作原理类似于将独立函数复制粘贴到某个文本框,然后在其他文本框中输入参数? 最佳答案 也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法,例如将分辨率加倍或输入负值,但它永远无法将窗口放在我的第二台显示器上。 关于如何在 C/C++/c# 中执行此操作的任何线索 最
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。 我正在尝试编写一个 C# 程序,它将使用 DES 算法进行加密和解密。我需要一些实
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
有没有办法强制将另一个 窗口置于顶部? 不是应用程序的窗口,而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
假设您可以在 C/C++ 或 Csharp 之间做出选择,并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例,那么构建套接字服务器应用程序的最明智选择是什么? 最佳答案 如
你们能告诉我它们之间的区别吗? 顺便问一下,有什么叫C++库或C库的吗? 最佳答案 C++ 标准库 和 C 标准库 是 C++ 和 C 标准定义的库,提供给 C++ 和 C 程序使用。那是那些词的共同
下面的测试代码,我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端 我想也许我应该使用
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码,但我不想与雇主共享该函数的代码。相反,我只想让他有权在他自己的代码中调用该函数。是否可以?我想到了这两种方法 - 在
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等,
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一些 C 代码,将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6
我是一名优秀的程序员,十分优秀!