gpt4 book ai didi

Python 学习教程之networkx

转载 作者:qq735679552 更新时间:2022-09-28 22:32:09 25 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python 学习教程之networkx由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

networkx是python的一个包,用于构建和操作复杂的图结构,提供分析图的算法。图是由顶点、边和可选的属性构成的数据结构,顶点表示数据,边是由两个顶点唯一确定的,表示两个顶点之间的关系。顶点和边也可以拥有更多的属性,以存储更多的信息.

对于networkx创建的无向图,允许一条边的两个顶点是相同的,即允许出现自循环,但是不允许两个顶点之间存在多条边,即出现平行边。边和顶点都可以有自定义的属性,属性称作边和顶点的数据,每一个属性都是一个key:value对.

一,创建图 。

在创建图之前,需要导入networkx模块,通常设置别名为nx;如果创建的图中,顶点之间的边没有方向,那么该图称作无向图。在创建图时,可以通过help(g)来获得图的帮助文档.

import networkx as nx 。

g=nx.graph()#创建空的无向图 g=nx.digraph()#创建空的有向图 。

二,图的顶点 。

图中的每一个顶点node都有一个关键的id属性,用于唯一标识一个节点,id属性可以整数或字符类型;顶点除了id属性之外,还可以自定义其他的属性.

1,向图中增加顶点 。

在向图中增加顶点时,可以一次增加一个顶点,也可以一次性增加多个顶点,顶点的id属性是必需的。在添加顶点之后,可以通过g.nodes()函数获得图的所有顶点的视图,返回的实际上nodeview对象;如果为g.nodes(data=true)的data参数设置为true,那么返回的是nodedataview对象,该对象不仅包含每个顶点的id属性,还包括顶点的其他属性.

?
1
2
3
4
g.add_node( 1 )
g.add_nodes_from([ 2 , 3 , 4 ])
g.nodes()
#nodeview((1, 2,3,4))

在向图中添加顶点时,除id属性之外,也可以向顶点中增加自定义的属性,例如,名称属性,权重属性:

?
1
2
>>> g.add_node( 1 ,name = 'n1' ,weight = 1 )
>>> g.add_node( 2 ,name = 'n2' ,weight = 1.2 )

2,查看顶点的属性 。

通过属性_node获得图的所有顶点和属性的信息,_node属性返回的是一个字典结构,字典的key属性是顶点的id属性,value属性是顶点的其他属性构成的一个字典.

?
1
2
3
>>> g._node
{ 1 : { 'name' : 'n1' , 'weight' : 1 }, 2 : { 'name' : 'n2' , 'weight' : 1.2 }, 3 : {}, 4 : {}}
>>>g.nodes(data = true)

可以通过顶点的id属性来查看顶点的其他属性:

?
1
2
3
4
>>> g.node[ 1 ]
{ 'name' : 'n1' , 'weight' : 1 }
>>> g.node[ 1 ][ 'name' ]
'n1 new'

通过g.nodes(),按照特定的条件来查看顶点:

?
1
2
>>> list (g.nodes(data = true))
[( 1 , { 'time' : '5pm' }), ( 3 , { 'time' : '2pm' })]

3,删除顶点 。

通过remove函数删除图的顶点,由于顶点的id属性能够唯一标识一个顶点,通常删除顶点都需要通过传递id属性作为参数.

?
1
2
g.remove_node(node_id)
g.remove_nodes_from(nodes_list)

4,更新顶点 。

更新图的顶点,有两种方式,第一种方式使用字典结构的_update函数,第二种方式是通过索引来设置新值:

?
1
2
3
>>> g._node[ 1 ].update({ 'name' : 'n1 new' })
>>> g.node[ 1 ][ 'name' ] = 'n1 new'
{ 1 : { 'name' : 'n1 new' , 'weight' : 1 }, 2 : { 'name' : 'n2' , 'weight' : 1.2 }, 3 : {}, 4 : {}}

5,删除顶点的属性 。

使用del命令删除顶点的属性 。

del g.nodes[1]['room'] 。

6,检查是否存在顶点 。

检查一个顶点是否存在于图中,可以使用 n in g方式来判断,也可以使用函数:

g.has_node(n) 。

三,图的边 。

图的边用于表示两个顶点之间的关系,因此,边是由两个顶点唯一确定的。为了表示复杂的关系,通常会为边增加一个权重weight属性;为了表示关系的类型,也会设置为边设置一个关系属性.

1,向图中增加边 。

边是由对应顶点的名称构成的,例如,顶点2和3之间有一条边,记作e=(2,3),通过add_edge(node1,node2)向图中添加一条边,也可以通过add_edges_from(list)向图中添加多条边;在添加边时,如果顶点不存在,那么networkx会自动把相应的顶点加入到图中.

?
1
2
3
4
g.add_edge( 2 , 3 )
g.add_edges_from([( 1 , 2 ),( 1 , 3 )])
g.edges()
#edgeview([(1, 2), (1, 3), (2, 3)])

可以向边中增加属性,例如,权重,关系等:

g.add_edge(1, 2, weight=4.7, relationship='renew') 。

由于在图中,边的权重weight是非常有用和常用的属性,因此,networkx模块内置以一个函数,专门用于在添加边时设置边的权重,该函数的参数是三元组,前两个字段是顶点的id属性,用于标识一个边,第三个字段是边的权重:

g.add_weighted_edges_from([(1,2,0.125),(1,3,0.75),(2,4,1.2),(3,4,0.375)]) 。

在增加边时,也可以一次增加多条边,为不同的边设置不同的属性:

g.add_edges_from([(1,2,{'color':'blue'}), (2,3,{'weight':8})]) 。

2,查看边的属性 。

查看边的属性,就是查看边的数据(data),查看所有边及其属性:

?
1
2
>>> g.edges(data = true)
edgedataview([( 1 , 2 , {}), ( 1 , 3 , {}), ( 2 , 3 , {})])

查看特定的边的信息有两种方式:

?
1
2
3
>>> g[ 1 ][ 2 ]
>>> g.get_edge_data( 1 , 2 )
{ 'weight' : 0.125 , 'relationship' : 'renew' , 'color' : 'blue' }

3,删除边 。

边是两个顶点的id属性构成的元组,通过 edge=(node1,node2) 来标识边,进而从图中找到边:

?
1
2
g.remove_edge(edge)
g.remove_edges_from(edges_list)

4,更新边的属性 。

通过边来更新边的属性,由两种方式,一种是使用update函数,一种是通过属性赋值来实现:

?
1
2
3
4
g[ 1 ][ 2 ][ 'weight' ] = 4.7
g.edge[ 1 ][ 2 ][ 'weight' ] = 4
g[ 1 ][ 2 ].update({ "weight" : 4.7 })
g.edges[ 1 , 2 ].update({ "weight" : 4.7 })

5,删除边的属性 。

通过 del命令来删除边的属性 。

del g[1][2]['name'] 。

6,检查边是否存在 。

检查一条边是否存在于图中 。

g.has_edge(1,2) 。

四,图的属性 。

图的属性主要是指相邻数据,节点和边.

1,adj 。

ajd返回的是一个adjacencyview视图,该视图是顶点的相邻的顶点和顶点的属性,用于显示用于存储与顶点相邻的顶点的数据,这是一个只读的字典结构,key是顶点,value是顶点的属性数据.

?
1
2
3
4
>>> g.adj[ 1 ][ 2 ]
{ 'weight' : 0.125 , 'relationship' : 'renew' , 'color' : 'blue' }
>>> g.adj[ 1 ]
atlasview({ 2 : { 'weight' : 0.125 , 'relationship' : 'renew' , 'color' : 'blue' }, 3 : { 'weight' : 0.75 }})

2,edges 。

图的边是由边的两个顶点唯一确定的,边还有一定的属性,因此,边是由两个顶点和边的属性构成的:

?
1
2
3
4
5
6
7
8
>>> g.edges
edgeview([( 1 , 2 ), ( 1 , 3 ), ( 2 , 3 ), ( 2 , 4 ), ( 3 , 4 )])
>>> g.edges.data()
edgedataview([( 1 , 2 , { 'weight' : 0.125 , 'relationship' : 'renew' , 'color' : 'blue' }),
( 1 , 3 , { 'weight' : 0.75 }),
( 2 , 3 , { 'weight' : 8 }),
( 2 , 4 , { 'weight' : 1.2 }),
( 3 , 4 , { 'weight' : 0.375 })])

edgeview仅仅提供边的信息,可以通过属性g.edges或函数g.edges()来获得图的边视图.

edgedataview提供图的边和边的属性,可以通过edgeview对象来调用data()函数获得.

3,nodes 。

图的顶点是顶点和顶点的属性构成的 。

?
1
2
3
4
>>> g.nodes
nodeview(( 1 , 2 , 3 , 4 ))
>>> g.nodes.data()
nodedataview({ 1 : { 'name' : 'n1 new' , 'weight' : 1 }, 2 : { 'name' : 'n2' , 'weight' : 1.2 }, 3 : {}, 4 : {}})

nodeview 通过属性g.nodes或函数g.nodes()来获得.

nodedataview提供图的边和边的属性,可以通过nodeview对象来调用data()函数获得.

4,degree 。

对于无向图,顶点的度是指跟顶点相连的边的数量;对于有向图,顶点的图分为入度和出度,朝向顶点的边称作入度;背向顶点的边称作出度.

通过g.degree 或g.degree()能够获得degreeview对象, 。

五,图的遍历 。

图的遍历是指按照图中各顶点之间的边,从图中的任一顶点出发,对图中的所有顶点访问一次且只访问一次。图的遍历按照优先顺序的不同,通常分为深度优先搜索(dfs)和广度优先搜索(bfs)两种方式.

1,查看顶点的相邻顶点 。

查看顶点的相邻顶点,有多种方式,例如,以下代码都用于返回顶点1的相邻顶点,g[n]表示图g中,与顶点n相邻的所有顶点:

?
1
2
3
g[n]
g.adj[n]
g.neighbors(n)

其中,g.neighbors(n)是g.adj[n]的迭代器版本.

2,查看图的相邻 。

该函数返回顶点n和相邻的节点信息:

?
1
2
3
>>> for n, nbrs in g.adjacency():
...   print (n)
...   print (nbrs)

3,图的遍历 。

深度优先遍历的算法:

首先以一个未被访问过的顶点作为起始顶点,沿当前顶点的边走到未访问过的相邻顶点; 当当前顶点没有未访问过的相邻顶点时,则回到上一个顶点,继续试探别的相邻顶点,直到所有的顶点都被访问过。 深度优先遍历算法的思想是:从一个顶点出发,一条路走到底;如果此路走不通,就返回上一个顶点,继续走其他路.

广度优先遍历的算法:

从顶点v出发,依次访问v的各个未访问过的相邻顶点; 。

分别从这些相邻顶点出发依次访问它们的相邻顶点; 。

广度优先遍历算法的思想是:以v为起点,按照路径的长度,由近至远,依次访问和v有路径相通且路径长度为1,2...,n的顶点.

在进行图遍历时,需要访问顶点的相邻顶点,这需要用到adjacency()函数,例如,g是一个无向图,n是顶点,nbrs是顶点n的相邻顶点,是一个字典结构 。

?
1
2
3
4
5
for n,nbrs in g.adjacency():
   print (n, nbrs)
   for nbr,attr in nbrs.items():
     # nbr表示跟n连接的顶点,attr表示这两个点连边的属性集合
     print (nbr,attr)

六,绘制graph 。

使用networkx模块draw()函数构造graph,使用matplotlib把图显示出来:

?
1
2
3
nx.draw(g)
import matplotlib.pyplot as plt
plt.show()

修改顶点和边的颜色:

?
1
2
3
g = nx.cubical_graph()
nx.draw(g, pos = nx.spectral_layout(g), nodecolor = 'r' , edge_color = 'b' )
plt.show()

完整的示例如下面的代码所示:

?
1
2
3
4
5
6
7
from matplotlib import pyplot as plt
import networkx as nx
g = nx.graph()
g.add_nodes_from([ 1 , 2 , 3 ])
g.add_edges_from([( 1 , 2 ),( 1 , 3 )])
nx.draw_networkx(g)
plt.show()

七,计算每个顶点的pagerank值 。

在计算每个顶点的pagerank(简称pr)值时,可以使用networkx模块中的pagerank()函数,该函数根据顶点的边和边的权重来计算顶点的pr值:

?
1
pagerank(g, alpha = 0.85 , personalization = none, max_iter = 100 , tol = 1e - 06 , nstart = none, weight = 'weight' , dangling = none)

常用的参数注释:

g:无向图会被转换为有向图,一条无向边转换为两条又向边 。

alpha:阻尼参数,默认值是0.85 。

weight:默认值是weight,表示使用edge的weight属性作为权重,如果没有指定,那么把edge的权重设置为1; 。

1,举个例子 。

例如,创建一个有向图,由三个顶点(a、b和c),两条边(a指向b,a指向c),边的权重都是0.5 。

?
1
2
3
4
g = nx.digraph()
g.add_weighted_edges_from([( 'a' , 'b' , 0.5 ),( 'a' , 'c' , 0.5 )])
print ( nx.pagerank(g))
#{'a': 0.259740259292235, 'c': 0.3701298703538825, 'b': 0.3701298703538825}

修改边的权重,并查看顶点的pr值:

?
1
2
3
g[ 'a' ][ 'c' ][ 'weight' ] = 1
print ( nx.pagerank(g)) 
# {'a': 0.259740259292235, 'c': 0.40692640737443164, 'b': 0.3333333333333333}

2,查看各个顶点的pr值 。

根据图来创建pagerank,并查看各个顶点的pagerank值 。

?
1
2
3
4
pr = nx.pagerank(g)
#page_rank_value=pr[node]
for node, pagerankvalue in pr.items():
   print ( "%s,%.4f" % (node,pagerankvalue))

原文链接:http://www.cnblogs.com/ljhdo/p/10662902.html 。

最后此篇关于Python 学习教程之networkx的文章就讲到这里了,如果你想了解更多关于Python 学习教程之networkx的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com