学习资料:hello算法(强烈推荐
一、认识图
先举个例子,使用一组顶点 V 和一组边 E 的集合来表示图G。以下示例展示了一个包含 5 个顶点和 7 条边的图。
V={1,2,3,4,5}(数组)
E={(1,2),(1,3),(1,5),(2,3),(2,4),(2,5),(4,5)}(二维数组,表示边
G={V,E}(组合,成为图)
如下
「图 graph」是一种非线性数据结构,由「顶点 vertex」和「边 edge」组成。
相较于线性关系(链表)和分治关系(树),网络关系(图)的自由度更高,因而更为复杂。
1.1 图的常见类型
1.1.1 根据边是否有方向分类
根据边是否具有方向,可分为**「无向图 undirected graph」和「有向图 directed graph**」
- 在无向图中,边表示两顶点之间的**“双向”连接关系**,例如微信或 QQ 中的“好友关系”。
- 在有向图中,边具有方向性,即
A→B
和A←B
两个方向的边是相互独立的,例如微博或抖音上的“关注”与“被关注”关系。
1.1.2 所有顶点是否连通
「连通图 connected graph」和「非连通图 disconnected graph」
- 对于连通图,从某个顶点出发,可以到达其余任意顶点。
- 对于非连通图,从某个顶点出发,至少有一个顶点无法到达。
1.1.3 边是否添加“权重”变量
为边添加“权重”变量,成为「有权图 weighted graph」。
例如在《王者荣耀》等手游中,系统会根据共同游戏时间来计算玩家之间的“亲密度”,这种亲密度网络就可以用有权图来表示。
1.2 图的常见术语
前面有提到的:「顶点 vertex」和「边 edge」
「邻接 adjacency」
当两顶点之间存在边相连时,称这两顶点“邻接”。
在下图中,顶点 1 的邻接顶点为顶点 2、3、5。
「路径 path」
从顶点 A 到顶点 B 经过的边构成的序列被称为从 A 到 B 的“路径”。在下图中,边序列 1-5-2-4
是顶点 1 到顶点 4 的一条路径。
「度 degree」
一个顶点拥有的边数。
下图中,顶点1的度为3。
对于有向图,「入度 in-degree」表示有多少条边指向该顶点,「出度 out-degree」表示有多少条边从该顶点指出。
下图中,顶点1的入度为3,出度为1
1.3 图的表示
图的常用表示方式包括**“邻接矩阵”和“邻接表”**。以下使用无向图进行举例。
1.3.1 「邻接矩阵 adjacency matrix」
设图的顶点数量为 n ,「邻接矩阵 adjacency matrix」使用一个 n×n 大小的矩阵来表示图,每一行(列)代表一个顶点,矩阵元素代表边,用 1 或 0 表示两个顶点之间是否存在边。
如图所示,设邻接矩阵为 M、顶点列表为 V ,那么
- 矩阵元素 M[i,j]=1 表示顶点 V[i] 到顶点 V[j] 之间存在边;
- 反之 M[i,j]=0 ,表示两顶点之间无边。
尝试从矩阵M逐步反推出图:
- 从矩阵M中可以得出存在顶点1~5共5个
- 也便于得出边:1-3 1-2 1-5 3-2 2-5 2-4 5-4
- 将边和点绘制成图
邻接矩阵具有以下特性。
- 顶点不能与自身相连,因此邻接矩阵主对角线元素没有意义。
- 对于无向图,两个方向的边等价,此时邻接矩阵关于主对角线对称。
- 将邻接矩阵的元素从 1 和 0 替换为权重,则可表示有权图。
复杂度分析
使用邻接矩阵表示图时,我们可以直接访问矩阵元素以获取边,因此增删查改操作的效率很高,时间复杂度均为 O(1) 。然而,矩阵的空间复杂度为 O(n2) ,内存占用较多。
1.3.2 「邻接表 adjacency list」
「邻接表 adjacency list」使用 n 个链表来表示图,链表节点表示顶点。第 i 个链表对应顶点 i ,其中存储了该顶点的所有邻接顶点(与该顶点相连的顶点)。
如下图 展示了一个使用邻接表存储的图的示例。
尝试使用邻接表反推出图。
邻接表的特点是将每个顶点和它的邻接顶点进行(链式)存储,只要遍历链表就可以绘制出图。
1-235
2-13
3-12
5-124
4-25
与邻接矩阵不同的是,邻接表仅存储实际存在的边,而边的总数通常远小于 n2 ,因此它更加节省空间。
然而,在邻接表中需要通过遍历链表来查找边,因此其时间效率不如邻接矩阵。
复杂度分析
邻接表结构与哈希表中的“链式地址”非常相似,因此我们也可以采用类似的方法来优化效率。比如当链表较长时,可以将链表转化为 AVL 树或红黑树,从而将时间效率从 O(n) 优化至 O(logn) ;还可以把链表转换为哈希表,从而将时间复杂度降至 O(1) 。
1.4 图的常见应用
许多现实系统可以用图来建模,相应的问题也可以约化为图计算问题。
顶点 | 边 | 图计算问题 | |
---|---|---|---|
社交网络 | 用户 | 好友关系 | 潜在好友推荐 |
地铁线路 | 站点 | 站点间的连通性 | 最短路线推荐 |
太阳系 | 星体 | 星体间的万有引力作用 | 行星轨道计算 |
二 图的基础操作
图的基础操作可分为对“边”的操作和对“顶点”的操作。在“邻接矩阵”和“邻接表”两种表示方法下,实现方式有所不同。
2.1 基于邻接矩阵的实现¶
给定一个顶点数量为 n 的无向图,则各种操作的实现方式
添加或删除边:直接在邻接矩阵中修改指定的边即可,使用 O(1) 时间。而由于是无向图,因此需要同时更新两个方向的边。
添加顶点:在邻接矩阵的尾部添加一行一列,并全部填 0 即可,使用 O(n) 时间。
删除顶点:在邻接矩阵中删除一行一列。当删除首行首列时达到最差情况,需要将 (n−1)2 个元素“向左上移动”,从而使用 O(n2) 时间。
初始化:传入 n 个顶点,初始化长度为 n 的顶点列表
vertices
,使用 O(n) 时间;初始化 n×n 大小的邻接矩阵adjMat
,使用 O(n2) 时间。
java实现
// 顶点列表,元素代表“顶点值”,索引代表“顶点索引”
List<Integer> vertices;
// 邻接矩阵,行列索引对应“顶点索引”
List<List<Integer>> adjMat;
2.2 基于邻接表的实现¶
设无向图的顶点总数为 n、边总数为 m ,则可根据图 9-8 所示的方法实现各种操作。
添加边:在顶点对应链表的末尾添加边即可,使用 O(1) 时间。因为是无向图,所以需要同时添加两个方向的边。
删除边:在顶点对应链表中查找并删除指定边,使用 O(m) 时间。在无向图中,需要同时删除两个方向的边。
添加顶点:在邻接表中添加一个链表,并将新增顶点作为链表头节点,使用 O(1) 时间。
删除顶点:需遍历整个邻接表,删除包含指定顶点的所有边,使用 O(n+m) 时间。
初始化:在邻接表中创建 n 个顶点和 2m 条边,使用 O(n+m) 时间。
以下是邻接表的代码实现。实际代码有以下不同。(实际应用场景中也可以使用列表,以快速实现功能牺牲一小部分性能
- 为了方便添加与删除顶点,以及简化代码,我们使用列表(动态数组)来代替链表。
- 使用哈希表来存储邻接表,
key
为顶点实例,value
为该顶点的邻接顶点列表(链表)。
// 邻接表,key:顶点,value:该顶点的所有邻接顶点
Map<Vertex, List<Vertex>> adjList;
2.3 效率对比
设图中共有 n 个顶点和 m 条边,
邻接矩阵 | 邻接表(链表) | 邻接表(哈希表) | |
---|---|---|---|
判断是否邻接 | O(1) | O(m) | O(1) |
添加边 | O(1) | O(1) | O(1) |
删除边 | O(1) | O(m) | O(1) |
添加顶点 | O(n) | O(1) | O(1) |
删除顶点 | O(n2) | O(n+m) | O(n) |
内存空间占用 | O(n2) | O(n+m) | O(n+m) |
总结
- 表面上看,似乎邻接表(哈希表)的时间效率与空间效率最优。
- 但实际上,在邻接矩阵中操作边的效率更高,只需一次数组访问或赋值操作即可。
- 综合来看,邻接矩阵体现了**“以空间换时间”的原则,而邻接表体现了“以时间换空间”**的原则。
三、 图的遍历
树代表的是“一对多”的关系,而图则具有更高的自由度,可以表示任意的“多对多”关系。因此,我们可以把树看作图的一种特例。
显然,树的遍历操作也是图的遍历操作的一种特例。
和树一样,图的遍历方式也可分为两种:「广度优先遍历」和「深度优先遍历」。
(具体实现先略,看得脑袋疼
四、总结
重点回顾¶
- 图由顶点和边组成,可以表示为一组顶点和一组边构成的集合。
- 相较于线性关系(链表)和分治关系(树),网络关系(图)具有更高的自由度,因而更为复杂。
- 有向图的边具有方向性,连通图中的任意顶点均可达,有权图的每条边都包含权重变量。
- 邻接矩阵利用矩阵来表示图,每一行(列)代表一个顶点,矩阵元素代表边,用 1 或 0 表示两个顶点之间有边或无边。邻接矩阵在增删查改操作上效率很高,但空间占用较多。
- 邻接表使用多个链表来表示图,第 i 个链表对应顶点 i ,其中存储了该顶点的所有邻接顶点。邻接表相对于邻接矩阵更加节省空间,但由于需要遍历链表来查找边,因此时间效率较低。
- 当邻接表中的链表过长时,可以将其转换为红黑树或哈希表,从而提升查询效率。
- 从算法思想的角度分析,邻接矩阵体现了“以空间换时间”,邻接表体现了“以时间换空间”。
- 图可用于建模各类现实系统,如社交网络、地铁线路等。
- 树是图的一种特例,树的遍历也是图的遍历的一种特例。
- 图的广度优先遍历是一种由近及远、层层扩张的搜索方式,通常借助队列实现。
- 图的深度优先遍历是一种优先走到底、无路可走时再回溯的搜索方式,常基于递归来实现。