数据结构与算法 Prim 最小生成树算法

问题分析

在一个有n个节点的无向连通图G = (V, E)中,V表示顶点集,E表示边集。只需n-1条边就可以使这个图连通,n-1条边要想保证图连通,就必须不含回路,所以我们只需要找出n-1条权值最小且无回路的边即可。
图片.png
需要明确几个概念:

  • 生成子图:选中一些边和所有顶点组成的图,称为原图的生成子图。
  • 生成树:如果生成子图恰好是一棵树,称为生成树。
  • 最小生成树:权值之和最小的生成树,称为最小生成树。

算法分析

为了在最小生成树的生成过程中,不产生环路,我们可以使用“切割法”。具体来说,在生成树的过程中,我们把已经在生成树的节点看成一个集合,把剩下的节点看作另一个集合,在这两个集合之间画一条切割线,从切割线经过的边上选出一条取值最小的作为新加入的边,可以形象地把这种方法称为“切割法”。
首先任选一个节点,如1号节点,把它放在U中,U = {1},那么剩下的节点即V - U = {2,3,4,5,6,7},V是图的所有顶点集合。如图2所示。
图片.png
现在在连接两个集合(U和V-U)的边中找出权值最小的,通过画切割线可以很快找到节点1和节点2之间的边权值最小,选中这条边,把2号节点加入U = {1, 2}, V - U = {3, 4, 5, 6}。
再按照上述操作在连接两个集合(U和V-U)的边中找出权值最小的边,如图3所示。如此下去,直到U = V结束。
图片.png
这个就是Prim算法,1957年由美国计算机科学家Robert C.Prim发现的。通过观察可以发现,Prim算法的贪心策略是:每次选取连接U和V-U的所有边中的最短边。

算法设计

算法设计的步骤如下所示:
步骤1:设计数据结构。用带权邻接矩阵C存储图G,bool数组s[],如果s[i] = true,说明顶点i已加入集合U,如图2所示。还有一个问题就是,从图上我们可以很直观地找出连接两个集合中的权值最小的边,但是在程序中如果穷举这些边就会很麻烦。在单源最短路径,我们只需要维护一个到该源点的最短距离数组dist[]即可,要构成生成树,我们需要一个维护父节点信息parent[]数组,对应dist[],到该源点最短距离的父节点是谁。closest[j]表示构成该源点边的最小权值的父节点信息,即理该点的最近父节点,lowcost[j]表示到该源点边的最小权值。对于图2的求解过程,对应的closest[]和lowcost[]如下图所示:
图片.png
只需要在V-U集合找lowcost[]值最小的顶点即可。
步骤2:初始化。令集合U={u},并初始化cloest[],lowcost[]和s[]。
步骤3:在V-U集合中找lowcost最小的节点t,将节点t加入集合U。
步骤4:如果集合V-U为空,算法结束。
步骤5:对集合V-U中的所有顶点j,更新其lowcost[]和closest[]。由于此时t已经是U中的节点,但它和U-V中的一些节点有连接,因此需要更新当它加入U时而引起的连接两个集合的权值最小的边的变化情况,更新公式为:if(c[t][j] < lowcost[j]) {lowcost[j] = c[t][j] ; closest[j] = t;},转步骤3。
按上述步骤,最终可以得到一棵权值之和最小的生成树。

算法图解

(1)数据结构

图片.png

(2)初始化

假设u=1, 令集合U = {1}, V - U = {2,3,4,5,6,7},s[1] = true,初始化closest[]:除了1号节点外其余节点均为1,表示V-U中的顶点到集合U的最临近点都为1,因为它们现在在U中还看不到其它节点。lowcost[]:1号节点到V-U中的节点的边的权值,直接读取邻接矩阵第一行就好。初始化结果如下图所示。
图片.png

(3)找最小

在集合V-U={2,3,4,5,6,7}中,依照贪心策略寻找V-U集合中lowcost最小的顶点t,如下图所示。
图片.png

(4)加入集合U

令集合U = {1,2}, V - U = {3,4,5,6,7}, s[2] = true。
图片.png

(5)更新

将2号节点加入集合U,和它邻接集合V-U中的节点是3和7。更新节点3和7:
c2 = 20 < lowcost[3] = INF,更新lowcost[3] = 20,同时更新closest[3] = 2;
c2 = 1 < lowcost[7] = 36, 更新lowcost[7] = 1,同时更新closest[7] = 2;更新后的结果如下图所示。
图片.png

(6)找最小

在集合V-U={3,4,5,6,7}中,依照贪心策略寻找V-U集合中lowcost最小的顶点t,如下图所示。
图片.png

(7)加入集合U

令集合U = {1,2,7}, V - U = {3,4,5,6}, s[7] = true。
图片.png

(8)更新

将7号节点加入集合U后,和它邻接集合V-U中的节点是3,4,5,6。更新:
c7 = 4 < lowcost[3] = 20, 更新lowcost[3] = 4, 同时更新closest[3] = 7;
c7 = 9 < lowcost[4] = INF, 更新lowcost[4] = 9, 同时更新closest[4] = 7;
c7 = 16 < lowcost[5] = INF, 更新lowcost[5] = 16, 同时更新closest[5] = 7;
c7 = 25 < lowcost[6] = 28, 更新lowcost[6] = 25, 同时更新closest[6] = 7;
更新后的结果如下图所示。
图片.png

(9)找最小

图片.png

(10)继续这样处理,最终得到结果如下图。

图片.png

代码片段展示

(1)初始化

1
2
3
4
5
6
7
8
9
10
11
12
// u表示最先加入集合U中的节点编号
s[u] = true;
for (int i = 1; i <= n; i++) {
// 初始化lowcost[],closest[]和s[]
if (i != u) {
lowcost[i] = c[u][i];
closest[i] = u;
s[i] = false;
}
else
lowcost[i] = 0;
}

(2)在集合V-U中寻找距离集合U最近的顶点t

1
2
3
4
5
6
7
8
9
int tmp = INF, t = u;
for (int j = 1; j <= n; j++) {
if (!s[j] && (lowcost[j] < tmp)) { //!s[j]表示j节点V-U集合中
t = j;
tmp = lowcost[j];
}
}
// 找不到,跳出循环
if (t == u) break;

(3)更新lowcost和closest数组

1
2
3
4
5
6
7
s[t] = true;  // 将t加入集合U
for (int j = 1; j <= n; j++) {
if ((!s[j]) && (c[t][j] < lowcost[j])) {
lowcost[j] = c[t][j];
closest[j] = t;
}
}

代码实现

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
public class PrimMST {

// 基于Prim算法实现最小生成树
private static final int INF = Integer.MAX_VALUE;

static int[][] init() {
int n, m;
System.out.println("请输入带权无向图的定点数和边数(以空格隔开):");
Scanner sc = new Scanner(System.in);
n = sc.nextInt();
m = sc.nextInt();
int[][] graph = new int[n + 1][n + 1];
for (int[] g : graph) Arrays.fill(g, INF);
System.out.println("请依次输入 m 条边的开始节点,结束节点,权值(以空格隔开):");
int start, end, wet;
for (int i = 0; i < m; i++) {
start = sc.nextInt();
end = sc.nextInt();
wet = sc.nextInt();
graph[start][end] = wet;
graph[end][start] = wet;
}
return graph;
}

@SuppressWarnings("SameParameterValue")
static int prim(int[][] c, int u) {
int n = c.length - 1;
// 定义数据结构lowcost[],closest[],s[]
int[] lowcost = new int[n + 1];
int[] closest = new int[n + 1];
boolean[] s = new boolean[n + 1];
// 1.初始化lowcost[],closest[],s[]
s[u] = true;
for (int i = 1; i <= n; i++) {
if (i != u) {
lowcost[i] = c[u][i];
closest[i] = u;
s[i] = false;
}
else
lowcost[i] = 0;
}

// n个节点之间需要找最短路径n-1次
for (int i = 0; i < n-1; i++) {
// 2.找最小
int tmp = INF, t = u;
for (int j = 1; j <= n; j++) {
if (!s[j] && (lowcost[j] < tmp)) { //!s[j]表示j节点V-U集合中
t = j;
tmp = lowcost[j];
}
}
// 找不到,跳出循环
if (t == u) break;
// 将t加入集合U
s[t] = true;

// 3.更新
for (int j = 1; j <= n; j++) {
if ((!s[j]) && (c[t][j] < lowcost[j])) {
lowcost[j] = c[t][j];
closest[j] = t;
}
}
}

// 4.打印最终结果
int totalcost = 0;
System.out.print("lowcost[]数组:");
for (int i = 1; i <= n; i++) {
System.out.print(lowcost[i] + " ");
totalcost += lowcost[i];
}
System.out.println();
System.out.print("closest[]数组:");
for (int i = 1; i <= n; i++) {
System.out.print(closest[i] + " ");
}
System.out.println();
return totalcost;
}

public static void main(String[] args) {
int[][] graph = init();
int weight = prim(graph, 1); // 1表示从1开始找
System.out.println("最小生成树总的花费是:" + weight);
}

}

实验结果

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
请输入带权无向图的定点数和边数(以空格隔开):
7 12
请依次输入12条边的开始节点,结束节点,权值(以空格隔开):
1 2 23
1 6 28
1 7 36
2 3 20
2 7 1
3 4 15
3 7 4
4 5 3
4 7 9
5 6 17
5 7 16
6 7 25
lowcost[]数组:0 23 4 9 3 17 1
closest[]数组:0 1 7 7 4 5 2

最小生成树总的花费是:57

算法优化

显然,Prim算法的时间复杂度为O(n^2),同单源最短路径,哈夫曼编码类似,都可以通过在“找最小”的步骤引入优先队列,可以使找最小的操作的时间复杂度降为O(logn),总的时间复杂度降为O(nlogn),Prim算法用优先队列比较简单,如前面几个贪心算法那样,只需构造一个结构体来存储节点相关信息,重写节点的排序规则就可以了。