跳转至

矩阵树定理

矩阵树定理解决了一张图的生成树个数计数问题。

本篇记号声明

本篇中的图,无论无向还是有向,都允许重边,但是默认没有自环。

有自环的情形

自环并不影响生成树的个数,也不影响下文中 Laplace 矩阵的计算,故而矩阵树定理对有自环的情形依然成立。计算时不必删去自环。如果删去自环,会影响根据 BEST 定理应用矩阵树定理统计有向图的欧拉回路个数。

无向图情况

是一个有 个顶点的无向图。定义度数矩阵

为点 与点 相连的边数,并定义邻接矩阵

定义 Laplace 矩阵(亦称 Kirchhoff 矩阵)

记图 的所有生成树个数为

有向图情况

是一个有 个顶点的有向图。定义出度矩阵

类似地定义入度矩阵

为点 指向点 的有向边数,并定义邻接矩阵

定义出度 Laplace 矩阵

定义入度 Laplace 矩阵

记图 的以 为根的所有根向树形图个数为 。所谓根向树形图,是说这张图的基图是一棵树,所有的边全部指向父亲。

记图 的以 为根的所有叶向树形图个数为 。所谓叶向树形图,是说这张图的基图是一棵树,所有的边全部指向儿子。

定理叙述

矩阵树定理具有多种形式。

定义 ,矩阵 的子矩阵 为选取 的元素得到的子矩阵。

定理 1(矩阵树定理,无向图,行列式形式)

对于无向图 和任意的 ,都有

也就是说,无向图的 Laplace 矩阵所有 阶主子式都相等,且都等于图的生成树的个数。

推论 1(矩阵树定理,无向图,特征值形式)

个特征值,那么有

定理 2(矩阵树定理,有向图根向树,行列式形式)

对于有向图 和任意的 ,都有

也就是说,有向图的出度 Laplace 矩阵删去第 行第 列得到的主子式等于以 为根的叶向树形图的个数。

因此如果要统计一张图所有的根向树形图,只要枚举所有的根 并对 求和即可。

定理 3(矩阵树定理,有向图叶向树,行列式形式)

对于有向图 和任意的 ,都有

也就是说,有向图的入度 Laplace 矩阵删去第 行第 列得到的主子式等于以 为根的根向树形图的个数。

因此如果要统计一张图所有的叶向树形图,只要枚举所有的根 并对 求和即可。

根向树形图也被称为内向树形图,但因为计算内向树形图用的是出度,为了不引起 的混淆,所以采用了根向这一说法。

定理证明

观察上述定理形式极为相似,这里给出一种统一的证明方式,并且将之前的结论拓展到带权的图上。

证明的大致思路如下:

  • 首先,所有情形都可以转化为计数有向图上根向树形图的情形;
  • 利用矩阵语言给出选出的若干边可以构成根向树形图的充要条件;
  • 将选边的操作利用 Cauchy–Binet 公式和 Laplace 矩阵的行列式联系起来;
  • 最后,将行列式形式的结论转化为特征值形式的结论。

引理:Cauchy–Binet 公式

引理 1(Cauchy–Binet)

给定 的矩阵 的矩阵 ,则有

这里求和记号的含义是, 取遍所有 中大小为 的子集。如果 ,必然有

证明(组合视角)

参考 「NOI2021」路径交点 的模型,首先考虑行列式的如下组合意义。对于 阶矩阵 ,建立有向无环图 。其中,顶点集为 ,亦即平面上的两列点。记左侧一列点为 ,右侧的一列点为 ;而有向边集为 ,并赋有边权 。在图中,称大小为 的边的子集 为一个路径组,如果它的起点互不相同,且终点也互不相同。显然,路径组 上的置换 可以一一对应。注意到,如果将一个路径组在平面上画出,这些边之间可能会两两相交,而这些交点的数目(计重数)就等于 的逆序数。这是因为边 和边 相交,当且仅当 ,即这是一个逆序对。为方便,称对应置换的逆序数的奇偶性,亦即该路径组交点个数的奇偶性,为该路径组的奇偶性。所以,如果将这些路径组按照权重计数,且用偶数交点的路径组数减去奇数交点的路径组数,就会得到行列式的 Leibniz 展开:

其中, 上的置换群,而 为置换 的符号(当逆序数为偶数时,它等于 ;当逆序数为奇数时,它等于 )。

在理解行列式的组合意义后,可以利用如下的组合模型证明 Cauchy–Binet 公式。对于 阶矩阵 阶矩阵 ,建立有向无环图 。其中,顶点集为 ,这里,;而有向边集为 ,其中,,分别赋以边权 。同样考虑自 的路径组(路径间两两不共用顶点),按照权重计数,并用偶数交点的路径组数减去奇数交点的路径组数。下面说明,Cauchy–Binet 公式的左右两侧分别用两种方式计算了这一数目。

对于左侧,基于上面描述的图 ,建立新图 ,其顶点集为 ,边集为 ,且对于边 赋以边权 ,即在原图 中自 的简单路径的加权计数。这一边权正是 。这相当于把上述的三层图简化成了两层图。但是,两层图 中的路径组(按权重计)并非和三层图 中的路径组一一对应。由于在两层图中,每个路径都对应三层图中若干条简单路径,在对两层图进行路径组的计数时,需要将权重相乘,这相当于对它们对应的三层图中的路径集合两两组合,这必然会造成出现共用中间经停点的情形。但是,这些共用中间经停点的路径对并不会对最后的答案有贡献,因为对于 和任意中间点 ,都存在两种简单路径对 ,但是这两组路径在三层图中的交点数目奇偶性必然相反,因为如果只看起点和终点,两组路径交换了终点。所以,这些共用中间经停点的路径在简化后的两层图计数时,贡献会两两抵消。对于剩下的情形,如果给定两条路径的起点和终点,那么无论中间的点如何如何选取(只要不选择同一个点),则这两条路径的交点个数的奇偶性不会变。故而, 中每一个路径组对应的所有原图 中的路径组都具有相同的奇偶性。因而, 提供了前文所述路径组数差值的一种计算方式。

对于右侧,它相当于枚举了所有可能的中间点的组合。给定任何中间点集合 ,分别考虑自 的路径组和自 的路径组,可以连接得到 的路径组,且前两个路径组对应的置换的复合就等于之后的路径组对应的置换,故而前两个路径的奇偶性的乘积等于之后的路径组的奇偶性。所以,所有中间点集合为 的路径组的计数的差值正等于自 的路径组的计数的差值和自 的路径组的计数的差值的乘积。对所有可能的 求和,即得到右式,故而它正是前文所述路径组数差值。

证明(代数视角)

上述组合证明其实可以逐字逐句地翻译成代数证明。这里转而提供另一种技巧性较强的代数证明,但用到了几个常见结论。当 时,行列式为零,因为

时,Cauchy–Binet 公式就是,方阵的积的行列式等于方阵的行列式的积。

时,注意到

又已知结论, 的系数是 的所有 阶主子式的和。故而,比较上式中两侧系数,有

这里,第二个等号用到了 的情形的结论。

用关联矩阵刻画图的结构

对于有向图 ,顶点数为 ,边数为 ,且边 赋有边权 。由此,可以定义 阶出度关联矩阵

阶入度关联矩阵

它们每行都记录了一条边:出度关联矩阵 记录了边的起点,入度关联矩阵 记录了边的终点。

简单计算可知

进而有

前文的 Cauchy–Binet 公式表明,Laplace 矩阵的主子式其实是一系列子结构的和。每个子结构都反映了对应的子图的性质。

引理 2

对于 的一个子图 ,若它满足 ,则子图 是一个以 为根的根向森林,当且仅当对应的算式

不为零。而且,该式当不为零时,必然等于 ,记作

证明

不妨设 。这是根据行列式的多重线性,每个行列式的每行都可以提取因子 ,这些因子的乘积为

首先分析两个因子等于零的条件。前一个因子 每行至多一个不为零的数字,即 。如果有任何一行全为零,则该行列式必然为零。所以,该行列式不为零,当且仅当每行恰好一个 ,亦即 中每个点都恰好是 中一条边的起点,且没有两个边共用同一个起点。已知 成为以 为根的根向森林,一个必要条件就是除了根之外,所有顶点有且只有一个父节点,这必然使得该因子不为零;但反过来并不一定成立,因为不能保证不存在环,所以还需要考察第二个因子。注意, 的终点未必在 中。

假定前一个因子不为零,则此时子图 成为根向森林,当且仅当 中没有环。此时,后一项 每行中都有一个 ,但可能有一个或零个 。对于终点也在 中的边,如果 的终点是 的起点,则将 对应的行加上 对应的行,可以消去 行中的 。可以想象,此时该行描述的是 首尾相接的简单路径。如果该行出现了新的 ,那么说明 的终点也在 内, 的位置就是 的终点,于事,可以继续找到以 的终点为起点的边,再次加到该行上。这样的边总是存在的,因为上一段论述说明, 中每个点都恰好是 中一条边的起点。这一过程一直持续到该行不在出现 为止,相当于不断添加新的边到简单路径 中。此时,如果该行只剩下一个 ,那么说明 的终点不在所选顶点 中,过程终止;如果上次加入的边恰巧抵消了现有的 ,即该行只剩下零,那么说明新边 的终点就是最开始的边 的起点,即出现了一个环。所以,没有环的充要条件是该一行列式经上述操作可以变形成每行都恰好只有一个 的形式。由于这些 的位置是各行对应边的起点,此时得到的矩阵实际上就是

综上所述,如果 不是根向森林,则要么 ,要么 ;否则,两者均不为零,且乘积等于

带权有向图的矩阵树定理

现在可以证明本文的主要结果。前文所述矩阵树定理均为该定理的特殊情形。

定理 4(矩阵树定理,带权有向图根向树,行列式形式)

对于任意的 ,都有

这里, 的以 为根的根向树形图的集合。

证明

为除去 点外的剩余顶点的集合。那么,根据 Cauchy–Binet 公式,右式可以写作

遍历所有的 ,由引理 2,当且仅当 构成一个以 为根的根向森林时,亦即 是一个以 为根的根向树形图时,右侧累加一个

时,每个树的权值都是 ,则左侧就是所有树的计数,即 ,这就得到定理 2。类比上文,可以将结论直接推广于叶向树形图,这就得到定理 3。最后,要得到无向图上的生成树计数,可以应用如下推论。

推论 4(矩阵树定理,带权无向图,行列式形式)

对于无向图 和任意的 ,都有

这里, 的生成树的集合。这也说明, 的所有 阶主子式都相等。

证明

对于无向图 ,可以构建有向图 ,其中,,即每条 中的无向边都拆成有向图中方向相反的两条有向边。任取 ,则 中以 为根的根向树形图和 中的生成树一一对应。由前者向后者,只需要移除边的定向和根的选取;由后者向前者,只需要从选定的根 开始逐边选取根向作为边的定向。所以,此时有

此处用到了结论 ,这容易直接验证。

特征值形式

仍然首先考虑有向图上的结论。

定理 5

对于有向图 ,定义多元多项式

这里, 是指以 为对角线元素的对角矩阵。那么,

就等于 的以 为根的根向森林的(带权的)计数。

证明

仿照定理 4 的证明,注意到如果令 ,那么,定理中的系数就是 (这一点不妨直接观察行列式的 Leibniz 展开式)。根据 Cauchy–Binet 公式,它等于

遍历所有的 ,由引理 2,当且仅当 构成一个以 为根的根向森林时,右侧累加一个

代入所有的未知元,得到 Laplace 矩阵的特征多项式

引理 3

Laplace 矩阵 至少有一个特征值为零。

证明

只要证明它的行列式为零即可。仿照定理 4 和 5 的证明,取 ,则这个行列式的大小应该等于有零棵树的根向森林的数目。这并不存在,所以该行列式等于零。

推论 5

对于有向图 ,所有由 棵树构成的根向森林的权值的总和等于系数

证明

对所有可能的 个根的选择求和即可。

定义 - 生成森林 是图的一个生成子图,使得这个子图有 个连通分量且无环。

推论 6

记无向图 - 生成森林 的集合为 ,则

这里, 为森林 中每个连通分量的顶点数目的乘积。特别地,当 时,有 ,故而

证明

仿照推论 4 的证明,可以直接利用推论 5 的结论。有向图中每一个由 棵树构成的根向森林都对应一个无向图中的 - 生成森林。但是,由于每个 - 生成森林 种选择根的方法,它会出现在 个有向图的根向森林中。

应用

Cayley 公式

推论 7(Cayley)

大小为 的带标号的无根树有 个。

证明

等价地,只要求得 个顶点的完全图的生成树的数目为 即可。为此,写出 Laplace 矩阵

计算它的任意主子式,有

应用定理 1 即得到结论。

BEST 定理

前置知识:欧拉图

这一定理将有向欧拉图中欧拉回路的数目和该图的根向树形图的数目联系起来,从而解决了有向图中的欧拉回路的计数问题。注意,任意无向图中的欧拉回路的计数问题是 NP 完全的。

在实现该算法时,应当首先判定给定图是否是欧拉图,移除所有零度顶点,然后建图计算根向树形图的个数,并由 BEST 定理得到欧拉回路的计数。注意,如果所求欧拉回路个数要求以给定点作为起点,需要将答案再乘上该点出度,相当于枚举回路中首条边。

在证明 BEST 定理之前,需要知道如下结论。

性质(有向图具有欧拉回路的判定)

一个有向图具有欧拉回路,当且仅当非零度顶点是强连通的,且所有顶点的出度和入度相等。

对于欧拉图,因为出度和入度相等,可以将它们略去上标,记作 。BEST 定理可以叙述如下。

定理 6(BEST 定理)

是有向欧拉图, 为任意顶点,那么 的不同欧拉回路总数

这也说明,对欧拉图 的任意两个节点 ,都有

证明

证明的大致思路是建立以 为起点的欧拉回路和以 为根的根向树形图以及各个顶点处出边的排列的对应关系。在指定欧拉回路的顶点后,需要证明的计数应当等于

这一计数的组合含义对应的构造如下。对于起点为 的欧拉回路,根据回路中每条边的出现顺序,可以构造出

  • 一个以 为根的根向树形图,由所有非根顶点处的最后一条出边组成,即
  • 处所有出边的排列顺序,即 ,和
  • 非根顶点 处除去最后一条出边之外的其他所有出边的排列顺序,即

下面说明,这样的构造得到的映射是双射。

一方面,给定欧拉回路,要证明所有非根顶点处的最后一条出边组成了一个根向树形图。根据构造,树中每个非根顶点的确只有一条出边,所以只需要证明这些出边不会成环。注意到,如果将所有顶点根据它在欧拉回路最后一次出现的顺序排序,那么非根顶点的最后一次出边必然指向顺序严格更靠后的顶点。如果存在环,那么环中就有一个顺序最靠后的顶点,因为它在环中,所以它指向了一个顺序并不靠后的点,这与上文矛盾。所以,非根顶点的最后一次出边必然构成根向树形图。

另一方面,给定任意根向树形图和其余出边的排列顺序,可以复原出一条欧拉回路,使得该欧拉回路经上述构造后可以得到给定的根向树形图和其余出边的排列顺序。对此,只需要从根 出发,每当到达一个顶点时,都根据给定的该顶点的出边排列顺序,选择顺序最靠前的、尚未经过的出边作为欧拉回路中本次的出边;如果该顶点处的排列中所有出边都已经经过了,就选择根向树形图中该顶点的出边作为欧拉回路中本次的出边。因为图是欧拉图,每个顶点的入度都等于出度,所以,这一过程不会在非根顶点处终止,即所得路径的确是回路。要证明所得路径是合法的欧拉回路,只需要证明这一过程能够遍历所有边就可以。

如果不能,则必然有某个顶点 的某个出边没有遍历到。考察顶点 。顶点 不能是根,因为最后会终止在根,如果根仍有出边剩余,这与过程终止矛盾。所以, 必然不是根。根据前文描述的过程,只要非根顶点 有任何出边剩余,那么非根顶点在树中的出边 必然剩余。记 。因为 的某个入边没有遍历到,根据 的出度等于入度,必然有 的某条出边没有遍历到。然后,可以类似地考察顶点 。这些推理将考察的顶点从 移动到了 ,即沿着根向树形图向树的根移动了一步。可以归纳地证明,此时必有根 的某个出边没有遍历到。前文已经说明这不可能,故得到矛盾。这说明,上一段所得路径的确是合法的欧拉回路。

可以验证这些映射都是单射,则必然同为双射。原命题得证。

实现

根据图写出 Laplace 矩阵,删去一行一列,求所得矩阵的行列式即可。求行列式可以使用 Gauss–Jordan 消元法。

例如,一个正方形图的生成树个数

可以用 Gauss–Jordan 消元解决,时间复杂度为

实现
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
#include <algorithm>
#include <cassert>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;
#define MOD 100000007
#define eps 1e-7

struct matrix {
  static const int maxn = 20;
  int n, m;
  double mat[maxn][maxn];

  matrix() { memset(mat, 0, sizeof(mat)); }

  void print() {
    cout << "MATRIX " << n << " " << m << endl;
    for (int i = 0; i < n; i++) {
      for (int j = 0; j < m; j++) {
        cout << mat[i][j] << "\t";
      }
      cout << endl;
    }
  }

  void random(int n) {
    this->n = n;
    this->m = n;
    for (int i = 0; i < n; i++)
      for (int j = 0; j < n; j++) mat[i][j] = rand() % 100;
  }

  void initSquare() {
    this->n = 4;
    this->m = 4;
    memset(mat, 0, sizeof(mat));
    mat[0][1] = mat[0][3] = 1;
    mat[1][0] = mat[1][2] = 1;
    mat[2][1] = mat[2][3] = 1;
    mat[3][0] = mat[3][2] = 1;
    mat[0][0] = mat[1][1] = mat[2][2] = mat[3][3] = -2;
    this->n--;  // 去一行
    this->m--;  // 去一列
  }

  double gauss() {
    double ans = 1;
    for (int i = 0; i < n; i++) {
      int sid = -1;
      for (int j = i; j < n; j++)
        if (abs(mat[j][i]) > eps) {
          sid = j;
          break;
        }
      if (sid == -1) continue;
      if (sid != i) {
        for (int j = 0; j < n; j++) {
          swap(mat[sid][j], mat[i][j]);
          ans = -ans;
        }
      }
      for (int j = i + 1; j < n; j++) {
        double ratio = mat[j][i] / mat[i][i];
        for (int k = 0; k < n; k++) {
          mat[j][k] -= mat[i][k] * ratio;
        }
      }
    }
    for (int i = 0; i < n; i++) ans *= mat[i][i];
    return abs(ans);
  }
};

int main() {
  srand(1);
  matrix T;
  // T.random(2);
  T.initSquare();
  T.print();
  double ans = T.gauss();
  T.print();
  cout << ans << endl;
}

例题

例题 1:「HEOI2015」小 Z 的房间

矩阵树定理的裸题。将每个空房间看作一个结点,根据输入的信息建图,得到 Laplace 矩阵后,任意删掉 的第 行第 列,求这个子式的行列式即可。求行列式的方法就是高斯消元成上三角阵然后算对角线积。另外本题需要在模 的整数子环 上进行高斯消元,采用辗转相除法即可。

例题 2:「FJOI2007」轮状病毒

本题的解法很多,这里用矩阵树定理是最直接的解法。当输入为 时,容易写出其 阶的 Laplace 矩阵为:

求出它的 阶子式的行列式即可,剩下的只有高精度计算了。

例题 2+

将例题 2 的数据加强,要求 ,但是答案对 1000007 取模。(本题求解需要一些线性代数知识)

推导递推式后利用矩阵快速幂即可求得。

推导递推式的过程:

注意到 删掉第 1 行第 1 列以后得到的矩阵很有规律,因此其实就是在求矩阵

的行列式。对 的行列式按第一列展开,得到

上述三个矩阵的行列式记为
注意到 是三对角行列式,采用类似的展开的方法可以得到 具有递推公式 。类似地,采用展开的方法可以得到 ,以及
将这些递推公式代入上式,得到:

于是猜测 也是非齐次的二阶线性递推。采用待定系数法可以得到最终的递推公式为

改写成 后,采用矩阵快速幂即可求出答案。

例题 3:「BZOJ3659」WHICH DREAMED IT

本题是 BEST 定理的直接应用,但是要注意,由于题目规定「两种完成任务的方式算作不同当且仅当使用钥匙的顺序不同」,对每个欧拉回路,1 号房间可以沿着任意一条出边出发,从而答案还要乘以 1 号房间的出度。

例题 4:「联合省选 2020 A」作业题

首先需要用莫比乌斯反演转化成计算所有生成树的边权和,因为与本文关系不大所以略去。

将行列式的项写成 ,最后答案是行列式的一次项系数,因为答案实际上是钦定一条边之后的生成树个数 这条边的边权之和,那么被乘上一次项系数的边就是被钦定的边。此时可以把高于一次的项忽略掉,复杂度

「北京省选集训 2019」生成树计数 是较为一般化的情况:计算生成树权值之和的 次方之和,用类似方法构造行列式的项即可,具体见洛谷题解。

例题 5:AGC051D C4

无向图欧拉回路计数是 NPC 问题,但这题的图较为简单,确定了 的边中从 指向 的有多少条,就可以确定其他三条边的定向方案,然后直接套用 BEST 定理就得到 的做法。