数据结构与算法 非线性数据结构-二叉树

「二叉树 Binary Tree」是一种非线性数据结构,代表着祖先与后代之间的派生关系,体现着“一分为二”的分治逻辑。与链表类似,二叉树的基本单元是节点,每个节点包含一个「值」和两个「指针」。

节点的两个指针分别指向「左子节点」和「右子节点」,同时该节点被称为这两个子节点的「父节点」。当给定一个二叉树的节点时,我们将该节点的左子节点及其以下节点形成的树称为该节点的「左子树」,同理可得「右子树」。

在二叉树中,除叶节点外,其他所有节点都包含子节点和非空子树。例如,在以下示例中,若将“节点 2”视为父节点,则其左子节点和右子节点分别是“节点 4”和“节点 5”,左子树是“节点 4 及其以下节点形成的树”,右子树是“节点 5 及其以下节点形成的树”。

父节点、子节点、子树

二叉树常见术语

二叉树涉及的术语较多,建议尽量理解并记住。

  • 「根节点 Root Node」:位于二叉树顶层的节点,没有父节点;
  • 「叶节点 Leaf Node」:没有子节点的节点,其两个指针均指向 null ;
  • 节点的「层 Level」:从顶至底递增,根节点所在层为 1 ;
  • 节点的「度 Degree」:节点的子节点的数量。在二叉树中,度的范围是 0, 1, 2 ;
  • 「边 Edge」:连接两个节点的线段,即节点指针;
  • 二叉树的「高度」:从根节点到最远叶节点所经过的边的数量;
  • 节点的「深度 Depth」 :从根节点到该节点所经过的边的数量;
  • 节点的「高度 Height」:从最远叶节点到该节点所经过的边的数量;

二叉树的常用术语

我们通常将「高度」和「深度」定义为“走过边的数量”,但有些题目可能会将其定义为“走过节点的数量”。在这种情况下,高度和深度都需要加 1 。

二叉树基本操作

初始化二叉树。与链表类似,首先初始化节点,然后构建引用指向(即指针)。

插入与删除节点。与链表类似,通过修改指针来实现插入与删除节点。

在二叉树中插入与删除节点

常见二叉树类型

完美(完全)二叉树

「完美二叉树 Perfect Binary Tree」除了最底层外,其余所有层的节点都被完全填满。在完美二叉树中,叶节点的度为 0 ,其余所有节点的度都为 2 ;若树高度为 h ,则节点总数为 2^{h+1} - 1 ,呈现标准的指数级关系,反映了自然界中常见的细胞分裂现象。

完美二叉树

完全二叉树

「完全二叉树 Complete Binary Tree」只有最底层的节点未被填满,且最底层节点尽量靠左填充。

完全二叉树

完满二叉树

「完满二叉树 Full Binary Tree」除了叶节点之外,其余所有节点都有两个子节点。

完满二叉树

平衡二叉树

「平衡二叉树 Balanced Binary Tree」中任意节点的左子树和右子树的高度之差的绝对值不超过 1 。

平衡二叉树

如下表所示,在最佳和最差结构下,二叉树的叶节点数量、节点总数、高度等达到极大或极小值。

完美二叉树 链表
第 i 层的节点数量 2^{i-1} 1
树的高度为 h 时的叶节点数量 2^h 1
树的高度为 h 时的节点总数 2^{h+1} - 1 h + 1
树的节点总数为 n 时的高度 log2 (n+1) - 1 n - 1

二叉树的遍历

二叉树的遍历是指不重复地访问二叉树(非线性结构)中的所有结点。在先左后右的原则下,根据访问根结点的次序不同,二叉树的遍历可以分为3种:前序遍历、中序遍历、后序遍历。

  1. 前序遍历(DLR):若二叉树为空,则空操作,否则访问根节点,然后前序遍历左子树,前序遍历右子树。(“前”的含义是,访问根结点在访问子树之前;)
  2. 中序遍历(LDR):访问根结点在访问左子树和访问右子树两者之间;
  3. 后序遍历(LRD):最后访问根结点;