【线性变换】
设 $V_1,V_2$ 是数域 $F$ 上的两个线性空间,将 $V_1$ 到 $V_2$ 的映射称为变换,线性变换是其中最简单、最基本的一种变换,其与矩阵、线性空间等都有密切的联系
定义变换 $T:V_1\rightarrow V_2$,若满足 $\forall \alpha_1,\alpha_2\in V_1,\lambda\in F$,有
则称 $T$ 是由 $V_1$ 到 $V_2$ 的线性变换,并称 $\alpha_1$ 为 $T\alpha_1$ 的原像,$T\alpha_1$ 为 $\alpha_1$ 的像
线性变换具有如下性质:
- $T\mathbf{0}=\mathbf{0}$
- 对于 $\forall k_i$,有 $T(\sum\limits_{i=1}^r k_i\alpha_i)=\sum\limits_{i=1}^rk_iT\alpha_i$
- 设 $\alpha_1,\cdots,\alpha_r\in V_1$ 且 $\alpha_1,\cdots,\alpha_r$ 线性相关,则 $T\alpha_1,\cdots,T\alpha_r$ 也是线性相关的
【变换矩阵】
设 $T:V_1\rightarrow V_2$ 为线性变换,$B_{\alpha}=\{T\alpha_1,\cdots,T\alpha_n\}$ 是 $V_1$ 的一组基,$B_{\beta}=\{\beta_1,\cdots,\beta_m\}$ 是 $V_2$ 的一组基,则
将这 $n$ 个关系式用矩阵记号来表示
称 $m\times n$ 阶矩阵
为线性变换 $T$ 在基偶 $(B_{\alpha},B_{\beta})$ 下的变换矩阵,其描述了 $n$ 维空间到 $m$ 维空间的线性变换的映射关系
故有
称为线性变换 $T$ 在基偶 $(B_{\alpha},B_{\beta})$ 下的矩阵表示
该式表明了,在给定基偶 $(B_{\alpha},B_{\beta})$ 的条件下,线性变换 $T$ 与变换矩阵 $A$ 一一对应,即对线性变换 $T$ 的研究,可转换为对矩阵 $A$ 的研究
【等价关系与相似关系】
在给定基偶 $(B_{\alpha},B_{\beta})$ 的条件下,线性变换 $T$ 与变换矩阵 $A$ 一一对应,那么 $T$ 在不同的基偶下,矩阵表示间的关系有最基本的两种,即等价关系和相似关系
等价关系
设 $(B_{\alpha},B_{\beta})$ 和 $(B_{\alpha’},B_{\beta’})$ 是 $V_1\rightarrow V_2$ 的两对基偶,$T$ 在这两个基偶下的变换矩阵分别为 $A,B$,且 $P$ 为 $B_{\alpha}$ 到 $B_{\alpha’}$ 的过渡矩阵,$Q$ 为 $B_{\beta}$ 到 $B_{\beta’}$ 的过渡矩阵,即
从而有
因此
由于 $B_{\beta}$ 是基,线性无关,故有
即 $T$ 在不同基偶下的矩阵 $A$ 和 $B$ 是等价关系,记为 $A\cong B$
等价关系可理解为:在 $n$ 维线性空间中选择基矩阵 $P$,在 $m$ 维线性空间中,选择基矩阵 $Q$,在 $P,Q$ 的作用下,通过线性变换 $T$ 的映射,由 $A$ 变为 $B$
相似关系
若线性变换 $T$ 是 $V_1\rightarrow V_1$,那么在上述过程中,有
进而可得
即 $T$ 在不同基偶下的矩阵 $A$ 和 $B$ 是相似关系,记为 $A\sim B$
相似关系可理解为:在 $n$ 维线性空间中选择基矩阵 $P$,在 $P$ 的作用下,通过线性变换 $T$ 的映射,由 $A$ 变为 $B$
【不变子空间】
进一步,讨论线性变换 $T:V\rightarrow V$ 的矩阵表示的简化问题,即 $T$ 在什么样的基下的矩阵表示较简单,这个问题与不变子空间和特征值与特征向量密切相关
核空间与值域
在给出不变子空间的定义前,首先给出核空间与值域的概念
设 $T:V_1\rightarrow V_2$ 为线性变换,分别称
为 $T$ 的核空间与值域
并称 $\text{dim}(N(T))$ 为 $T$ 的零度,记为 $\text{null }T$,称 $\text{dim}(R(T))$ 为 $T$ 的秩,记为 $\text{rank }T$
通过基的扩张方法,对于线性变换 $T:V_1\rightarrow V_2$ ,记 $n=\text{dim}V_1$,有
不变子空间
设 $T:V\rightarrow V$ 为线性变换,$W$ 是 $V$ 的子空间,若 $\forall \alpha\in W$,有 $T\alpha\in W$,则称 $W$ 为 $V$ 的不变子空间
显然,核空间 $N(T)$ 和值域 $R(T)$ 都是 $T$ 的不变子空间
利用不变子空间,可以简化线性变换 $T$ 的矩阵表示
设 $\text{dim} V=n$,$W\subset V$ 是不变子空间,$\text{dim}W=k<n$,取 $W$ 的一组基 $\{\alpha_1,\cdots,\alpha_k\}$,将其扩张为 $V$ 的基 $\{\alpha_1,\cdots,\alpha_k,\alpha_{k+1},\cdots,\alpha_{n}\}$
由于 $T(W)\subset W$,故 $T\alpha_1,\cdots,T\alpha_k$ 是 $\alpha_1,\cdots,\alpha_k$ 的线性组合,而 $T\alpha_{k+1},\cdots,T\alpha_{n}$ 是 $\alpha_1,\cdots,\alpha_n$ 的线性组合,即
故 $T:V\rightarrow V$ 在由不变子空间 $W$ 的基 $\{\alpha_1,\cdots,\alpha_k\}$ 所扩张成空间 $V$ 的基 $\{\alpha_1,\alpha_2,\cdots,\alpha_n\}$ 下的矩阵表示为
反之,若 $T:V\rightarrow V$ 在某个基 $\{\alpha_1,\cdots,\alpha_k,\alpha_{k+1},\cdots,\alpha_{n}\}$ 下的矩阵具有以上形状,则
必是 $T:V\rightarrow V$ 的不变子空间
更进一步,若 $W_1\triangleq \text{span}\{\alpha_{k+1},\cdots,\alpha_n\}$ 也是 $T$ 的不变子空间,则此时 $T:V\rightarrow V$ 在基 $\{\alpha_1,\cdots,\alpha_k,\alpha_{k+1},\cdots,\alpha_{n}\}$ 下的矩阵表示为对角块阵,即
其中,$A_{11}$ 为 $W$ 所对应的过渡矩阵,$A_{22}$ 为 $W_1$ 所对应的过渡矩阵
一般若 $V$ 为 $T$ 的若干个不变子空间的直和
在每个 $W_i$ 中取基 $\{\alpha_{i1},\cdots,\alpha_{in_i}\}$,再将这些基合起来构成 $V$ 的一组基,则 $T:V\rightarrow V$ 在该基下的矩阵表示为对角块阵,即
其中,$A_{ii}$ 为 $W_i$ 所对应的过渡矩阵
【特征值与特征向量】
引入
通过利用不变子空间,将线性变换 $T:V\rightarrow V$ 的矩阵表示简化为对角块阵
而对角阵又是对角块阵中最简单的一种,那么是否在一定条件下 $T:V\rightarrow V$ 的矩阵表示可以简化为对角阵?
由于 $T:V\rightarrow V$ 在基 $B=\{\alpha_1,\alpha_2,\cdots,\alpha_n\}$ 下的矩阵是对角阵,即
则
从而有
为此,引入线性变换 $T$ 的特征值和特征向量的概念
特征值与特征向量
设线性变换 $T:V\rightarrow V$,若 $\exists \lambda_0\in F$ 及非零向量 $\alpha$,使得
则称 $\lambda_0$ 是 $T$ 的一个特征值,$\alpha$ 是 $T$ 关于 $\lambda_0$ 的特征向量
易见,若 $\alpha$ 为 $\lambda_0$ 的特征向量,则 $\forall k\in F$,$k\alpha$ 亦为 $\lambda_0$ 的特征向量,即特征向量不被特征值唯一确定,但特征值由特征向量决定
对于 $T$ 的任一特征值 $\lambda_0$,$T$ 关于 $\lambda_0$ 的所有特征向量,再加上零向量组成的集合
是 $V^n$ 的一个子空间,称 $V_{\lambda_0}$ 是 $T$ 关于 $\lambda_0$ 的特征子空间,$\text{dim}V_{\lambda_0}$ 是 $\lambda_0$ 的几何重数
显然,$V_{\lambda_0}$ 是 $T$ 的不变子空间,且 $\lambda_0$ 的几何重数就是 $T$ 关于 $\lambda_0$ 的线性无关特征向量的最大个数,其反映了特征向量的个数
特征多项式
下面给出如何求 $T$ 的特征值 $\lambda_0$ 和对应的特征向量 $\alpha$ 的方法
设 $n$ 维线性空间 $V$ 的基为 $B=\{\alpha_1,\alpha_2,\cdots,\alpha_n\}$,$T$ 在 $B$ 下的变换矩阵为 $A$,向量 $\alpha=\sum\limits_{i=1}^nx_i\alpha_i=B\mathbf{x}$,$\mathbf{x}=[x_1,x_2,\cdots,x_n]^T$,则
即 $T\alpha$ 在基 $B$ 下的坐标为 $A\mathbf{x}$
又因 $T\alpha=\lambda_0\alpha$,则 $B(A\mathbf{x})=B(\lambda_0\mathbf{x})$,即 $B(\lambda_0\mathbf{x}-A\mathbf{x})=\mathbf{0}$,因为 $B$ 为基,故
即 $\lambda_0$ 是矩阵 $A$ 的特征值
反过来,若 $\lambda_0$ 是矩阵 $A$ 的特征值,则方程组
有非零解 $\mathbf{x}=[x_1,x_2,\cdots,x_n]^T$,从而
是 $\lambda_0$ 的特征向量
由于相似阵具有相同的特征多项式,故将 $A$ 的特征多项式
称为线性变换 $T$ 的特征多项式,$T$ 的特征值即该特征多项式的根
我们知道,如果 $\lambda_1,\lambda_2,\cdots,\lambda_s$ 是 $T$ 的所有不同的特征值,那么 $T$ 的特征多项式可写为
且 $n_1+n_2+\cdots+n_s=n$,称 $n_i$ 为特征值 $\lambda_i$ 的代数重数,其反映了特征向量重复的次数
关于特征值 $\lambda_i$ 的代数重数和几何重数有如下定理:设 $\lambda_1,\lambda_2,\cdots,\lambda_s$ 是 $T$ 的所有不同的特征值,则对任一 $\lambda_i$ 都有
即任何特征值的几何重数不大于其代数重数
【线性变换对角化】
在有了特征值与特征向量、几何重数与代数重数的概念后,继续讨论线性变换 $T:V\rightarrow V$ 的矩阵表示的简化问题,由于最简单的矩阵表示是对角矩阵,那么在什么条件下 $T:V\rightarrow V$ 的矩阵表示为对角矩阵?
给出线性变换可对角化的定义:若存在 $V$ 的基,使 $T:V\rightarrow V$ 在 $B$ 下的矩阵是对角阵,则称线性变换 $T:V\rightarrow V$ 是可对角化的
线性变换 $T:V\rightarrow V$ 是可对角化的充要条件是下列等价条件之一成立:
- $T$ 有 $n$ 个线性无关的特征向量
- $V^n$ 可直和分解为所有特征值 $\lambda_i$ 对应的特征子空间,即 $V_{\lambda_1}\oplus V_{\lambda_2}\oplus\cdots\oplus V_{\lambda_s}=V^n$
- 任一特征值的几何重数等于代数重数,即 $\text{dim}V_{\lambda_i}=n_i$
也就是说,当线性变换 $T:V\rightarrow V$ 满足上述的条件之一时,其矩阵表示为对角矩阵