Alex_McAvoy

想要成为渔夫的猎手

线性变换及其矩阵表示

【线性变换】

设 $V_1,V_2$ 是数域 $F$ 上的两个线性空间,将 $V_1$ 到 $V_2$ 的映射称为变换,线性变换是其中最简单、最基本的一种变换,其与矩阵、线性空间等都有密切的联系

定义变换 $T:V_1\rightarrow V_2$,若满足 $\forall \alpha_1,\alpha_2\in V_1,\lambda\in F$,有

则称 $T$ 是由 $V_1$ 到 $V_2$ 的线性变换,并称 $\alpha_1$ 为 $T\alpha_1$ 的原像,$T\alpha_1$ 为 $\alpha_1$ 的

线性变换具有如下性质:

  1. $T\mathbf{0}=\mathbf{0}$
  2. 对于 $\forall k_i$,有 $T(\sum\limits_{i=1}^r k_i\alpha_i)=\sum\limits_{i=1}^rk_iT\alpha_i$
  3. 设 $\alpha_1,\cdots,\alpha_r\in V_1$ 且 $\alpha_1,\cdots,\alpha_r$ 线性相关,则 $T\alpha_1,\cdots,T\alpha_r$ 也是线性相关的

【变换矩阵】

设 $T:V_1\rightarrow V_2$ 为线性变换,$B_{\alpha}=\{T\alpha_1,\cdots,T\alpha_n\}$ 是 $V_1$ 的一组基,$B_{\beta}=\{\beta_1,\cdots,\beta_m\}$ 是 $V_2$ 的一组基,则

将这 $n$ 个关系式用矩阵记号来表示

称 $m\times n$ 阶矩阵

为线性变换 $T$ 在基偶 $(B_{\alpha},B_{\beta})$ 下的变换矩阵,其描述了 $n$ 维空间到 $m$ 维空间的线性变换的映射关系

故有

称为线性变换 $T$ 在基偶 $(B_{\alpha},B_{\beta})$ 下的矩阵表示

该式表明了,在给定基偶 $(B_{\alpha},B_{\beta})$ 的条件下,线性变换 $T$ 与变换矩阵 $A$ 一一对应,即对线性变换 $T$ 的研究,可转换为对矩阵 $A$ 的研究

【等价关系与相似关系】

在给定基偶 $(B_{\alpha},B_{\beta})$ 的条件下,线性变换 $T$ 与变换矩阵 $A$ 一一对应,那么 $T$ 在不同的基偶下,矩阵表示间的关系有最基本的两种,即等价关系和相似关系

等价关系

设 $(B_{\alpha},B_{\beta})$ 和 $(B_{\alpha’},B_{\beta’})$ 是 $V_1\rightarrow V_2$ 的两对基偶,$T$ 在这两个基偶下的变换矩阵分别为 $A,B$,且 $P$ 为 $B_{\alpha}$ 到 $B_{\alpha’}$ 的过渡矩阵,$Q$ 为 $B_{\beta}$ 到 $B_{\beta’}$ 的过渡矩阵,即

从而有

因此

由于 $B_{\beta}$ 是基,线性无关,故有

即 $T$ 在不同基偶下的矩阵 $A$ 和 $B$ 是等价关系,记为 $A\cong B$

等价关系可理解为:在 $n$ 维线性空间中选择基矩阵 $P$,在 $m$ 维线性空间中,选择基矩阵 $Q$,在 $P,Q$ 的作用下,通过线性变换 $T$ 的映射,由 $A$ 变为 $B$

相似关系

若线性变换 $T$ 是 $V_1\rightarrow V_1$,那么在上述过程中,有

进而可得

即 $T$ 在不同基偶下的矩阵 $A$ 和 $B$ 是相似关系,记为 $A\sim B$

相似关系可理解为:在 $n$ 维线性空间中选择基矩阵 $P$,在 $P$ 的作用下,通过线性变换 $T$ 的映射,由 $A$ 变为 $B$

【不变子空间】

进一步,讨论线性变换 $T:V\rightarrow V$ 的矩阵表示的简化问题,即 $T$ 在什么样的基下的矩阵表示较简单,这个问题与不变子空间和特征值与特征向量密切相关

核空间与值域

在给出不变子空间的定义前,首先给出核空间与值域的概念

设 $T:V_1\rightarrow V_2$ 为线性变换,分别称

为 $T$ 的核空间值域

并称 $\text{dim}(N(T))$ 为 $T$ 的零度,记为 $\text{null }T$,称 $\text{dim}(R(T))$ 为 $T$ 的,记为 $\text{rank }T$

通过基的扩张方法,对于线性变换 $T:V_1\rightarrow V_2$ ,记 $n=\text{dim}V_1$,有

不变子空间

设 $T:V\rightarrow V$ 为线性变换,$W$ 是 $V$ 的子空间,若 $\forall \alpha\in W$,有 $T\alpha\in W$,则称 $W$ 为 $V$ 的不变子空间

显然,核空间 $N(T)$ 和值域 $R(T)$ 都是 $T$ 的不变子空间


利用不变子空间,可以简化线性变换 $T$ 的矩阵表示

设 $\text{dim} V=n$,$W\subset V$ 是不变子空间,$\text{dim}W=k<n$,取 $W$ 的一组基 $\{\alpha_1,\cdots,\alpha_k\}$,将其扩张为 $V$ 的基 $\{\alpha_1,\cdots,\alpha_k,\alpha_{k+1},\cdots,\alpha_{n}\}$

由于 $T(W)\subset W$,故 $T\alpha_1,\cdots,T\alpha_k$ 是 $\alpha_1,\cdots,\alpha_k$ 的线性组合,而 $T\alpha_{k+1},\cdots,T\alpha_{n}$ 是 $\alpha_1,\cdots,\alpha_n$ 的线性组合,即

故 $T:V\rightarrow V$ 在由不变子空间 $W$ 的基 $\{\alpha_1,\cdots,\alpha_k\}$ 所扩张成空间 $V$ 的基 $\{\alpha_1,\alpha_2,\cdots,\alpha_n\}$ 下的矩阵表示为

反之,若 $T:V\rightarrow V$ 在某个基 $\{\alpha_1,\cdots,\alpha_k,\alpha_{k+1},\cdots,\alpha_{n}\}$ 下的矩阵具有以上形状,则

必是 $T:V\rightarrow V$ 的不变子空间

更进一步,若 $W_1\triangleq \text{span}\{\alpha_{k+1},\cdots,\alpha_n\}$ 也是 $T$ 的不变子空间,则此时 $T:V\rightarrow V$ 在基 $\{\alpha_1,\cdots,\alpha_k,\alpha_{k+1},\cdots,\alpha_{n}\}$ 下的矩阵表示为对角块阵,即

其中,$A_{11}$ 为 $W$ 所对应的过渡矩阵,$A_{22}$ 为 $W_1$ 所对应的过渡矩阵

一般若 $V$ 为 $T$ 的若干个不变子空间的直和

在每个 $W_i$ 中取基 $\{\alpha_{i1},\cdots,\alpha_{in_i}\}$,再将这些基合起来构成 $V$ 的一组基,则 $T:V\rightarrow V$ 在该基下的矩阵表示为对角块阵,即

其中,$A_{ii}$ 为 $W_i$ 所对应的过渡矩阵

【特征值与特征向量】

引入

通过利用不变子空间,将线性变换 $T:V\rightarrow V$ 的矩阵表示简化为对角块阵

而对角阵又是对角块阵中最简单的一种,那么是否在一定条件下 $T:V\rightarrow V$ 的矩阵表示可以简化为对角阵?

由于 $T:V\rightarrow V$ 在基 $B=\{\alpha_1,\alpha_2,\cdots,\alpha_n\}$ 下的矩阵是对角阵,即

从而有

为此,引入线性变换 $T$ 的特征值和特征向量的概念

特征值与特征向量

设线性变换 $T:V\rightarrow V$,若 $\exists \lambda_0\in F$ 及非零向量 $\alpha$,使得

则称 $\lambda_0$ 是 $T$ 的一个特征值,$\alpha$ 是 $T$ 关于 $\lambda_0$ 的特征向量

易见,若 $\alpha$ 为 $\lambda_0$ 的特征向量,则 $\forall k\in F$,$k\alpha$ 亦为 $\lambda_0$ 的特征向量,即特征向量不被特征值唯一确定,但特征值由特征向量决定

对于 $T$ 的任一特征值 $\lambda_0$,$T$ 关于 $\lambda_0$ 的所有特征向量,再加上零向量组成的集合

是 $V^n$ 的一个子空间,称 $V_{\lambda_0}$ 是 $T$ 关于 $\lambda_0$ 的特征子空间,$\text{dim}V_{\lambda_0}$ 是 $\lambda_0$ 的几何重数

显然,$V_{\lambda_0}$ 是 $T$ 的不变子空间,且 $\lambda_0$ 的几何重数就是 $T$ 关于 $\lambda_0$ 的线性无关特征向量的最大个数,其反映了特征向量的个数

特征多项式

下面给出如何求 $T$ 的特征值 $\lambda_0$ 和对应的特征向量 $\alpha$ 的方法

设 $n$ 维线性空间 $V$ 的基为 $B=\{\alpha_1,\alpha_2,\cdots,\alpha_n\}$,$T$ 在 $B$ 下的变换矩阵为 $A$,向量 $\alpha=\sum\limits_{i=1}^nx_i\alpha_i=B\mathbf{x}$,$\mathbf{x}=[x_1,x_2,\cdots,x_n]^T$,则

即 $T\alpha$ 在基 $B$ 下的坐标为 $A\mathbf{x}$

又因 $T\alpha=\lambda_0\alpha$,则 $B(A\mathbf{x})=B(\lambda_0\mathbf{x})$,即 $B(\lambda_0\mathbf{x}-A\mathbf{x})=\mathbf{0}$,因为 $B$ 为基,故

即 $\lambda_0$ 是矩阵 $A$ 的特征值

反过来,若 $\lambda_0$ 是矩阵 $A$ 的特征值,则方程组

有非零解 $\mathbf{x}=[x_1,x_2,\cdots,x_n]^T$,从而

是 $\lambda_0$ 的特征向量

由于相似阵具有相同的特征多项式,故将 $A$ 的特征多项式

称为线性变换 $T$ 的特征多项式,$T$ 的特征值即该特征多项式的根


我们知道,如果 $\lambda_1,\lambda_2,\cdots,\lambda_s$ 是 $T$ 的所有不同的特征值,那么 $T$ 的特征多项式可写为

且 $n_1+n_2+\cdots+n_s=n$,称 $n_i$ 为特征值 $\lambda_i$ 的代数重数,其反映了特征向量重复的次数

关于特征值 $\lambda_i$ 的代数重数和几何重数有如下定理:设 $\lambda_1,\lambda_2,\cdots,\lambda_s$ 是 $T$ 的所有不同的特征值,则对任一 $\lambda_i$ 都有

即任何特征值的几何重数不大于其代数重数

【线性变换对角化】

在有了特征值与特征向量、几何重数与代数重数的概念后,继续讨论线性变换 $T:V\rightarrow V$ 的矩阵表示的简化问题,由于最简单的矩阵表示是对角矩阵,那么在什么条件下 $T:V\rightarrow V$ 的矩阵表示为对角矩阵?

给出线性变换可对角化的定义:若存在 $V$ 的基,使 $T:V\rightarrow V$ 在 $B$ 下的矩阵是对角阵,则称线性变换 $T:V\rightarrow V$ 是可对角化的

线性变换 $T:V\rightarrow V$ 是可对角化的充要条件是下列等价条件之一成立:

  1. $T$ 有 $n$ 个线性无关的特征向量
  2. $V^n$ 可直和分解为所有特征值 $\lambda_i$ 对应的特征子空间,即 $V_{\lambda_1}\oplus V_{\lambda_2}\oplus\cdots\oplus V_{\lambda_s}=V^n$
  3. 任一特征值的几何重数等于代数重数,即 $\text{dim}V_{\lambda_i}=n_i$

也就是说,当线性变换 $T:V\rightarrow V$ 满足上述的条件之一时,其矩阵表示为对角矩阵

感谢您对我的支持,让我继续努力分享有用的技术与知识点!