文章目录
本篇文章适合个人复习翻阅,不建议新手入门使用
特征值
特征值的引入
定义:相似
若 A , B A,B A,B 均为 n n n 阶方阵且存在 n n n 阶非异阵 P P P,使得 B = P − 1 A P B=P^{-1}AP B=P−1AP则称 A A A 与 B B B 相似,记为 A ≈ B A\approx B A≈B
命题
相似关系是等价关系(满足自反性,对称性,传递性)
由不变子空间的相关结论,我们知道
定理
设线性空间 V V V 可分解为
V = V 1 ⊕ V 2 ⊕ ⋯ ⊕ V m V=V_1\oplus V_2\oplus\cdots\oplus V_m V=V1⊕V2⊕⋯⊕Vm
其中每个 V i V_i Vi 都是线性变换 φ \varphi φ 的不变子空间,则 φ \varphi φ 可以表示为分块对角阵
证明思路
只需证 m = 2 m=2 m=2 的情形,设 V 1 V_1 V1 的一组基 { e 1 , e 2 , … , e r } \{e_1,e_2,\dots,e_r\} {e1,e2,…,er},将其扩充为 V V V 的一组基 { e 1 , e 2 , … , e r , e r + 1 , … , e n } \{e_1,e_2,\dots,e_r,e_{r+1},\dots,e_n\} {e1,e2,…,er,er+1,…,en},则 { e r + 1 , … , e n } \{e_{r+1},\dots,e_n\} {er+1,…,en} 是 V 2 V_2 V2 的一组基
由于 φ ( V 1 ) ⊂ V 1 , φ ( V 2 ) ⊂ V 2 \varphi(V_1)\subset V_1,\varphi(V_2)\subset V_2 φ(V1)⊂V1,φ(V2)⊂V2,则设
{ φ ( e 1 ) = a 11 e 1 + a 12 e 2 + ⋯ + a 1 r e r φ ( e 2 ) = a 21 e 1 + a 22 e 2 + ⋯ + a 2 r e r ⋯ ⋯ φ ( e r ) = a r 1 e 1 + a r 2 e 2 + ⋯ + a r r e r \begin{cases} \varphi(e_1)=a_{11}e_1+a_{12}e_2+\cdots+a_{1r}e_r\\ \varphi(e_2)=a_{21}e_1+a_{22}e_2+\cdots+a_{2r}e_r\\ \cdots\quad\cdots\\ \varphi(e_r)=a_{r1}e_1+a_{r2}e_2+\cdots+a_{rr}e_r\\ \end{cases} ⎩
⎨
⎧φ(e1)=a11e1+a12e2+⋯+a1rerφ(e2)=a21e1+a22e2+⋯+a2rer⋯⋯φ(er)=ar1e1+ar2e2+⋯+arrer
{ φ ( e r + 1 ) = a r + 1 , r + 1 e r + 1 + ⋯ + a r + 1 , n e n φ ( e r + 2 ) = a r + 2 , r + 1 e r + 1 + ⋯ + a r + 2 , n e n ⋯ ⋯ φ ( e n ) = a n , r + 1 e r + 1 + ⋯ + a n n e n \begin{cases} \varphi(e_{r+1})=a_{r+1,r+1}e_{r+1}+\cdots+a_{r+1,n}e_n\\ \varphi(e_{r+2})=a_{r+2,r+1}e_{r+1}+\cdots+a_{r+2,n}e_n\\ \cdots\quad\cdots\\ \varphi(e_{n})=a_{n,r+1}e_{r+1}+\cdots+a_{nn}e_n\\ \end{cases} ⎩ ⎨ ⎧φ(er+1)=ar+1,r+1er+1+⋯+ar+1,nenφ(er+2)=ar+2,r+1er+1+⋯+ar+2,nen⋯⋯φ(en)=an,r+1er+1+⋯+annen
即在 φ ( e 1 ) , … , φ ( e r ) \varphi(e_1),\dots,\varphi(e_r) φ(e1),…,φ(er) 的表达式中 e r + 1 , … , e n e_{r+1},\dots,e_n er+1,…,en 前的系数均为零,
在 φ ( e r + 1 ) , … , φ ( e n ) \varphi(e_{r+1}),\dots,\varphi(e_n) φ(er+1),…,φ(en) 的表达式中 e 1 , … , e r e_{1},\dots,e_r e1,…,er 前的系数均为零,
则 φ \varphi φ 在基 { e 1 , e 2 , … , e r , e r + 1 , … , e n } \{e_1,e_2,\dots,e_r,e_{r+1},\dots,e_n\} {e1,e2,…,er,er+1,…,en} 下的表示矩阵形如
( a 11 ⋯ a r 1 0 ⋯ 0 ⋮ ⋮ ⋮ ⋮ a 1 r ⋯ a r r 0 ⋯ 0 0 ⋯ 0 a r + 1 , r + 1 ⋯ a n , r + 1 ⋮ ⋮ ⋮ ⋮ 0 ⋯ 0 a r + 1 , n ⋯ a n n ) \begin{pmatrix} a_{11}&\cdots&a_{r1}&0&\cdots&0\\ \vdots&&\vdots&\vdots&&\vdots\\ a_{1r}&\cdots&a_{rr}&0&\cdots&0\\ 0&\cdots&0&a_{r+1,r+1}&\cdots&a_{n,r+1}\\ \vdots&&\vdots&\vdots&&\vdots\\ 0&\cdots&0&a_{r+1,n}&\cdots&a_{nn}\\ \end{pmatrix}
a11⋮a1r0⋮0⋯⋯⋯⋯ar1⋮arr0⋮00⋮0ar+1,r+1⋮ar+1,n⋯⋯⋯⋯0⋮0an,r+1⋮ann
即为分块对角阵 ■ \blacksquare ■
若 V i V_i Vi 是一维子空间,则 φ \varphi φ 在 V i V_i Vi 上的作用相当于一个数乘,即存在 λ 0 ∈ K \lambda_0\in\mathbb{K} λ0∈K,使得 φ ( x ) = λ 0 x \varphi(x)=\lambda_0x φ(x)=λ0x
若所有 V i V_i Vi 都是一维子空间,则 φ \varphi φ 的表示矩阵可写为对角阵
考虑如下问题:给定线性空间 V V V 上的线性变换 φ \varphi φ,能否找到 V V V 的一组基,使线性变换 φ \varphi φ 在这组基下的表示矩阵为对角阵;
由于一个线性变换在不同基下的矩阵是相似的,故上面的问题即可理解为找到所有相似于对角阵的矩阵
特征值、特征向量、特征多项式
定义:线性变换的特征值、特征向量
设 φ \varphi φ 是数域 K \mathbb{K} K 上线性空间 V V V 上的线性变换,若 λ 0 ∈ K , x ∈ V \lambda_0\in\mathbb{K},x\in V λ0∈K,x∈V 且 x ≠ 0 x\neq 0 x=0,使
φ ( x ) = λ 0 x \varphi(x)=\lambda_0x φ(x)=λ0x
则称 λ 0 \lambda_0 λ0 是线性变换 φ \varphi φ 的一个特征值,向量 x x x 称为 φ \varphi φ 关于特征值 λ 0 \lambda_0 λ0 的特征向量
定义:特征子空间
φ \varphi φ 关于特征值 λ 0 \lambda_0 λ0 的全体特征向量和零向量构成一个 V V V 的子空间,记为 V λ 0 V_{\lambda_0} Vλ0,称为 φ \varphi φ 的关于特征值 λ 0 \lambda_0 λ0 的特征子空间,显然 V λ 0 V_{\lambda_0} Vλ0 是 φ \varphi φ 的不变子空间
设 φ \varphi φ 在某组基下的表示矩阵为 A A A,向量 x x x 在这组基下可表示为一个列向量 α \alpha α,此时 φ ( x ) = λ 0 x \varphi(x)=\lambda_0x φ(x)=λ0x,等价于 A α = λ 0 α A\alpha=\lambda_0\alpha Aα=λ0α
或 ( λ 0 I n − A ) α = 0 (\lambda_0I_n-A)\alpha=0 (λ0In−A)α=0
定义:矩阵的特征值
设 A A A 是数域 K \mathbb{K} K 上的 n n n 阶方阵,若存在 λ 0 ∈ K \lambda_0\in\mathbb{K} λ0∈K 及 n n n 维非零列向量 α \alpha α,使得
A α = λ 0 α A\alpha=\lambda_0\alpha Aα=λ0α
则称 λ 0 \lambda_0 λ0 为矩阵 A A A 的一个特征值, α \alpha α 为 A A A 关于特征值 λ 0 \lambda_0 λ0 的特征向量。齐次方程组 ( λ 0 I − A ) x = 0 (\lambda_0I-A)x=0 (λ0I−A)x=0 的解空间 V λ 0 V_{\lambda_0} Vλ0 称为 A A A 关于特征值 λ 0 \lambda_0 λ0 的特征子空间
定义:特征多项式
设 A A A 是 n n n 阶方阵,称 ∣ λ I n − A ∣ |\lambda I_n-A| ∣λIn−A∣ 为 A A A 的特征多项式
注:
- 矩阵 A A A 的特征值即为它特征多项式的根
- 称 ∣ λ I n − A ∣ |\lambda I_n-A| ∣λIn−A∣ 为线性变换 φ \varphi φ 的特征多项式,记为 ∣ λ I − φ ∣ |\lambda I-\varphi| ∣λI−φ∣
定理
若 B B B 与 A A A 相似,则 B B B 与 A A A 具有相同的特征多项式,从而具有相同的特征值(计重数)
证明思路
∣ λ I n − B ∣ = ∣ P − 1 ( λ I n − A ) P ∣ = ∣ P − 1 ∣ ∣ λ I n − A ∣ ∣ P ∣ = ∣ λ I n − A ∣ |\lambda I_n -B|=|P^{-1}(\lambda I_n-A)P|=|P^{-1}||\lambda I_n-A||P|=|\lambda I_n-A| ∣λIn−B∣=∣P−1(λIn−A)P∣=∣P−1∣∣λIn−A∣∣P∣=∣λIn−A∣
命题
任意复方阵相似于一个上三角阵
注:上三角阵的特征值即为对角线上的元素
证明思路:(数学归纳法)
设 A α 1 = λ 1 α 1 A\alpha_1=\lambda_1\alpha_1 Aα1=λ1α1,将 α 1 \alpha_1 α1 作为 C n \mathbb{C}_n Cn 的基向量,扩展为一组基 { α 1 , … , α n } \{\alpha_1,\dots,\alpha_n\} {α1,…,αn},拼成矩阵 P = { α 1 , … , α n } P=\{\alpha_1,\dots,\alpha_n\} P={α1,…,αn},则 P P P 为非异阵,且
A P = ( α 1 , … , α n ) ( λ 1 ∗ O A 1 ) AP=(\alpha_1,\dots,\alpha_n)\begin{pmatrix} \lambda_1&*\\ O&A_1\\ \end{pmatrix} AP=(α1,…,αn)(λ1O∗A1)
注意到上式即为 P − 1 A P = ( λ 1 ∗ O A 1 ) P^{-1}AP=\begin{pmatrix} \lambda_1&*\\ O&A_1\\ \end{pmatrix} P−1AP=(λ1O∗A1),由于 A 1 A_1 A1 是 n − 1 n-1 n−1 阶方阵,由归纳法可得
特殊矩阵的特征值
命题:矩阵多项式的特征值
设 n n n 阶矩阵 A A A 的全部特征值 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,…,λn, f ( x ) f(x) f(x) 是一个多项式,则 f ( A ) f(A) f(A) 的全部特征值为 f ( λ 1 ) , f ( λ 2 ) , … , f ( λ n ) f(\lambda_1),f(\lambda_2),\dots,f(\lambda_n) f(λ1),f(λ2),…,f(λn)
证明
由于任意 n n n 阶矩阵均复相似于上三角矩阵,故设
P − 1 A P = ( λ 1 ∗ ⋯ ∗ 0 λ 2 ⋯ ∗ ⋮ ⋮ ⋮ 0 0 ⋯ λ n ) P^{-1}AP=\begin{pmatrix} \lambda_1&*&\cdots&*\\ 0&\lambda_2&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n\\ \end{pmatrix} P−1AP=
λ10⋮0∗λ2⋮0⋯⋯⋯∗∗⋮λn
结合上三角矩阵的四则运算性质,可得
P − 1 f ( A ) P = f ( P − 1 A P ) = ( f ( λ 1 ) ∗ ⋯ ∗ 0 f ( λ 2 ) ⋯ ∗ ⋮ ⋮ ⋮ 0 0 ⋯ f ( λ n ) ) P^{-1}f(A)P=f(P^{-1}AP)=\begin{pmatrix} f(\lambda_1)&*&\cdots&*\\ 0&f(\lambda_2)&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&f(\lambda_n)\\ \end{pmatrix} P−1f(A)P=f(P−1AP)=
f(λ1)0⋮0∗f(λ2)⋮0⋯⋯⋯∗∗⋮f(λn)
则观察出 f ( A ) f(A) f(A) 的特征值为 f ( λ 1 ) , f ( λ 2 ) , … , f ( λ n ) f(\lambda_1),f(\lambda_2),\dots,f(\lambda_n) f(λ1),f(λ2),…,f(λn)
命题:逆矩阵的特征值
设 n n n 阶矩阵 A A A 可逆,且 A A A 的特征值为 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,…,λn,则 A − 1 A^{-1} A−1 的全部特征值为 λ 1 − 1 , λ 2 − 1 , … , λ n − 1 \lambda_1^{-1},\lambda_2^{-1},\dots,\lambda_n^{-1} λ1−1,λ2−1,…,λn−1
证明:(思路同上)
由于任意 n n n 阶矩阵均复相似于上三角矩阵,故设
P − 1 A P = ( λ 1 ∗ ⋯ ∗ 0 λ 2 ⋯ ∗ ⋮ ⋮ ⋮ 0 0 ⋯ λ n ) P^{-1}AP=\begin{pmatrix} \lambda_1&*&\cdots&*\\ 0&\lambda_2&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n\\ \end{pmatrix} P−1AP=
λ10⋮0∗λ2⋮0⋯⋯⋯∗∗⋮λn
则有
A = P ( λ 1 ∗ ⋯ ∗ 0 λ 2 ⋯ ∗ ⋮ ⋮ ⋮ 0 0 ⋯ λ n ) P − 1 A=P\begin{pmatrix} \lambda_1&*&\cdots&*\\ 0&\lambda_2&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n\\ \end{pmatrix}P^{-1} A=P
λ10⋮0∗λ2⋮0⋯⋯⋯∗∗⋮λn
P−1
则
A − 1 = P ( λ 1 − 1 ∗ ⋯ ∗ 0 λ 2 − 1 ⋯ ∗ ⋮ ⋮ ⋮ 0 0 ⋯ λ n − 1 ) P − 1 A^{-1}=P\begin{pmatrix} \lambda_1^{-1}&*&\cdots&*\\ 0&\lambda_2^{-1}&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n^{-1}\\ \end{pmatrix}P^{-1} A−1=P
λ1−10⋮0∗λ2−1⋮0⋯⋯⋯∗∗⋮λn−1
P−1
则观察出 A − 1 A^{-1} A−1 的特征值为 λ 1 − 1 , λ 2 − 1 , … , λ n − 1 \lambda_1^{-1},\lambda_2^{-1},\dots,\lambda_n^{-1} λ1−1,λ2−1,…,λn−1
命题:循环矩阵的特征值
设循环矩阵
A = ( a 1 a 2 a 3 ⋯ a n a n a 1 a 2 ⋯ a n − 1 a n − 1 a n a 1 ⋯ a n − 2 ⋮ ⋮ ⋮ ⋮ a 2 a 3 a 4 ⋯ a 1 ) A=\begin{pmatrix} a_1&a_2&a_3&\cdots&a_n\\ a_n&a_1&a_2&\cdots&a_{n-1}\\ a_{n-1}&a_n&a_1&\cdots&a_{n-2}\\ \vdots&\vdots&\vdots&&\vdots\\ a_2&a_3&a_4&\cdots&a_1\\ \end{pmatrix} A=
a1anan−1⋮a2a2a1an⋮a3a3a2a1⋮a4⋯⋯⋯⋯anan−1an−2⋮a1
设 J = ( O I n − 1 1 O ) J=\begin{pmatrix} O&I_{n-1}\\ 1&O\\ \end{pmatrix} J=(O1In−1O), f ( x ) = a 1 + a 2 x + a 3 x 2 + ⋯ a n x n − 1 f(x)=a_1+a_2x+a_3x^2+\cdots a_nx^{n-1} f(x)=a1+a2x+a3x2+⋯anxn−1,则 A = f ( J ) A=f(J) A=f(J),又 ∣ λ I n − J ∣ = λ n − 1 |\lambda I_n-J|=\lambda^n-1 ∣λIn−J∣=λn−1,则 J J J 的特征值为
ω k = exp ( 2 k π i n ) , 0 ≤ k ≤ n − 1 \omega_k=\exp{(\frac{2k\pi i}{n})},0\leq k\leq n-1 ωk=exp(n2kπi),0≤k≤n−1
从而 A A A 的特征值为 f ( ω 0 ) , f ( ω 1 ) , … , f ( ω n − 1 ) f(\omega_0),f(\omega_1),\dots,f(\omega_{n-1}) f(ω0),f(ω1),…,f(ωn−1)
命题:幂零矩阵的特征值
n n n 阶矩阵 A A A 是幂零矩阵当且仅当 A A A 的特征值全为零
证明
幂零矩阵即存在 k k k,使得 A k = 0 A^k=0 Ak=0,则对任意 A A A 的特征值 λ \lambda λ,有 λ k = 0 \lambda^k=0 λk=0,即 λ = 0 \lambda=0 λ=0
反过来,若 A A A 的特征值全为零,则存在可逆阵 P P P,使得 B = P − 1 A P B=P^{-1}AP B=P−1AP 是上三角阵且对角线元素均为零,则 A n = P B n P − 1 = 0 A^n=PB^nP^{-1}=0 An=PBnP−1=0
命题:伴随矩阵的特征值
设 n n n 阶矩阵 A A A 的全体特征值为 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,…,λn,则 A ∗ A^* A∗ 的全体特征值为 ∏ i ≠ 1 λ i , ∏ i ≠ 2 λ i , … , ∏ i ≠ n λ i \prod\limits_{i\neq 1}\lambda_i,\prod\limits_{i\neq 2}\lambda_i,\dots,\prod\limits_{i\neq n}\lambda_i i=1∏λi,i=2∏λi,…,i=n∏λi
证明
由于任意 n n n 阶矩阵均复相似于上三角矩阵,故设
P − 1 A P = ( λ 1 ∗ ⋯ ∗ 0 λ 2 ⋯ ∗ ⋮ ⋮ ⋮ 0 0 ⋯ λ n ) P^{-1}AP=\begin{pmatrix} \lambda_1&*&\cdots&*\\ 0&\lambda_2&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n\\ \end{pmatrix} P−1AP=
λ10⋮0∗λ2⋮0⋯⋯⋯∗∗⋮λn
由于上三角的伴随矩阵仍为上三角,则
P − 1 A ∗ P = P ∗ A ∗ ( P − 1 ) ∗ = ( P − 1 A P ) ∗ = ( ∏ i ≠ 1 λ i ∗ ⋯ ∗ 0 ∏ i ≠ 2 λ i ⋯ ∗ ⋮ ⋮ ⋮ 0 0 ⋯ ∏ i ≠ n λ i ) P^{-1}A^*P=P^*A^*(P^{-1})^*=(P^{-1}AP)^*=\begin{pmatrix} \prod\limits_{i\neq 1}\lambda_i&*&\cdots&*\\ 0&\prod\limits_{i\neq 2}\lambda_i&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\prod\limits_{i\neq n}\lambda_i\\ \end{pmatrix} P−1A∗P=P∗A∗(P−1)∗=(P−1AP)∗=
i=1∏λi0⋮0∗i=2∏λi⋮0⋯⋯⋯∗∗⋮i=n∏λi
参考书:《高等代数学》谢启鸿 姚慕生 吴泉水 编著