线性代数高效学习指南(特征值与特征向量篇):矩阵的”灵魂”

说实话,特征值和特征向量是线性代数里最深奥的部分。

它抽象、难懂,但应用极广——从主成分分析到微分方程,从量子力学到机器学习,都离不开特征值。

今天学长分享特征值与特征向量的学习方法,帮你拿下这个硬骨头。

特征值与特征向量的定义

基本定义

特征值: 设A是n阶矩阵,若存在数λ和n维非零向量x,使得Ax = λx,则称λ是A的特征值,x是A的特征向量

几何意义:

特征向量在变换后方向不变(不共线则反方向),只伸缩λ倍。

代数意义:

Ax = λx → (A-λE)x = 0

学长说

特征向量的定义就一句话:在矩阵变换下方向不变的向量。 记住这个,几何意义就理解了。

特征多项式

特征方程:

|A - λE| = 0

特征多项式:

f(λ) = |A - λE| = (-1)^n(λ-λ₁)(λ-λ₂)...(λ-λₙ)

重要结论:

  • λ₁+λ₂+…+λₙ = tr(A) = a₁₁+a₂₂+…+aₙₙ (迹)
  • λ₁·λ₂·…·λₙ = |A| (行列式)

学长说

特征值之和等于矩阵的迹,特征值之积等于行列式。 这是检验特征值是否算错的好方法!

特征值与特征向量的计算

计算步骤

Step 1:求特征方程 |A-λE| = 0
Step 2:解特征方程,得到特征值λ₁,λ₂,...,λₙ
Step 3:对于每个λᵢ,解方程组 (A-λᵢE)x = 0
Step 4:求基础解系,即为特征向量

具体计算

例:求矩阵A = [[2,1],[1,2]]的特征值和特征向量

Step 1:特征方程
|A-λE| = |[2-λ, 1],[1, 2-λ]|
= (2-λ)(2-λ) - 1
= (2-λ)² - 1
= λ² - 4λ + 3
= (λ-1)(λ-3) = 0

Step 2:特征值
λ₁ = 1, λ₂ = 3

Step 3:求特征向量

对于λ₁ = 1:
(A-E)x = 0
[1, 1],[1, 1] → [1, 1],[0, 0]
x₁ + x₂ = 0
x = k[-1, 1]^T (k≠0)

对于λ₂ = 3:
(A-3E)x = 0
[-1, 1],[1, -1] → [1, -1],[0, 0]
x₁ - x₂ = 0
x = k[1, 1]^T (k≠0)

学长说

特征向量不唯一(任意非零倍数都是)。 但同一个特征值的特征向量共面(线性相关)。

特征值的性质

代数性质

性质说明
同一特征值的特征向量不唯一任意非零倍数
不同特征值的特征向量线性无关重要结论
k重特征值最多有k个线性无关特征向量可能是0
λ=0是特征值 ⟺ A不可逆可逆判别
A可逆 ⟺ 特征值全非零可逆判别

迹与行列式

迹(trace):

tr(A) = Σλᵢ = Σaᵢᵢ

行列式:

|A| = Πλᵢ

重要推论:

  • |A| ≠ 0 ⟺ 0不是特征值
  • tr(AB) = tr(BA)
  • tr(A+B) = tr(A) + tr(B)

相似矩阵

相似定义

定义: 若存在可逆矩阵P,使得P⁻¹AP = B,则称A相似于B,记作A~B

性质:

  • 反身性:A~A
  • 对称性:A~B ⟹ B~A
  • 传递性:A~B, B~C ⟹ A~C

重要定理:

A~B ⟹
- |A| = |B|
- tr(A) = tr(B)
- 特征值相同(重数也相同)
- r(A) = r(B)

学长说

相似矩阵的本质:同一个线性变换在不同基下的表示。 它们有相同的”本质”,所以特征值相同。

矩阵对角化

可对角化条件:

A可对角化 ⟺ A有n个线性无关特征向量

对角化步骤:

Step 1:求A的n个线性无关特征向量
Step 2:以特征向量为列构成矩阵P
Step 3:Λ = P⁻¹AP = diag(λ₁,λ₂,...,λₙ)

例:

A = [[2,1],[1,2]]
特征值:λ₁=1, λ₂=3
特征向量:p₁=[-1,1], p₂=[1,1]

P = [[-1,1],[1,1]]
P⁻¹ = (1/2)[[1,-1],[-1,-1]]

Λ = P⁻¹AP = [[1,0],[0,3]]

实对称矩阵的对角化

特殊性质:

  • 实对称矩阵必可对角化
  • 必有n个线性无关特征向量
  • 不同特征值的特征向量正交

正交对角化:

存在正交矩阵Q,使得 Q⁻¹AQ = Q^T A Q = Λ

步骤:

  1. 求特征值和特征向量
  2. 特征向量正交规范化(施密特正交化)
  3. 以正交规范特征向量构成正交矩阵Q
  4. Λ = Q^T A Q

学长说

实对称矩阵的对角化是考试重点。 施密特正交化是难点,但步骤固定,多练就行。

二次型

二次型的定义

二次型: 含n个变量的二次齐次多项式

矩阵表示:

f(x₁,x₂,...,xₙ) = x^T A x
其中A是对称矩阵

例:

f(x,y) = x² + 2xy + y²
= [x, y] [[1, 1],[1, 1]] [x],[y]

二次型的标准形

定义: 只含平方项的二次型

方法1:配方法

例:

f = x₁² + 2x₁x₂ + x₂² + x₂x₃
= (x₁ + x₂)² + x₂x₃
= (x₁ + x₂)² + [(x₂ + x₃/2)² - (x₃/2)²]
= y₁² + y₂² - y₃²

其中:
y₁ = x₁ + x₂
y₂ = x₂ + x₃/2
y₃ = x₃

方法2:正交变换法

f = x^T A x → y^T Λ y
其中x = Qy,Q是正交矩阵

步骤:

  1. 求A的特征值和特征向量
  2. 正交规范化构成Q
  3. 写出标准形

正定二次型

定义: 对任意非零x,x^T Ax > 0

判别方法:

方法条件
特征值所有特征值 > 0
顺序主子式所有顺序主子式 > 0
定义对任意x≠0,f>0

顺序主子式:

阶数主子式
1阶a₁₁
2阶
3阶

学长说

正定二次型的判别是考试重点。 顺序主子式法最常用,也最简单。

特征值的应用

求矩阵的幂

方法:

A = PΛP⁻¹
A^k = PΛ^k P⁻¹
= P diag(λ₁^k,...,λₙ^k) P⁻¹

例:

A = [[2,1],[1,2]], A = PΛP⁻¹
A^k = P diag(1^k, 3^k) P⁻¹
= P diag(1, 3^k) P⁻¹

求矩阵指数(微分方程)

在微分方程中的应用:

x' = Ax → x(t) = e^(At) x(0)
e^(At) = P e^(Λt) P⁻¹

主成分分析(PCA)

原理:

  • 数据协方差矩阵的特征值反映主成分的方差
  • 特征向量是主成分的方向

量子力学

定态薛定谔方程:

Hψ = Eψ

E是哈密顿算符H的特征值。

学长私房话

说实话,特征值和特征向量是线性代数里最”高级”的内容。

学好了,说明你对线性代数有了深刻理解。

学长的学习方法:

  1. 理解定义
    • 几何意义要理解
    • 特征向量在变换下方向不变
  2. 熟练计算
    • 求特征值、解方程组要多练
    • 施密特正交化要掌握
  3. 掌握性质
    • 迹与行列式的关系
    • 相似矩阵的性质
  4. 理解应用
    • 对角化、二次型
    • 了解实际应用场景

学长踩过的坑

我大一下学特征值,总是把特征向量算错。 后来发现,问题出在解方程组时漏掉自由变量。 用基础解系表示时,一定要把所有自由变量写出来。 细节决定成败!

特征值和特征向量是线性代数最美的部分。

它揭示了矩阵的”本质”——特征。

学好了,你就能真正理解线性代数的精髓!