理解特征向量与特征值

理解特征向量与特征值 | AI生成和翻译

Home 2025.11

你离理解已经很接近了，但有一个关键误解让你感到困惑。

让我用简单清晰的方式，逐步解释特征向量和特征值。

方阵 A 的特征向量是一个非零向量 v，当你用 A 乘以它时，会得到同一个向量的缩放版本：

A × v = λ × v

这里：

换句话说：
矩阵 A 拉伸或收缩特征向量 v，但不会改变它的方向（如果 λ 为负，可能会翻转方向）。

所以，在应用 A 之后，该向量仍然指向相同（或相反）的方向——只有其长度按

倍改变。

从 A v = λ v 出发，我们可以重新整理：

A v − λ v = 0
A v − λ I v = 0
(A − λ I) v = 0

这是一个线性方程组。

要存在非零解 v，矩阵 (A − λI) 必须是奇异的（不可逆的），这意味着：

det(A − λI) = 0

这就是特征方程。解它就能得到特征值 λ。

然后，对于每个 λ，你解方程 (A − λI) v = 0 来找到特征向量 v。

你说：

“(A−λE) * 特征向量 = 0，但这就像 3×3 ⋅ 3×1 = 3×1 矩阵，它怎么可能是零呢？”

是的，结果是一个 3×1 向量。
但它是零向量（即 [0, 0, 0]ᵀ），不是零矩阵。

所以：

(A − λI) v = [0]
             [0]   ← 3×1 零向量
             [0]

这并不意味着 (A − λI) 是零矩阵！
它只是意味着 v 在 (A − λI) 的零空间中。
矩阵 (A − λI) 将这个特殊的向量 v 发送到零，但会将其他向量发送到别处。

设

A = [2  1]
    [0  2]

尝试 v = [1, 0]ᵀ

那么
A v = [2 1] [1] = [2×1 + 1×0] = [2] = 2 × [1 [0 2] [0] [0×1 + 2×0] [0] [0]

所以 A v = 2 v → λ = 2, v = [1,0]ᵀ 是一个特征向量。

现在检查 (A − 2I)v：

A − 2I = [2-2  1] = [0 1]
         [0    2-2]   [0 0]

[0 1] [1] = [0×1 + 1×0] = [0] = 零向量
[0 0] [0]   [0×1 + 0×0]   [0]

是的！它是零，即使 (A − 2I) 不是零矩阵。

所以，不要以混淆的方式认为 (A − λI)v = 0 是”整个矩阵乘以 v 什么也没得到”——它只是说：这个特定方向 v 被平移后的矩阵完全消除了。

一旦你明白了这一点，一切就都清楚了。

如果你想一起计算一个例子，请告诉我！

Back Donate