线性代数 矩阵对角化计算过程化

Definition1: 对于向量空间 的一个变换 (一般使用花体拉丁字母 代表 的变换, 代表元素 在变换 下的象)如果对于 中任意元素 和数域 则称变换(映射) 为线性变换(映射)

一个矩阵 乘一个向量 实際上是把 “变换”为另一个向量 ,即将 映射到 中矩阵乘法法则告诉我们

式(2)符合式(1)关于线性变换的定义,因此矩阵和向量相乘本质上是一種线性变换这种变换将 中的一个向量映射到 中去。

当 即 是方阵时这个线性变换为

意味着将二维空间 中的向量 映射为二维空间 中的向量

1.2特征值与特征向量

先给出定义然后我们会用一个例子来说明特征向量的几何意义

使 成立,则称 是特征值

注意到 是一个方阵,所以 在 时有非零解这些非零解便是 的特征向量。现在看一个例题由 可列出关于 的方程,这个方程被称为 的特征方程

令其等于零可得: ,将 分别玳回方程(4)可得:

由上图不难发现特征向量在经过与 相乘这个变换操作后得到的新向量方向与特征向量相同

1.矩阵与向量相乘是一种线性变換
2.矩阵的特征向量经过矩阵所代表的线性变换后方向与原方向保持一致

这种“变换”中的”不变性“被我们看作矩阵的一种特征,故而叫特征值与特征向量它反映了变换矩阵所代表的线性变换的固有特点。

假设 有 个特征值 和特征向量 由1.2中方程 可得:

上式意味着如果给一个方阵 左乘其特征向量矩阵 的逆,右乘 便可得到一个矩阵对角化计算过程阵

观察式(8)不难发现要矩阵对角化计算过程化 有两个前提条件

非方陣没有特征值和特征向量,也就无法构成 矩阵

2.1 实对称矩阵的矩阵对角化计算过程化

由定义容易知道一个对称矩阵必然是一个方阵
根据这篇攵章1.2部分的内容可知如果我们要把一个向量 投影到由向量 张成的空间 中去,就要找到一个投影矩阵 用 去右乘 来得到 在 中的投影
故投影矩阵 为对称矩阵Q.E.D
Theorem2:所有实对称矩阵都可分解为
其中 由的正交特征向量组成 的特征值均为实数

a.先证明 的所有特征值为为实数

Proof: 1.2告诉我们求 嘚特征值等价于求方程 的非零解我们先利用 求得 特征值 ,再将 回代入(a1)解出 特征向量 。容易发现当特征值为复数时, 必有复数元素因此特征向量 也必含复数元素。则有
因为 是实矩阵所以两边取共轭得:

b.证明对称矩阵 的特征向量均正交之前,先引入两个引理

Lemma1: 实对称矩阵 对應于不同特征值的特征向量必正交 Proof:设 为对应于 的特征向量:
想办法构造出 (或 ):
Lemma2: 若 是实对称矩阵 的特征方程的 重根则 , ,因此可从 中选出 个正茭的向量作为 的解,也就是作为 的特征向量

容易验证当 阶方阵 的互不相等的特征值 的重数分别为 时,

根据Lemma2可知:对于每一个 均对应了 個正交的特征向量,记这组正交向量为 根据Lemma1可知: 不同组内的特征向量也相互正交。所以 中的 个特征向量均正交

在矩阵矩阵对角化计算過程化后面介绍对称矩阵主要是因为实对称矩阵有着良好的性质和广泛的应用。下面我们概述下前面的内容

2.2.1矩阵矩阵对角化计算过程化嘚本质

不了解基变换矩阵请参考

特征向量来自于方阵 的行空间中。特征向量,式 表明对 施加 所代表的变换 后将其映射为 中的 ,也就是说在映射前后 的方向不发生改变而长度伸缩 倍。当方阵有足够的( 个)特征向量时我们用这些特征向量作为空间 的基,由特征向量的定义知:線性变换 在这组基向量上都是伸缩变换

这个矩阵代表的线性变换是在基向量上进行的而 则是在基向量 上进行的, 是一个基变换矩阵

当方阵没有足够的( 个)线性无关的特征向量时,就无法作为 的一组基也就无法在特征向量基上描述线性变换 。

不是实对称矩阵时 我們可以直接组成 ,也可以将特征向量单位化再组成

我们为什么能对特征向量进行单位化既然可以单位化那能不能正交化呢?

Lemma3:如果 的特征向量 则,即 也是 的特征向量 Lemma3解释了特征向量为什么能够单位化。同时注意:如果对特征向量进行正交化特征向量将不再保持原囿方向,与特征向量保持方向不变的性质相冲突所以一般而言不能对非正交的特征向量进行正交化操作。

特别地当方阵 是对称矩阵时,我们证明了 一定有足够的( 个)线性无关特征向量构成 矩阵并且此时 , 即是单位正交矩阵(orthonormal matrix)。

虽然我们只证明了 是正交矩阵(orthogonal matrix)但根据Lemma3,我们可鉯将特征向量全部单位化再组成 ,这样 就变成了单位正交矩阵也就有

2.2.2实对称矩阵的矩阵对角化计算过程化

特征向量来自方阵的行空间, 阶實对称矩阵必有 个单位正交的特征向量我们完全可以用 个单位正交的特征向量 作为行空间 的基向量组 ,令人偷税的是在经过方阵所代表的线性变换映射后,这组基在列空间中的象仍是正交的 一般而言,正交的总是最好最简洁最方便的!

是方阵时我们给出了矩阵矩阵對角化计算过程化的方法当 不是方阵时我们能不能也将 “矩阵对角化计算过程化”呢?

矩阵对角化计算过程化打引号是因为当 不是方阵時我们通过SVD得到的是形如
或者形如 的矩形”矩阵对角化计算过程阵“。而在Part.1Part.2中我们得到的矩阵对角化计算过程阵是方阵

2.2中我们知道方阵 矩阵对角化计算过程化的含义:

矩阵矩阵对角化计算过程化就是把一组基上的线性变换用另一组基(特征向量基)来描述用后一组基描述时,线性变换 只是单纯的伸缩变换 其对应的变换矩阵为矩阵对角化计算过程矩阵 。特别地当 是实对称矩阵时,特征向量基是正茭的

也就是说 和 代表的是同一种线性变换,只是用于描述的基向量不同罢了

奇异值分解本质上同方阵矩阵对角化计算过程化意义相同,即在不同的基上描述同一种线性变换矩阵 对应的线性变换为 ,对于

便是在这组默认的基上对 的数值化描述因此实际上

方阵矩阵对角化计算过程化中选择合适的基(由特征向量组成的基)描述线性变换使该变换在数值描述上成为单纯的伸缩变换,特别地在对称方阵矩阵对角化计算过程化过程中这组基是正交的。于是我们就想能不能给非方阵 对应变换 的定义域 值域 也选择合适的基向量,使变换 在数徝描述上也像方阵矩阵对角化计算过程化里那样变为单纯的伸缩变换或者更进一步像对称方阵矩阵对角化计算过程化中那样选取的基也昰正交的?答案当然是 能!

在开始选择基向量之前先回顾矩阵四个子空间的联系图

的定义域也就是 选择一组正交基等价于在 和 中分别找到两组正交的基

在 这篇文章的附录 [2],我们证明过 由 这篇文章2.2部分可知行空间和零空间互为 下的正交补故

Lemma4: 和 具有相同的行空间和零空間。因此在 中分别找两组正交的基等价于在 中分别找两组正交基

的秩为 ,则由(11)和秩-零度定理[1]可知: 明显是实对称矩阵根据夲文2.1和2.2可知 的正交特征向量 来自其行空间 , 来自其零空间 。来自于零空间的 均对应于特征值

Lemma4告诉我们 具有相同的行空间和零空间,因此來自 的一组正交基, 可作为 的一组正交基因为 互为正交补,所以 是
的正交基 是 的单位正交特征向量。又因为 与 互为正交补所以 ,即

到目前為止,我们找到了映射 定义域 内的正交基 和值域 内的正交基现在问题变成了:用我们找到的这两正交基组基是否能使映射 的数值化描述變为单纯的伸缩变换

答案是 能!下面我们来证明它。

Theorem3:设有矩阵 其对应的线性映射为 。已知对称阵 的单位特征向量 可作为 的一组正交基
对称阵 的单位特征向量 可作为 的一组正交基,试证明

Proof:因为 是 的单位特征向量不妨设对应的特征值为


因为 是单位向量( ),故 ,所以有:
(d5)表明向量 僦是方阵 的特征向量,其对应的特征值为 将 单位化就是求 。因此 的单位特征向量 即有 ,其中 是方阵 特征值 的平方根

其中 是方阵 特征徝的平方根。根据这个式子我们可以写出SVD的形式:

又因为 由方阵 的正交特征向量组成,所以 所以

除了 其他元素全为 。式(*)右边是 个秩为 如果把这些秩 矩阵看作组成 的成分,则 代表了该秩 矩阵这个成分占 的比重

在图片压缩技术中应用SVD便可以找到图像矩阵中占比最大的成汾。删去占比过大的成分会使原图片丢失较多信息,变得模糊就如本文正文前两张图片展示的一样。

我要回帖

更多关于 矩阵对角化计算过程 的文章

 

随机推荐