矩阵理论笔记
[toc]
须知:
- 这篇笔记并不是《矩阵理论》课程的全部内容,只是我(以及往年题)认为的重点内容。
- 因为这篇笔记从头到尾都是我一个人写的,也没有细致地校对过,所以一定会存在一些笔误,欢迎在评论区帮我指正,不胜感激。
- 由此,我强烈建议各位在线阅读,而不是下载下来阅读,因为我会随时更新错误或者补充内容。
线性空间引论
这一部分其实基本就高代的内容,复习一下。
非齐次线性方程组的解法
这个必须得会吧。为了防止遗忘,还是写一下。
对于非齐次线性方程组
【例】 求
的通解。 【解】首先写出增广矩阵,也就是系数矩阵右边加上
这一列。 因此 移项,得方程组的一般解为 即:
则取
为一个特解。
为导出组的一个基础解系, 从而方程组的通解为
线性空间和线性子空间
一般学习线性代数只会学习到向量空间,而不会学习线性空间,所以笔记从线性空间开始写。线性空间是向量空间的推广,为此需要首先定义两个概念:
【数域】数集
常见的数域有:
- 有理数
- 实数
- 复数
- 扩域,例如
【加群】在非空集合
- 交换律:
- 结合律:
- 存在零:
- 存在负元:
称
于是,可以将向量空间推广为线性空间:
【线性空间】 设
此时,称
可能向量空间给人一种既定观念,就是向量一定是由标量组合而成的,但是其实并不是这样。考虑正弦函数集合:
常见的线性空间有:
- 向量空间
- 矩阵空间,
是复数域上所有 矩阵构成的集合。 - 一元多项式,
- 设
,则 的解集构成线性空间。 - 定义在
上的全体多项式、全体可微函数、全体连续函数、全体可积函数、全体实函数,都是 上的线性空间。
在线性空间上有:
零向量唯一
任意向量的负向量存在且唯一
【线性子空间】设
例如,平面
对于子空间的判别,以下三个命题等价:
是 的子空间 且
其实,在实操中,判定子空间,一般首先看
如果
对于矩阵
【矩阵零空间】齐次线性方程组
【矩阵列空间】
基和坐标
首先回顾一下线性相关和线性无关的概念,因为和线代里面的没啥区别,所以不重复写了。
【极大线性无关组与秩】设
由极大线性无关组,可以定义线性空间的基:
【基】设
线性无关 中所有向量都可以由 线性表示
那么说
定义了基,其目的就是唯一表示其它的向量。这种表示的方法叫做坐标:
【坐标】 设
称有序数组
对于两个不同的基,存在过渡矩阵:
【过渡矩阵】 设
引入矩阵表示:
其中
对于
例:空间
在数域 和 上的维数分别是多少? 解:在
上,向量组 是 的一组基,所以维数是2。在 上,向量 和 线性相关,且任一复数均可由 或 线性表示.故向量组 和 分别构成 的一组基,即定义在 上的线性空间 的维数为 .
有维数定理:设
【例】设
, 求 及 的维数,其中 。 【解1】
要求
的维数,即求 四个向量张成的空间的维数。有: 对其进行初等行变换,有: 这个矩阵的秩是 ,所以 。 设
,则有: 即: 移项并化简,有: 化简,有: 左边的矩阵的秩是
,所以解是一维的。具体一点,有: 代入,有: 所以, 【解2】
显然,
,由维数定理: 只需像上面那样求出 即可,无需算两个矩阵的秩。
内积空间
在线性空间上,额外定义对于两个向量
- 共轭对称性:
; - 可加性:
; - 齐次性:
; - 正定性:
, 当且仅当 时等号成立.
此时可以称
注意,齐次性只对第一个向量成立。对于第二个向量,有共轭齐次性:
由内积定义中的共轭对称性,有:
所以有:
将
【度量矩阵】 设
为
如果
在内积空间中,可以定义一个向量的长度:
齐次:
正定:不再解释了
平行四边形法则:
三角不等式(三角形两边之和大于第三边)
Cauchy-Schwarz不等式(余弦定理)
定义两个向量之间的夹角为:
由内积和夹角,可以引出正交的概念:
【正交】对于内积空间
向量正交于集合,指的是对于线性空间
集合正交于集合,指的是线性空间中的两个集合,其中任意两个向量都相互正交。
注意:集合正交于集合并不简单地等同于集合垂直于集合。考虑到3维欧氏空间中的两个相互垂直的平面,它们并不相互正交(因为两个集合的交集上任意两向量共线)。
【正交补】设
对于正交补,有:
【例】
求
的列空间的正交补 。 【解】即解方程组:
方程组的解集,就是和 的每一列都正交的向量的集合。化简得: 所以,原方程组可为: 所以,解空间为:
其实,有线性代数基本定理:
行空间
直和与投影
【直和与正交直和】 设
特别的, 若
进一步, 若
其实,若
【例】在立体直角坐标系中,
,那么 是直和吗? ![]()
【解】不是,因为
所以分解不唯一。
为了判断一个和是不是直和,有以下四个等价命题:
+ 是直和 中零元素表示方法唯一
MOOC第一章答案
1 |
|
矩阵和线性映射
映射和线性映射
【单射和满射】对于映射
考察实数域
上的函数 和 。因为 ,所以 不是单射;因为 无解,所以 不是满射。 既是单射又是满射,所以 是双射。
【线性映射】如果对于映射
- 可加性:
- 齐次性:
【例】对于在其自身上[2]的线性空间
上的映射: 不是线性映射。因为
关于线性映射,有以下推论:
保持原点不动:
如果
是 中一组线性相关向量,那么 也是 中一组线性相关向量如果
是 中一组线性无关向量,那么 也是 中一组线性无关向量当且仅当
是单射,如果 是 中一组线性无关向量,那么 也是 中一组线性无关向量如果
维数相同,那么此时 中一组基的像是 中的一组基, 是双射
与矩阵相似地,定义线性映射
- 零空间:
,即使得像为原点的 的值的集合。它的维数叫做 的「亏」。 - 值空间:
,即 的实际取值范围。它的维数叫做 的「秩」。
【亏加秩定理】线性映射的亏和秩之和等于其定义域空间的维数。
矩阵与同构
【线性映射的矩阵】设
简单理解:线性映射的矩阵,就是
当线性空间
【例】已知多项式空间
(即以 为变量的三次多项式空间)的子空间 ,其中 .
- 求子空间
的一个基; - 对于
中的多项式 , 定义线性变换
求线性变换
在(1)中求出的基下的矩阵. 【解】
注意到:
,因此一组基为 计算基象组:
因此,矩阵为把基象组依次写成纵列然后拼起来:
【同构】设
所谓的「同构」,其实就是「一样」,「一回事」的意思。
两个线性空间同构,当且仅当其维数相等。
【同一个线性映射在不同基下的矩阵的关系】
设
则
特别的,如果线性映射是变换,即
特征值和特征向量
【线性变换的特征值和特征向量】设线性变换
则称
需要注意:
从几何上来看,就是线性变换作用于特征向量后,仍然保持共线
属于同一个特征值的特征向量的线性组合也是属于这个特征值的特征向量
如果特征向量是线性变换零空间里的非零向量,那么其特征值是0
设
是线性变换, 是 的一组基, 且 , 则 在基 下的矩阵为对角阵
【矩阵的特征值和特征向量】设
由定义可以知道,矩阵的特征值是一个一元
一个矩阵的特征值之和等于其对角线上元素之和,这个和也叫做矩阵的「迹」,记作
【例】已知
,求 的特征多项式,并求 。 【解】显然,
,因此 是一个秩为 的矩阵(每一行都是向量 乘以标量倍)。那么,考虑齐次线性方程组 它的基础解系是 维的,即矩阵的零空间是 维的。从特征方程的角度来看, 代表 为矩阵 的其一特征值,那么其特征值为 的线性无关的特征向量的个数为 ,又特征值的代数重数不会少于几何重数,所以 至少为 重特征值。 所以
只有一个非零特征值。所以矩阵的特征多项式具有如下的形式: 因为 的特征值之和等于其对角线元素之和,所以 关于
,有:
【特征子空间】矩阵的属于某个特征值
如果所有特征值的几何重数等于代数重数,则矩阵可以相似对角化,即:
酉变换和酉矩阵
酉变换是实数域中的正交变换推广到复数域中的结果。
【正交变换和酉变换】若欧氏(酉)空间中的线性变换
称
【正交矩阵和酉矩阵】如果
标准正交基经过酉变换以后仍然是标准正交基,而且酉变换在标准正交基下的矩阵是酉矩阵。正交/酉变换的核心特征是「保持长度不变」。
酉矩阵的行列式的模是
矩阵是酉矩阵的充要条件是它的
常见的酉矩阵有初等旋转矩阵和反射矩阵。
其中,初等旋转矩阵记为
幂等矩阵
这个书里面并没有,但是慕课作业里面有很多相关的内容,所以整理一下。
幂等矩阵指的是满足
关于幂等矩阵
证明:注意到幂等矩阵的定义等价为
。设 ,即 ,则 ,则 。若
,即 ,故 。因为
,所以 也是幂等矩阵,故第二部分证毕。 不是幂等矩阵,因为 。证明:设
,则有 ,有 ,两边同时乘以 : ,则由第一条性质易得
亏加秩定理:
可对角化为
考虑任意一个特征值,有
,则 ,但是 ,故 , 。其中,如果特征值为
,其特征子空间是 ,如果特征值为 ,其特征子空间是 .这两个特征子空间的基底合并以后可以生成
。特征值
的代数重数。
MOOC第二章答案
1 |
|
矩阵分解
满秩分解
【满秩分解】设
证明:假设
,取 的一组基 ,则有: 定义 ,则有: 其中, 又因为 所以
.
可以看到,满秩分解取决于
【例】求
的满秩分解。 【解】观察得,
构成 的一组基。 则向量 在这组基下的坐标分别是: 故满秩分解为:
那么如果观察不出来怎么办呢?其实也有通用方法:
【例】求以下矩阵的满秩分解:
【解】
先通过初等行变换把它变成行最简形:
观察每一行的首元出现在哪一列,把原矩阵的这些列抽出来,组合在一起,作为
矩阵: 观察每一行的首元出现在哪一行,把行最简矩阵的这些行抽出来,组合在一起,作为
矩阵: 有:
【矩阵的左右逆】设矩阵
关于矩阵的秩有重要结论:
QR分解
【QR分解】如果复(实)方阵
如果实数方阵
证明:设
,那么这个向量组是 的一组基。把这组基进行施密特正交化,得到标准正交基 。注意到 , 都是空间的基,有: 其中 是过度矩阵。 考虑施密特正交化的过程:
则有
也可以用初等反射变换求QR分解,具体操作方法是:
取
为矩阵 的第一列构成的列向量,计算其 范数构造:
构造:
计算:
其结果的第一列除了第一个元素以外都是 ,即:对矩阵
递归进行前四步,最终得到的即为 矩阵。 矩阵的计算方法是: 其中:
【例】计算QR分解:
【解】
$$
$$ 则:
则:
接下来考察长方形矩阵的QR分解。
【列/行正交规范矩阵】设
考虑
Schur分解和矩阵多项式
【Schur引理】任意复方阵
【矩阵多项式】 设
式中,
称为矩阵多项式。
其实矩阵多项式就是把普通多项式的变量变成了一个矩阵。
我们可以利用Schur引理来研究矩阵多项式的性质,例如:
【定理】设复矩阵
【证明】:存在一个酉矩阵
,使得 其中 是上三角阵,其对角线元素是 的特征值。注意到: 其中上三角阵 的对角线元素是 ,由于 酉相似于 ,所以它们有相同的特征值,证毕。
【Hamilton-Cayley定理】设
【证明】:
可以表示为: 则由shur引理,有 , 可以表示为: 因为上三角阵相乘,对角线元素相乘,所以中间的累乘式结果是 ,证毕。
接下来介绍关于矩阵的几个重要多项式:
【零化多项式】如果多项式
不难发现,矩阵的特征多项式就是一个典型的零化多项式。
【最小多项式】矩阵的零化多项式中,最小次数且最高次项系数为
矩阵的特征多项式不一定是最小多项式。例如二阶单位矩阵,其特征多项式是
,但是最小多项式是 。
关于最小多项式,有以下结论:
- 矩阵的最小多项式唯一,而且可以整除任何零化多项式
- 矩阵的最小多项式的根与特征多项式相同(不计重数)
据此,可以知道一个求矩阵的最小多项式的方法,就是先求它的特征多项式,并写成根的分解的形式,然后将每一项的次数置为
【例】求最小多项式:
【解】矩阵的特征多项式为: 因此最小多项式可能是 或者 验证第一个,有:
因此最小多项式是 。
对角化分解
【定义:单纯矩阵】如果
关于单纯矩阵,以下命题等价:
是单纯矩阵 有 个线性无关的特征向量- 特征值
的代数重数等于几何重数 - 最小多项式无重根
关于单纯矩阵,还有两个充分而不必要条件:
- 如果复方阵的零化多项式无重根,那么它是单纯矩阵
- 如果
阶复方阵有 个互异的特征值,那么它是单纯矩阵
【例】之前分析过的幂等矩阵是单纯矩阵吗?
【解】幂等矩阵是满足
的矩阵,显然 是它的一个零化多项式,无重根,所以 是单纯矩阵。
【酉相似对角化】如果
设矩阵
求Hermite矩阵
- 求出
所有的相异特征值和重数 - 对于每个特征值,求
的基础解系,并将其单位正交化 - 由标准正交特征向量生成酉矩阵
,则 是酉矩阵
【正规矩阵】设
复方阵
关于正规矩阵,有:
显然:正规矩阵的单纯矩阵的加强版。
复方阵
是正规矩阵当且仅当 有 个特征向量构成 空间的一组标准正交基,且属于 的不同特征值的特征向量正交. 阶实方阵 是正交矩阵当且仅当 的所有特征值的模值为 1 , 且存在酉矩阵 使得
其中
阶复方阵 是酉矩阵当且仅当 的所有特征值的模值为 1 , 且存在酉矩阵 使得
其中
- 常见的正規矩陣有:实对称矩阵、Hermitian矩阵、酉矩阵、反Hermitian矩阵
谱分解
接下来进一步研究单纯矩阵和正规矩阵的性质。
单纯矩阵谱分解
单纯矩阵
【证明】:
因为
是单纯矩阵,有: 把 按行列进行分块,有: 在这里, 其实就是属于 的特征向量。 则有:
其中 下证 是幂等矩阵。由 ,有: 则有: 证毕。 其实,可用同样的方法证明:
。
进一步的,如果更一般的情况,即有
【例】计算谱分解:
【解】先计算特征值: 对应的特征向量为: 则有: 则: 由定义:
关于单纯矩阵的谱分解,有性质:
- 集合
唯一
有推论:
若
例】计算谱分解:
【解】先计算特征值: 定义 , 则
正规矩阵的谱分解
正规矩阵是单纯矩阵的特殊情况。在正规矩阵的谱分解中,
【例】求正规矩阵的谱分解
【解】计算矩阵 的特征值与特征向量, 分别为: , . 将
和 单位正交化, 并将 单位化, 得 定义
, 则 是 的谱分解式。
若当标准型
接下来讨论不单纯的矩阵,也就是不能相似对角化的矩阵,如果非要把它相似对角化会怎样。
矩阵与三个重要因子
【
例如,我们经常见到的特征矩阵
- 交换行/列顺序
- 给某一行/列乘以非零常数
- 给某一行/列乘以一个
多项式然后加到另一行/列上。
若
【行列式因子】一个矩阵的
【不变因子】不变因子可以通过下面的形式计算:
不变因子的前一项总是后一项的因子,而且有:
一个矩阵的特征矩阵的不变因子的最后一项
【初等因子】把每个不变因子分解成一次因式的幂的乘积形式,所有这些一次因式的幂的集合(相同的必须按出现次数重复计算)称为矩阵的初等因子组。
【例】求矩阵
的各阶行列式因子、初等因子和不变因子 【解】先求行列式因子:
三阶行列式因子:
二阶行列式因子: 求矩阵的9个子式的最大公因式,例如:
等等。最终算出来最大公因式是
。 一阶行列式因子:
即所有元素的最大公因式:
求不变因子:
求初等因子:
设
则
史密斯标准型
一个
史密斯标准型的求法是:
确定原矩阵的一阶行列式因子
通过初等变换,把原矩阵的左上角元素变成
通过初等变换,把原矩阵的第一行、第一列除了第一个以外的元素都变成
,此时矩阵为:对
递归进行前三步。
【例】求史密斯标准型:
【解】 计算一阶行列式因子
,则: 计算右下方子矩阵的一阶行列式因子:
若当标准型的求法
假如矩阵有一个不变因子是
对于矩阵
【例】已知三阶矩阵
,且 ,求其若当标准型。 【解】因为
所以 是 的一个零化多项式。又因为 ,所以是最小多项式。 考虑
的特征矩阵 ,其行列式 是其所有不变因子的积(史密斯标准型),也是矩阵的特征多项式。所以,其所有初等因子的最小公倍式就是 的最小多项式 ,所以其初等因子组是 ,其若当标准型为: 【例2】
。求 的初等因子,不变因子, 及 Smith 标准型。写出 的 Jordan 标准型及最小多项式。 【解2】初等因子为:
考虑矩阵:
,先求其各阶行列式因子,再由行列式因子求出不变因子和史密斯标准型。
- 求
,因为 和 的最大公因式为 ,因此 - 求
,因为 和 的最大公因式为 ,因此 - 求
,因为 、 和 的最大公因式为 ,因此 - 求
,因为原来的矩阵有 项,求 即选择其中的 项相乘。如果不选 ,那么必选 ;如果不选 ,那么必选 ,因此 必定是其中一个公因式,而且是最大公因式。 - 求
,为 因此,矩阵不变因子为:
史密斯标准型为:
若当标准型为: 最小多项式为:
MOOC第三章答案
1 |
|
矩阵分析
向量范数
【向量范数】设
- 正定:
且当且仅当 时, - 齐次:
- 三角不等式:
称其为向量的范数,称这个线性空间为赋范线性空间。
有以下三种常用的范数:
,即所有元素的绝对值之和 ,即所有元素的绝对值中的最大值 ,即我们日常使用的「欧氏距离」 ,其中 ,上面三个范数都是它的特殊情况。
问:内积空间是赋范线性空间吗?
答:是的,不仅如此,内积空间所定义的距离还满足「平行四边形法则」。
【范数等价】对于两个向量范数
事实上,有限维线性空间的所有范数都是等价的。
矩阵范数
【矩阵的向量范数】对于定义在
- 正定:
且当且仅当 时, - 齐次:
- 三角不等式:
称其为矩阵的向量范数。这其实就是把矩阵”拉直“看成向量。如果要考虑真正的矩阵,就要满足第四条性质:
- 矩阵乘法相容性:
则称其为矩阵范数。
【向量范数与矩阵范数相容】 若对
则称向量范数
给定一个
【算子范数/诱导范数】 设
则
对于向量范数
列和范数:每一列的元素绝对值之和的最大值:
行和范数:每一行的元素绝对值之和的最大值:
谱范数:
矩阵特征值的估计
【谱和谱半径】对于复方阵
谱半径本身不是范数(不满足正定性中的「范数为0等价于矩阵为
」),而且它不大于任何一个矩阵范数。
【盖尔圆盘】对于
因为
与 有相同的特征值集合,所以实际上矩阵的所有特征值要落在 和 的所有盖尔圆盘的并集之内。
如果
如果原点不在任何盖尔圆盘内,矩阵就不是奇异矩阵。
【例】证明下面的矩阵至少有两个实特征值
【解】矩阵的四个盖尔圆为: 在紫色的圆里,有一个实特征值。矩阵是
阶矩阵,所以有四个特征值。因为复特征值都是成对出现的,所以最多只能有一对复特征值,所以至少有两个实特征值。
在使用盖尔圆估计特征值时,为了获得更多的孤立圆,我们可以构造一个矩阵
一般来说,构造
- 如果
,其它 都是 ,那么会缩小第 个盖尔圆、放大其它盖尔圆。 - 如果
,其它 都是 ,那么会放大第 个盖尔圆,缩小其它盖尔圆。
【例】用盖尔圆隔离特征值:
【解】原矩阵的四个盖尔圆为: ![]()
的四个盖尔圆为: TIPS:往年题里,这个
的元素的选取,往往在 之间。
矩阵幂级数
要讨论幂级数,就要先讨论收敛。要讨论矩阵,就要先讨论向量。
【向量按范数收敛】
则称向量序列
【向量按坐标收敛】设
若存在
事实上,这些收敛的定义都是相互等价的:

矩阵的收敛和上面的一样,只需要把范数改成矩阵范数就行了。
【矩阵级数】设有矩阵序列
矩阵级数收敛,等价于:
部分和序列收敛
个数项级数 收敛。
矩阵级数绝对收敛,等价于:
个数项级数 收敛。存在一个矩阵范数,使得
收敛。
【矩阵幂级数】设
关于其收敛性,有:设普通幂级数
,矩阵幂级数 绝对收敛 ,矩阵幂级数 发散 ,无法判断,只能通过定义(每个元素都收敛)判断
其中
回顾:计算普通幂级数的收敛半径:
【例】判断矩阵幂级数的收敛性,如果收敛,求其和。
【解】矩阵幂级数中,有: ,因此普通幂级数 的收敛半径为 。 矩阵的谱半径为
因此收敛。 当然,这里也并不是一定要求特征值。因为矩阵的行和范数是
,而谱半径一定是小于行和范数的,所以谱半径一定小于 ,进而小于 。 求和:
相减,有: 即 【例2】设 , 判断 的敛散性. 【解2】
,普通级数 收敛半径也为 ,因此改用定义判断。 对于若当块的乘方,有:
$$ ()_k^n=( )_k $$
代入到本题,有:
容易发现, 发散,因此原矩阵级数发散。
矩阵函数
如果把收敛的矩阵幂级数写成函数的形式,就是矩阵函数:
称之为含参矩阵函数。
尽管矩阵函数看起来好像是无穷级数,但是因为矩阵有个最小多项式,所以它总是可以表示成有限个矩阵次幂的线性组合。即:
设矩阵
现在,就是要求出这个有限和
【复函数的谱上给定】如果对于复函数
【谱上一致】设复方阵
则称函数
由此,可以利用谱上一致法计算矩阵函数,操作步骤为:
计算矩阵的最小多项式,假设最小多项式是
次待定系数法,设
把矩阵的各个特征值依次带入上面的方程(代入
的位置),得到方程组。如果特征值不够用,就对上面的方程两边求导,再代入,直到能求出 的唯一解。
【例】计算
,其中: 【解】首先计算 的特征多项式: 验证:
故最小多项式为3次。
设:
把特征值代入 的位置,有: 发现方程不够,对原方程求导: 代入,得到最终方程组: 解得: 后略。
MOOC第四章答案
1 |
|
本站的运行成本约为每个月5元人民币,如果您觉得本站有用,欢迎打赏: