矩阵理论笔记

[toc]

须知：

这篇笔记并不是《矩阵理论》课程的全部内容，只是我（以及往年题）认为的重点内容。
因为这篇笔记从头到尾都是我一个人写的，也没有细致地校对过，所以一定会存在一些笔误，欢迎在评论区帮我指正，不胜感激。
由此，我强烈建议各位在线阅读，而不是下载下来阅读，因为我会随时更新错误或者补充内容。

线性空间引论

这一部分其实基本就高代的内容，复习一下。

非齐次线性方程组的解法

这个必须得会吧。为了防止遗忘，还是写一下。

对于非齐次线性方程组其解是由一个特解和齐次线性方程组的通解组成的。接下来通过一个例子展示方程组的解法。

【例】求

的通解。【解】首先写出增广矩阵，也就是系数矩阵右边加上这一列。因此移项，得方程组的一般解为

即：

则取为一个特解。

为导出组的一个基础解系, 从而方程组的通解为

线性空间和线性子空间

一般学习线性代数只会学习到向量空间，而不会学习线性空间，所以笔记从线性空间开始写。线性空间是向量空间的推广，为此需要首先定义两个概念：

【数域】数集中任意两个元素经过四则运算后的结果仍然在中，称为一个数域。

常见的数域有：

有理数
实数
复数
扩域，例如

【加群】在非空集合上定义一种代数运算,称之为加法（记为“” ）,使得都有中唯一元素与之对应,该元素称为与的和，且满足如下性质

交换律：
结合律：
存在零：
存在负元：

称构成一个加群。

于是，可以将向量空间推广为线性空间：

【线性空间】设是一个加群, 是一个数域. 定义了中的数与中元素的一种代数运算, 称为数乘, 使得 , 有中唯一元素与之对应, 称为与的积, 且满足以下性质:

此时，称为数域上的线性空间。此时，中的元素称为「向量」，中的元素称为「标量」。特别的，如果是实数域或者复数域，称为实线性空间或者复线性空间。

可能向量空间给人一种既定观念，就是向量一定是由标量组合而成的，但是其实并不是这样。考虑正弦函数集合：和数域，很显然在上构成一个线性空间。此时这些正弦函数就是向量，标量仍然是普通的实数。可能很难说「正弦函数」这个东西是由实数组合而成的吧。

常见的线性空间有：

向量空间
矩阵空间，是复数域上所有矩阵构成的集合。
一元多项式，
设，则的解集构成线性空间。
定义在上的全体多项式、全体可微函数、全体连续函数、全体可积函数、全体实函数，都是上的线性空间。

在线性空间上有：

零向量唯一
任意向量的负向量存在且唯一

【线性子空间】设是上的线性空间,是的非空子集.若的向量关于的加法和数乘运算也构成上的线性空间,则称是的子空间。

例如，平面是三维空间的一个线性子空间。但是不能说，是的线性子空间，因为前者的元素是二维向量，后者的元素是三维向量，二维向量并不是三维向量的子集。可以说，是的子空间。

对于子空间的判别，以下三个命题等价：

是的子空间
且

其实，在实操中，判定子空间，一般首先看中是否含有零元素。如果不含，那么一定不是子空间。如果包含，再验证第三个命题。

如果都是数域上的子空间，那么它们的交与和也是的子空间。其中集合交的定义是显然的，集合的和指的是：而且，交空间是包含于的最大子空间，和空间是包含了的最小子空间。两个子空间的并，不一定是子空间。

对于矩阵来说，有两个相当重要的子空间：

【矩阵零空间】齐次线性方程组的解集，记作

【矩阵列空间】的列的所有线性组合构成的集合，记作。列空间也叫做值空间，是因为当且仅当时，方程才是有解的。

基和坐标

首先回顾一下线性相关和线性无关的概念，因为和线代里面的没啥区别，所以不重复写了。

【极大线性无关组与秩】设是线性空间的一组向量. 若中存在个线性无关的向量 , 并且中任一向量均可由向量组线性表示, 则称向量组为向量组的极大线性无关组,数称为向量组的秩, 记为

向量组中的任一向量都可由极大线性无关组唯一表示。

由极大线性无关组，可以定义线性空间的基：

【基】设是数域上的线性空间，是里的一组向量，而且

线性无关
中所有向量都可以由线性表示

那么说是的一组基。事实上，中所有向量可以由基唯一表示，这叫唯一表示定理。

定义了基，其目的就是唯一表示其它的向量。这种表示的方法叫做坐标：

【坐标】设是数域上线性空间的一组基, 对任意向量 , 令

称有序数组是在基下的坐标，它由与基唯一确定.

对于两个不同的基，存在过渡矩阵：

【过渡矩阵】设和是数域上线性空间的两组基, 令

引入矩阵表示:

其中 , 称是由基到基的过渡矩阵（或变换矩阵）.

对于中的任意向量，设其在基中的坐标为，在基中的坐标为，则有：【维数】在线性空间中, 不同线性无关组中向量个数最大者叫作的维数, 记为 . 当 , 称为有限维空间, 否则称为无限维空间, 记。其实，等价于的任意一个基的向量个数为。

例：空间在数域和上的维数分别是多少？

解：在上，向量组是的一组基，所以维数是2。在上，向量和线性相关,且任一复数均可由或线性表示.故向量组和分别构成的一组基,即定义在上的线性空间的维数为 .

有维数定理：设是的两个子空间，则：

【例】设 , 求及的维数，其中。

【解1】

要求的维数，即求四个向量张成的空间的维数。有：对其进行初等行变换，有：这个矩阵的秩是，所以。

设，则有：即：移项并化简，有：化简，有：

左边的矩阵的秩是，所以解是一维的。具体一点，有：代入，有：所以，

【解2】

显然，，由维数定理：只需像上面那样求出即可，无需算两个矩阵的秩。

内积空间

在线性空间上，额外定义对于两个向量的内积运算，内积运算的结果是数域中的一个数，且满足：

共轭对称性: ;
可加性: ;
齐次性: ;
正定性: , 当且仅当时等号成立.

此时可以称是一个内积空间。有限维的实内积空间叫欧几里得空间，有限维的复内积空间叫酉空间。

注意，齐次性只对第一个向量成立。对于第二个向量，有共轭齐次性：考虑中的向量，定义运算^[1]：那么，需要满足什么条件，才能使得这个运算成为内积呢？

由内积定义中的共轭对称性，有：这个推导有两点可能需要解释。第一，因为它的结果是个1*1的矩阵，所以共轭可以写作共轭转置。第二，

所以有：我们将满足的矩阵称为Hermite矩阵。此外，还需补充正定性：

将称为二次型，为的矩阵，如果且等号仅在取得，称为正定矩阵，为正定二次型。

【度量矩阵】设是内积空间中的一组基, 称阶矩阵

为关于基的度量矩阵 (或Gram矩阵),常记为。度量矩阵和基是一一对应的。

如果，且其在基下的坐标分别是和，则有：显然，度量矩阵是正定Hermite矩阵。

在内积空间中，可以定义一个向量的长度：长度具有以下的性质：

齐次：
正定：不再解释了
平行四边形法则：
三角不等式（三角形两边之和大于第三边）
Cauchy-Schwarz不等式（余弦定理）定义两个向量之间的夹角为：

由内积和夹角，可以引出正交的概念：

【正交】对于内积空间中的两个向量，如果有，称这两个向量正交。一组互相垂直的向量组称为正交向量组，单位向量构成的正交向量组称为标准正交向量组。在维内积空间中，由个向量组成的正交向量组称为正交基，由单位向量组成的正交基称为标准正交基。

向量正交于集合，指的是对于线性空间中的一个向量和子集，正交于中的任何一个向量，那么称正交于集合。

集合正交于集合，指的是线性空间中的两个集合，其中任意两个向量都相互正交。

注意：集合正交于集合并不简单地等同于集合垂直于集合。考虑到3维欧氏空间中的两个相互垂直的平面，它们并不相互正交（因为两个集合的交集上任意两向量共线）。

【正交补】设是线性空间的子空间，那么所有和正交的向量构成的集合称为的正交补。正交补一定是线性子空间。

对于正交补，有：

【例】

求的列空间的正交补。

【解】即解方程组：方程组的解集，就是和的每一列都正交的向量的集合。化简得：所以，原方程组可为：所以，解空间为：

其实，有线性代数基本定理：

行空间和零空间是中的正交补空间；列空间和左零空间是中的正交补空间。

直和与投影

【直和与正交直和】设与是线性空间的子空间，若和空间中任意向量均唯一地表示成中的一个向量和中的一个向量之和，则称是与的直和，记为。

特别的, 若 , 则称表达式为直和分解.

进一步, 若 , 则称直和是与的正交直和, 记为。

其实，若，则.

【例】在立体直角坐标系中，，那么是直和吗？

【解】不是，因为所以分解不唯一。

为了判断一个和是不是直和，有以下四个等价命题：

+是直和
中零元素表示方法唯一

MOOC第一章答案

A A A C D
B B B C B 
B BCD CD ABC ABC
ABD AD AC BCD C
BC ABCD 110
11111
11101
11100
01000
11001
10111
1011
CSS

矩阵和线性映射

映射和线性映射

【单射和满射】对于映射，如果有，那么是一个单射。也就是说，不同的元素一定被映射为不同的像。如果有，那么是一个满射。也就是说，像集里的每个元素都能被取到。如果既是单射又是满射，那么是双射。也就是说，每个都有且仅有一个与其对应。

考察实数域上的函数和。因为，所以不是单射；因为无解，所以不是满射。既是单射又是满射，所以是双射。

【线性映射】如果对于映射和数域（其中是上线性空间）满足两条线性性质，称为上的线性映射。如果，称为线性变换。

可加性：
齐次性：

【例】对于在其自身上^[2]的线性空间上的映射：不是线性映射。因为

关于线性映射，有以下推论：

保持原点不动：
如果是中一组线性相关向量，那么也是中一组线性相关向量
如果是中一组线性无关向量，那么也是中一组线性无关向量
当且仅当是单射，如果是中一组线性无关向量，那么也是中一组线性无关向量

如果维数相同，那么此时中一组基的像是中的一组基，是双射

与矩阵相似地，定义线性映射的零空间和值空间：

零空间：，即使得像为原点的的值的集合。它的维数叫做的「亏」。
值空间：，即的实际取值范围。它的维数叫做的「秩」。

【亏加秩定理】线性映射的亏和秩之和等于其定义域空间的维数。

矩阵与同构

【线性映射的矩阵】设和是数域上的线性空间, 和分别是和的基，且 . 因此可由基线性表示，即其中称为在的基和的基下的矩阵.

简单理解：线性映射的矩阵，就是中的基的像在的基下的坐标，依次写成纵列，然后拼接起来。

当线性空间和的基确定后，矩阵和线性映射唯一确定。即：有且仅有一个矩阵使得线性映射是，也有且仅有一个线性映射使得矩阵是。

【例】已知多项式空间（即以为变量的三次多项式空间）的子空间 ,其中 .

求子空间的一个基;

对于中的多项式 , 定义线性变换

求线性变换在（1）中求出的基下的矩阵.

【解】

注意到：，因此一组基为

计算基象组：

因此，矩阵为把基象组依次写成纵列然后拼起来：

【同构】设是上的线性空间，如果有一个既是双射又是线性映射的映射，那么称和同构，是同构映射。同构映射一定可逆，而且其逆映射也是同构映射。

所谓的「同构」，其实就是「一样」，「一回事」的意思。

两个线性空间同构，当且仅当其维数相等。

【同一个线性映射在不同基下的矩阵的关系】和是的两组基,

和是的两组基,

设，

则。即：矩阵可以通过有限次初等变换变成矩阵，两矩阵相抵（等价）。

特别的，如果线性映射是变换，即，那么有：也就是和相似。可以看出，矩阵相似其实就是矩阵等价的特殊情况。

特征值和特征向量

【线性变换的特征值和特征向量】设线性变换，若存在及的非零向量 使得

则称是的一个特征值, 称为的属于特征值的一个特征向量。

需要注意：

从几何上来看，就是线性变换作用于特征向量后，仍然保持共线
属于同一个特征值的特征向量的线性组合也是属于这个特征值的特征向量
如果特征向量是线性变换零空间里的非零向量，那么其特征值是0
设是线性变换，是的一组基, 且, 则在基下的矩阵为对角阵

【矩阵的特征值和特征向量】设为一文字, 矩阵称为的特征矩阵, 其行列式称为的特征多项式, 方程的根称为的特征值（或特征根）. 方程的非零解向量称为属于特征值的特征向量。

是线性变换的特征值，当且仅当它是的任意一个矩阵的特征值，属于同一线性变换的各个矩阵的特征值完全相同。

由定义可以知道，矩阵的特征值是一个一元次方程式的根。这个根的重数是特征值的代数重数。因此，一个的矩阵的所有特征值的重数之和是。有时，我们也说「一个阶方阵有个特征值」，注意这里的「个」是要计算重数的。

一个矩阵的特征值之和等于其对角线上元素之和，这个和也叫做矩阵的「迹」，记作。

【例】已知，求的特征多项式，并求。

【解】显然，，因此是一个秩为的矩阵（每一行都是向量乘以标量倍）。那么，考虑齐次线性方程组它的基础解系是维的，即矩阵的零空间是维的。从特征方程的角度来看，代表为矩阵的其一特征值，那么其特征值为的线性无关的特征向量的个数为，又特征值的代数重数不会少于几何重数，所以至少为重特征值。

所以只有一个非零特征值。所以矩阵的特征多项式具有如下的形式：因为的特征值之和等于其对角线元素之和，所以

关于，有：

【特征子空间】矩阵的属于某个特征值的全体特征值再加上零向量，构成一个线性空间，叫做属于特征值的特征子空间，记作特征子空间的维数是特征值的几何重数。几何重数不会超过代数重数。

如果所有特征值的几何重数等于代数重数，则矩阵可以相似对角化，即：，其中是对角矩阵。

酉变换和酉矩阵

酉变换是实数域中的正交变换推广到复数域中的结果。

【正交变换和酉变换】若欧氏(酉)空间中的线性变换保持向量的内积不变，即

称为正交(酉)变换。

【正交矩阵和酉矩阵】如果阶实方阵满足或者，称为正交矩阵；如果阶复方阵满足或者，称为酉矩阵。

标准正交基经过酉变换以后仍然是标准正交基，而且酉变换在标准正交基下的矩阵是酉矩阵。正交/酉变换的核心特征是「保持长度不变」。

酉矩阵的行列式的模是，所有特征值的模也是。

矩阵是酉矩阵的充要条件是它的个列向量构成标准正交基。

常见的酉矩阵有初等旋转矩阵和反射矩阵。

其中，初等旋转矩阵记为，它的形式是，先写出一个阶单位阵，然后把矩阵放到第行列，最后变成这样：初等反射矩阵表示了把向量用以作为法向量的超平面作为镜面反射的变换。有：

幂等矩阵

这个书里面并没有，但是慕课作业里面有很多相关的内容，所以整理一下。

幂等矩阵指的是满足的矩阵。从几何上看，幂等矩阵代表了一种投影变换，因为投影一次（）和投影两次（）的结果一样。一个典型的幂等矩阵是：它就是把三维坐标投影到前两个维度构成的平面上的投影变换。

关于幂等矩阵的性质，有：

证明：注意到幂等矩阵的定义等价为。设，即，则，则。

若，即，故。

因为，所以也是幂等矩阵，故第二部分证毕。

不是幂等矩阵，因为。
证明：设，则有，有，两边同时乘以：，则
由第一条性质易得
亏加秩定理：
可对角化为

考虑任意一个特征值，有，则，但是，故，。

其中，如果特征值为，其特征子空间是，如果特征值为，其特征子空间是.

这两个特征子空间的基底合并以后可以生成。
特征值的代数重数。

MOOC第二章答案

D C ACD BC BD
AB 1 1 1 1
1 BD 1 1 1
1 0 1 1 0
1 1 1 1 1
1 1 1 1 1
0 1 1 0 1
0 1 B A A B
APACHE

矩阵分解

满秩分解

【满秩分解】设是的秩为的矩阵，记作，则存在和，使得

证明：假设，取的一组基，则有：定义，则有：其中，又因为

所以.

可以看到，满秩分解取决于上基的选取，所以满秩分解并不唯一。

【例】求的满秩分解。

【解】观察得，构成的一组基。则向量在这组基下的坐标分别是：

故满秩分解为：

那么如果观察不出来怎么办呢？其实也有通用方法：

【例】求以下矩阵的满秩分解：【解】

先通过初等行变换把它变成行最简形：

观察每一行的首元出现在哪一列，把原矩阵的这些列抽出来，组合在一起，作为矩阵：

观察每一行的首元出现在哪一行，把行最简矩阵的这些行抽出来，组合在一起，作为矩阵：

有：

【矩阵的左右逆】设矩阵，如果存在使得，称是的右逆；如果存在矩阵使得，称是的左逆。矩阵存在右逆的充要条件是它是行满秩矩阵；矩阵存在左逆的充要条件是它是列满秩矩阵。

关于矩阵的秩有重要结论：

QR分解

【QR分解】如果复（实）方阵可以分解为：其中是酉（正交）矩阵，是上三角矩阵，则称可以被QR分解。QR分解也叫酉三角分解（正交三角分解）。

如果实数方阵是满秩的，那么它可以被QR分解，而且分解方法唯一。

证明：设，那么这个向量组是的一组基。把这组基进行施密特正交化，得到标准正交基。注意到,都是空间的基，有：其中是过度矩阵。

考虑施密特正交化的过程：则有

也可以用初等反射变换求QR分解，具体操作方法是：

取为矩阵的第一列构成的列向量，计算其范数
构造：
构造：
计算：其结果的第一列除了第一个元素以外都是，即：
对矩阵递归进行前四步，最终得到的即为矩阵。
矩阵的计算方法是：其中：

【例】计算QR分解：

【解】

$$ $$

则：

则：

接下来考察长方形矩阵的QR分解。

【列/行正交规范矩阵】设，若则称是列正交规范矩阵，是行正交规范矩阵。

考虑的QR分解。按照上面的施密特正交化法，有：其中是列正交规范矩阵。我们把它的列补齐成的标准正交基：则有：所以可分解为 , 其中, 是阶酉矩阵, 为正线上三角阵, .

Schur分解和矩阵多项式

【Schur引理】任意复方阵相似于上三角阵，即存在可逆矩阵使得，且的对角元素是的特征值。进一步，任意复方阵酉相似于上三角阵 , 即存在酉矩阵使得为上三角阵。

【矩阵多项式】设 , 定义数域上的多项式

式中, . 则

称为矩阵多项式。

其实矩阵多项式就是把普通多项式的变量变成了一个矩阵。

我们可以利用Schur引理来研究矩阵多项式的性质，例如：

【定理】设复矩阵的特征值为，是任意多项式，那么的特征值是。

【证明】：存在一个酉矩阵，使得其中是上三角阵，其对角线元素是的特征值。注意到：其中上三角阵的对角线元素是，由于酉相似于，所以它们有相同的特征值，证毕。

【Hamilton-Cayley定理】设是的特征多项式，那么。即：矩阵是自己的特征多项式的根。

【证明】：可以表示为：则由shur引理，有，可以表示为：因为上三角阵相乘，对角线元素相乘，所以中间的累乘式结果是，证毕。

接下来介绍关于矩阵的几个重要多项式：

【零化多项式】如果多项式满足，称其为矩阵的零化多项式。

不难发现，矩阵的特征多项式就是一个典型的零化多项式。

【最小多项式】矩阵的零化多项式中，最小次数且最高次项系数为的多项式称为最小多项式，记作。

矩阵的特征多项式不一定是最小多项式。例如二阶单位矩阵，其特征多项式是，但是最小多项式是。

关于最小多项式，有以下结论：

矩阵的最小多项式唯一，而且可以整除任何零化多项式
矩阵的最小多项式的根与特征多项式相同（不计重数）

据此，可以知道一个求矩阵的最小多项式的方法，就是先求它的特征多项式，并写成根的分解的形式，然后将每一项的次数置为，验证是否是零化多项式，如果不是，就挨个提高次数，直到发现一个零化多项式为止。

【例】求最小多项式：【解】矩阵的特征多项式为：因此最小多项式可能是或者

验证第一个，有：因此最小多项式是。

对角化分解

【定义：单纯矩阵】如果阶复方阵相似于对角矩阵，即存在阶可逆矩阵，使得则称是单纯矩阵，也叫可对角化矩阵。单纯阵的定义式就是单纯阵的对角化分解式，它实际上是Schur分解的一种特殊形式（Schur分解是「上三角阵」，对角化分解是「对角矩阵」）。

关于单纯矩阵，以下命题等价：

是单纯矩阵
有个线性无关的特征向量
特征值的代数重数等于几何重数
最小多项式无重根

关于单纯矩阵，还有两个充分而不必要条件：

如果复方阵的零化多项式无重根，那么它是单纯矩阵
如果阶复方阵有个互异的特征值，那么它是单纯矩阵

【例】之前分析过的幂等矩阵是单纯矩阵吗？

【解】幂等矩阵是满足的矩阵，显然是它的一个零化多项式，无重根，所以是单纯矩阵。

【酉相似对角化】如果阶复方阵酉相似于对角矩阵，即存在阶酉矩阵，使得，那么称是可酉相似对角化的。

设矩阵，那么是Hermit矩阵（）当且仅当的所有特征值是实数，而且存在酉矩阵，使得.

求Hermite矩阵酉相似于对角阵的步骤如下:

求出所有的相异特征值和重数
对于每个特征值，求的基础解系，并将其单位正交化
由标准正交特征向量生成酉矩阵，则是酉矩阵

【正规矩阵】设，则满足的矩阵称为正规矩阵。

复方阵是正规矩阵，和酉相似于对角阵等价。

关于正规矩阵，有：

显然：正规矩阵的单纯矩阵的加强版。
复方阵是正规矩阵当且仅当有个特征向量构成空间的一组标准正交基，且属于的不同特征值的特征向量正交.
阶实方阵是正交矩阵当且仅当的所有特征值的模值为 1 , 且存在酉矩阵使得

其中是的个特征值.

阶复方阵是酉矩阵当且仅当的所有特征值的模值为 1 , 且存在酉矩阵使得

其中是的个特征值.

常见的正規矩陣有：实对称矩阵、Hermitian矩阵、酉矩阵、反Hermitian矩阵

谱分解

接下来进一步研究单纯矩阵和正规矩阵的性质。

单纯矩阵谱分解

单纯矩阵可以写成一系列幂等矩阵的加权和的形式，其中的权是的特征值：

【证明】：

因为是单纯矩阵，有：把按行列进行分块，有：在这里，其实就是属于的特征向量。

则有：其中下证是幂等矩阵。由，有：则有：证毕。

其实，可用同样的方法证明：。

进一步的，如果更一般的情况，即有个特征值，其中是特征值的重数，有：其中其中，是第个特征值的第个特征向量，可由求出

【例】计算谱分解：【解】先计算特征值：对应的特征向量为：则有：则：由定义：

关于单纯矩阵的谱分解，有性质：

集合唯一

有推论：

若是一个多项式，有：进一步，若设，则有：

例】计算谱分解：【解】先计算特征值：定义 , 则

正规矩阵的谱分解

正规矩阵是单纯矩阵的特殊情况。在正规矩阵的谱分解中，都是正交矩阵。而且有：其中是属于的单位正交的特征向量们。

【例】求正规矩阵的谱分解【解】计算矩阵的特征值与特征向量, 分别为: ，.

将和单位正交化, 并将单位化, 得

定义 , 则是的谱分解式。

若当标准型

接下来讨论不单纯的矩阵，也就是不能相似对角化的矩阵，如果非要把它相似对角化会怎样。

矩阵与三个重要因子

【矩阵】如果矩阵的元素都是多项式，那么矩阵称为矩阵。

例如，我们经常见到的特征矩阵就是一个典型的矩阵。

矩阵的的秩定义为其非零子式的最大阶数。矩阵可逆，等价于其行列式是非零的常数。

矩阵也可以进行初等行列变换，即：

交换行/列顺序
给某一行/列乘以非零常数
给某一行/列乘以一个多项式然后加到另一行/列上。

若经过有限次初等变换变为，称这两个矩阵相抵。与数字矩阵不同的是，秩相同的矩阵不一定相抵。矩阵如果要相抵，除了秩相同以外，还要有相同的各阶行列式因子。

【行列式因子】一个矩阵的阶行列式因子定义为其全部阶子式的首最大公因子，记为。

【不变因子】不变因子可以通过下面的形式计算：

不变因子的前一项总是后一项的因子，而且有：

一个矩阵的特征矩阵的不变因子的最后一项即为原矩阵的最小多项式。

【初等因子】把每个不变因子分解成一次因式的幂的乘积形式，所有这些一次因式的幂的集合（相同的必须按出现次数重复计算）称为矩阵的初等因子组。

【例】求矩阵的各阶行列式因子、初等因子和不变因子

【解】先求行列式因子：

三阶行列式因子：二阶行列式因子：

求矩阵的9个子式的最大公因式，例如：

等等。最终算出来最大公因式是。

一阶行列式因子：

即所有元素的最大公因式：

求不变因子：

求初等因子：

设矩阵为对角块矩阵, 即

则初等因子的全体就是的全部初等因子，其中是适当阶数的矩阵。

史密斯标准型

一个矩阵的史密斯标准型为：其中是矩阵的不变因子。

史密斯标准型的求法是：

确定原矩阵的一阶行列式因子
通过初等变换，把原矩阵的左上角元素变成
通过初等变换，把原矩阵的第一行、第一列除了第一个以外的元素都变成，此时矩阵为：
对递归进行前三步。

【例】求史密斯标准型：【解】

计算一阶行列式因子，则：计算右下方子矩阵的一阶行列式因子：

若当标准型的求法

假如矩阵有一个不变因子是，那么它对应一个阶，主对角线元素为，主对角线上一行元素为的若当块。

对于矩阵的特征矩阵的初等因子组，它们对应的若当块以任意顺序组合，就是矩阵的若当标准型。

【例】已知三阶矩阵，且，求其若当标准型。

【解】因为所以是的一个零化多项式。又因为，所以是最小多项式。

考虑的特征矩阵，其行列式是其所有不变因子的积（史密斯标准型），也是矩阵的特征多项式。所以，其所有初等因子的最小公倍式就是的最小多项式，所以其初等因子组是，其若当标准型为：

【例2】。求的初等因子,不变因子, 及 Smith 标准型。写出的 Jordan 标准型及最小多项式。

【解2】初等因子为：

考虑矩阵：，先求其各阶行列式因子，再由行列式因子求出不变因子和史密斯标准型。

求，因为和的最大公因式为，因此

求，因为和的最大公因式为，因此

求，因为、和的最大公因式为，因此

求，因为原来的矩阵有项，求即选择其中的项相乘。如果不选，那么必选；如果不选，那么必选，因此必定是其中一个公因式，而且是最大公因式。

求，为

因此，矩阵不变因子为：

史密斯标准型为：若当标准型为：最小多项式为：

MOOC第三章答案

C C CD A B
B D A ACD ABCD
AC CD C B D
D 1 C B D
C C C D A
B ABC ABCD BC AD
ABCD BC AD ABC 1
00111
11111
01101
11111
10111
00111
10111
01111
0 ABCD 111
1111 BC
11
MATHEMATICA

矩阵分析

向量范数

【向量范数】设是数域上的线性空间，是的实值函数，如果满足：

正定：且当且仅当时，
齐次：
三角不等式：

称其为向量的范数，称这个线性空间为赋范线性空间。

有以下三种常用的范数：

，即所有元素的绝对值之和
，即所有元素的绝对值中的最大值
，即我们日常使用的「欧氏距离」
，其中，上面三个范数都是它的特殊情况。

问：内积空间是赋范线性空间吗？

答：是的，不仅如此，内积空间所定义的距离还满足「平行四边形法则」。

【范数等价】对于两个向量范数和，如果有：那么称这两个范数等价。范数等价满足等价的性质，即传递性、自反性和对称性。

事实上，有限维线性空间的所有范数都是等价的。

矩阵范数

【矩阵的向量范数】对于定义在上的矩阵，如果满足：

正定：且当且仅当时，
齐次：
三角不等式：

称其为矩阵的向量范数。这其实就是把矩阵”拉直“看成向量。如果要考虑真正的矩阵，就要满足第四条性质：

矩阵乘法相容性：

则称其为矩阵范数。

【向量范数与矩阵范数相容】若对和 , 向量范数与矩阵范数满足

则称向量范数与矩阵范数相容.

给定一个的矩阵范数，一定会对应一个的向量范数与之相容。这是显然的：，其中是任意非零向量。证明相容性，有：已知向量范数，其实也有矩阵范数与之对应且相容，不过这个没有那么显然：

【算子范数/诱导范数】设是上的一个向量范数, 对任意，定义

则是一个与相容的矩阵范数, 称其是从属于向量范数的算子范数或由向量范数诱导的矩阵范数。

对于向量范数，有诱导范数，它们分别称为列和范数、行和范数和谱范数。

列和范数：每一列的元素绝对值之和的最大值：
行和范数：每一行的元素绝对值之和的最大值：
谱范数：

矩阵特征值的估计

【谱和谱半径】对于复方阵，其所有特征值的集合叫做这个矩阵的谱，其中特征值最大的模叫做这个矩阵的谱半径。

谱半径本身不是范数（不满足正定性中的「范数为0等价于矩阵为」），而且它不大于任何一个矩阵范数。

【盖尔圆盘】对于，每一行来说，以它的主对角线上的那个元素为圆心，其它所有元素的模之和为半径的圆及其内部，叫做这个矩阵的盖尔圆盘。用数学公式来说，就是：定义盖尔圆盘【盖尔圆盘定理】矩阵的所有特征值都在矩阵的所有盖尔圆盘的并集之内。

因为与有相同的特征值集合，所以实际上矩阵的所有特征值要落在和的所有盖尔圆盘的并集之内。

如果的其中个盖尔圆盘是并集形成一个联通的区域（相切也算），且该区域和其余圆盘都不相交，那么这个区域里面恰好有个特征值。那么，孤立的盖尔圆盘里面有且只有一个特征值。如果矩阵有个独立的盖尔圆盘，那么它至少有个互异的实特征值。如果所有盖尔圆盘互不相交，那么矩阵是单纯矩阵。

如果原点不在任何盖尔圆盘内，矩阵就不是奇异矩阵。

【例】证明下面的矩阵至少有两个实特征值【解】矩阵的四个盖尔圆为：

在紫色的圆里，有一个实特征值。矩阵是阶矩阵，所以有四个特征值。因为复特征值都是成对出现的，所以最多只能有一对复特征值，所以至少有两个实特征值。

在使用盖尔圆估计特征值时，为了获得更多的孤立圆，我们可以构造一个矩阵，然后有：因为相似，所以它们具有相同的特征值。但是的盖尔圆盘是相互孤立的，这样就能更加精准地估计了。

一般来说，构造的方法是取一些非零实数，然后有：通常，的选取方法为：

如果，其它都是，那么会缩小第个盖尔圆、放大其它盖尔圆。
如果，其它都是，那么会放大第个盖尔圆，缩小其它盖尔圆。

【例】用盖尔圆隔离特征值：【解】原矩阵的四个盖尔圆为：的四个盖尔圆为：

TIPS：往年题里，这个的元素的选取，往往在之间。

矩阵幂级数

要讨论幂级数，就要先讨论收敛。要讨论矩阵，就要先讨论向量。

【向量按范数收敛】是维赋范线性空间，是中一个向量序列, 记为 . 若存在的向量满足

则称向量序列按范数收敛于 , 记作

因为有限维线性空间中所有范数都是等价的，所以只要向量按某种范数收敛，它就按所有范数收敛。

【向量按坐标收敛】设是维赋范线性空间, 是中一组基, 是中一个向量序列，并记向量序列中的任一向量在下坐标为

若存在的向量满足则称向量序列按坐标收敛于向量 , 其中是向量在基下坐标.

事实上，这些收敛的定义都是相互等价的：

矩阵的收敛和上面的一样，只需要把范数改成矩阵范数就行了。

【矩阵级数】设有矩阵序列，则称为矩阵级数。

矩阵级数收敛，等价于：

部分和序列收敛
个数项级数收敛。

矩阵级数绝对收敛，等价于：

个数项级数收敛。
存在一个矩阵范数，使得收敛。

【矩阵幂级数】设，则定义矩阵级数其中为矩阵幂级数。

关于其收敛性，有：设普通幂级数的收敛半径为，则

，矩阵幂级数绝对收敛
，矩阵幂级数发散
，无法判断，只能通过定义（每个元素都收敛）判断

其中是矩阵的谱半径，即特征值的绝对值的最大值。

回顾：计算普通幂级数的收敛半径：

【例】判断矩阵幂级数的收敛性，如果收敛，求其和。【解】矩阵幂级数中，有：，因此普通幂级数的收敛半径为。

矩阵的谱半径为因此收敛。

当然，这里也并不是一定要求特征值。因为矩阵的行和范数是，而谱半径一定是小于行和范数的，所以谱半径一定小于，进而小于。

求和：相减，有：即【例2】设 , 判断的敛散性.

【解2】，普通级数收敛半径也为，因此改用定义判断。

对于若当块的乘方，有：
$$ ( )_k^n=(
)_k $$

代入到本题，有：容易发现，发散，因此原矩阵级数发散。

矩阵函数

如果把收敛的矩阵幂级数写成函数的形式，就是矩阵函数：若矩阵函数的自变量由矩阵换成 , 其中为标量参数, 则有矩阵函数表达式为

称之为含参矩阵函数。

尽管矩阵函数看起来好像是无穷级数，但是因为矩阵有个最小多项式，所以它总是可以表示成有限个矩阵次幂的线性组合。即：

设矩阵的最小多项式次数为 , 幂级数的收敛半径为 . 若 ,定义矩阵函数 , 则必存在唯一的次矩阵多项式使得 .

现在，就是要求出这个有限和。

【复函数的谱上给定】如果对于复函数和矩阵，如果对于的代数重数为的特征值，和在处的阶导数都有界，那么称复函数在矩阵的谱上给定。

【谱上一致】设复方阵的最小多项式为 , . 若函数和在谱上给定且满足

则称函数和在矩阵的谱上一致。

和在矩阵的谱上一致是的充要条件。

由此，可以利用谱上一致法计算矩阵函数，操作步骤为：

计算矩阵的最小多项式，假设最小多项式是次
待定系数法，设
把矩阵的各个特征值依次带入上面的方程（代入的位置），得到方程组。如果特征值不够用，就对上面的方程两边求导，再代入，直到能求出的唯一解。

【例】计算，其中：【解】首先计算的特征多项式：验证：

故最小多项式为3次。

设：把特征值代入的位置，有：发现方程不够，对原方程求导：代入，得到最终方程组：解得：后略。

MOOC第四章答案

DAACC BDABC
C0001 01111
01111 1BBAA
AABAA BAD(ABCD)(ABC)
(ABC)(ACD)(ABC)(AD)(AC) 10111
11110 11001
11110 11111
11111 11111
01011 BD00D
SCSS

本站的运行成本约为每个月5元人民币，如果您觉得本站有用，欢迎打赏：

其中的(y^H)是共轭转置的意思，也就是说(y^H=yT) ↩︎
意思就是，线性空间的「数域」也是那个集合Q(√3) ↩︎

笔记

#矩阵理论

矩阵理论笔记

https://suzumiyaakizuki.github.io/2024/10/05/矩阵理论笔记/

作者

SuzumiyaAkizuki

发布于

2024年10月5日

许可协议

ヤマノススメ！2024年9月！上一篇

最优化笔记下一篇