矩阵,是一种数学术语。在数学中,矩阵(Matrix)是一个按照长方阵列排列的数字或符号的集合,其中的数字或符号称为元素。矩阵概念由19世纪英国数学家凯利首先提出。
矩阵通常用大写字母表示,如。矩阵中的元素用小写字母表示,如,其中,分别表示元素所在的行和列。矩阵数学形式如下
常见的矩阵有行
向量、列向量、零矩阵、方阵、单位阵等。矩阵的基本运算有线性运算(矩阵加减和数乘)、矩阵乘法、转置及共轭转置、方阵的幂运算、
行列式运算、伴随运算,逆运算等。与矩阵相关的概念有秩,特征值、奇异值、迹、范数等。
单位矩阵经过一次初等变换后变成初等矩阵。通过初等变换还可以求方阵逆矩阵,求解
线性方程组等。矩阵间的关系有等价、合同、相似及正交相似。矩阵也可按一定方式分解为几个矩阵相乘的形式。
矩阵在工程技术领域可用于
多智能体研究、机器人学等;在物理学中可用于解决物理模型的线性方程组问题;在数学中可以解决数学建模相关问题;在经济管理中可以用于动态规划和数据统计。
发展史
古代起源
矩阵的研究历史悠久,
拉丁方阵和
幻方在史前年代已有人研究。
成书于
西汉末、
东汉初的《
九章算术》用分离系数法表示线性方程组,得到其增广矩阵。在消元过程中,使用的把某行乘以某一非零
实数、从某行中减去另一行等运算技巧,相当于矩阵的初等变换。在当时该方法仅作为
线性方程组的标准表示与处理方式。
近代概念
矩阵的现代概念在19世纪逐渐形成。1801年
德国约翰·卡尔·弗里德里希·高斯(F.Gauss,1777~1855)把一个线性变换的全部系数作为一个整体。1844年,德国数学家爱森斯坦(F.Eissenstein,1823~1852)讨论了“变换”(矩阵)及其乘积。1850年,
英国数学家
西尔维斯特(James Joseph Sylvester,18414-1897)首先使用矩阵一词。
逻辑上,矩阵的概念先于
行列式,但在实际的历史中恰好相反。
日本数学家
关孝和(1683年)与微积分的发现者之一
戈特弗里德·莱布尼茨(1693年)近乎同时地独立建立了行列式理论。其后行列式作为解
线性方程组的工具逐步发展。1750年,
加百列·克莱姆发现了
克莱姆法则。
1854年,
法国数学家埃米尔特(C.Hermite,1822~1901)使用了“正交矩阵”这一术语,但它的正式定义直到1878年才由
德国数学家费罗贝尼乌斯(F.G.Frohenius,1849~1917)发表。
1858年,
英国数学家凯莱(A.Gayley,1821~1895)发表《关于矩阵理论的研究报告》。他首先将矩阵作为一个独立的数学对象加以研究,因而被认为是矩阵论的创立者,同时给出了现在通用的一系列定义,如两矩阵相等、零矩阵、单位矩阵、两矩阵的和、一个数与一个矩阵的数量积、两个矩阵的积、矩阵的逆、
转置矩阵等。并且凯莱还注意到矩阵的乘法是可结合的,但一般不可交换,且矩阵只能用矩阵去右乘。
1879年,费罗贝尼乌斯引入矩阵秩的概念。至此,矩阵的体系基本建立。
中文命名
矩阵的概念最早于1922年见于中文。1922年,程廷熙在一篇介绍文章
中将矩阵译为“纵横阵”。1925年,科学名词审查会算学名词审查组在《科学》第十卷第四期刊登的审定名词表中,矩阵被翻译为“矩阵式”,方块矩阵翻译为“方阵式”,而各类矩阵如“正交矩阵”、“伴随矩阵”中的“矩阵”则被翻译为“方阵”。
1935年,中国数学会审查后,中华民国教育部审定的《数学名词》中,“矩阵”作为译名首次出现。1938年,曹惠群在接受科学名词审查会委托就数学名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。
中华人民共和国成立后编订的《数学名词》中,则将译名定为“(矩)阵”。1993年,中国自然科学名词审定委员会公布的《数学名词》中,“矩阵”被定为正式译名,并沿用至今。
基本概念
定义
矩阵是一组数字(或符号)按行和列排列形成的一个阵列。一般使用大写字母(、、等)来表示。如果某个矩阵有行和列,那么这个矩阵被称为 ""矩阵,可以有以下几种表达方式:
式中,被称为矩阵的元素,位于矩阵的第行第列。
矩阵还可表示为或。这里的称为矩阵的型。若两个矩阵有相同的行数和列数,则称他们为
同型矩阵。若矩阵,同型且相同位置上的元素也都相同,则称它们相等,记为。
设为一个矩阵,任取中的行()和列(),将位于这些行列交叉处的数字按照原来的位置关系排成一个矩阵,这个矩阵称为的型子矩阵。
根据矩阵中元素的属性,把元素都是
实数的矩阵称为实矩阵,同样可定义复矩阵、有理矩阵、数域上矩阵等,数域上全体矩阵记为。
常见矩阵
下面介绍一些常见的矩阵。
(2)列向量(矩阵):只有1列和行的矩阵.
(3)零矩阵:元素都是零的矩阵,符号表示零矩阵,简记为。
(4)负矩阵:设,称矩阵为的负矩阵,记作,即
(4)方阵:行数与列数相同的矩阵。矩阵称为级(阶)方阵。一个普通的数字可以被视为1阶方阵。例如,3可以被认为是方阵。阶方阵可表示为:
式中,中元素称为主对角线元,它们所在的直线称为主对角线或对角线;元素与的连线称为副对角线。
(5)对角矩阵:主对角线外的元素都是0的方阵,简记为。
(6)单位矩阵:主对角线元素全是1,其他元素全为0的方阵,记为或。
(7)上三角矩阵:主对角线下方元素全为0的方阵。
(8)下三角矩阵:主对角线上方元素全为0的方阵。
分块矩阵
对于较大型的矩阵,我们常用若干条横线与竖线将它划分为若干子矩阵,以这些子矩阵为元素(称为块元素)的形式矩阵称为分块矩阵。
矩阵的分块是人为的,目的是便于运算和讨论。下面介绍常用的几种矩阵分块。
(1)设A是矩阵,按列、行分块,分别可以表示为:
(2)设是级方阵,则可以表示为如下两种分块矩阵:
其中和分别为的右下方和左上方的级子矩阵。
矩阵的秩及相关矩阵
若矩阵的某一个阶子式不等于零,而的所有阶子式全为零,那么称为的最高阶非零子式,数称为矩阵的秩,记作或。规定零矩阵的秩等于0。
与秩相关的矩阵如下:
(1)行满秩矩阵:矩阵的秩等于其行数的矩阵。
(2)列满秩矩阵:矩阵的秩等于其列数的矩阵。
(3)满秩矩阵:若阶矩阵的
行列式,则的秩等于,称其为满秩矩阵。显然满秩矩阵就是可逆矩阵,也称非奇异矩阵。
(4)降秩矩阵:若阶矩阵的行列式,则的秩小于,称其为降秩矩阵。显然降秩矩阵就是不可逆矩阵,也称奇异矩阵。
(5)行阶梯矩阵:每一个非零行的非零首元都处于上一行非零首元右边的矩阵。任意一个矩阵总可以经过若干次初等行变换化为行阶梯矩阵。
(6)行最简矩阵:每一行的第一个非零元素为1且这个元素所在列的其他元素都是0的行阶梯矩阵。任意一个矩阵总可以经过若干次初等行变换化为行最简矩阵。
(7)标准型矩阵:把分块矩阵的形式称为标准型矩阵,任意秩为的矩阵总能够经过若干次初等变换(行变换和列变换)化为标准型。
特征值和特征向量
设是阶方阵,若数和维非零列向量,使得成立,则称是方阵的一个特征值,为方阵对应于特征值的特征向量。
是关于的次多项式,称为方阵的特征多项式,方阵称为方阵的特征
方程。矩阵的特征方程在
复数域内的个根就是的所有特征值。
矩阵全体特征值的和等于矩阵的迹,记作。
奇异值
设矩阵,则矩阵是半正定的,因而特征值均为非负
实数,可表示为
则称为矩阵的奇异值。
范数
范数是具有“长度”概念的函数。在泛函分析中,常被用来度量
向量空间或矩阵中每个向量的大小或长度。矩阵可以看作一个拉长的
向量,如矩阵,将后面的每行依次接到前一行的结尾,就构成一个拉长的维向量。
设为的矩阵,则其范数记作,它是矩阵的实值函数。下面介绍几种典型的矩阵范数。
(1)行和范数。
(2)列和范数。
(3)1-范数。
(4)()范数,该范数也称为2-范数。
(5)-范数
基本运算
矩阵的基本运算包括矩阵的线性运算(
加法和数乘)、乘法、转置及共轭转置、幂运算、
行列式运算、伴随运算和逆运算等。
线性运算
矩阵的加法与矩阵的数乘运算统称为矩阵的线性运算。
(1)矩阵的加法:设有两个矩阵、,那么矩阵与的和记作,也可以记作,规定
根据负矩阵的概念,定义两个矩阵与的差。需要注意,只有当两个矩阵是
同型矩阵时,这两个矩阵才能求和或差。
设为同型矩阵,则加法运算公式为
,
(2)矩阵的数乘:设矩阵,规定数与的乘积为矩阵,记作或,即
,,
矩阵乘法
设矩阵表示为矩阵与的乘积,则记作。一般的,当左边矩阵的列数与右边矩阵的行数相同时,两矩阵才能相乘,乘积的行数等于矩阵的行数,其列数等于矩阵的列数。所以记号常读作左乘或者右乘。具体乘法法则如下。
(1)矩阵与矩阵的乘积:设矩阵,,则矩阵与的乘积的元素为矩阵的第行与矩阵的第列的乘积,即
(2)行矩阵与列矩阵的乘积:该乘积是矩阵与矩阵乘积的特例,结果是一个1阶方阵,只有一个元素,此时习惯省略括弧。设行矩阵,列矩阵,按照矩阵与矩阵的乘积规则得
设为矩阵,k为数,则乘法运算公式为
,,,
矩阵转置
把矩阵的行换成同
序数的列得到一个新矩阵,叫做的
转置矩阵,记作(或)。即若
则
设为矩阵,为数,则转置运算规律为
,,,,
共轭转置
当为复矩阵时,用表示的
共轭复数,记。称为的共轭矩阵。
把一个
复数矩阵的各元素改为其共轭复数并作转置,所得矩阵称为A的共轭转置矩阵,记作,即
式中的上划线表示取共轭。复数矩阵的共轭转置可视为实数矩阵转置的推广。
方阵求幂
设是阶方阵,根据矩阵乘法法则有
其中为正整数,即等于个连乘。显然,只有方阵的幂才有意义。
除此之外,方阵求幂还有以下公式
,,
设为矩阵,为矩阵,则有
方阵行列式
由阶方阵的元素所构成的行列式(各元素的位置不变),称为方阵的行列式,记作或。行列式的计算结果为一个数字或符号,可采用降阶法或性质变换法求得。这里重点讲述降阶法。
降阶法运用了代数余子式的知识。行列式(表达式详见”代数余子式”小节)等于它的任一行各元素分别与其对应的代数余子式的乘积之和。即对于一个阶行列式
划去元素所在的第行与第列,剩下个元素按原来的排法构成一个阶
行列式:
称为元素在中的余子式,记为。
令,称为元素的代数余子式。则
使用这个法则可以将高阶行列式运算化为低阶行列式运算,最终取得运算结果。
例如三阶行列式可通过降阶法由二阶行列式表示为
方阵伴随矩阵
阶方阵的伴随矩阵为
其中,是
行列式中元素的代数余子式。需要注意,行列式第行第列元素的代数余子式放在伴随矩阵的第行第列上。
方阵求逆
设A为阶方阵,如果存在阶方阵,使得,则称是可逆矩阵,且为的逆矩阵,记作,即。求逆矩阵的方法有初等变换法和伴随矩阵法等。这里主要介绍伴随矩阵法。
方阵可逆的充要条件是,由此可求得
设为可逆矩阵,则可逆矩阵运算公式为
,,
特殊矩阵
酉矩阵
复数域上的方阵满足,则称是酉矩阵,其中表示以的元素的共轭复数作元素的矩阵,而实际为的共轭转置矩阵,所以酉矩阵可看作复数域内推广的可逆矩阵。
对称矩阵
若阶矩阵中的元素满足条件,即,则称为阶对称矩阵。
若矩阵满足那么称为反对称矩阵或斜对称矩阵。
正交矩阵
对于所有元素都是
实数的方阵,如果满足等于单位矩阵,那么被称作正交矩阵。实数是
复数的
子集,所以所有正交矩阵都是酉矩阵。
正定矩阵
设是阶对称矩阵,若对任意维非零
向量,有,则称为正定矩阵,记为。
若对任意维向量,有,则称为非负定矩阵(半正定矩阵),记为。
设是阶对称矩阵,则是正定(非负定)矩阵的充要条件是的所有特征值为正(非负)。
正规矩阵
设矩阵满足,则称其为正规矩阵。
容易验证,对角矩阵、酉矩阵、实对称矩阵、反对称矩阵及正交矩阵等都是正规矩阵。
稀疏矩阵
稀疏矩阵没有严格定义,一般认为矩阵中0元素的个数达到一定数量即可将其定义为稀疏矩阵。
稀疏矩阵广泛应用于各类科学计算和工程应用的问题建模与数值求解。
雅可比矩阵
雅可比矩阵常用于机器人运动学,也可应用于
群体生物学。对非线性
微分方程系统的每个微分方程的因变量求
偏导数,然后把因变量的均衡值代入这些表达式,即可得到雅可比矩阵。例如,两个因变量的两个微分方程组成的系统的雅可比矩阵为
初等变换
定义
初等变换包括初等行变换和初等列变换,二者本质原理相同。初等行(列)变换的三种具体变换如下:
(1)交换第、两行(列)的位置,记作。
(2)以非零数乘第行(列),记作。
(3)把第行(列)的倍加到第行(列)上,记作。
与三种变换相关的名词如下:
行等价:若,则称与行等价。
列等价:若,则称与列等价。
等价:若,则称与等价。
等价具有传递性,若与等价,且与等价,则与等价。
初等矩阵
由单位矩阵经过一次初等变换得到的矩阵称为初等矩阵(初等方阵)。初等矩阵的
逆矩阵依然是初等矩阵,初等矩阵的次方依然是初等矩阵:
(行交换)
(行倍乘)
(行倍加)
对施行一次初等行变换,相当于在的左边乘以相应的初等矩阵。对施行一次初等列变换,相当于在的右边乘以相应的初等矩阵。
初等变换求秩
初等变换不改变矩阵的秩,所以可以通过初等变换将一般的矩阵变换成行(列)阶梯矩阵,所得非零行行数即为原矩阵的秩。
如矩阵:
经初等行变换后的行阶梯矩阵:
矩阵非零行行数为2,所以的秩为2,即。
初等变换求逆
可以用初等行变换求矩阵的
逆矩阵。具体方法是:把阶矩阵和阶单位矩阵放在同一个矩阵中,即增广矩阵,然后对其进行初等行变换:
当把矩阵变成单位矩阵时,矩阵就是。
线性方程组的解
因为
一次函数为线性函数,所以称元一次
方程组为元线性方程组,简称线性方程组,可写作,即
其中称为系数矩阵,称为未知量矩阵,称为常数项矩阵,矩阵称为
方程组的增广矩阵。
当常数项矩阵全为零()时,该
方程组称为齐次
线性方程组;不全为零时称为非齐次线性方程组或一般线性方程组。
通过初等变换可以求解线性方程组,线性方程组解的判定
定理如下。
(1)无解的充要条件是。
(2)有唯一解的充要条件是。
(3)有无穷多解的充要条件是。
线性方程组的通解包括基础解系和通解。
矩阵关系
等价
若矩阵经过一系列初等变换化成矩阵,与必是同型的,称矩阵与等价。
对任何一个矩阵,均可以经过一系列初等行变换化成行阶梯矩阵,或再经过一系列初等行变换化成行最简矩阵,即任何一个矩阵都行等价于一个行最简矩阵,而且后者是唯一的。
合同
设为阶矩阵,如果存在可逆矩阵,使,则称与是合同的,记为。
(1)自反性。对任意阶矩阵,有。
(2)对称性。若,则。
(3)传递性。若,,则。
相似
设都是阶矩阵,若有可逆矩阵,使,则称是的相似矩阵,或说矩阵与相似,对进行运算称为对进行相似变换,可逆矩阵称为把变成的相似变换矩阵。
相似矩阵具有相同的特征值。
正交相似
设,若存在正交方阵,使得,则称与正交相似。
显然,正交相似的矩阵必然等价、合同且相似。
矩阵分解
将矩阵表示成特定类型矩阵的乘积,即为矩阵的分解。下面介绍几种常见的分解类型。
LU分解
设,若可以表示成一个下
三角矩阵与一个上三角矩阵的乘积,则称为矩阵的分解(三角分解)。
QR分解
设且,则必存在非奇异上三角矩阵及矩阵,使得。
秩分解
设是复矩阵,,则必存在秩为的两个矩阵,,使得。
奇异值分解
设是的非零奇异值,则存在阶酉矩阵及阶酉矩阵,矩阵,使得,称为矩阵的奇异值分解。
谱分解
设矩阵是阶正规矩阵,则存在酉矩阵,使得,将矩阵进行列分块,即,则
令,则为矩阵的谱分解。
应用举例
矩阵是将重要信息数据摘录下来的一个数表,可以对数据进行各种变换,得到一个新的矩阵,从而通过
代数的方法进行研究,对复杂和抽象化的问题进行简化,看清问题的本质,得出一些需要的结论,因此在很多实际应用中都渗透了矩阵理论。
工程技术
矩阵理论经过两个多世纪的发展,已广泛应用于控制理论与控制工程、计算机软件与理论、电力系统及其自动化、电路与系统、信号与信息处理等工程技术领域。
在机器学习领域,拉普拉斯矩阵可应用于网络社区检测,矩阵SVD分解也可应用于图像压缩。
在油气勘测、天气预报、飞行器设计、电路分析、图像分析、生物医学工程等领域,稀疏矩阵可作为问题
建模与数值求解的重要工具。
在
多智能体的研究中,邻接矩阵可表示智能体间的连接关系。
在控制理论中,线性系统的描述和解需要借助矩阵进行表示。
在机器视觉领域,灰度-
梯度共生矩阵可用于提取图像信息。
自然科学
利用矩阵的初等变换原理可以求解由实际问题产生的
线性方程组,如密码的破译问题、交通流问题、
化学方程式的配平、电路问题、网络流问题等。
矩阵具有一定的几何意义,如缩放矩阵和旋转矩阵可以使图形变换;应用矩阵
行列式的几何意义可以简化空间图形的解析过程等。
无限维矩阵可作为研究函数空间算子的有力工具。
矩阵在数学建模分析中同样起着重要作用。
经济管理
稀疏矩阵可以作为
线性规划问题的约束条件,应用于军事作战,经济分析等。
企业运用矩阵工具可以建立实际高效的
理论模型,可以进行
动态规划及数据统计计算等,为企业的决策作数据理论支撑。