您的位置:首页 > 其它

线性代数应该这样学4:线性映射,单射与满射,零空间与像空间,线性映射基本定理

2021-02-02 01:07 344 查看

在本系列中,我的个人见解将使用斜体标注。每篇文章的最后,我将选择摘录一些例题。由于文章是我独自整理的,缺乏审阅,难免出现错误,如有发现欢迎在评论区中指正。

[Toc]

Part 1:线性映射

线性映射让线性代数不再是静态的一门学科,有了线性映射,线性空间中的向量就可以动起来。这一章同时也在告诉读者,向量不只是狭义的数组。

线性映射(linear map) 从$V$到$W$的线性映射是具有下列性质的函数$T:V\to W$:

  1. 加性(additivity):\forall u,v\in V,有$T(u+v)=Tu+Tv$。
  2. 齐性(homogeneity):$\forall \lambda \in\mathbb$和$v\in V$,有$T(\lambda v)=\lambda (Tv)$。

注意线性映射的加性和齐性是缺一不可的,它们并没有相互包含的关系

线性映射的集合 $\mathcal L(V,W)$代表从$V$到$W$的所有线性映射。

在$\mathcal L(V,W)$中,每一个线性映射$T$是一个集合内的元素,要搞清楚集合的基本元素是什么。

由于$V,W$都是线性空间,所以不可避免地要讨论线性空间的维数和基。可以直观地想象一下,如果一个线性映射$T$确定了集合中每一个基向量$v_1,\cdots,v_n$的取值,那么$V$中的任何向量$v$在$W$中的像$Tv$也随之确定,因为$v$只能由$v_1,\cdots,v_n$唯一表示。这个性质直接引出了下面的定理。

线性映射与基 设$v_1,\cdots,v_n$是$V$的基,w_1,\cdots,w_n\in W,则存在唯一一个线性映射$T:V\to W$使得对任意$j=1,\cdots,n$,都有

Tv_j=w_j.

这里需要先说明两个线性映射相等指的是什么,如果两个线性映射把任意$V$中的$v$都映射到同一个像上,就称它们是同一个线性映射。从我们刚才的分析来看,只要两个线性映射对所有基的成像都相同,它们就是同一个线性映射。

首先证明这样的线性映射存在。定义$T$为

T(c_1v_1+\cdots+c_nv_n)=c_1w_1+\cdots+c_nw_n,

显然只要取$c_i=1$,当$j\ne i$时$c_j=0$,就有$Tv_j=w_j$。下验证$T\in\mathcal L(V,W),即满足加性和齐性。首先\forall \lambda \in\mathbb$,v=c_1v_1+\cdots+c_nv_n,有

T(\lambda v)=T(\lambda c_1v_1+\cdots+\lambda c_nv_n)=\lambda T(c_1v_1+\cdots+c_nv_n)=\lambda Tv,

另外对于$u=a_1v_1+\cdots+a_nv_n$,有

T(u+v)=(a_1+c_1)Tv_1+\cdots+(a_n+c_n)Tv_n=Tu+Tv.

这里写得很简略,展开以后可以立即得出,就不详叙了。接下来要证明这样的线性映射是唯一的,即任何$S\in \mathcal L(V,W)$,如果它满足$Sv_j=w_j$,则$\forall v=c_1v_1+\cdots+c_nv_n$,有

Sv=c_1Sv_1+\cdots+c_nSv_n=c_1w_1+\cdots+c_nw_n=Tv,

故$S=T$。

刚才我们所构建的$\mathcal L(V,W)只是一个集合,一个集合如果不具有运算,那么集合内部就没有结构,只是一个元素的集合体。现在,我们可以给\mathcal L(V,W)$内定义运算,从而使它具有更多的性质。

\mathcal L(V,W)上的加法和标量乘法:

  1. 定义$S+T$为$V$到$W$的线性映射,满足对一切$v$都有

    (S+T)v=Sv+Tv.
  2. 定义$\lambda T$是$V$到$W$的线性映射,满足对一切$v$都有

    (\lambda T)v=\lambda (Tv).

这里需要思考,这样定义出来的$S+T$与$\lambda T$是否是线性映射(实际上肯定是,但是需要验证)。同时,要将$\mathcal L(V,W)$上的加法、标量乘法与线性映射的加性、齐性区分开,这两个是完全不同的东西。

加上了定义之后,我们可以验证$\mathcal L(V,W)$是一个线性空间。回顾线性空间的定义条件,加法、乘法、交换性、结合性、分配性质都是容易验证的,乘法单位元也是显然的,而加法单位元应该是$0$映射:\forall v,0v=0。要注意,这里第一个$0$既不是$0$向量,也不是标量$0$,而是一个线性映射:0\in\mathcal L(V,W),它将$v$上的所有向量映射到$W$空间的加法单位元$0$。

线性映射的乘积(product of linear maps) 若$L\in\mathcal L(U,V)$,S\in\mathcal L(V,W),则定义线性映射的乘积$ST$为:

\forall u\in U,\quad ST(u)=S(Tu)\in W.

注意到,如果我们把每一个线性映射看成线性空间里的一个向量,一般的向量乘积是没有定义的,但线性映射却可以定义乘积,这是它与一般向量的不同之处。实际上,线性映射也属于特殊的一种函数,所以线性映射的乘积等价于函数的复合。

$ST$是线性映射:线性映射的乘积仍然是一个线性映射。

\forall u_1,u_2\in U,\lambda \in\mathbb{F},

ST(u_1+u_2)=S[T(u_1+u_2)]=S(Tu_1+Tu_2)=STu_1+STu_2,\\ ST(\lambda u)=S[T(\lambda u)]=S[\lambda (Tu)]=\lambda S(Tu)=\lambda STu.

故$ST$作为映射满足加性和齐性,是线性映射。

我们把线性映射看成一个向量,但是相乘的两个向量并不属于同一个向量空间,乘出的结果也并不属于原来两个向量空间之一(广义来说,即不考虑$\mathcal L(V,V)$的特例),所以它与线性空间中定义的加法又不属于同一种运算类型。

线性映射乘积的代数性质 以下性质有助于对线性映射进行复合。

  1. 结合性(associativity):如果以下乘积都是有意义的,则

    (T_1T_2)T_3=T_1(T_2T_3).

    这里$T_1,T_2$和$T_3$都是线性映射。

  2. 单位元(identity):存在恒等映射$I_V,I_W$,使得$\forall T\in\mathcal L(V,W)$,

    I_WT=TI_V=T.

    在学习的初级阶段,写出映射乘积的存在条件还是很有必要的。

  3. 分配性质(distributive properties):对$T,T_1,T_2\in\mathcal L(U,V)$,S,S_1,S_2\in\mathcal L(V,W),成立

    (S_1+S_2)T=S_1T+S_2T,\\ S(T_1+T_2)=ST_1+ST_2.

一般要注意,线性映射的乘法不可交换,即对于一般函数也有$f[g(x)]\ne g[f(x)]$一样。对于那些特别可交换的线性映射对,称它们为可交换的。

结合性:\forall v,这里$v$落在$L_3$的定义域内,则

(T_1T_2)T_3v=(T_1T_2T_3)v=T_1(T_2T_3)v,

故结合性成立。这里的每个等号都是基于线性映射乘法的定义的,不妨回顾一下。

单位元:\forall v\in V,

I_WTv=I_W(Tv)=Tv,\\ TI_V v=T(I_Vv)=Tv,

故$I_WT=TI_V=T$。

分配性质:\forall v\in V,

(S_1+S_2)Tv=(S_1+S_2)(Tv)=S_1Tv+S_2Tv=(S_1T+S_2T)v,\\ S(T_1+T_2)v=S(T_1v+T_2v)=ST_1v+ST_2v=(ST_1+ST_2)v.

对于第一行,第一个等号是线性映射乘法定义,第二个等号是线性映射加法定义,第三个等号是映射的线性性。对于第二行,第一个等号是线性映射加法定义,第二个等号是映射的线性性,第三个等号也是线性映射加法定义。

最后书上给出一个实用的定理,这个定理常常可以直接证明映射不是线性的。

线性映射对加法单位元 若$T\in\mathcal L(V,W)$,则$T(0)=0$。

T(0)=T(0+0)=T(0)+T(0),

故$T(0)=0$。

Part 2:零空间与值域

可以说,本节中提到的零空间、值域、单射满射都是彼此相连的一个整体,它们之间具有许多联系,共同构成线性映射的结构基础。

零空间(null space) 对于$T\in\mathcal L(V,W)$,$T$的零空间指的是$V$中那些被$T$映射为$0$的向量构成的集合:

\mathrm{null}{T}=\{v\in V:Tv=0\}.

零空间也被称为核空间(kernel)。

零空间之所以能被称为空间,是因为零空间也是一个向量空间,满足加法与标量的封闭性。显然,如果零空间不是线性空间,也没有研究它的价值。

零空间是子空间 设$T\in\mathcal L(V,W),则\mathrmT$是$V$的子空间。

设$u,v\in\mathrmT$,则

T(u+v)=Tu+Tv=0,\quad u+v\in\mathrm{null}T.

对于$\lambda \in\mathbb$,有

T(\lambda v)=\lambda Tv=0,\quad \lambda v\in\mathrm{null}T.

最后,由于$T(0)=0$,所以$0\in\mathrmT$。向量空间的三大条件得以验证。

单射(injective) 如果$Tu=Tv\Leftrightarrow u=v$,则称$T\in\mathcal L(V,W)$是单射。

单射的概念很重要,联想能够一一确定自变量和因变量的函数——可逆函数,它与单射就很类似。

单射的等价条件 设$T\in\mathcal L(V,W)$,则$T$是单射等价于$\mathrmT={0}$。

这是一个十分重要的定理。

已有${0}\subset\mathrmT$。当$T$是单射时,\forall v\in \mathrm{null}T,有

Tv=0=T0,

结合单射性就得到$v=0$,即$\mathrmT= {0}$。

反之,若$\mathrmT=0$,则$\forall u,v\in V$,如果$Tu=Tv$,则

Tu-Tv=T(u-v)=0,

故$u-v=0$,得到$u=v$,从而证明$T$是单射。

值域(range) 对于$T\in\mathcal L(V,W)$,称$V$的值域为所有形如$Tv(v\in V)$的向量构成的集合,即

\mathrm{range}T=\{Tv:v\in V\}.

自然地,值域也应该是一个子空间,但注意对象不同。显然每一个$Tv\in W$,所以值域是$W$的子空间而不是$V$的,这点与零空间不同。

值域是子空间 设$T\in\mathcal L(V,W),则\mathrmT$是$W$的子空间。

这个证明虽然简单,但又和零空间的有一些不同。

若$w_1,w_2\in\mathrmT$,则$\exists v_1,v_2\in V$,Tv_1=w_1,Tv_2=w_2,则

w_1+w_2=Tv_1+Tv_2=T(v_1+v_2),

由于$v_1+v_2\in V$,所以$w_1+w_2\in \mathrmT$。同理

\lambda w_1=\lambda Tv_1=T(\lambda v_1)\in\mathrm{range}T,

又因为$T(0)=0$,所以$0\in\mathrmT$。向量空间的三个条件得以验证。

满射(surjective) 设$T\in\mathcal L(V,W),如果\mathrmT=W$,则称$T$是满射。

单射可以类比一一映射,满射则相当于将映射的值域扩充满了,二者一结合,就能得到全空间上的一一映射。

需要注意的是,如果$W'$是$W$的非平凡子空间,$T\in\mathcal L(V,W')$是满的很可能不意味着$T\in\mathcal L(V,W)$上也是满的,即使对$T$作解析延拓也不一定,这是因为$\mathrmT$受到$V$的维数限制,我们可以很容易地证明这一点。

事实上,我们前面得出了单射与零空间的关系,这里得出了满射与像空间(值域)的关系,这两组关系在形式上对偶,不妨将$Tu=Tv\Leftrightarrow u=v$看作单射的衍生性质,而从零空间的角度定义它,这样显得更统一,不过这让“单射”的名字没有那么写实了。

线性映射基本定理 设$V$是有限维的,T\in\mathcal L(V,W),则$\mathrmT$是有限维的,且

\dim V=\dim\mathrm{null}T+\dim\mathrm{range}T.

这个定理揭示了线性映射结构的本质关系——它只会造成信息的丢失,而不会造成信息的增加,因为$T(0)=0$,而零空间的维数就是信息丢失多少的量度。

设$u_1,\cdots,u_m$是$\mathrmT$的基,则$\dim \mathrmT=m$。这组基可以扩充成$V$的基:

u_1,\cdots,u_m,v_1,\cdots,v_n,\quad \dim{V}=m+n.

如果等式成立,则$\dim\mathrmT=n$,自然会猜想$Tv_1,\cdots,Tv_n$是$\mathrmT$的基,这包括张成性与线性无关性两方面。

先证张成性,\forall v\in V,有

v=a_1u_1+\cdots+a_m u_m+b_1v_1+\cdots+b_nv_n,

Tv=T\left(\sum_{j=1}^m a_ju_j+\sum_{j=1}^n b_jv_j \right)=\sum_{j=1}^nb_j Tv_j,

因此$Tv_1,\cdots,Tv_n$张成$\mathrmT$。

再证线性无关,令

a_1Tv_1+\cdots +a_nTv_n=0,

T\left(\sum_{j=1}^n a_jv_j\right)=0,\quad \sum_{j=1}^n a_j v_j\in\mathrm{null}T,

所以

\sum_{j=1}^n a_jv_j=\sum_{j=1}^m b_ju_m,

移项后得到$a_1=\cdots=a_n=b_1=\cdots=b_m=0$,线性无关性得证。

对比线性映射基本定理与和空间维数公式的证明过程,读者应该能捕捉到二者之间的共同点。

由线性映射基本定理,直接得到两个推论:

  1. 到更小维数向量空间的线性映射不是单射。
  2. 到更大维数向量空间的线性映射不是满射。

由此结论建立线性方程组求解的关系,是一个直接的推论。事实上,线性方程组的本质就是我们在例题1中提到的$T\in\mathcal L(\mathbb^n,\mathbb^m)$,$n$是变量个数,$m$是约束条件个数,在这里就不展开了。

例题

3.A部分的例题比较简单,毕竟还是围绕着有限维向量空间的线性映射,只要别忘了有限维向量空间的基就好。3.B部分的例题则主要围绕着线性映射基本定理,还有一些维数的基本关系,只要会利用$V$和$W$的基构造满足条件的线性映射(构造的存在性由“线性映射与基”结论保证),问题基本可以迎刃而解。

第一题(3.A 3) 设$T\in\mathcal L(\mathbb^n,\mathbb^m)$,证明存在标量$A_{j,k}\in\mathbb$,其中$j=1,\cdots,m$,k=1,\cdots,n,使得对任意$(x_1,\cdots,x_n)\in\mathbb^n$都有

T(x_1,\cdots,x_n)=(A_{1,1}x_1+\cdots+A_{1,n}x_n,\cdots,A_{m,1}x_1+\cdots+A_{m,n}x_n).

这题看起来无从入手,但是线性代数嘛,既然是有限维向量空间,那就有穷举的机会,莽就完事了。

取$V$的一组自然基$e_1,\cdots,e_n$,它在$T$下必然拥有一个像,故设

T(e_i)=(A_{1,i},A_{2,i},\cdots,A_{m,i}),

由于$V$中的每一个向量都可以被这组基线性表示,不妨设

v=x_1e_1+\cdots+x_ne_n,

则由$T$的线性性,

\begin{aligned} T(v)&=T(x_1e_1+\cdots+x_ne_n)\\ &=T(x_1,\cdots,x_n)\\ &=x_1T(e_1)+\cdots+x_nT(e_n)\\ &=(A_{1,1}x_1+\cdots+A_{1,n}x_n,\cdots,A_{m,1}x_1+\cdots+A_{m,n}x_n). \end{aligned}

由$v$的任意性,结论得证。

第二题(3.A 14) 设$V$是有限维的且$\dim\ge2$,证明存在$S,T\in\mathcal L(V,V)$,使得$ST\ne TS$。

这题的关键信息在于$\dim\ge 2$,因而可以找到两个线性无关向量,围绕他们进行一波构造就可以推出找到这样的$S,T$。

设$v_1,v_2$是$V$中两个线性无关的向量,因为$\dim V\ge 2$,所以这样的两个向量是可以找到的。

Tv_1=v_2,\quad Sv_1=v_1+v_2,\\ Tv_2=0,\quad Sv_2=v_1.

STv_1=Sv_2=v_1,\\ TSv_1=T(v_1+v_2)=v_2,

由$v_1,v_2$的线性无关性,得到$STv_1\ne TSv_1$,即$ST\ne TS$。

第三题(3.B 22) 设$U,V$都是有限维向量空间,并设$S\in \mathcal L(V,W)$,T\in\mathcal L(U,V),证明:

\dim\mathrm{null}(ST)\le \dim\mathrm{null}S+\dim\mathrm{null}T.

万变不离其宗,基扩充在证明维数不等式上依然是永远的神。

首先要注意到$\mathrmT\subset\mathrm(ST)$。设$u_1,\cdots,u_m$是$\mathrmT$的基,如果$\mathrmT=\mathrm(ST),则不等式已经成立。假设二者不等,则可以扩充为\mathrm(ST)$的基:

u_1,\cdots,u_m,u_{m+1},\cdots,u_{n}.

满足

Tu_{m+1}\ne 0,\cdots,Tu_n\ne 0.

现证明$Tu_{m+1},\cdots,Tu_n$是线性无关的,即

a_{m+1}Tu_{m+1}+\cdots+a_nTu_n=T\left(\sum_{j={m+1}}^{n} a_ju_{j} \right),

所以$\sum_^a_ju_j\in\mathrmT$,即

\sum_{j=m+1}^n a_ju_j=\sum_{k=1}^m b_ku_k,

移项得到$a_{m+1}=\cdots=a_n=0$(由于$u_1,\cdots,u_n$是$\mathrm(ST)的基),所以线性无关性得证。又因为\mathrmS$中线性无关组的长度中小于张成组的长度,所以

\dim S\ge n-m,\\ \dim\mathrm{null}(ST)=n=n-m+m\le \dim\mathrm{null}S+\dim\mathrm{null}T.

第四题(3.B 26、27)

1、设$D\in\mathcal L(\mathcal P(\mathbb),\mathcal P(\mathbb))$使得对每个非常数多项式$p\in\mathcal P(\mathbb)均有\mathrm(Dp)=(\mathrmp)-1$,这里$\mathrm$指的是多项式的次数,证明$D$是满射。

2、设$p\in\mathcal P(\mathbb)$,证明存在多项式$q\in\mathcal P(\mathbb)$使得

5q''+3q'=p.

这题本质上和线性方程组是一样的,但由于笔记中对线性方程组的介绍很少,因此将这个例题摘录于此。第二问中的微分算子其实就是第一问中$D$的一种显式,可以看作1中结论的直接应用。另外,看到多项式时,应当考虑多项式空间的自然基,本题的主要问题是无限维向量空间的处理。

1、由题意,\forall n,

\mathrm{deg}Dx^{n+1}=n,

显然由于$Dx,Dx^2,\cdots$的次数不同,它们是线性无关的,对任何一个给定的$j$,

\mathrm{span}(Dx,Dx^2,\cdots,Dx^{j+1})=\mathrm{span}(1,x,\cdots,x^j),

因此令$j\to \infty$,有

\mathrm{span}(Dx,Dx^2,Dx^3,\cdots)=\mathrm{span}(1,x,x^2,\cdots)=\mathcal P(\mathbb{R}),\\ \mathcal P(\mathbb{R})\subset \mathrm{range}D.

又因为对任何多项式$p$,$Dp$仍是一个多项式,所以

\mathrm{range}D\subset \mathcal P(\mathbb{R}),

即$\mathrmD=\mathcal P(\mathbb)$,也就是$D$是满射。

2、定义降次算子为$Dp=3p'+5p''$,则由1,$D$是满的,所以$\forall q\in\mathcal P(\mathbb)$,必定存在一个$p$,使得

Dp=5p''+3p'=q.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: