您的位置:首页 > 其它

漫步线性代数十三——线性变换

2016-08-31 22:12 281 查看
我们已经知道了矩阵A的四个基本空间,它的零空间使得向量变成零向量,因为Ax是列的组合,所以所有向量都位于列空间里。之后我们还会看到一些每秒的东西——A将它的行空间变成列空间,在这些维度为r的空间上矩阵是可逆的,这是矩阵A的实际操作,还有一部分被零空间和左零空间隐藏了。

假设x是一个n为向量,当A乘以x的时候,它将向量变成了一个新的向量Ax,对于Rn空间里的所有点x都会发生这种变化,整个空间被矩阵A变换了,图1给出了矩阵的四种变换:



图1:四种矩阵的变换

1、A=[c00c],它是单位矩阵乘以常数得到的,A=cI,将每个向量拉伸c倍,整个空间被拉长或收缩。

2、A=[01−10],旋转矩阵,它将空间绕原点进行旋转,图中的例子是旋转了90度,每个点从(x,y)变成(−y,x)。

3、A=[011c],反射矩阵,它将每个向量做关于某个镜面的反射,图中的镜面是直线y=x,像(2,2)这类点不会发生变化,像(2,−2)这类点翻转成(−2,2)。像v=(2,2)+(2,−2)=(4,0)这类点一部分变化一部分不变,Av=(2,2)+(−2,2)=(0,4)。

反射矩阵也是置换矩阵!在代数上它非常简单,就是将(x,y)变成(y,x),而在几何图像上被掩盖了。

4、A=[1000],投影矩阵,它将整个空间投影到低维子空间上(不可逆),图中是将平面的每个向量(x,y)变为水平轴上最近的点(x,0)。这个轴是A 的列空间,投影为(0,0)的y轴是零空间。

这些例子也可以放到三维空间里,此时矩阵将是在空间中进行缩放,沿着平面旋转或反射,将一切事物投影到二维平面上。另外知道矩阵不能做什么也是很重要,某些变化T(x)利用Ax就做不到:

不可能移动原点,因为对于每个矩阵A0=0。

如果向量x变成x′,那么2x肯定是2x′。一般来说cx肯定变成cx′,因为A(cx)=c(AX)。

如果向量x,y分别变成x′,y′,那么他们的和x+y肯定变成x′+y′,因为A(x+y)=Ax+Ay。

矩阵乘法进行变换的时候施加这些规则,第二个规则包含第一个(c=0得到A0=0),对于第三个规则,考虑(4,0)关于45 度直线的反射,它可以分成(2,2)+(2,−2),而且这两部分互为反射。同样的考虑投影:先分成两部分,然后分别投影并将投影相加。这些规则应用在任何矩阵的变换上。

他们的重要性还体现在名字的:符合三条规则的变换叫做线性变换。这些规则可以总结为一个:

20、对于任意的数c,d和向量x,y,矩阵乘法满足线性规则:A(cx+dy)=c(Ax)+d(Ay)(1)满足这个要求的任何变换T(x) 是一个线性变换。

任何矩阵都产生一个线性变换,那么反过来说:每一个线性变化都对应一个矩阵吗?本篇文章就是找出这个答案:是的。这是步入线性代数的基础,从性质(1) 开始引申出许多其他结论。现在我们直接从矩阵开始,看看他们如何表示线性变换。

一个变换没必要必须从Rn变到相同的空间Rn,允许将Rn中的向量变成不同空间Rm中的向量,那就是m×n矩阵所做的事!原始向量x有n 个元素,变换向量Ax 有m个元素,线性变换的规则同样满足长方形矩阵,所以他们也生成线性变换。

更进一步,线性条件(1)的操作有加法和标量乘法,但是x,y 没有必要是Rn 的列向量,这些不是唯一的空间,根据定义,任何向量空间都存在组合cx+dy,他们可以是多项式,也可以是矩阵,也可以是函数x(t),y(t),只要变换满足(1),那它就是线性的。

我们举一个空间Pn上的例子,这些向量是次数为n的多项式p(t),他们看起来像p=a0+a1t+⋯+antn,并且向量空间的维数是n+1(因为有常数项)。

例1:微分运算A=d/dt是线性的:

Ap(t)=ddt(a0+a1t+⋯+antn)=a1+⋯+nantn−1(2)

A的零空间是一维的常数空间:da0/dt=0,列空间是n 为空间Pn−1;方程(2)的右边一直在空间里。零度(=1)和秩(=n)的和是原始空间Pn的维数。

例2:从0到t的积分运算也是线性的:

Ap(t)=∫t0(a0+a1t+⋯+antn)dt=a0t+⋯+ann+1tn+1(3)

这次没有零空间(除了零向量外)但是积分没有得到Pn+1 中的所有多项式,方程(3)的右边没有常数项,可以常数多项式在左零空间里。

例3:一个确定多项式像2+3t乘以多项式是线性的:

Ap(t)=(2+3t)(a0+a1t+⋯+antn)=2a0+⋯+3antn+1

将Pn变换到Pn+1,除了p=0外没有零空间。

在这些例子中,线性都不太难验证,有些看起来还挺有趣。是金子总会发光,这种性质有点像自生的属性,不会因为外界条件而改变。无关怎样,变换有非常重要的性质。但是许多变化都不是线性的,例如平方多项式(Ap=p2),或加一(Ap=p+1),或保持正系数(A(t−t2)=t)。只有线性变换才能得出矩阵。

矩阵表示变换

线性有个至关重要的结论:如果我们知道基中每个向量的Ax,那么我们就知道整个空间中每个向量的Ax。假设基包含n个向量x1,…,xn,所以其他向量x都是基向量的组合,那么线性就确定了Ax:

如果x=c1x1+⋯+cnxn,那么Ax=c1(Ax1)+⋯+cn(Axn)(4)

变换确定了基向量后,根据线性就已经确定了其他向量。对于两个向量x,y,根据(1)将得到(4)中的条件,对于基来说,这些向量的变换是比较自由的,但是当他们确定以后,每个向量的变换就确定了!

例4:什么样的线性变化将x1,x2 变成Ax1,Ax2?

x1=[10]变成Ax1=⎡⎣⎢234⎤⎦⎥;x2=[01]变成Ax2=⎡⎣⎢468⎤⎦⎥

满足条件的矩阵为:

A=⎡⎣⎢234468⎤⎦⎥

我们从另一个基(1,1),(2,−1)开始,A是唯一的线性变换:

A[11]=⎡⎣⎢6912⎤⎦⎥A[2−1]=⎡⎣⎢000⎤⎦⎥

加些来我们找出表示微分和积分的矩阵。首先我们必须确定一个基,对于3次多项式,很自然的选择四个基向量:

p1=1,p2=t,p3=t2,p4=t3

基不是唯一的,但是某些选择确实必须的而且也是最方便的。这四个基向量的导数是0,1,2t,3t2:

d/dtAp1=0,Ap2=p1,Ap3=2p2,Ap4=3p3(5)

d/dt是一种运算,就像矩阵一样,但是是什么样的矩阵呢?考虑通常的四维空间,坐标向量为p1=(1,0,0,0),p2=(0,1,0,0),p3=(0,0,1,0),p4=(0,0,0,1),由(5)确定的矩阵是:

Adiff=⎡⎣⎢⎢⎢0000100002000030⎤⎦⎥⎥⎥

Ap1是第一列,也就是零,Ap2是第二列,也就是p1,Ap3是2p2,Ap4是3p3,零空间包含p1,列空间包含p1,p2,p3(立方的导数是平方)。根据线性,像p=2+t−t2−t3的导数可以确定出来:

dpdt=Ap→⎡⎣⎢⎢⎢0000100002000030⎤⎦⎥⎥⎥⎡⎣⎢⎢⎢21−1−1⎤⎦⎥⎥⎥=⎡⎣⎢⎢⎢1−2−30⎤⎦⎥⎥⎥→1−2t−3t2

总而言之,矩阵携带了所有的信息,如果基和矩阵都是已知的,那么每个矩阵的变换就是已知的。

信息编码很容易,将一个空间变换到它本身,一个基就足够了,从一个空间到另一个空间的变换需要其他的基。

21、假设向量x1,…,xn是空间V的一个基,向量y1,…,ym是W的一个基,从V到W的线性变换T用A来表示,将T应用到第j 个基向量xj得到第j列,将T(xj)写成y组合的形式为:

T(xj)=Axj=a1jy1+a2jy2+⋯+amjym(6)

对于微分矩阵,列1来自于第一个基向量p1=1,它的导数为0,所以列1为0,最后一列来自(d/dt)t3=3t2。因为3t2=0p1+0p2+3p3+0p4,所以最后一列包含0,0,3,0,法则(6)一次得到矩阵的一列。

对于积分同样如此,它是从三次方到四次方,也就是V=P3 到W=P4,所以我们需要W的一组基,很自然的选择是y1=1,y2=t,y3=t2,y4=t3,y5=t4,也就是四次多项式。应用积分到V 中每个基向量得:

∫t01dt=torAx1=y2,…,∫t0t3dt=14t4orAx4=14y5

Aint=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢01000001200000130000014⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

积分和微分时逆运算,或者说从微分得到的积分可以还原到原来的函数,为了用矩阵表示,我们需要将微分矩阵变为4×5:

Adiff=⎡⎣⎢⎢⎢00001000020000300004⎤⎦⎥⎥⎥AdiffAint=⎡⎣⎢⎢⎢1111⎤⎦⎥⎥⎥

微分是积分的左逆,长方形矩阵不可能两边同时有逆!所以反过来AintAdiff=I是不成立的,5×5的话在第一行得到零,常数的导数为零,而AintAdiff的其他行和单位矩阵一样,因为tn微分后在积分还是tn。

旋转矩阵Q,投影矩阵P,反射矩阵H

本部分我们介绍90度的旋转矩阵,向x轴的投影矩阵和45度线的反射矩阵,他们的矩阵都很简单:

Q=[01−10]P=[1000]H=[0110]

在x−y平面上的基本线性变换都是比较简单的,但是旋转其他角度,投影到任何一条线上,沿任何线做反射也是很容是可视化的,他们依然是线性变换,原点都是固定的:A0=0,肯定能用矩阵来表示。使用自然基(1,0)T,(0,1)T就可以找到这些矩阵。

1、旋转矩阵,图2所示旋转角度为θ,同时也显示了对两个基向量的效果。第一个变成(cosθ,sinθ),长度为1保持不变;第二个基向量变成(−sinθ,cosθ),根据规则(6),这些数放到矩阵的列中(我们用c,s分别表示cosθsinθ):

Qθ的逆等于Qθ吗?是的。

QθQ−θ=[cs−sc][c−ssc]=[1001]

Qθ的平方等于Q2θ吗?是的。

Q2θ=[cs−sc][cs−sc]=[c2−s22cs−2csc2−s2]=[cos2θsin2θ−sin2θcos2θ]

Qθ和Qφ的乘积等于Qθ+φ吗?是的。

QθQφ=[cosθcosφ−sinθsinφsinθcosφ+cosθsinφ……]=[cos(θ+φ)sin(θ+φ)……]

最后一种情况包含前两种情况,当φ=−θ时就是第一种情况,当φ=+θ时就是第二种情况。这三个方程由三角恒等式确定,毫无例外所有答案都是肯定的,矩阵乘法定义的非常精确,这样的话他们的乘积就对应着变换的乘积。

22、假设A,B分别是从V到W和从U到V的线性变换,他们的乘积AB从U的一个向量u开始,变成V中的Bu,最后是W中的ABu。组合AB依然是线性变换(从U到W),它的矩阵是矩阵A,B的乘积。

对于AdiffAint,这个组合变换得到单位矩阵(AintAdiff将常数消灭掉了)。对于两个旋转操作,乘法的顺序无所谓,那么U=V=W是x−y平面,QθQφ和QφQθ是一样的。对于一个旋转和一个反射操作,顺序不同结果就不同。

注意:为了构建矩阵,我们需要V,W的基,然后U,V的基。为了跟V保持一样的基,矩阵乘法直接从U的基变成W的基,如果我们知道了变换A的矩阵(我们叫做[A]),那么规则22就变得非常简洁:[AB]=[A][B],前面讲过的乘法规则完全由这个要求确定——它肯定对应着线性变换的乘积。



图2:旋转矩阵(左),反射矩阵(右)

2、投影矩阵,图2也给出了(1,0)到θ直线的投影,投影长度是c=cosθ,注意投影点不是(c,s);向量长度为1,所以我们必须乘以c。同样,(0.1)的投影长度为s,投影点是s(c,s)=(cs,s2),它是投影矩阵P的第二列:

p=[c2cscss2]

这个矩阵没有逆,因为这个变换不是可逆的。垂线上的点映射到原点上;这条线是P的零空间。θ线上的点映射到自身!对他们进行两次映射效果和一次是一样的,也就是P2=P:

P2=[c2cscss2]2=[c2(c2+s2)cs(c2+s2)cs(c2+s2)s2(c2+s2)]=P

其中c2+s2=cos2θ+sin2θ=1。投影矩阵等于它自身的平方。

3、反射矩阵,图3给出了(1,0)关于θ线的反射,反射的长度等于原始长度,就像旋转操作那样——但是这里θ线保持不变。垂线的方向反转了,

H=[2c2−12cs2cs2s2−1]

矩阵H有一个特别的性质:H2=I,两次反射回到原始情况。一次反射是自身的反转:H=H−1,从几何上看非常明显。反射和映射的关系式:H=2P−I,这意味着Hx+x=2Px——反射的加上原始的等于投影的两倍,另外这还证实了H2=I

H2=(2P−I)2=4P2−4P+I=I,因为P2=P



图3:反射:几何和矩阵

我们需要强调一下,矩阵依赖于所选择的基。假设第一个基在θ线上,第二个基向量跟它垂直:

对于投影,这个矩阵按如下方式构建:第一列就是第一个基向量(投影到自身),第二列就是投影为零的基向量。

对于反射,第二个基向量通过反射变成第一个向量的反方向,那个反射轴就是第二列。当矩阵H,P的基一样时,矩阵H依然满足2P−I。

对于旋转,矩阵不发生变换,跟之前一样。

选择一个最好的基明显是整个问题的核心,之后我们会形式介绍这个。

当线性变换不变时,基的改变会影响到矩阵,就像矩阵A变为S−1AS,由此可见,一个变换是由不同的矩阵表示出来,之后要将的特征值理论会导出公式S−1AS和最好的基。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息