-
真正讲透线性代数在二、三维空间的应用
——工科线性代数现代化和大众化的思路之三
西安电子科技大学电子工程系
陈怀琛
email
:
hchchen1934@
摘要:<
/p>
通过用线性代数对二三维向量空间进行分析和图解,
使学生大大提
高立体概念及其与线性变换、
矩阵乘法及矩阵分解的关系。使得学习向量空间的概念更易
接受并具有更强的实用性。
我在论文
《论
工科线性代数现代化和大众化
》
中
曾经提出,
对大学一年级的学生,
能够
建立三维立体概念,
已经是不低的要求了。
其实教学计划中设立
了好几门课程帮助达到这个
目的,
如制图与画法几何,高等数学
中的多变量微积分等,还有物理中的空间电磁场,
数学
中的场论
,
电机课中的旋转磁场形成、
乃至于信号处理中的复信号等等。
线性代数也应该是
一个组成部分。
我觉
得至少对于弱电类的专业,
实现的情况并不太好,
学生的空间概
念还是
很弱的,证据之一是许多学生,
甚至部分毕业多年的教师
,在后续课中,对频谱分析中的负
频率,对信号处理中的复信号,都觉得难以理解。对机
类专业而言,多自由度机器人,三坐
标测量仪,
各种航行器在空
间的运动,
对线性代数在三维空间应用的要求更高。
现有的线性
代数在此方面相当薄弱,
很明显的一点,
就教材中使用的三维图形数目来比,
中国教材往往
只有美国教
材的
10
%以下,所以强化三维空间的概念是非常必要的。
p>
一、
用二、三维向量来说明向量空间的运算规则
< br>二维空间
(平面)
上的向量及其运算规则,
特别是两个线性无关向量的线性组合是学生
理解线性代数的感性基础。
MIT
的教材从下图讲向量的加减运算规则,进而列出其线性组
图
1
向量的相加与相减
合
b
?
c
v
?
d
w
?
?
4
c
?
d<
/p>
?
?
?
?
2
c
?
2
d
?
?
?
。
再进一步的问题是平面上的任何向量
b
是否都能由这个线性组合
实现,甚至设计了给定
b<
/p>
猜测
c,d
的比赛,看谁能估计出最接近
的
c,d
值。从这里又引入了
线性相关
的概念,超定方程的概念(若
b
不在
x
y
平面上)等。
从二维向量引深至三
维向量和三维空间,
并讨论向量的长度
(范数)
、
向量的数量积
(美
国的书上
还喜欢用点乘
(dot
product)
这个名词,
MATLAB
中也有点乘算符)
、向量积和混合
积等。这时就有了更多的空间概念和图形。比如图
2
那样的图形。
而后在讲
行列式的时候,又可以拿出图
3
的平行六面体说明三阶行列式的
几何意义。
图
2
三维空间的向量相加(左)和向量混合积(右)
人们都说线性代数是在几何与代数
之间建立的一座桥梁。所以把空间解析
p>
几何放到线性代数中合并实施已经成为
许多学校的教学改革措施。几
何是要用
图形说明概念的,线性代数既然作为桥
梁,必然要把图
形,特别是三维立体图
形放在特别重要的地位,把图形与代数
的
表述与推导紧密结合,才能使学生理
解线性代数的方法论。线性代数的大众
化必须把这一点放在重要地位。而要做
到这一条,
必须使对二三维向量空间的
图
3
三阶行列式等价于此平行六面体的体积
讨论在教材中占主要篇幅。如果突出
N
维向量空间,那就必然
扩大了公式推导的篇幅,图形就没有地位了!
二、
用向量空间概念求超定方程组的解
用
向量空间的方法往往可以更为简捷地推导公式,超定方程组的解可以作为一个例子。
通常
采用的是误差平方和最小的准则,
其解也称为最小二乘解。
国外
所有作为公共课的线性
代数教材,
都要讲这个内容,国内教材则
几乎避开它。其实线性方程组只有适定、
超定和欠
定三类,工程
中要解决的只有前两类(因为欠
定方程属于条件不全的命题,
工
程师可以拒绝
12
解)
,不教学生解超
定方程,等于浪费了线性
10
代数一半的功能。
要严格地推导出最小二乘解
b=3w+2v
8
的公式,利用空间几何概念是最方便而清楚
6
3
v
的。
4
在
图
1
例中如果设
b
=[5;10]
,
求
c,d
,
则可
2
以得出以下
的联立方程:
4
c
?
< br>d
?
5
,解得
< br>2
c
?
2
d
?
10
0
-2
v
0
w
5
2w
10
c
=2
,
d=3
。这是适定方程的情况其
图形如右。
如
果
给
出
的
是
三
维
空
间
的<
/p>
b
向
量
b
=[5;10;1]
,
那
么
,
由
于
?
4
?
?<
/p>
?
1
?
?
,
v
?
?
2
?
,
w
?
?
2
?
?
?
?
联立方程将成
?
?
?
0
< br>?
?
?
0
?
?
b
4
c
?
d
?
5
p>
为:
2
c
?
2
d
?
10
。由于
w,v
都在
bb
e
0
c
?
p>
0
d
?
1
10
xy
平面上,
它们
的线性组合绝不能
8
-2
跑到
z=0
以外的空间位置去,故而
6
0
2
4
第三个方程是矛盾方
程。
v
4
2
6
最小二乘解不要求方程左端
w
8
0
的合成向量
bb
准确地等于
b
,
而是
要求它与
b
的误差
e
在平面上所有
图
3
简单情况下最小二乘解的几何意义
可能的
bb
中达到最小,在图上可
p>
以看出,最小的误差即
b
的矢端离
xy
平面的垂直距离,也就是应该从
b
的矢端向
xy
作的
垂线
的长度。
如果
v
和
w
不在
xy
平面上,
那么最小二乘误差
e
的特
征就应该是与
v
和
w
< br>组成的平面
1
0.5
0
垂直,也就是与
v
和
w
都满足正交条件。
v
?
e
=
0,
< br>w
?
e
=
0
,合成一个向量式:
T
T
?
w
T
?
。因为
e=b-bb
,其中
b
是给定的方程组右端列向量,
bb
则
是基本向
A
?
e
=
?
T
?
?
e
=
0
,
p>
?
v
?
T
量的线性组合
bb=
c
w+
d
v
,其中
c,d
是待求的常数向量
x
的分量,
通常我们用向量
x
上加一
个帽
x
来表示,
w,v
又组
成系数矩阵
A
,于是
bb
=
Ax
,
e
=
b
-
Ax
< br>,代入两个正交条件,经
过如下推导
< br>A
T
)
)
)
)
?
b
-
Ax
?
=
0,
?
1
)
)
p>
?
A
T
Ax
?
A
T
b
?
x
?
?
A
T
A
?
A
T
b
,就得到了二三
阶条件下最小二乘解的公式。
设
A
为
m
n
矩阵,方程数
m
大于变量数
n
p>
,称
Ax=b
为超定方程,即不可能找到一
个
x
,满足
A
x
b
0
。如果我们不寻求理想的数学解
,而是从工程意义上找到尽量接近
理想的解,那就应该容许引入误差向量
e
。
e
=
Ax
-
b
令
其矩阵形式如下
?
< br>e
1
?
?
e
?
?
a
1
1
K
2
?
<
/p>
e
?
?
?
?
?
M
O
?
M
?
?
?
?
?
a
m
1
L
?
e
m
?
?<
/p>
x
1
?
?
b
1
?
a
1
n
?
?
?
?
?
b
2
?
x
2
M
?
?
?
?<
/p>
?
?
?
?
Ax
-
b
?
M
p>
?
?
M
?
a
mn
?
?
?
?
?
?
?
x
n
?
?
b
m
?
能把误差向量
e
的范数最小的
x
就定义为这个超定方程的最小二乘解,
也称为
x
的估计
?
表示。
值,通常用
x
?
p>
=
(A
T
A)
p>
-1
A
T
b
x
由于在推导过程中并未有任何一步
对维数有过限制,
这个公式在高维的线性代数方程中
同样适用。
在
MATLAB
中,把运算
(A
T
A)
1
A
T
单独编成一个子程
序,称为
pinv
函数,它是
Psue
doinverse
(伪逆或广义逆)
的缩称。
这样,
求最小二乘解的公式可以写成:
x
pinv(
A
)*
b
,
MATLAB
把
左除求解的符号
x=Ab
通用于适定、
欠定和超定三种情况,
系统会自动根据
系数矩阵
A
的维数
n
和
m
进行判断而得出适当的解,
读者必须对这些解能作出
正确的判读,
因此对于三种方程的解的特性要有清楚的概念。
三、
QR
分解及施密特正交系的几何意义
从下面的例题开始,
先考虑二阶的问题。
设两个列向量
v1=(-1;2),v2=(6;8)
,
p>
组成向量组:
?
?
1
6
?
?<
/p>
-0.4472
0.8944
?
?
2.2361
4.4721
?
A
< br>=
?
v
1
,
v
2
?
?
?
?
,作
QR
分解:
A
=
Q
R
?
?
0.8944
0.4472
?
?
0 8.9443
?
。
2
8
?
?
?
?
?
?
在笛卡尔坐标系中画出
列向量
v1,v2
如图
3a
,
Q
满足正交向量组的条件
Q
T
Q=I
2
。它的两个
列向量
Q
(:,1)
p>
和
Q
(:,2)
是
长度为
1
的单位向量,
-10
-5
0
5
10
它们代表了新建立的坐标系
x1
和
y1
,在图中
10
v2(6
,8)
画出了它们的方向。
R
则是向量
v1,v2
在新坐
x1
标系中的坐标值。它的第一列只有一个元素说
5
y1<
/p>
明新坐标系的第一根轴取的就是
v1
方向
,
第二
v1(-1,2)
根轴则按正交
分解的要求取的是与
v1
正交的
0
p>
方向。
QR
分解实际上仅仅是一个正交坐标
变
换,从原来的笛卡尔正交坐标系转到新的正交
-5
坐标系。两者之间仅仅是转动了一个角度
θ
p>
,
图
3a
p>
两维矩阵
QR
分解的几何意义
cos
?
?
sin
?
?
?
其实
Q
就是按
Q
?
与
θ
关联的:
?
sin
?
cos
p>
?
?
?
?
新坐标系的特点是其第一根轴沿着第一根向量,它不改变描述对象(此处是
v1,v2
向量组)
的形状和大小。如果两个向量
v1,v2
调换一下位置,
Q
和
θ
都会发生改变,因为这时新坐标
系的第一根轴将取为
v2
的方向。
现在来看三维向量的情况,设三个列向量
v1=(9;-5;2
),v2=(0;7;5),v3=(-1;-9;6)
,组成向量
组
A
:用
MA
TLAB
语句
[Q,R]=qr(A)
作
QR
分解后,得到:
?
9 0 -1
?
p>
?
A
?
?
?
-5 7 -9
?
,
?
?
2 5
6
?
?
?
-0
.8581 -0.2475 -0.4499
?
?<
/p>
Q
?
?
?
0.4767 -0.7094 -0.5191
?
,
?
?
-0.190
7 -0.6599 0.7267
?
?
?
-10.4881 2.3837
-4.5766
?
?
R
?
?
0
-8.2655
2.6727
?
?
?
?
0
0
9.
4822
?
?
同样可以检验
Q
T
Q=I
3
,
说明
Q
是归一化的三维
空间正交坐标系,
R
中第一个列向量只
有一个元素,说明新坐标的第一根轴取的是
v1
方向;
R
中第二个列向量有两个元素,说明
新坐标的第
二根轴是取在
v1,v2
平面上,方向与
v1
正交;它的第三个列向量有三个元素,
说明它在新坐标系
的三个方向都有分量。
因为在立体图中画出三个列向量和三根新坐标轴不
太容易,画出来了也看不清楚,此处就不画了。
四、
工程中需用
QR
分解的实例
工程中很多情况
都需要建立新的坐标系,绝大部
分是正交坐标系。各种航行器(飞机、汽车、船舶、
p>
航天器)都要有自己的机身坐标系。它们与地面笛卡
尔坐标系的关系
通常用三个空间角
(欧拉角)
来度量,
点
1
点
2
点
3
点
4
点
5
x
-0.28
4.04
0.72
2.72
1.97
y
-0.03
4.59
0.71
4.21
1.81
z
0.55
3.01
-0.13
6.23
-0.32
-
-
-
-
-
-
-
-
-
上一篇:ansys中GET,node中文解释
下一篇:信息工程专业术语(18)