最小二乘法
下面是一道有趣的智力思考题。
给你一本书,你能否仅用普通的刻度尺,测出一张纸的厚度吗?答案是肯定的。我想聪明的读者都已猜到了:只需量出全书的厚度,然后除以全书纸的张数,即得每张纸的厚度。
上述方法可以用于类似的场合。例如,为了测出细漆包线的直径大小,可以采用绕线的办法,在一根铅笔上,紧密地绕上n圈,如图测量出这n圈漆包线在铅笔上所占位置的长L,则该漆包线的直径d,显然应该满足d×n≈L,即d≈L/n。
然而,尽管很多人都懂得应该这样去做,但并非所有的人都知道其中的科学原理。假设某本书共1128页(除封页),测得厚60毫米,各页的厚度(单位毫米)为:
a1,a2,a3,,a1128。
可得到:
∑1128i—1ai=a1+a2+……a1128=60。
而一张纸的厚度0.0532(毫米),则是这1128个数的平均值。
现在需要证明的是:对于量x的n个观测值a1,a2,,an,它们的平均值∑n=a1,a2,+……+ann是所要测定的量x的最理想取值。式中求和符号表示从1累加到n。
事实上,最理想的取值x,应当使它与n个观察值的差的总和为最小。但考虑到差(x—a1)(i=1,2,…,n)可能有正有负,如果直接地把它们相加,势必使某些差的值相抵消,影响了偏离的真实性,这显然是不合理的。于是,人们想到了用(x—ai)2来替代相应的差。这样一来,最理想的取值x应当使函数y=(x—ai)2+(x—a2)2+……+(x—an)2。
=nx2—x(∑ai)x+∑a2i。
取极小值。这是关于x的二次函数,易知当x=∑ain=a1+a2+……+ann时y取极小。这就是为什么平均值可以看成是观测量最理想取值的道理。
同样的原理可以用于二维的情形,只是计算要稍微复杂一些,我们将要得到的结果,在数学上非常有名,叫做最小二乘法。它是德国数学家高斯,于公元1795年创立的,那时他年仅18岁。
现在假定我们观察到n个经验点:
(x1,y1),(x2,y2),…,(xn,yn)
如果我们认定这n个经验点Mi(i=1,2,…,n)是对直线y=Ax+B上的点在观测时的误差。那么,这些经验点Mi(xi,yi)与直线上相应点N(xi,Ai+B)之间的以下量y=2∑MiNi=∑[yi—(AXi+B)]2应当取极小值。“最小二乘法”的名称,大约就是由此而来。函数y显然可以写成A的二次函数:
y=(∑x2i)A2—2[∑xi(yi—B)]A+∑(yi+B)2。
从而当A=(∑xiyi)—B(∑xi)(∑x2i)时取极小值。整理得:
(∑x2i)A+(∑xi)B=∑xiyi。
同理,函数y又可以写成B的二次函数,而当这一函数取极小值时,又得:
(∑xi)A+(∑xi)B=∑xiyi。
这样,由方程组:
(∑xi)A+nB=∑y1。
(∑x2i)A+(∑xi)B=∑xiyi。
便可以确定参数A、B的值。从而得到一条最逼近n个经验点Mi(I=1,2,…n)的直线。
最小二乘法在科学上有许多妙用,这里暂不介绍。
奇妙的钟型曲线
一位教师在统计自己所教的两个班级学生的成绩时,得到了下表:
分数段频数计算频数相对频数
95~100一10.01。
90~9540.04。
85—90正70.07。
80—85正正正正220.22。
75—80正正正正240.24。
70—75正正正正240.24。
65—70正正100.10。
60—65正一60.06。
55—60一10.01。
50—55一10.01。
合计1001.00。
这位教师根据这张表画出了以下学生成绩分布直方图,这时他惊奇地发现:所得直方图很接近于一种两头低中间高的钟型曲线。钟型曲线,在许多地方都出现过。
公元1261年,我国宋朝数学家杨辉,在《详解九章算法》一书中,记载了一幅图形,这个图形被后人称为杨辉三角形或帕斯卡三角形。
杨辉三角形的构造法则如下:三角形的两条斜边都由数字1组成,其余的数都等于它肩上的两数相加。下表是根据上述法则得到的,容易看出,每排数目的总和恰好都是一个2的方幂。
如果我们把这些数按列的分布画出坐标,我们可以连成一条相当规范的钟型曲线。
读者不知是否想过,神枪手也不可能百发百中,只是他们命中红心机会较多,而偏离红心的机会较少罢了。图画出了神枪手(A)、普通射手(B)和一般人(C)射击命中率的钟型曲→x线,它们之间的区别几乎一目了然。
要揭示神秘钟型曲线的奥秘,我们还得借助于射击的例子。
当我们瞄准靶心(O)开枪射击时,离靶心越远的地方自然着弹可能性越少。今以靶心为原点,如下图建立直角坐标系XOY,并令y=ф(x)为沿x轴方向命中率的钟型曲线。由对称关系,显然可设ф(x)=f(x2)
看下图易知:在n次射击中,区间x内的着弹点应正比于射击次数及命中区间的长度,即着弹数n=nf(x2)x从而,在区间x内命中的频率px=nn=f(x2)x。
同理py=f(y2)y。
对于整个靶面来说,小阴影区A的着弹频率p,显然可以写成p=px·py。
=f(x2)f(y2)A。
今在平面上,以O为原点另立UOV坐标系,使U轴恰过A点。由于着弹点的频率是与坐标轴选择没有关系的,从而又有:
P=Pu·Pv。
=f(u2)f(v2)A。
漫谈选优
选优,在数学中颇具时代气息。选优学的历史,与数学发展史之间有着千丝万缕的关系。
早在二千多年前几何学发达的古希腊,人们就知道用图形的对称性质,去解决诸如“在河岸上取一点C,使它到A、B两村路程之和最短”等一类最简单的选优问题。
极值是最重要的一种变量中的常量。
随着代数学的发展,不等式求极值的方法使用得更加普遍。
一个精彩的例子是:“体积为V的圆柱体,它的高h和底半径r应当采用怎样的比,才能使表面积S最小?”
易知S=2πr2+2πrh。
V=πr2h。
从而S=2πr2+2vr。
=2πr2+Vr+Vr。
≥3×32πr2×Vr×Vr=332πV2。
上式表明,当2π2=Vr时S取极小值,由此可知V=2πr3。
h=Vπr2=2πr3πr3=2r。
这就是说,体积一定的圆柱体,当高与底直径相等时,有最小的表面积。这也是为什么今天市场上的有盖牙罐总是设计得高与口径相等的道理。读者还可以用相同的方法证明:无盖的罐子,最节省材料的形状应当是,罐子的高等于口径大小的二分之一。
笛卡儿坐标的建立,使形数结合更加紧密。由牛顿和莱布尼兹创立的微积分学,为求函数的极值提供了一整套完整的算法。17世纪,选优学在应用方面呈现出一派勃勃生机。
客观现实在变化的量中,常常存在某种联系。这些联系在数学上表现为等式约束:
Fi=0(I=1,2,,k)
对于附加了若干约束条件的选优问题,拉格朗日提出了著名的“不定乘数法”即引进k个参量λi,把在Fi=0约束下对F的条件选优问题,化为求=F+λ1F1+λ2F2+ΛΛλkFk。
的无条件选优问题。
随着生产和科学的发展,以函数为变数的选优问题突出了出来。这些问题中最古老和最有代表性的有三个:短程线问题最速降落问题和等周问题。这些古老而富有趣味的问题,经天才数学家欧拉和泊松等人富有创造性的工作,升华为一门瑰丽的数学分支——变分法。
近代电子计算机的出现和使用,使原来并不引人注目的一次函数选优问题,又重新得以重视和发展。
一次函数选优问题的提法是:未知数x1满足不等式组a11x1+a12x2+…+a1kxk+b1≥0。
a21x1+a22x2+…+a2kxk+b2≥0。
an1x1+an2x2+…+ankxk+bn≥0。
试求一次函数y=∑kj—1cjxj+d的最大值和最小值。
解决这类问题的一般方法是单纯形法。其基本思路可以通过下图加以介绍。不等式组相当于把未知量的取值限制在区域Ω内,而一次函数y=∑kj—1cjxj+d对于不同的y值是一组相互平行的“直线”,从而优值将在区域Ω的角点(顶点)上取得。
由于实践中提出的类似上述的线性规划问题都带特殊性。因此人们已经总结出许多诸如物资调动、合理装车等切实可行的好方法,使古老的一次函数选优问题,得以重新发放光辉。
自然科学其他分支的研究常常经选优学以提示。例如前面我们讲到的:蜂窝的底是由三个具有70°32’角的菱形拼接而成,它启示我们这样的结构是最经济的。在深水中横放一根半径为a的圆柱,探索水的绕流导致了对儒可夫斯基函数ω=f(z)=12(z+a2z)(z为复数)
的研究,这个函数为各种优良机翼提供原型。
有时用力学上的模拟方法可以比数学方法更容易得到结果。例如应用橡皮筋拉力,可以轻而易举地找出主要矛盾线,从而解决了统筹方法中的重要课题。著名的三村建立小学问题,可以在平面上用三点模拟三村,用重物P1模拟各村的学生数,并用细线通过滑轮连接于Q点,则平衡后Q点的位置就是建立小学的最好地点。可以证明,这时各村学生到校的总里程数最短。
迄今为止我们讲述的都是必然性问题,实际上更多的是我们甚至连变量间的依赖关系都不知道。为了探求它们之间的相互关系,我们常用n次曲线。
y=a0+a1x+a2x2+Λ+anx2。
去拟合m组试验数据(xi,yi)(i=1,2,…,m),而反过来把这m组数据看成是对曲线的随机误差。自然,这种拟合要求f=∑mi=1(xi—yi)2。
取最小值。根据上述要求,求出n+1个待定系数a1,从而得出最优的n次拟合曲线。
因为统计方法是基于大数定律,从而得到的结果只能认为具有很大的,但不是绝对的把握。以下蒙特卡罗方法便是一个极典型的例子。这个方法的要点是把试验区域分成m个等积的小方块,如果我们希望找到一个小方块其中心试验值优于全部m块中的n块,那么只要随机抽取m块中的r块,并在每个方块的中心做试验,而后取其中最好的一个结果就是。
事实上,从m个中随机抽r个,其中有一个优于n个的可能性为p=1—(nm)r。
当r增大时,P很接近于1,从而是十拿九稳的事。
最后还要提到另一类有趣的选优问题。这类问题区别于前述种种问题的特点,在于它不单是选取或比较某些量,而是在某些量的极小中去选取极大,或从极大中去选取极小。这是博弈论的课题。其基本思想用形象的语言来表达可以说成是:“往最好可能努力,作最坏估计打算。”我们这里不再进一步讲述它。