历史视角:综述数理方程

论文 ? 次阅读
归档
本文原已在其他场合、更早之前发表,已无时效。
ABC
本文属初学作品,其时仍在学习、探索;高人不必读。
综述
本文主要是对前人成果的总结,不是博主自己的成果。

:本篇为学习《数学物理方程》时所作的课程论文。其间准备仓促、储备无多,便对照于《古今数学思想》的框架,将课程所学的几种方程解法整合为一个(看似)完整的历史叙述,遂有此篇综述。需提醒读者:这篇文章相当片面,其中若干论断也是纸上谈兵、与实际不符;阅读之时,只需留意于具体内容即可,(2020 年 5 月 2 日)


数学物理方程(Equation from Mathematical Physics)是本学期学习的一门数学课,从原则上也应该是工科学生进入大学以来数学知识的顶峰——自此门课程以后,便再无专门的数理基础课程1了。但是,由于课时的极度限制,以及许多年来不断调整至今日情形的教学安排,我们所能从课堂上获取到的内容是非常有限的;许多知识、方法的讲授纯粹是开了一个头,而没有继续地深入下去。同样地,尽管我们学校的教本在国内小有名气,但其中的内容看来也是一再删减、约化,以求在有限的课时内能够讲完,学生都能考个好的分数。这固然能够满足绝大多数同学的基本需求(或谓为教学目标),但对于希望获得更加深入理解的同学而言,则显然是不足够的。

对于一个仅仅讲求实用的工程技术人员而言,他并不需要知道各种数学方法的历史来源、发展历程、内蕴思想,他只需要应用那些已经为几代甚至十几代人精心整理好的符号法则,用以实际的计算即可。具体到数学物理方程,一个工程人员所需要知道的两件事情便是:写出定解问题,并将其扔进种种的商用/科学计算有限元软件中。这看起来似乎就已经足够了。可是,对于另外一类人而言,以上的种种「不需要」却不幸成为了他们所最关心、最感兴趣的内容;而我似乎在某种程度上可以被归入这一类人之中。这便是本文的来由了。

关于数理方程的表观印象

概括地说,数学物理方程这门课程似乎可以更换为另一个名字:偏微分方程(Partial Differential Equation, PDE)。尽管从其构建的思路看,其核心内容是「由物理现象所导出的偏微分方程」;但即使是在纯数学的研究领域内,与物理现象无关的偏微分方程也尚未被作为理论研究的核心2。在偏微分方程这一领域内,数学与物理的结合是如此紧密,以至于人们提到「数学物理」这四个字,头脑中便会跳出那三个经典的二阶偏微分方程3,以及这样几位功勋卓著的数学家之形象:Euler,D’Alembert,Lagrange,Laplace,Fourier……可以说,数学物理方程——或者经典的偏微分方程领域,堪称是科学史上最早的「交叉学科」。

这与常微分方程(Ordinary Differential Equation, ODE)的情形完全不同。在那里,与物理问题相关的内容仅仅是极小的一部分;许多研究者对于纯粹理论性质的讨论抱有更大兴趣,且的确获得了大量的成果。更加重要的一点是,常微分方程作为一个具有良好性质与完整理论的数学结构,已经融入到整个数学理论体系的各个方面之中;而偏微分方程至今在这方面的进展不大,尚不能被视为一类良好定义的数学对象用于更广的领域之中,尽管将其融合到各个领域之中的尝试已经被大量做出了。

看到这种现象,人们不禁要问:是什么使偏微分方程具有了这样的种种特性?在讨论这一问题之前,我们有必要先理清数学物理方程的历史源流,由此才有可能理解其研究对象——偏微分方程的内蕴复杂性和数学家、物理家们面临的困难所在。

PDE 只是 ODE 的简单扩张吗?

就我们对于数学知识的概念而言,既然偏微分这一概念是一元函数的微分在高维空间中的自然扩展,那么偏微分方程也自然应该是常微分方程在高维空间中的一种推广。从历史进程来说,这种直觉能够得到应验,因为第一个为数学家所重点关注的数学物理方程——波动方程,便是由常微分方程的研究之中诞生出来的。

1733年,Daniel Bernoulli在对单侧固定的悬链线之波动规律进行研究时,导出了这样一个结果:设有一根上端固定、竖直悬挂的悬链线,自重不计但在其上施加着均匀的载荷,那么对于任意一个固定的时刻而言,悬链线上坐标为\(x\)的一点处之位移 \(u(x)\)4满足常微分方程:

\[\alpha\frac{\mathrm{d}}{\mathrm{d}x}\left(x\frac{\mathrm{d}u(x)}{\mathrm{d}x}\right)+u(x)=0\]

其中\(\alpha\)为一个待取定的系数。他利用并不严格的方法求出了这个方程的级数通解,这个解在今天看来是我们所熟知的Bessel函数

\[u(x)=CJ_0\left(2\sqrt\frac x\alpha\right)\]

其中\(C\)为任意常数。由悬链上侧固定的边界条件,他发现方程中的系数\(\alpha\)有无穷多个取值,按照物理意义而言这意味着这根悬链线有着无穷多个振动模式与特征频率5。无疑,从这个发现本身来看,其是令人鼓舞的;但我们作为具有「后见之明」的回顾者,应当立即注意到其工作之中存在着的一个问题:Daniel并没有研究位移\(u\)和\(t\)之间的关系,这导致他只好停留在常微分方程的领域之中。

同样的,我们还有可能想到另一个与此问题相关的常微分方程——简谐振动方程: \(\frac{\mathrm{d}^2u(t)}{\mathrm{d}t^2}+Ku(t)=0\) 其中\(K\)为回复力关于偏移\(u(t)\)的系数。这一方程最早由John Bernoulli在1727年作出,并且他也确认了我们所熟知的正弦形式通解6 。与他的儿子Daniel一样,John也没能意识到由\(u(t)\)到\(u(x,t)\)的跨越是有可能实现的。

看起来,只要将以上的两类努力之成果综合起来,我们就有可能找到\(u(x,t)\)的表达式了;而这关键的一步由D’Alembert迈出。他在John Bernoulli关于简谐振动之工作的基础上稍作修改,引入\(u(x,t)\)这样的多元函数,从而第一次导出了一维波动方程

\begin{equation}\label{wave} \frac{\partial u(x,t)}{\partial t^2}-a^2\frac{\partial u(x,t)}{\partial x^2}=0 \end{equation}

其中\(a\)为一个常数7。自然地,人们会猜想,如同常微分方程一样,如式 \eqref{wave} 一样的偏微分方程,也应当能够通过初等积分的方式求解出通解,然后再根据实际问题所给定的初始条件、边界条件解出待定常数(在偏微分方程中则是待定的任意函数)即可。这想法是不错的,而D’Alembert也正是按照这样的思路来做的。按照那一十分经典的变量代换

\[\left\{ {\begin{array}{*{20}{l}} {\xi = x - at}\\ {\eta = x + at} \end{array}} \right.\]

D’Alembert便找到了方程 \eqref{wave} 的通解为 \(u(x,t)=F(x-at)+G(x+at)\) 其中\(F,G\)可以是任何满足基本要求的函数,而在D’Alembert那里这要求是「由代数和微积分的步骤构成的解析表达式」。再将通解代入到定解条件

\[\left\{ {\begin{array}{*{20}{l}} {u(0,t) = u(l,t) = 0,\:t > 0}\\ {u(x,0) = f(x),\:0 < x < l} \end{array}} \right.\]

之中,就可以最终解出一个符合定解条件的解\(u(x,t)\),其中的任意函数变为了与\(f(x)\)有关,且满足所谓奇性周期性的特定函数8

这里,原先在常微分方程中起过作用的「先求通解,再代条件」方法又一次取得了巨大的成功。PDE到这里看起来似乎与ODE没有本质区别,只是要积分的变量变成了两个(或者更多)、待定的东西变成函数罢了,除了为当时数学家所困惑的初等不可积问题超越方程问题之外,并没有出现什么本质上的困难——何况初等不可积、超越方程无法解出,都算是无关痛痒的小事,它们毕竟也算是给出了封闭形式的表达,同样可被视为方程已经解出的标志。《古今数学思想》的作者M·克莱因总结道:

数学家们确实认识到了偏微分方程并没有包含什么新的运算技巧,他与常微分方程的不足之处只在于,在解中可以出现任意函数。他们期望把偏微分方程化为常微分方程去确定这些任意函数。Laplace(1773)和Lagrange(1784)明确地说,他们认为一个偏微分方程被化为常微分方程问题时,这个偏微分方程就已被积分出来了。另一种方法,如像Daniel Bernoulli对波动方程及Laplace对位势方程那样,用的是寻求特殊函数的级数展开式。(《古今数学思想》第2册,第286页)

不幸的是,问题并不如人们想象的那样简单。随着工作的深入进行,数学家们逐渐认识到,想要轻易地为偏微分方程构造一套系统的理论和解法,几乎是不可能的事情——特别是对于物理问题中最为常见的二阶方程,进展甚微。由于在观念上,数学家们相信偏微分方程的通解特解意义更为重要(这在常微分方程中是成立的),这使得他们在面对偏微分方程这样一个复杂程度并不明确的数学结构时,失去了前进的力量,只能停留在诸如D’Alembert方法以及Euler、Daniel Bernoulli等人对于波动方程所提出的正弦模式叠加解9

\[u(x,t)=\sum_{n=1}^\infty A_n\sin\frac{n\pi x}{l}\cos\frac{n\pi at}{l}\]

等几个非常有限且不明晰的结果之上。系统的理论与求解方法并未找到,在之后的探索之中他们也发现这种努力几乎是徒劳的。这导致数学物理方程/偏微分方程的理论研究在一段时间内陷入了停滞。

就我个人的理解,这种挫折清晰的反映了人们认识世界时所必须面对的两个困难:对于未知问题的盲目和急于求成,以及对于已有观念、方法的依赖和固守。在数学物理方程理论之中,未知的是偏微分方程作为一种新数学对象所具有的复杂内蕴结构,其客观存在、不会改变,但人们只对其有着非常有限的认识与了解;已有的观念则来自于常微分方程理论,在那里经典的微积分方法取得了巨大的成功,系统的解法和理论被比较容易的揭示出来,数学家们遂猜想这条路也可以引领着他们走向同样的胜利,因为他们从直观上感到PDE似乎本就是ODE的一个简单扩张,如同多元微积分是一元微积分的简单扩张一样。这个想法不幸的成为一个巨大的错误,并使得那个时代最优秀的一批数学家在PDE的世界中也陷入了泥沼、无所建树。「偏微分方程解的理论还有待形成,这门学科整个说来还处在它的幼年时代。10这是一个非常恰当的总结,但这个事实令人感到遗憾。

分离变量与特殊函数理论的繁荣

抛开十八世纪之内若干非常有限、孤立的进展,偏微分方程领域内的第一位集大成者是活跃于十九世纪之初的Fourier。他在《热的解析理论》一书中首次给出了偏微分方程的一种系统解法,而随后人们便意识到这一解法可以无困难地推广到更多的方程中去。在这一方面,Fourier的贡献主要有两点:推导出热在温度场中传播所满足的热传导方程

\[\left(\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}+\frac{\partial^2}{\partial z^2}\right)u=a^2\frac{\partial u}{\partial t}\]

其中\(u(x,y,z,t)\)代表了三维空间中的时变温度场,而\(a\)是与物体传热性质有关的常数;并且,由分离变量的方法确定了对一类定解问题普遍适用的解法。

分离变量的思路,在学习过本课程的学生看来,是比较容易理解的。为便于讨论,先讨论一个特例,即一维热传导方程

\begin{equation}\label{eq:1Dheat} \frac{\partial^2}{\partial x^2}-a^2\frac{\partial u}{\partial t}=0 \end{equation}

而Fourier当年也是如此简化讨论的。附加于这个方程的,还有定解条件

\[\left\{ {\begin{array}{*{20}{ll}} u(0,t)=u(l,t)=0&,\ t>0\\ u(x,0)=f(x)&,\ 0<x<l \end{array}} \right.\]

为了求解,他先假定方程具有一组分离变量的解11

\begin{equation}\label{seperate} u(x,t)=X(x)T(t)\end{equation}

从表面上看,这种做法的动机是不得而知的。在我们的课上,说法是:认为方程的解是若干基本模式(在波动方程中是所谓的振动模式,在传热方程中呢?)的叠加,它们是由时间和空间分别控制的两部分之结合,由此驱使着像Fourier这样的开拓者做了这种尝试,从而发现了其可行性。然而,这种做法从数学上倒是解释得通的——分离变量可以直接将方程简化,有如多元微分方程组中的去耦。将如 \eqref{seperate} 一样的尝试解代入到方程 \eqref{eq:1Dheat} 中,稍加变形可以得到

\[\frac{X(x)}{a^2X(x)}=\frac{T'(t)}{T(t)}\]

Fourier依据着自己的一套说法宣称这两个比值只能为一个常数\(-\lambda\),我们的课程中则认为「两个不同的物理量恒等,则它们必须都为常数」。由此,原来的偏微分方程 \eqref{eq:1Dheat} 便被轻而易举的拆成了两个常微分方程

\begin{equation} X''{}(x)+\lambda a^2X(x)=0\label{eq:heatX} \end{equation}

\begin{equation} T’(t)+\lambda T(t)=0 \label{eq:heatT} \end{equation}

最后,再将定解问题中关于\(u(x,t)\)的约束转化为关于\(X(x)\)与\(T(t)\)各自的约束,就能将一个偏微分方程的定解问题转变为两个常微分方程的定解问题。

看起来问题似乎已经彻底解决了——通过一种新的方法,PDE又回到了ODE之上。但是,这还不够,因为之前所提出的\(\lambda\)还没有确定;到这里,边界条件的不可或缺一下子浮现出来。方程 \eqref{eq:heatX} 的通解容易确定为

\[X(x)=c_1\cos\left(\sqrt{\lambda}ax\right)+c_2\sin\left(\sqrt\lambda ax\right)\]

根据原来的定解条件则可以确定对应于常微分方程 \eqref{eq:heatX} 的定解条件是 \(X(0)=0,\ X(l)=0\) 其中,前者决定了\(c_1=0\),而后者要求未定的\(\lambda\)必须满足周期条件

\[\sqrt\lambda al=n\pi\ (n=1,2,\cdots)\]

由此,\(\lambda\)只能取若干的分立值\(\lambda_n=\left(\frac{n\pi}{kl}\right)^2\),其中\(n\)可取为任意整数。这就是我们在今天以特征值所称呼的一个重要结果12。将这若干个\(\lambda_n\)回代到通解中去,就可以得到无穷个\(X(x)\)的特解: \(X_n(x)=\sin\frac{n\pi x}l\) 它们线性无关,且它们的线性组合均是满足定解条件的方程 \eqref{eq:heatX} 的非零解。

对于另一关于 \(T(t)\) 的方程 \eqref{eq:heatT},所给的初始条件却并不能直接分解到\(T(t)\)之上。为此,只能先得到方程\eqref{eq:heatT}的基本解:

\[T(t)=\mathrm{e}^{-\lambda t}\]

将之前解出的分立\(\lambda_n\)代入其中可以得到若干个\(T_n(t)\),按照分离变量的做法可知每一个

\[u_n(x,t)=X_n(x)T_n(t)=\sin\frac{n\pi x}{l}\exp\left[-\left(\frac{n\pi}{al}\right)^2t\right]\]

都是符合边界条件(而未必符合初始条件)的方程 \eqref{eq:1Dheat} 之解。自然它们的线性组合

\[\sum_{n=1}^\infty X_n(x)T_n(0)\]

也满足方程和边界条件。为了满足初始条件,只要在\(t=0\)时设

\begin{equation}\label{sum} f(x)=\sum_{n=1}^\infty X_n(x)T_n(0)=\sum_{n=1}^\infty A_n\sin\frac{n\pi x}{l} \end{equation}

并解出对应于每个叠加因子的系数\(A_n\),就算是彻底解出了定解问题。此后的故事是一般读者所熟悉的:Fourier利用较繁杂的推导确立了三角级数展开 \eqref{sum} 的系数公式(尽管在他之前Euler和Clairaut已经给出,并且他的方法更加复杂 13):

\[A_n=\frac2l\int_0^lf(x)\sin\frac{n\pi x}{l}\mathrm{d}x\]

并断言「每一个函数」都可以表示为这样的三角级数展开,由此引发了数学界关于函数之定义的大论战。Fourier在这方面的工作给整个数学理论体系造成了很大的冲击,不过其所造成的主要影响与我们所要讨论的内容无关。

回看Fourier所应用的分离变量方法,有这样几点值得注意。首先,从形式上看,这种努力仍然是基于「将PDE转化为ODE」的这样一种企图。然而在其过程中,一个重要的事实被揭示出来:

与常微分方程不同,在大多数情况下偏微分方程与其初始条件、边界条件不可分割——即,大多数偏微分方程只有在以定解问题的形式提出时才有求解的可能。

就一维传热方程定解问题来说,人为取定的常数\(\lambda\)原可以是任意实数,但由于定解条件的约束其只能取若干个分立值\(\lambda_n\),由此使得寻求诸如Fourier展开式 \eqref{sum} 这样的满足初始条件的解成为了可能。即使是这样精妙的方法,可以看出其系数的求解仍然比较复杂(Fourier系数公式在代入具体函数后往往不是初等可积的),由此可以看到:十八世纪那些企图用含任意函数的通解去适配边界条件的努力,为何大部分都失败了。经过几十年的论战、互相怀疑14,Fourier的思想最终为大部分数学家所认同,并被诸如Poisson等数学家发扬光大,在这一方面他们取得了许多重要的成果。

Fourier的工作中所揭示出来的另一点是:可用于做级数展开的基函数之范围,比人们15之前所认为的更广,且这种拓张似乎能够带来显而易见的好处。既然Fourier用三角级数求得了一维传热方程定解问题的级数展开解,那么对于复杂的问题,只需要更换展开的基函数即可,看起来这似乎没有什么本质上的难度。尽管在Fourier之前已经有零星的将函数用三角函数(这来自于Euler和Clairaut16)、Bessel函数(来自于Euler和Poisson17)、Legendre多项式(来自于Legendre自己18)等特殊函数展开一般函数的做法,但这直到Fourier的工作发表以后,其才成为求解偏微分方程定解问题时可以倚赖的方案。

随着分离变量法被应用到更多的问题之中,对于特殊函数的研究逐渐增多,以至于其甚至独立出来成为一项系统的数学理论分支。这种趋势的产生,与偏微分方程内蕴的复杂结构是分不开的;假如说所有的偏微分方程定解问题——至少所有的二阶偏微分方程问题,都只要按Fourier的三角展开就能解决,我们何必求助于陌生的Bessel函数、Legendre多项式,乃至能堆积成厚厚一本字典的其他种种特殊函数呢?事实上,即使是由一维传热方程改为极坐标下的二维传热方程,问题的性质便已发生变化;二维传热方程

\[\left(\frac{\partial^2}{\partial \rho^2}+\frac1\rho\frac{\partial}{\partial \rho}\right)u-a^2\frac{\partial u}{\partial t}=0\]

所导出的特征值问题中,关于分离变量后函数\(R(\rho)\)的特征值问题骤然变为了

\[\rho^2R''(\rho)+\rho R'(\rho)+(\lambda\rho^2-n^2)R(\rho)=0\]

这种复杂的形式,其中\(\lambda\)是按照一般分离变量法设出的常数\(\lambda\),而\(n^2\)则来自于另一函数\(\Phi(\theta)\)所解出的分立值。这个方程可以化为一个Bessel方程,由此导致解得的特征函数也不可避免地成为Bessel函数了。诸如这样的例子很多。

进一步地,从孤立的几个方程出发,数学家们逐渐认识到:各个定解问题所导出的特征值问题之性质,与方程本身的属性、边界条件的形式及坐标系的选取都有关系。特别地,对于最常见的二阶方程,其导出的特征值问题都具有形如

\begin{equation}\label{sig} L(x)y''+M(x)y’+\lambda N(x)y=0 \end{equation}

的形式。到1837年,由力学教授Sturm和数学家Liouville确立了经典的Sturm-Liouville特征值理论,他们的结果表明形如式 \eqref{sig} 的特征值问题总是有无穷多个可记为\(\lambda_n\)的非零特征值,并且导出的特征函数族具有加权正交、完备等良好的性质19。因篇幅所限和主题约束,不再详细讨论。

经过之后几代人的努力,级数展开解偏微分方程的方法被发展到一种相当完备的程度;其不仅在理论上取得了相当的严密性完备性,同时也在各类问题中展示出其强大的力量。与之紧密相关的特殊函数理论,也随之迎来了巨大发展,并不受阻碍地如同十八世纪以前的初等函数和初等积分一样被数学家们视为理所当然的实在对象——尽管它们的性质极其复杂,甚至连求解Bessel函数零点这样的事情都算得上是一种挑战。当然,这里最耐人寻味的一件事情是:十九世纪的数学家们在很大程度上,放弃了对一般方程之通解问题的探索——而这还是前一个世纪的人们所梦寐以求的。对于具体定解问题(往往来自于自然科学的需要)求解的需求,代替了对如常微分方程中那样完备之理论的渴望,构成了新一代PDE研究者勇往直前的动力。

有关 Green 函数

现在,我们需要把注意力转移到剩余的那一个还未涉及的二阶方程——位势方程Laplace方程)上来了。方程的形式\(\Delta u=0\),或

\begin{equation}\label{position} \left(\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}+\frac{\partial^2}{\partial z^2}\right)u=0\end{equation}

是跨度甚广的数学与自然科学领域之中少有的几个「四处露面」而又并不平凡的方程。就其所能够描述的现象来看,它无疑是三大二阶方程之中应用范围最广的——这从剩余两个方程中取\(u\)与\(t\)无关(即稳态)便得到位势方程这一事实便可看出。从历史上来看,位势方程的出现,则直接出自于力学的研究。

在数学上可以证明,如果在三维坐标系下,某个力场\(\mathbf{F}(x,y,z)\)可以表述为

\begin{equation}\label{condition} \mathbf{F}(x,y,z)=\dfrac{C\mathbf{r}}{\left(\sqrt{x^2+y^2+z^2}\right)^{n+1}}=\frac{C\mathbf{r}}{r^{n+1}}\ (n=0,1,\cdots)\end{equation}

其中\(C\)为常数而\(\mathbf{r}\)为由原点指向\((x,y,z)\)的向量,那么\(\mathbf{F}=\mathbf{F}(\mathbf{r})\)必为一个保守力——将任意一个单位质点在空间中移动时\(\mathbf{F}\)所做的功,仅与始末点的位置有关,而与移动路径无关。作为能够满足条件 \eqref{condition} 的特例,万有引力及与之形式类同的库仑力

\[\mathbf{F}(\mathbf{r})=\frac{K}{r^2}\cdot\frac{\mathbf{r}}{r}\]

其中\(K\)为常数,对万有引力这是\(gMm\),对库仑力这是\(\dfrac{Qq}{4\pi\varepsilon_0}\))也具有这样的保守特性,这自然的使人想到:存在着一个与位置\((x,y,z)\)有关的函数\(V(x,y,z)\),使得我们可以用\(V(x,y,z)\)的简单运算(具体地说是加减运算)来表征\(\mathbf{F}(x,y,z)\)这一矢量场所做的标量功——这个函数就是位势函数。按照今天的定义,对应于力场\(\mathbf{F}(x,y,z)=\left(F_x,F_y,F_z\right)\)的势函数\(V(x,y,z)\)满足

\[\frac{\partial V}{\partial x}=F_x,\ \frac{\partial V}{\partial y}=F_y,\ \frac{\partial V}{\partial z}=F_z\]

即\(V\)在各方向上的偏导数恰为力场在各方向上的分量。进一步的便可以导出,像这样的势函数必须满足位势方程 \eqref{position}。从物理学的角度来看,势函数理论的出现,使得人们有可能摆脱对矢量力场繁琐且依赖几何的推演,转而直接关注形式确定的势函数(然后求一次偏导便可得到复杂的力场),这无疑是一件好消息。

但是,在将求解的问题由离散物体推向连续质量分布体后,这种做法很快地遭遇了实际上的困难;有时,我们只了解势函数的部分信息,例如所谓的边界条件。这样,势函数的求解转而成为了一个PDE定解问题,最经典者莫过于Dirichlet(内)问题

\[\left\{ {\begin{array}{*{20}{ll}} \Delta u(x,y,z)=0,&(x,y,z)\in\Omega\\ u(x,y,z)=f(x,y,z),&(x,y,z)\in\partial\Omega \end{array}} \right.\]

其中\(\Omega\)是一个确定的空间区域,\(f\)则是一个给定的函数。物理学的研究到这里,与当时在数学界20正陷入僵局的研究内容汇合了,这使得一些研究者开始考虑从问题的物理背景出发,探求解决方案。

电磁学的数学化为主要工作的Green在这一方面迈出了重要的一步,他的工作于1828年发表,但很晚之后才广为人知21。如同我们在课程中所讲授的顺序一样,他首先证明了今天被我们称作Green第一公式的一个联系三重积分与曲面积分的表达式:

\[\iiint_\Omega U\Delta V\mathrm{d}v+\iint_{\partial\Omega}U\frac{\partial V}{\partial n}\mathrm{d}\sigma=\iiint_\Omega V\Delta U\mathrm{d}v+\iint_{\partial\Omega}V\frac{\partial U}{\partial n}\mathrm{d}\sigma\]

其中\(U,V\)是任意两个在\(\bar{\Omega}\)上连续的函数。Green在这时假定\(V\)正是待定的一个势函数,而\(U\)则是另一个更容易确定的函数,那么他所要做的工作就是将\(V\)用\(U\)等其他已知条件(例如在Dirichlet问题中是\(\Delta V=0\)和\(V\)在\(\partial\Omega\)上的值)表示出来。首先,观察Green第一公式,有两个无法确定的内容:

  1. 项\(\displaystyle\iint_{\partial\Omega}U\frac{\partial V}{\partial n}\mathrm{d}\sigma\)中的\(\dfrac{\partial V}{\partial n}\)在边界上的取值,这是边界条件没有给定的,且也不应该给定;

  2. 项\(\displaystyle\iint_{\Omega}V\Delta U\mathrm{d}v\)中的\(V\),这本就是方程要求解的未知内容。

很显然,不可能通过什么简单的技巧将这两个关于\(V\)的未知内容变为已知,故Green断定只能对与之相乘的\(U\)函数加强约束:它应当能够在以上的两项中恒为\(0\)以消除未知项的阻碍。这样,就要求函数\(U\)必须满足

\begin{equation} \begin{cases} \Delta U(x,y,z)=0,&(x,y,z)\in\Omega \cr U(x,y,z)=0,&(x,y,z)\in\partial\Omega \end{cases} \label{zero} \end{equation}

问题一下子显现出来:以上定解问题的唯一解是\(U=0\),这等于什么也没做。在这里,Green对于电磁学的已有研究为他提供了线索:对于一个放置于原点的单位点电荷22所产生的势函数

\[V_0(r)=\frac{1}{4\pi r}\]

除了在原点以外处处满足\(\Delta V_0=0\)。该函数在区域边界——例如单位球的边界上,虽然值不为\(0\),但可以用一些简单的方法再叠加另一个与之类似的势函数\(V_1(r)\)(它的奇点不在区域内),将其在边界上的函数值抵消掉。作为一个特例,这里所采用的函数所具有的特点是:它满足齐次的边界条件,在区域内部仅有一个奇点,而在奇点外都满足位势方程\(\Delta U=0\)。这样的\(U\),除了一个奇点之外仍然能够满足之前所推导出的约束式 \eqref{zero},也许它就可以作为Green所想要找到的那个非平凡的\(U\)函数了。而Green自己所得到的结果则是,对于满足以下三条性质的\(U\):

  1. \(U\)在边界\(\partial\Omega\)上恒为\(0\);

  2. \(U\)在\(\Omega\)内部的某一个点处按\(\dfrac1r\ (r\to0)\)的规律发散;

  3. \(U\)在内部满足位势方程\(\Delta U=0\);

待求的势函数\(V\)就可以由Green第一公式表示为

\[4\pi V=-\iint_{\partial\Omega}f\cdot\frac{\partial U}{\partial n}\mathrm{d}\sigma\]

容易看出,这个方法还可推广到方程自由项不为\(0\)的情形,也即Poisson方程

\[\Delta V=\rho(x,y,z)\]

的定解问题之中,只是结果中会再多出一个三重积分式罢了。

Green所声明的函数\(U\)便是今天我们所熟知的Green函数(我们的课本中所用的记号为\(G(P,P_0)\)),而我们课本中的提法也与Green当年的提法有所不同。在我们今天看来,利用Green函数方法求解偏微分方程的本质是:构造一个符合特定要求的点源函数,以代表如同点电荷所散发的电场那样的单位函数;然后,再根据定解条件(特别是区域形状),来叠加这样的单位函数,有如电磁学中用若干个点电荷叠加出一个连续带电体的电势场。在这里,令人惊奇的一点是:Green的时代根本就没有所谓\(\boldsymbol{\delta}-\)函数的概念,而这正是我们今天理解Green函数方法的一个重要入口23。Green函数毫无疑问在区域\(\Omega\)内存在着奇点,这本应造成数学上的困难;假使Green是十八世纪晚期到十九世纪初的一位已经接受过严格\(\delta-\varepsilon\)极限理论教育的数学家,那么他很有可能在此裹足不前,一无所获。基于物理的直觉,他毫无怀疑的接受了这种想法(将这带奇点的要求视为一个点电荷的固有性质),并自由地将这种事实上还存在着不严格之处的分析过程应用到他对电磁学的研究中去,取得了很大的成果。也许这也算是一种「幸事」。

物理直觉在此也取得了一次辉煌的胜利。可是,Green函数方法似乎也只能走到这里;尽管Green函数方法对于位势方程而言24看起来是一种普适的方法,但是这种普适的前提是:Green函数\(U\)已经给定。事实证明,求解这样的基本解并没有什么有效普适的方法,特别是对于一般形状的区域\(\Omega\)而言。这一点也非常容易理解,因为回顾Green的推导过程便可以发现,求解\(U\)的过程在本质上仍然是一个位势方程定解问题(例如 \eqref{zero}所给出的)。如果说Green函数方法真的成功了,那只是因为关于\(U\)的定解问题在\(\Omega\)是简单区域——如我们课本上所涉及的上半空间圆域——时,其解可通过物理知识容易的确定,而不必求助于PDE的专门理论。由此可以看出,经典的Green函数方法只算是「始于物理,止于物理」,如果边界条件(具体地说是边界形状)在物理上都已经复杂到不可理解的程度,那也就不可能依靠Green函数方法了——或者说,这种做法是无意义的。

从之后的发展情况来看,Green函数在两个方面还有更多的进展:一是在严格性系统性方面得到完善,并与广义函数理论结合起来而成为在数学理论上的一种很有效的工具25;二是在物理上进一步拓展了其应用,成为理论物理、量子力学领域的关键概念。这些与我们所学的无关,没有必要做深入讨论。

路在何方?

正文的内容到此便结束了,以上所阐述的是我这一学期以来对于这门课程中若干知识点零碎的理解与看法,贯穿全文的数学史内容不过是用于串接这些想法的一条纽带

尽管作为一个工科生,我对于数学之「世界体系」的了解非常的有限与片面,但我仍然能够感到偏微分方程这样一个数学分支所具有最大一个特点是:系统理论严重缺乏。常微分方程的求解上固然也有种种困难,但关于其内蕴性质的研究已经是相当深入和系统了,以至于在我看来,把整个微积分和初等函数理论的基础(从实数理论向上)用常微分方程理论替换掉,都是可行的26;而偏微分方程的理论则相当受限,即使是最新的偏微分方程教本也不能不以三大二阶方程作为核心或关键部分来组织内容——它们代替了抽象的理论框架,成为偏微分方程理论的临时框架。也许,这种临时,会最终成为一种永久——而这并不是数学家们 27所希望看到的。

关于十八世纪的常微分方程,M·克莱因的评价是:「总的说来,这门学科还是各种类型的孤立技巧的汇编。28不幸的是,对于到今天为止的偏微分方程而言,这种说法也存在着一定的适用性,尽管说「孤立」是谈不上的。本文所述的均为本校课程(至少是课本上)有所论述的求解方法,在此之外的种种方法则更是数不胜数。在我们工科生所能理解的范围之内,就还有复变函数积分法利用解析函数与调和函数之间的关系)、Laplace变换法幂级数方法变分原理29等种种;至于那些探索偏微分方程解整体结构和性质的努力,所遵循的途径则更是千差万别,它们在一些地方交汇,却又在另一些方面分道扬镳。分支甚繁,其背后所隐藏的一个事实是:令人满意的普适解法与理论体系都是不存在的,已有的解法与理论却几乎是构成了整个分析领域之中复杂度的顶峰。总之,当我们说起「数理方程难学」的时候,一方面是意指那繁杂的求解过程,另一方面则是抱怨系统理论框架的缺失。

我对20世纪以来的偏微分方程研究一无所知,但我知道:即使其中产生了大量足以撼动这一数学分支的突破性成果,其影响也未能波及到本领域之外,更没有走进科学与工程领域。我们作为实际的应用者,仍然在依赖着一百多年以前的有限结果,求解着很有限的一类问题;即使是在近几十年突飞猛进着的数值方法,其背后的严格理论基础也没有完全成型,支离破碎。好消息是,至今还没有新闻宣称:「由于PDE理论的不完整性,一座用不严格数值方法求解设计的大桥在狂风中解体」之类的新闻,这使得我们仍然可以抱着99%的信心继续向前。

路是人走出来的,不亲自实践所得来的皆是空谈,例如本文。因此,我也得拾起D’Alembert的那句老话了:「前进吧,你就会有信心!30

  1. 这是对于大多数工科生而言的。对于我们少年班的学生(以及力学、飞设等专业)而言,还余有一门计算方法课程。 

  2. 但似乎可以被称为是「前沿研究领域」。我对现代数学的研究主题了解不多,但据说目前从事偏微分方程理论研究的人数众多。 

  3. 或Maxwell方程组、Schrödinger方程、Navier-Stokes方程组等一些与物理现象结合更加紧密的偏微分方程(组)。 

  4. 原文使用的记号为\(y\)或\(y(t,x)\),为了与我们所学的统一改用常用的记号\(u\)或\(u(x,t)\)。下面均如此。 

  5. M·克莱因.古今数学思想(第2册).上海:上海科学技术出版社,1979,第213页. 

  6. M·克莱因.古今数学思想(第2册).上海:上海科学技术出版社,1979,第212页. 

  7. M·克莱因.古今数学思想(第2册).上海:上海科学技术出版社,1979,第241-242页. 

  8. 看起来D’Alembert从来没有研究过所谓的「无界弦振动」问题,这对于当时的物理研究似乎是不可想象、无实际意义的。因此,我们所熟知的D’Alembert公式

    \[u(x,t)=\frac{\varphi(x-at)+\varphi(x+at)}{2}+\frac1{2a}\int_{x-at}^{x+at}\psi(\xi)\mathrm{d}\xi\]

    确实蕴含了D’Alembert的思想,然而却不直接来自于他本人。 

  9. 见于M·克莱因.古今数学思想(第2册).上海:上海科学技术出版社,1979,第245-247页.注意,这个结果看起来与Fourier的结果类似,但Euler等人提出这种设想的出发点是弦振动模式的物理含义(频率的倍增,多个模式的叠加),而非任何明确的数学构造。除此以外,他们对于这一做法的适用范围、严格性等也并不清楚,更没有如Fourier或之后的Poisson那样意识到这种方法可以普遍的应用于各种偏微分方程的求解或函数的展开。 

  10. M·克莱因.古今数学思想(第2册).上海:上海科学技术出版社,1979,第286页. 

  11. Fourier并不是第一个对偏微分方程施行分离变量手续的人,最早的实施者可能是D’Alembert,但他并没有完成这种解法。见《古今数学思想》第2册,第256-257页。 

  12. 在自然科学领域之中,特征值理论最重要的一点就是在数学上引出了量子论「物理量取值分立」的这一基本结果,尽管关于后者的研究从来都不是从数学角度出发的。 

  13. 见M·克莱因.古今数学思想(第3册).上海:上海科学技术出版社,1979,第58页.特别地,Euler所用的推导Fourier系数的方法,正是今天各种教本中所讲授的(利用三角函数在函数空间中的正交性),而Fourier自己却是用非常复杂且十分含糊的手段得到的。 

  14. 其他数学家所质疑的往往并不是分离变量法,而是Fourier关于三角级数展开的那个著名论断。 

  15. 这里说的是十八世纪的数学家们。当然,对于我们这些大学生而言,一个简单的函数可以用另一组我们甚至都不认识的复杂非初等函数展开,恐怕要更加令人感到诧异。 

  16. 见M·克莱因.古今数学思想(第2册).上海:上海科学技术出版社,1979,第182-188页. 

  17. 见M·克莱因.古今数学思想(第2册).上海:上海科学技术出版社,1979,第259-260页. 

  18. 见M·克莱因.古今数学思想(第2册).上海:上海科学技术出版社,1979,第269页. 

  19. 除此以外还有很多重要结果,不再详述。 

  20. 当然,我们知道,十八世纪到十九世纪之间,数学界和物理学界的分野还并不那样明晰。这是一个历史常识。 

  21. M·克莱因.古今数学思想(第3册).上海:上海科学技术出版社,1979,第67页. 

  22. 从物理意义上看,所谓的单位实际上是真空介电常数\(\varepsilon_0\),而不是1。 

  23. 我们的课本中没有按照\(\delta-\)函数来解析位势方程的基本解和Green函数,证明若干重要结果时都是应用的\(\delta-\varepsilon\)极限方法。不过,我曾去旁听过本校物理实验班的几节数学物理方法课,在他们的课程中则是以\(\delta-\)函数理论入手来讲解Green函数的,因为这样做较为简明快捷。 

  24. 稍稍修改各处的定义,Green函数方法便可没有实际困难地推广到其他二阶方程定解问题的求解过程中去。 

  25. 特别的,在Green函数与\(\delta-\)函数的关系理清之后,就可以使其成为一种独立于物理方法的纯数学工具了,因此也有可能被应用于更加复杂的边界条件之下。 

  26. 我在这方面的思考不算深入,但我猜想,这种做法很有可能大大的助益于工科数学的讲授。 

  27. 对于我们的培养目标——工程技术人员来说,系统理论的存在与否倒是无关紧要。即使新的理论体系横空出世,工程师和科研人员所需要做的也仍然是两件事情:列出定解问题,扔进有限元软件。(假如他们还意识到需要检验解的合理性和数学依据,那会更好。但这种尝试在很多时候也被证明是一种徒劳。)数学理论与实际应用之间的鸿沟一直都是以这样的形式存在着的。 

  28. M·克莱因.古今数学思想(第2册).上海:上海科学技术出版社,1979,第237页. 

  29. 我只知道以Dirichlet原理出发,可以作为研究PDE定解问题(准确的说是位势方程Dirichlet问题)之解的存在性的一种思路,但是不太清楚这种方法能否直接用于PDE定解问题的求解。 

  30. 更常见的中文翻译是:「向前吧,你就会得到信念!」