MENU

Calculus of Variations:变分计算

• October 4, 2019 • Read: 15001 • Knowledge,变分法

变分问题是一个寻求泛函在什么条件下取得极值的问题;在已知泛函表达式时,确定这个泛函取得极值是要通过变分计算(运算)来实现的,当然对于古典变分问题而言,研究的对象和目的就是泛函本身以及求泛函的极值;而变分运算是后续寻找PDE对应的等效泛函的基础,通常变分运算可以近似地把它当作微积分中地微分来理解。

变分算子$\delta$

$\delta$称为变分符号。一个函数$y(x)$的变分记作$\delta y$,具体意义为,当独立的变量(自变量)$x$保持不变时(这里也可以理解为,因为自变量变化程度为0,即为一个定值,所以记为$\delta x = 0$),函数$y(x)$产生的一个微小(无限小)的变化,记为$\delta y$。在函数的微积分中,我们知道函数值的变化量是由于函数自变量的变化引起的,而在泛函中,自变量保持不变,那么应变量的变化只能是函数形式发生改变而引起的,这一描述通过古典变分问题的构造可以很清晰地反映出泛函研究的主要对象。

对于如下泛函而言:

$$ I[y(\cdot)] = \int_a ^b F(x, y, y')dx $$

被积函数$F(x,y,y')$是函数$y(x)$及自变量、函数一阶导数所组成的,$I[y(\cdot)]$就是一个泛函!积分的上下限表明了自变量$x$的取值范围。把变分符号当作微分符号来处理;多元函数全微分的意义在于给出自变量变化引起的函数值变化的大小,本质上为某一方向(变量)上,单位长度引起的函数值变化(一阶导数或斜率)与这一方向(变量)的变化量的乘积。依据全微分的概念,可以很好地理解泛函的变化量,$\delta I$。由于$y$变化(从$y\rightarrow y + \delta y$),$y'$是函数的一阶导,其变化可以可以记为$\delta y'$,那么引起被积函数$F$的变化量,表示为:

$$ \partial F = \frac{\partial F}{\partial y} \delta y + \frac{\partial F}{\partial y'} \delta y' $$

而函数的全微分为定义为:

$$ \mathrm{d}F = \frac{\partial F}{\partial x} \mathrm{d}x + \frac{\partial F}{\partial y} \mathrm{d}y + \frac{\partial F}{\partial y'} \mathrm{d}y' $$

将变分与微分相对比,它们的运算基本相同,唯一不同点在自变量$x$上,因为在泛函中,函数的变分$\delta y$是在保持自变量$x$不变的情况下定义的,所以$dx= 0 $,这一项自然为0.

参照微分符号的运算,变分运算几个主要的法则为:

$$ \delta (F_1 \pm F_2) = \delta F_1 \pm \delta F_2\\ \delta(F_1 F_2) = F_2 \delta F_1 + F_1\delta F_2\\ \delta(F_1)^{n} = n(F_1)^{n - 1} \delta F_1\\ \frac{\mathrm{d}}{\mathrm{d}x} \delta = \delta(\frac{\mathrm{d}y}{\mathrm{d}x}) $$

泛函取得极值的条件

对于函数的极值研究,一般都是通过函数的一阶导数来确定,通过导数为0,获得函数的驻点,然后利用驻点左右两侧的函数单调性来确定是极大值还是极小值。由于泛函可以理解为函数的函数,因此,利用函数确定极值的方法,将其引入到变分问题中来,即泛函取得极值的条件为$\delta I = 0$。

$$ \delta I = 0 $$

这一结论可以通过Taylor展开式与变分运算法则来得到。假定$h(x)$为函数$y(x)$的增量,那么对应$y(x)'$的增量为$h(x)'$,一个完整的变分问题,通常还会给出边界条件,由于在边界处必须得到强制满足,所以这个增量在边界处$h(x) = 0$才能保证原始问题的成立,即$h(a) = h(b)=0$。

如文章前述给出的泛函形式,它相应的增量为:

$$ \begin{aligned} \Delta I = I(y + h) - I(y) = \int_a ^b [F(x, y + h, y' + h') - F(x, y, y')]\mathrm{d}x \end{aligned} $$

对该式子应用Taylor展开,有:

$$ \Delta I = \int_a ^b [F_y(x, y, y')h - F_{y'}(x, y, y')h'] \mathrm{d}x + 高阶项\\ = \Delta I + o(h^2) $$

忽略高阶项,并应用分部积分法,可以得到:

$$ \Delta I = \int_a ^b [\frac{\partial F}{\partial y} - \frac{\mathrm{d}}{\partial x}(\frac{\partial F}{\partial y'})]h \mathrm{d}x + \frac{\partial F}{\partial y'}h|_{x=0} ^{x =b} $$

由于边界条件的限制,且为了使得泛函的变分为0,必须使得前面的积分项为0,由此得到泛函取得极值的条件,即欧拉方程,这里所给出的知识单变量情况下的形式。

$$ \frac{\partial F}{\partial y} - \frac{\mathrm{d}}{\partial x}(\frac{\partial F}{\partial y'}) = 0 $$

古典变分问题中,通过欧拉方程可以将变分问题的求解转化为一个微分方程来解决!这表明,变分问题与微分方程描述的问题是可以相互转化的(PDE转化为泛函极值,以后会谈到),物理问题的存在都是客观的,但是可以从不同的角度进行描述与解释;边值问题与求泛函极值问题是可以相互转化的,因为它们都是对同一个物理问题的数学描述。

这里,对于欧拉方程的推导并不重要,重要的一点是泛函取极值的条件,我们可以将其考虑为函数进行处理,使得通过泛函的变分为0,来确定极值。此外,将泛函极值问题转化为微分方程形式进行解决,只是表明了两者之间的一个联系,在实际中,因为微分方程的边界条件的限制、以及方程本身,基本无法得到解析求解,所以,将积分形式转换为微分形式进行求解不是一个明智的选择;更为普遍的是把微分方程通过变分法得到其等效积分形式,按照泛函极值问题来确定,因为极值问题的求解代价相比于PDE的求解要小的多,这也是为什么要研究泛函的原因,其价值在于能够为PDE的求解带来方便。偏微分方程往往描述的是一个边值问题,边值问题转化为泛函极值的确定问题,这一研究始终贯穿于变分法的学习中,它也是有限元方法的数学基础

Archives Tip
QR Code for this page
Tipping QR Code