最小作用量原理
一种变分原理
最小作用量原理(principle of least action)又称平稳作用量原理(stationary action principle),在数学中称为变分原理。最小作用量原理是指系统在t1与t2之间的运动轨迹,是使得作用量取驻值的轨迹。当应用于一个机械系统的作用量时,可以得到此机械系统的运动方程。这原理的研究引导出经典力学约瑟夫·拉格朗日表述和哈密顿表述的发展。卡尔·雅可比(Jacobi)称最小作用量原理为分析力学之母。最小作用量原理是一条原理,因此它不能被证明,截止至2020年,所有已知的物理系统都可以用该形式处理。
最小作用量原理的原始思想可以追溯到公元前1世纪,希罗(Hero)提出的光的最短路程原理。最小作用量原理最早、最成功的应用是皮耶·德·费玛(Fermat)于1662年用“最短时间”代替“最短路径”,提出了费马原理皮埃尔·莫佩尔蒂(Maupertuis)力求在力学中找到最小作用量代替牛顿动力学方程,他在1744年正式提出了最小作用量原理。同年,长城欧拉(Euler)提出了变分法的基本方程,但在许多地方还依赖于几何论证。1746年,莫佩尔蒂继续撰写了有关最小作用量原理的文章。
通过最小作用量原理可以推导出系统运动方程牛顿第二运动定律纳维乔治·斯托克斯方程、麦克斯韦方程组热力学第一定律的基本方程等众多方程和定律。该原理仍然是现代物理学和数学的核心,在物理里,应用于热力学流体力学相对论量子力学粒子物理学和场论等 ;在数学里,该原理是莫尔斯理论的研究焦点。最小作用量原理有很多种应用例子,如:皮埃尔·莫佩尔蒂原理(Maupertuis's principle)和哈密顿原理(Hamilton's principle)。
定义
作用量
所有有质量物体的运动都具有一个共同的特点。不论是一个球抛向空中,还是行星围绕着太阳运动,与运动相关物体的能量都会存在一个量,称为作用量。
最小作用量原理
最小作用量原理的现代定义式为。它代表了人对于物理学几乎所有领域的最深刻理解,本质上表达的是通过提出自然是否在追求某个量的最小化或自然是否在寻求某种不变性来确定物理系统的行为。
简史
起源
最早出现“最小”这一观念是在亚里士多德时代,它表示许多用很少力气能做到的事,却用了很大的力气,多出来的部分都是无用的。在之后的发展中,这一观念一直影响着历代科学家和哲学家。最小作用量原理的原始思想是从对光现象的观察中起始的。公元前3世纪,欧几里得在视学著作《镜学》(Catoptrica)中提出光的反射定律,即入射角等于反射角。后来希腊工程师希罗(Hero)提出光的最短路程原理,认为光在空间任意两点间传播时总是沿长度最短的路径进行。公元2世纪,克罗狄斯·托勒密(Ptolemaeus)明确提出最小化的思想,认为光在反射过程中反射角和入射角相等
最小作用量原理最早、最成功的应用是法国物理学家皮耶·德·费玛(Fermat),1662年他用“最短时间”代替“最短路径”,提出了费马原理,认为光在媒质中任意两点间传播时所用时间最短。1682年,德国哲学家、数学家戈特弗里德·莱布尼茨(Leibniz)试图建立一个能支配于整个力学和光学过程的作用量概念,虽然他没有成功,但是对学者们的后续研究产生了重大影响。
正式提出
皮埃尔·莫佩尔蒂(Maupertuis)力求在力学中找到最小作用量,代替牛顿动力学方程,他在1744年正式提出了最小作用量原理,即自然界总是通过最简单的方法产生作用,如果一个物体必须没有任何阻碍地从一点到另一点,自然界就利用最短的途径和最快的速度来引导它。同年,瑞士数学家莱昂哈德·欧拉(Euler)提出了变分法的基本方程,奠定了变分法这门学科的独立基础。但长城欧拉的变分法在许多地方还依赖于几何论证,这激发许多科学家继续探索。1760年法国物理学家、数学家约瑟夫·拉格朗日(Lagrange)在纯分析的基础上建立了变分学,第一个对最小作用量原理作了正确的表述,并从动力学的普遍原理(达朗贝尔-拉格朗日)出发严格推导出牛顿动力学方程
后续发展
1788年,拉格朗日又在《动力分析》(Mécanique analytique)中以他自己的变分法为基础,通过描述系统历史路径上可能的(或虚拟的)位移引起的总和(或积分)的变化,推断出力学系统的某些性质,由此产生了 "广义坐标",推导出经典力学系统的拉格朗日方程,其中系统的动能与广义坐标、相应的广义力和时间有关。
1835年,哈密顿(Hamilton)发表了具有深远影响的论文《变分作用原理》与《波动力学的一般方法》。在这两篇论文中,哈密顿首先从费马原理出发,发展了几何光学的定律,进而证明,光线轨迹可以利用对单一数学量——特征函数的计算得出来。他发现,这一特征函数与对应单粒子动力学作用量函数的特征非常相似,而几何光学中光线轨迹又与牛顿力学单粒子的轨迹十分相似。卡尔·雅可比(Jacobi)于1842年解决了变分法是否总能找到最小值而非其他驻点(最大值或鞍点)的问题,他的大部分工作集中于二维曲面测地线上。莫尔斯在1920年代到30年代首次给出了明确的一般性陈述,形成了莫尔斯理论
1856年,哈密顿又对马吕斯(Malus)理论进行折射过程分析,利用最小作用量原理发展出一整套光学理论,他把力学中的最小作用量原理与几何光学中的费马原理进行类比,利用广义坐标、广义动量和拉格朗日函数定义出了哈密顿作用量函数,并发展成为了哈密顿原理,真正解决了皮埃尔·莫佩尔蒂的设想。
现代物理学阶段
1900年,马克斯·普朗克(Planck)为解释黑体辐射引入了能量子的概念,他认为作为建立统一的世界物理图景基础的最小作用量原理,是所有可逆过程的普遍原理。1915年,阿尔伯特·爱因斯坦(Einstein)和戴维·希尔伯特(Hilbert)分别找到了相应的作用量表达式,从而利用最小作用量原理建立了引力场方程。1918年,德国数学家艾米·诺特(Noether)证明了一个定理,揭示了最小作用量原理、对称性和守恒定律内在的统一性,指出对于作用量的每种对称性(即变换不变性)都有一个守恒定律与之对应。最小作用量原理正是这一客观事实的数学表述,它体现着物理实在的结构,这也是物理学家们对最小作用量原理更深刻的认识,为场论的研究找到了新研究方法。
1923年,路易·德布罗意(de Broglie)把光现象和力学现象做了类比。他表示,在经典力学中,质点的运动服从力学的最小作用量原理。1933 年,物理学家保罗·狄拉克(Dirac)在量子振幅干涉中发现了这一原理的量子力学基础,从而证明了这一原理可用于量子计算。随后施温格(Schwinger)和理查德·费曼(Feynman)独立地将这一原理应用到量子电动力学中。1948年,美国物理学家费曼从最小作用量原理出发创造了路径积分方法,这种方法是和埃尔温·薛定谔(Schrödinger)、海森伯格(Heisenberg)的方法并列的一种表述量子力学的等价方法。
20世纪80年代,弱电统一理论得到了证实,使科学家们坚定了弱作用、电磁作用、强作用的大统一理论以及关于4种相互作用的超大统一理论成功的信念。这种情况表明规范场理论证实了最小作用量原理的最高地位,促使学者们自觉地利用最小作用量原理来寻找新的物理规律,建立新的物理理论。
在20世纪取得重要进展的现代宇宙学,虽然还不成熟,但由最小作用量原理导出的惠勒-德维特(Wheeler-DeWitt)方程(相当于薛定谔方程)给出了许多有意义的结果,并因此形成了斯蒂芬·霍金无边界方案和林德、维金的隧道方案这两大主要的量子宇宙学学派。
原理
莫佩尔蒂-拉格朗日原理
考虑一个理想、稳定、保守的完整系统,动能是广义速度的二次齐次函数存在能量积分
,是对应着系统运动的能量常量。
在位形空间中,正路从始点到终点,起始和终止时刻分别为和,引入约瑟夫·拉格朗日作用量。如果要求在相同的始点和终点的变更轨道运动中,保持能量与正路能量相同,那么真实运动的运动量为驻定值。这就是最小作用量原理,这里的“最小”是历史上用语的延续,在实际情况中对应正路的作用量不一定是最小值,但一定是驻定值。
费马的表述
费马原理更正确的版本应是“平稳时间原理”,即光沿着所需时间平稳的路径传播,其中“平稳"可以是极大值、极小值或拐点。假设介质1、介质2的折射率分别为、,且。当光线以较小的角单射时,部分光进入介质2并产生折射,部分光被反射。它们间的相对强度取决于两种介质的折射率。斯涅尔定律为:光的反射定律、折射定律
从费马定理可以推导出斯涅尔定律,设当光线由点出发,经过两种光学介质分界面上点的反射后,再到达点。
的距离为,的距离为。假设,以点作为原点,的距离为,的距离为。因此,从经到的光程为。取对
导数,并令其为,则。可推导出光的反射定律
光在介质1与介质2的速度分别为,,光从点传播到点所需时间为
。取对的导数,并令其为,则
,可推导出。将速度与介质折射率关系带入,可证得折射定律。
几何光学中,费马原理可表示为。式中表示介质的折射率;表示路径元。
莫佩尔蒂的表述
莫佩尔蒂采取了一条与长城欧拉类似的原理,作为他解释光折射定律的基础。他认为一条光线从一种媒质中的点向另一种媒质中的点的行进仍可认为是最小作用的路径,倘若这种作用通过光线在每种媒质中行过的距离乘以光在其中的速度来度量的话。即是一极小值,他由此推出。
皮埃尔·莫佩尔蒂发表的最小作用量原理阐明,对于所有的自然现象,作用量趋向于最小值。他定义一个运动中的物体的作用量为,是物体质量、移动速度与移动距离的乘积,即。
莫佩尔蒂的原理可以解决弹性碰撞完全非弹性碰撞问题,可以导出杠杆原理,而且可以讨论光的折射问题等。以非弹性碰撞为例,取两个完全非弹性体,质量各为与,碰撞前速度为与,碰撞后的共同速度为,碰撞中物体速度变化为,的速度变化为,距离采用单位时间内通过的距离。皮埃尔·莫佩尔蒂认为这种情况下作用量就是质量乘以速度的平方。即系统的作用量为。原理要求作用量最小,所以有
,。
莫佩尔蒂的原理有不少含混不清的地方,既没有给“作用量”下明确定义,也没有给出这一乘积在哪一区间才适用,只是随着应用于每一不同的问题而赋以不同的意义。
欧拉-拉格朗日的表述
约瑟夫·拉格朗日是第一个对最小作用量原理做了正确表述的人,该表述为。研究定常完整约束系统,且广义力有势。在运动过程中系统的总机械能保持不变,为常数。这个关系在连接真实路径上两个固定位置的所有临近路径上成立,该式必须应用全变分,。完整系统的约瑟夫·拉格朗日原理为在系统的两个固定位置之间,拉格朗日作用量在真实路径上与具有同一总机械能常数的邻近路径上相比较而有极值莱昂哈德·欧拉拉格朗日最小作用量原理为或。式中表示广义动量;表示广义坐标;表示系统动能。
高斯最小约束原理
对于某时的同一位形和速度的一个力学系统,的函数对于真实运动的
是最小值。
赫兹最小曲率原理
服从平稳约束、且无主动力作用的质点系,在多维空间的代表点的真实运动具有不变的速度,而且它在多维空间运动的轨迹,与约束所允许的其他轨迹比较,真实运动的轨迹曲率最小。
达朗贝尔原理
达朗贝尔原理阐明,在一个系统内,如果所有约束力因为虚位移而做的虚功,总和是零,则这系统内的每一个粒子,所受到的外力与惯性力矢量和,与虚位移的点积,总和起来是零。
相关推导
系统运动方程
当系统的作用量已知时,利用最小作用量原理来推断系统运动方程是一种简洁的方法。考虑系统构型的微小变化
(式1),其边界条件为(式2)。约瑟夫·拉格朗日坐标的变分式(式1)产生了作用量的变分,(式3),其中,已使用对重复指标求和的惯例。由于
,可以写出(式4)。式2给定边界条件,当对积分时,式4的右边第一项不作贡献。因此,式3变为。由于作用量对系统的约瑟夫·拉格朗日坐标的微小变化稳定,故对于任何,,得到欧拉-拉格朗日方程,这就是系统的运动方程
牛顿第二定律
对于特别的物理系统,可以直接找到它们的拉格朗日量。最简单的例子是在势中运动的质点。在这种情况下,系统的拉格朗日量可简单地由粒子的动能与势能之间的差给出。在3维形式下,可以写出,其中,
是粒子的勒内·笛卡尔坐标,是粒子的速度,。欧拉-拉格朗日方程给出运动方程
(式5)。对于在势中的质点,式5是著名的牛顿第二运动定律
纳维-斯托克斯方程
流体受到的外力可分为体积力和表面应力两类。表面应力可用两阶对称应力张量来表示,用表示流体元速度矢量,为密度,为体积,为封闭表面积。通过拉格朗日函数可得作用量函数,然后按最小作用量原理得到适合广义牛顿黏性假设的粘性流体的纳维乔治·斯托克斯(Navier-Stokes)方程
麦克斯韦方程组
对于电荷在电磁场中的运动来说,选取作用量为,式中表示电荷;表示光速;表示粒子运动速度矢量;表示场的矢势;表示场的标势;表示粒子运动速度,标量。可得麦克斯韦方程组
热力学第一定律的基本方程
相对论热力学的拉格朗日函数,式中表示系统的热力学内能;表示系统的开尔文;表示系统的;表示系统的运动速度;表示系统的动量。若相对论热力学的最小作用量原理选取,可得相对论热力学第一定律的基本方程为。
路径积分
作用量是世界线的函数,在不同的世界线上有不同的作用量。微观粒子可以同时通过所有可能的世界线从到达,但通过不同的世界线到达时具有不同的相位。量子物理假定世界线上的相位等于。
设由通过世界线到达的概率幅为,则对于量子系统,由到达的总概率幅等于所有世界线概率幅的叠加:(式6),其中称为传播函数。它也是一个波函数,不过是由特殊点传播到终点的波函数,其物理意义是在发现电子后,再在探测到此电子的概率
。式6称为传播函数的路径求和公式。
为进行实际计算,把传播函数中的求和公式改写为对路径积分:
(式7)。其中表示在时间内,对连接、所有世界线的积分。式7称为传播函数的路径积分公式。
应用
流体动力学
对于惯性参照系下的黏性流体,选取适当的拉格朗日函数,利用变分计算,可得黏性流体的力学方程。可以证明,最小作用量原理普适于地球上实际发生的任意时限与任意体积的流体运动,以及各种流体动力学的原始方程模式的精确评估,对于流体力学模式的改进具有重要的实际意义。
纳米粒子运动学
物理学中最小作用量原理从功能角度去考察和比较客体一切可能的运动(经历),认为客体的实际运动(经历)可以由作用量求极值得出,是其中作用量最小的那个。AFM纳米操作问题符合最小作用量原理,当探针与被操作物体接触后对其施加作用力,使纳米物体的状态由静止变为运动,此时会得到一个使物体运动的探针最小作用力。在此基础上,根据对纳米颗粒进行作用力分析,依据探针推动纳米粒子的作用力最小原则,建立纳米粒子的运动学模型,可以预测推动操作后纳米粒子的位置,从而提高纳米操作的稳定性及操作效率。
热力学
在热力学理论发展过程中,最小作用量原理被推广应用于热力学领域并做了进一步研究,从作用量表达式先后导出了热力学的基本变换关系式。
相对论
广义相对论研究形成初步思想后,利用最小作用量原理推导出了广义相对论场方程,即爱因斯坦场方程(爱因斯坦-希尔伯特作用量)的广义相对论场方程。此外,相对论力学方程也可以用作用量的语言表述出来。
量子力学
从最小作用量原理出发,创造了一种表述量子力学的等价方法——路径积分方法。路径积分方法是处理量子力学问题的重要而又简明的方法。路径积分形式可以推广到普遍量子场论。此外,量子力学的薛定谔方程、克莱因-高登(Klein-Gordon)方程、保罗·狄拉克(Dirac)方程等,都可以用作用量的语言表述出来。
场论
经典场论和量子场论中,场方程和场的守恒量都可以由统一的最小作用量原理出发而得到。在统一场论以至弦律中,最小作用量原理担当着主要角色。建立理论实际上可归结为找出正确的拉格朗日密度的具体形式。随后,场的对称性也由它体现出来,可由它去严格定义。
意义
最小作用量原理以其简洁、优美的形式和对物理学各个领域的普适性揭示了自然界的某些基本规律和特征。只要找出对应于不同物理问题的作用量函数的表达式,就可用最小作用量原理求解该问题。从宇宙的创生到演化,极小到极大,最小作用量原理都扮演着重要的角色,统一说明了宇宙的整体特征,深刻地反映了物质世界的统一性。同时,在宇宙创生期,最小作用量原理发挥了关键作用,使得宇宙的诞生成为自然科学研究的一个重要领域。
最小作用量原理对力学研究有指导性意义。例如,在量子力学中,有一个作用量常数普朗克常数),给出了粒子性与波动性之间的联系,成为物理世界统一性的桥梁,它的量纲是。
以哲学的观点看,自然界中某些量尽可能保持最小值,这也许表明了自然界受到某些根本的节省机制的制约。自然界存在某些普遍或共同的规律,支配着不同领域里的不同过程。或者说,不同领域里的不同过程都处在广泛联系之中,因而都具有一些共同的特征,以至相似的规律和表现形式。最小作用量原理揭示了自然界的统一性、和谐性、对称性以及自然规律的逻辑简单性。自然界的各种事物和现象虽然千变万化、纷繁复杂,但是它们之间却存在深刻的内在联系,它们在本质上是相互关联的。
参考资料
..2024-03-31
《当代物理学进展》六.太原师范学院物理系.2024-04-08
Mécanique analytique.britannica.2024-04-08
..2024-04-08
..2024-04-01
目录
概述
定义
作用量
最小作用量原理
简史
起源
正式提出
后续发展
现代物理学阶段
原理
莫佩尔蒂-拉格朗日原理
费马的表述
莫佩尔蒂的表述
欧拉-拉格朗日的表述
高斯最小约束原理
赫兹最小曲率原理
达朗贝尔原理
相关推导
系统运动方程
牛顿第二定律
纳维-斯托克斯方程
麦克斯韦方程组
热力学第一定律的基本方程
路径积分
应用
流体动力学
纳米粒子运动学
热力学
相对论
量子力学
场论
意义
参考资料