"如果你不知道怎么精确求解,那就猜一个答案——然后优化它。"
变分原理是量子力学中最实用的武器之一:它保证你永远不会高估基态能量。
第7章 变分原理:猜一个答案,优化它
7.1 故事:量子建筑师的竞标
23世纪,"量子建筑师事务所"承接了一项史无前例的工程:设计一颗人造原子的基态。客户要求电子云分布必须精确到皮米级,但方程太复杂,没有解析解。
首席建筑师苏然召集团队:"微扰理论要求我们知道一个邻近的可解问题。但这次不一样——我们的系统远离任何已知的精确解。怎么办?"
"用变分法。"资深工程师老张说,"我们猜一个试探波函数,带几个可调参数。然后计算这个试探函数的期望值。变分原理告诉我们:无论猜得对不对,算出来的能量永远不会低于真实基态能量。"
"所以如果我们调整参数让能量最低,就最接近真实基态?"
"对。这就像竞标——你知道真实成本是底价,每次报价(试探函数)都不会低于底价。最低的报价最接近底价。"
核心洞察:变分原理将"求解微分方程"转化为"优化参数"——把量子力学问题变成微积分问题。
7.2 前置知识:泛函与变分法基础
在进入量子力学的变分原理之前,我们需要补充一些数学工具。变分法是处理"函数的函数"(泛函)的数学分支,它是理解变分原理的关键。
7.2.1 什么是泛函?
在普通微积分中,我们研究函数:f:R→R,把一个数映射到另一个数。例如 f(x)=x2。
在变分法中,我们研究泛函:F:F→R,把一个函数映射到一个数。例如:
- 曲线长度:L[y]=∫ab√1+[y′(x)]2dx
- 泛函积分:I[f]=∫abf(x)dx
- 量子力学中的能量期望值:E[ψ]=⟨ψ∣ψ⟩⟨ψ∣H∣ψ⟩
泛函 E[ψ] 输入一个波函数 ψ(x),输出一个实数(能量期望值)。我们的目标是找到使 E[ψ] 最小的 ψ。
7.2.2 泛函的变分
类比函数的微分。对于函数 f(x),微小改变 x→x+δx 导致 df=f′(x)δx。
对于泛函 F[y],考虑函数的微小改变 y(x)→y(x)+δy(x):
δF=F[y+δy]−F[y]
如果泛函在 y0 处取极值,则对于任意小的 δy:
δF=0
这就是泛函取极值的必要条件。
7.2.3 欧拉-拉格朗日方程
对于形如 F[y]=∫abL(y,y′,x)dx 的泛函,变分 δF=0 给出著名的欧拉-拉格朗日方程:
∂y∂L−dxd∂y′∂L=0
例子:最短路径问题。在平面上两点间找长度最短的曲线。长度泛函 L[y]=∫x1x2√1+(y′)2dx 的欧拉-拉格朗日方程给出 y′′=0,即直线。
7.2.4 瑞利商
在有限维线性代数中,对于厄米矩阵 A,瑞利商定义为:
R(x)=x†xx†Ax
定理:瑞利商的最小值等于 A 的最小本征值 λmin,且当 x 为对应本征向量时取到。
量子力学中的能量期望值就是瑞利商的无穷维推广。变分原理就是瑞利商在希尔伯特空间中的版本。
7.2.5 变分原理与薛定谔方程的等价性
变分原理 δE[ψ]=0 与薛定谔方程 H∣ψ⟩=E∣ψ⟩ 是等价的。
证明概要:对 E[ψ]=⟨ψ∣H∣ψ⟩/⟨ψ∣ψ⟩ 取变分,令 δE=0,利用 δ⟨ψ∣ψ⟩=0(归一化约束),得到 H∣ψ⟩=E∣ψ⟩。
这说明:变分原理的最小值点就是薛定谔方程的解。变分法在精确求解的意义上与薛定谔方程完全等价;只是我们通常用有限参数的试探函数来近似这个最小值。
7.3 变分原理的理论基础
7.3.1 核心定理
变分原理:对于任意归一化的试探波函数 ψ:
Evar=⟨ψ∣H∣ψ⟩≥Egs
其中 Egs 是真实的基态能量。试探函数的能量期望值永远不会低于真实基态。
7.3.2 为什么成立?
把 ψ 按 H 的本征态展开:
ψ=n∑cn∣n⟩,n∑∣cn∣2=1
则:
⟨H⟩=n∑∣cn∣2En=E1+n>1∑∣cn∣2(En−E1)≥E1=Egs
只有当 ψ=∣gs⟩(完全正确的基态)时,等号才成立。
graph TD
A["任意试探波函数 ψ"] -->|计算| B["⟨ψ|H|ψ⟩ = E_var"]
B -->|变分原理保证| C["E_var ≥ E_gs"]
C -->|"调整 ψ"| D["让 E_var 最小"]
D --> E["最接近 E_gs 的试探函数"]
style C fill:#e8f5e9
style E fill:#fff3e0 7.3.3 与微扰理论的联系
在第6章中,我们学到微扰理论的二阶能量修正对于基态总是负的(E1(2)<0),这意味着二阶修正总是让基态能量降低。
变分原理给出了更强的保证:无论试探波函数怎么选,算出来的能量总是高于真实基态。二阶微扰的负修正,可以看作是试探波函数(未微扰基态)向真实基态靠拢时,能量下降的一个特例。
graph LR
A[变分原理] -->|通用保证| B["E_var ≥ E_gs"]
C[微扰理论] -->|基态特例| D["E⁽²⁾ < 0"]
A -->|包含| C
B -->|更强| D
style A fill:#e8f5e9
style B fill:#fff3e0 7.3.4 瑞利-里茨方法
瑞利-里茨(Rayleigh-Ritz)方法是变分原理的系统化实现:
- 选择一族试探波函数 ψ(α1,α2,...),含可调参数 {αi}
- 计算 E({αi})=⟨ψ∣H∣ψ⟩
- 对每个 αi 求偏导并令其为零:∂αi∂E=0
- 解这组方程,找到使 E 最小的参数值
- 代回得到最佳试探函数和能量上界
graph TD
A[选择试探函数族] -->|"含参数 α₁,α₂,..."| B["计算 E(α₁,α₂)"]
B -->|"求偏导 ∂E/∂αᵢ = 0"| C[解方程组]
C -->|极小值点| D[最优参数]
D -->|代回| E["最佳能量上界
最接近 E_gs"]
style D fill:#fff3e0
style E fill:#e8f5e9
7.4 试探波函数的艺术
7.4.1 选择试探函数的原则
- 物理直觉:试探函数应包含对真实解的合理猜测
- 边界条件:满足波函数的基本约束(连续性、归一化、渐近行为)
- 可调参数:引入参数 α,β,... 来优化
- 计算可行:期望值 ⟨H⟩ 必须能算出来
7.4.2 常见策略
高斯试探函数(谐振子型):
ψ(x)=(π2α)1/4e−αx2
指数试探函数(氢原子型):
ψ(r)=√πα3e−αr
正交基展开(线性变分法):
ψ=i=1∑Nciϕi
7.4.3 例题:用高斯试探函数估算谐振子基态
问题:用高斯试探函数 ψ(x)=(π2α)1/4e−αx2 估算一维谐振子基态能量。
解答:
谐振子哈密顿量:H=−2mℏ2dx2d2+21mω2x2
计算动能期望值:
⟨T⟩=−2mℏ2∫−∞∞ψ∗dx2d2ψdx=2mℏ2α
计算势能期望值:
⟨V⟩=21mω2∫−∞∞x2∣ψ∣2dx=8αmω2
总能量期望值:
E(α)=2mℏ2α+8αmω2
对 α 求极小值:
dαdE=2mℏ2−8α2mω2=0
解得:
α=2ℏmω
代回:
Emin=2ℏω
我们得到了精确解! 因为谐振子的基态恰好就是高斯函数。
graph LR
A[高斯试探函数] -->|"计算 ⟨T⟩ + ⟨V⟩"| B["E(α) = ℏ²α/2m + mω²/8α"]
B -->|求极小值| C["α = mω/2ℏ"]
C -->|代回| D["E_min = ℏω/2
精确解!"]
style D fill:#e8f5e9
7.5 数值例子 I:无限深势阱的变分估算
7.5.1 问题描述
一维无限深势阱:
V(x) = \begin{cases} 0, & 0< x < L \\ \infty, & \text{其他} \end{cases}
精确基态能量:E1=2mL2π2ℏ2≈4.9348mL2ℏ2
精确基态波函数:ψ1(x)=√L2sin(Lπx)
7.5.2 试探波函数
选择简单的多项式试探函数(满足边界条件 ψ(0)=ψ(L)=0):
ψ(x)=Ax(L−x)
这是一个抛物线,在势阱中心最大,边界处为零——符合物理直觉。
7.5.3 归一化
∫0L∣A∣2x2(L−x)2dx=∣A∣230L5=1
A=√L530
7.5.4 计算能量期望值
动能:
dx2d2ψ=−2A
⟨T⟩=−2mℏ2∫0Lψdx2d2ψdx=mℏ2A2∫0Lx(L−x)dx
=mℏ2⋅L530⋅6L3=mL25ℏ2
势能:在势阱内 V=0,所以 ⟨V⟩=0。
7.5.5 结果与对比
Evar=mL25ℏ2=5mL2ℏ2
与精确解对比:
- 精确:E1≈4.9348mL2ℏ2
- 变分:Evar=5mL2ℏ2
- 误差仅约 1.3%
物理意义:试探函数(抛物线)与真实解(正弦曲线)形状不同,但变分法给出的能量非常接近真实值。这验证了变分原理的威力——即使"猜"得不完全对,能量估算仍然很好。
7.6 数值例子 II:氦原子基态的详细计算
7.6.1 物理设置
氦原子:核电荷 Z=2,两个电子。哈密顿量(原子单位,ℏ=me=e=1):
H=−21∇12−21∇22−r12−r22+r121
最后一项是电子-电子排斥,使问题不可精确求解。
7.6.2 试探波函数与参数
物理直觉:每个电子受到另一个电子的"屏蔽",感受到的有效核电荷小于 2e。
试探波函数用类氢波函数,但把核电荷 Z=2 替换为有效核电荷 Zeff:
ψ=πZeff3e−Zeff(r1+r2)
7.6.3 期望值计算
动能(两个独立电子,核电荷为 Zeff):
⟨T⟩=2×2Zeff2=Zeff2
电子-核吸引(真实核电荷 Z=2):
⟨Ven⟩=2×(−2Zeff)=−4Zeff
电子-电子排斥(对于类氢波函数):
⟨Vee⟩=85Zeff
7.6.4 总能量与优化
E(Zeff)=Zeff2−4Zeff+85Zeff=Zeff2−827Zeff
对 Zeff 求导:
dZeffdE=2Zeff−827=0
Zeff=1627=1.6875
7.6.5 数值结果
代回能量表达式:
E = \left(\frac{27}{16}\right)^2 - \frac{27}{8} \times \frac{27}{16} = \frac{729}{256} - \frac{729}{128} = -\frac{729}{256} \approx -2.8477 \text{(原子单位)}
转换为 eV(1 原子单位 = 27.2 eV):
E=−2.8477×27.2≈−77.5 eV
结果对比表:
| 方法 | 基态能量估算 | 误差 |
|---|
| 忽略电子排斥(Z=2 类氢) | −108.8 eV | 偏大 29 eV |
| 一阶微扰理论 | −74.8 eV | 偏大 4.2 eV |
| 简单变分法(Zeff=1.69) | −77.5 eV | 偏大 1.5 eV |
| 更复杂的试探函数 | −78.8 eV | 偏大 0.2 eV |
| 实验值 | −79.0 eV | — |
变分法的威力:用一个参数的调整,就把误差从 29 eV 降到 1.5 eV。
7.6.6 Hylleraas方法与关联波函数
1929年,挪威物理学家Hylleraas引入了包含 r12=∣r⃗1−r⃗2∣ 的试探函数:
ψ=e−Zeff(r1+r2)⋅f(r12)
用了仅6个参数,Hylleraas就得到了 −78.98 eV——与实验值仅差 0.02 eV!
历史意义:Hylleraas的工作是量子化学的里程碑。它证明了好的试探函数不仅要捕捉"单粒子"物理,还要捕捉"多粒子关联"——这正是现代量子化学方法(如组态相互作用CI和密度泛函理论DFT)的核心追求。
graph TD
A[简单变分法] -->|独立电子近似| B["Z_eff = 1.69
误差 1.5 eV"]
A -->|局限| C[忽略电子关联]
D["Hylleraas 1929"] -->|"引入 r₁₂"| E[关联波函数]
E -->|6个参数| F["-78.98 eV
误差 0.02 eV"]
F -->|启发| G["现代量子化学
CI, DFT"]
style F fill:#e8f5e9
style G fill:#fff3e0
7.7 氢分子离子:化学键的量子起源
7.7.1 问题设置
H2+:两个质子 + 一个电子。电子在两个质子之间运动,形成化学键。
哈密顿量:
H=−2mℏ2∇2−4πε0e2(r11+r21)
其中 r1,r2 是电子到两个质子的距离。
7.7.2 分子轨道试探函数
物理直觉:电子可能在质子1附近,也可能在质子2附近。两个情况对称。
线性组合试探函数(LCAO):
ψ=c1ψ1+c2ψ2
由对称性,c1=±c2:
- 成键轨道(对称,c1=c2):电子集中在两质子之间,能量降低
- 反键轨道(反对称,c1=−c2):电子在两质子外侧,能量升高
graph TD
subgraph "H₂⁺的分子轨道"
A["质子1 + 电子"] -->|叠加| C["成键轨道 σ
对称 + 电子在中间"]
B["质子2 + 电子"] -->|叠加| C
A -->|叠加| D["反键轨道 σ*
反对称 + 电子在外侧"]
B -->|叠加| D
end
style C fill:#e8f5e9
style D fill:#ffebee 7.7.3 数值例子:氢分子离子的能量曲线
重叠积分:
S=⟨ψ1∣ψ2⟩=e−R/a0(1+a0R+3a02R2)
其中 R 是两个质子间距,a0 是玻尔半径。
哈密顿矩阵元:
H_{11} = H_{22} = E_1 + \frac{e^2}{4\pi\varepsilon_0 R} - \text{(电子与另一质子的吸引修正)} H_{12} = H_{21} = (E_1 + \frac{e^2}{4\pi\varepsilon_0 R})S - \text{(交换积分)}
能量本征值:
E±=1±SH11±H12
- E+(成键):在 R≈1.06 Å 处有极小值,结合能约 2.7 eV
- E−(反键):单调递减,无束缚态
计算数值(R=2a0≈1.06 Å):
- S≈0.58
- E+≈−15.4 eV(相对于分离的 H+H+,结合能约 2.7 eV)
- 实验值:结合能约 2.65 eV,键长约 1.06 Å
化学键的本质:当成键轨道形成时,电子在两质子之间的概率增加,有效屏蔽了质子间的库仑排斥,同时电子与两个质子都保持吸引——净效果是能量降低。
graph TD
A["H₂⁺ 变分解"] -->|电子基态| B["成键轨道 σ"]
B -->|核运动| C["振动量子化
v = 0,1,2,..."]
C -->|整体转动| D["转动量子化
J = 0,1,2,..."]
B -->|激发| E["电子跃迁
分子光谱"]
style B fill:#e8f5e9
style C fill:#fff3e0
style D fill:#e3f2fd
style E fill:#fce4ec
7.8 激发态的变分法
变分原理只保证基态能量是上界。对于激发态,我们需要额外约束。
7.8.1 正交约束变分法
定理:如果试探波函数 ψ 与所有低能态正交,则:
⟨ψ∣H∣ψ⟩≥En+1
操作方式:要估算第一激发态,要求试探波函数与基态正交:
⟨ψtrial∣ψgs⟩=0
7.8.2 数值例子:谐振子第一激发态
问题:用变分法估算一维谐振子第一激发态能量。
解答:
已知基态是高斯函数(偶宇称),第一激发态必须是奇宇称。
选择试探函数 ψ(x)=Axe−αx2(奇函数,自动与基态正交)。
归一化:
A2∫−∞∞x2e−2αx2dx=A22(2α)3/2√π=1
A=(π4α3)1/4⋅√2
动能:
⟨T⟩=2m3ℏ2α
势能:
⟨V⟩=8α3mω2
总能量:
E(α)=2m3ℏ2α+8α3mω2
求极小值:
α=2ℏmω
代回:
E=23ℏω
这正是第一激发态的精确能量!因为试探函数恰好就是真实的第一激发态。
7.8.3 线性变分法与激发态
在线性变分法中,我们把试探函数展开为有限基组的线性组合:
ψ=i=1∑Nciϕi
变分问题转化为求解 N×N 矩阵的本征值问题。最小的本征值对应基态,次小的对应第一激发态,以此类推。
优点:一次计算同时得到多个能级的近似!
缺点:高激发态的精度通常不如低激发态,因为基组对高能态的覆盖不足。
7.9 与其他章节的联系
变分原理与量子力学的其他核心主题有着深刻的交织:
graph TD
A["第7章 变分原理"] -->|基态上界| B["第6章 微扰理论
二阶修正使能量降低"]
A -->|试探波函数| C["第8章 WKB近似
另一种近似策略"]
A -->|分子轨道| D["第11章 散射
LCAO的极限形式"]
A -->|线性变分| E["量子化学基础
Hartree-Fock"]
style A fill:#e8f5e9
style B fill:#fff3e0
style C fill:#e3f2fd
style D fill:#fce4ec
style E fill:#f3e5f5
7.10 本章总结
graph TD
A[第7章核心] --> B[变分原理]
A --> C[试探波函数]
A --> D[氦原子]
A --> E[氢分子离子]
A --> F[激发态变分]
B -->|保证| G["E_var ≥ E_gs"]
C -->|策略| H["物理直觉 + 可调参数"]
D -->|有效核电荷| I["Z_eff = 1.69
误差 1.5 eV"]
D -->|Hylleraas| J["关联波函数
误差 0.02 eV"]
E -->|LCAO| K["成键/反键轨道
化学键起源"]
F -->|正交约束| L[激发态上界]
G --> M["优化参数
逼近真实解"]
H --> M
I --> N["多电子原子
近似方法"]
J --> N
K --> O[量子化学基础]
L --> P["线性变分法
多能级同时求解"]
style M fill:#e8f5e9
style N fill:#fff3e0
style O fill:#e3f2fd
style P fill:#fce4ec带走的三句话:
- 变分原理保证试探函数的能量不会低于真实基态——它是量子力学中的"最低报价法则"。
- 好的试探函数是科学与艺术的结合:物理直觉决定形状,可调参数优化精度。
- 化学键是量子力学现象:电子波函数在两核间叠加,降低系统总能量。
"变分法不是作弊——它是量子力学中最诚实的近似方法,因为它明确告诉你:我只会高估,不会低估。" —— Griffiths
7.11 练习与思考
谐振子试探函数:用高斯试探函数 ψ(x)=(π2α)1/4e−αx2 估算谐振子基态能量。计算 ⟨H⟩ 并对 α 求极小值。你得到精确解了吗?为什么?
无限深势阱变分法:用试探函数 ψ(x)=x(L−x) 计算无限深势阱基态能量,并与精确解 E1=π2ℏ2/(2mL2) 比较。误差是多少?
氦原子变分法:推导简单变分法中 ⟨H⟩ 关于 Zeff 的表达式,验证 Zeff=27/16=1.6875 时取极小值。计算此时的能量并与实验值比较。
激发态变分法:证明如果试探波函数与基态正交,则其能量期望值是第一激发态的上界。用谐振子的奇函数试探函数验证这一点。
氢分子离子:定性解释为什么反对称组合(c1=−c2)是反键的。提示:在质子连线的中点处,对称波函数有极大值,反对称波函数有节点(零点)。