"如果你不知道怎么精确求解，那就猜一个答案——然后优化它。"
变分原理是量子力学中最实用的武器之一：它保证你永远不会高估基态能量。

第7章变分原理：猜一个答案，优化它

7.1 故事：量子建筑师的竞标

23世纪，"量子建筑师事务所"承接了一项史无前例的工程：设计一颗人造原子的基态。客户要求电子云分布必须精确到皮米级，但方程太复杂，没有解析解。

首席建筑师苏然召集团队："微扰理论要求我们知道一个邻近的可解问题。但这次不一样——我们的系统远离任何已知的精确解。怎么办？"

"用变分法。"资深工程师老张说，"我们猜一个试探波函数，带几个可调参数。然后计算这个试探函数的期望值。变分原理告诉我们：无论猜得对不对，算出来的能量永远不会低于真实基态能量。"

"所以如果我们调整参数让能量最低，就最接近真实基态？"

"对。这就像竞标——你知道真实成本是底价，每次报价（试探函数）都不会低于底价。最低的报价最接近底价。"

核心洞察：变分原理将"求解微分方程"转化为"优化参数"——把量子力学问题变成微积分问题。

7.2 前置知识：泛函与变分法基础

在进入量子力学的变分原理之前，我们需要补充一些数学工具。变分法是处理"函数的函数"（泛函）的数学分支，它是理解变分原理的关键。

7.2.1 什么是泛函？

在普通微积分中，我们研究函数： $f: \mathbb{R} \to \mathbb{R}$ ，把一个数映射到另一个数。例如 $f(x) = x^2$ 。

在变分法中，我们研究泛函： $F: \mathcal{F} \to \mathbb{R}$ ，把一个函数映射到一个数。例如：

曲线长度： $L[y] = \int_a^b \sqrt{1 + [y'(x)]^2} dx$
泛函积分： $I[f] = \int_a^b f(x) dx$
量子力学中的能量期望值： $E[\psi] = \frac{\langle \psi | H | \psi \rangle}{\langle \psi | \psi \rangle}$

泛函 $E[\psi]$ 输入一个波函数 $\psi(x)$ ，输出一个实数（能量期望值）。我们的目标是找到使 $E[\psi]$ 最小的 $\psi$ 。

7.2.2 泛函的变分

类比函数的微分。对于函数 $f(x)$ ，微小改变 $x \to x + \delta x$ 导致 $df = f'(x)\delta x$ 。

对于泛函 $F[y]$ ，考虑函数的微小改变 $y(x) \to y(x) + \delta y(x)$ ：

$\delta F = F[y + \delta y] - F[y]$

如果泛函在 $y_0$ 处取极值，则对于任意小的 $\delta y$ ：

$\delta F = 0$

这就是泛函取极值的必要条件。

7.2.3 欧拉-拉格朗日方程

对于形如 $F[y] = \int_a^b L(y, y', x) dx$ 的泛函，变分 $\delta F = 0$ 给出著名的欧拉-拉格朗日方程：

$\frac{\partial L}{\partial y} - \frac{d}{dx}\frac{\partial L}{\partial y'} = 0$

例子：最短路径问题。在平面上两点间找长度最短的曲线。长度泛函 $L[y] = \int_{x_1}^{x_2} \sqrt{1 + (y')^2} dx$ 的欧拉-拉格朗日方程给出 $y'' = 0$ ，即直线。

7.2.4 瑞利商

在有限维线性代数中，对于厄米矩阵 $A$ ，瑞利商定义为：

$R(x) = \frac{x^\dagger A x}{x^\dagger x}$

定理：瑞利商的最小值等于 $A$ 的最小本征值 $\lambda_{\min}$ ，且当 $x$ 为对应本征向量时取到。

量子力学中的能量期望值就是瑞利商的无穷维推广。变分原理就是瑞利商在希尔伯特空间中的版本。

7.2.5 变分原理与薛定谔方程的等价性

变分原理 $\delta E[\psi] = 0$ 与薛定谔方程 $H|\psi\rangle = E|\psi\rangle$ 是等价的。

这说明：变分原理的最小值点就是薛定谔方程的解。变分法在精确求解的意义上与薛定谔方程完全等价；只是我们通常用有限参数的试探函数来近似这个最小值。

7.3 变分原理的理论基础

7.3.1 核心定理

变分原理：对于任意归一化的试探波函数 $\psi$ ：

$E_{\text{var}} = \langle \psi | H | \psi \rangle \geq E_{\text{gs}}$

其中 $E_{\text{gs}}$ 是真实的基态能量。试探函数的能量期望值永远不会低于真实基态。

7.3.2 为什么成立？

把 $\psi$ 按 $H$ 的本征态展开：

$\psi = \sum_n c_n |n\rangle, \quad \sum_n |c_n|^2 = 1$

则：

$\langle H \rangle = \sum_n |c_n|^2 E_n = E_1 + \sum_{n>1} |c_n|^2 (E_n - E_1) \geq E_1 = E_{\text{gs}}$

只有当 $\psi = |\text{gs}\rangle$ （完全正确的基态）时，等号才成立。

graph TD
    A["任意试探波函数 ψ"] -->|计算| B["⟨ψ|H|ψ⟩ = E_var"]
    B -->|变分原理保证| C["E_var ≥ E_gs"]
    C -->|"调整 ψ"| D["让 E_var 最小"]
    D --> E["最接近 E_gs 的试探函数"]
    
    style C fill:#e8f5e9
    style E fill:#fff3e0

7.3.3 与微扰理论的联系

在第6章中，我们学到微扰理论的二阶能量修正对于基态总是负的（ $E_1^{(2)} < 0$ ），这意味着二阶修正总是让基态能量降低。

变分原理给出了更强的保证：无论试探波函数怎么选，算出来的能量总是高于真实基态。二阶微扰的负修正，可以看作是试探波函数（未微扰基态）向真实基态靠拢时，能量下降的一个特例。

graph LR
    A[变分原理] -->|通用保证| B["E_var ≥ E_gs"]
    C[微扰理论] -->|基态特例| D["E⁽²⁾ < 0"]
    A -->|包含| C
    B -->|更强| D
    
    style A fill:#e8f5e9
    style B fill:#fff3e0

7.3.4 瑞利-里茨方法

瑞利-里茨（Rayleigh-Ritz）方法是变分原理的系统化实现：

选择一族试探波函数 $\psi(\alpha_1, \alpha_2, ...)$ ，含可调参数 $\{\alpha_i\}$
计算 $E(\{\alpha_i\}) = \langle \psi | H | \psi \rangle$
对每个 $\alpha_i$ 求偏导并令其为零： $\frac{\partial E}{\partial \alpha_i} = 0$
解这组方程，找到使 $E$ 最小的参数值
代回得到最佳试探函数和能量上界

graph TD
    A[选择试探函数族] -->|"含参数 α₁,α₂,..."| B["计算 E(α₁,α₂)"]
    B -->|"求偏导 ∂E/∂αᵢ = 0"| C[解方程组]
    C -->|极小值点| D[最优参数]
    D -->|代回| E["最佳能量上界
最接近 E_gs"]
    
    style D fill:#fff3e0
    style E fill:#e8f5e9

7.4 试探波函数的艺术

7.4.1 选择试探函数的原则

物理直觉：试探函数应包含对真实解的合理猜测
边界条件：满足波函数的基本约束（连续性、归一化、渐近行为）
可调参数：引入参数 $\alpha, \beta, ...$ 来优化
计算可行：期望值 $\langle H \rangle$ 必须能算出来

7.4.2 常见策略

高斯试探函数（谐振子型）：

$\psi(x) = \left(\frac{2\alpha}{\pi}\right)^{1/4} e^{-\alpha x^2}$

指数试探函数（氢原子型）：

$\psi(r) = \sqrt{\frac{\alpha^3}{\pi}} e^{-\alpha r}$

正交基展开（线性变分法）：

$\psi = \sum_{i=1}^N c_i \phi_i$

7.4.3 例题：用高斯试探函数估算谐振子基态

问题：用高斯试探函数 $\psi(x) = \left(\frac{2\alpha}{\pi}\right)^{1/4}e^{-\alpha x^2}$ 估算一维谐振子基态能量。

解答：

谐振子哈密顿量： $H = -\frac{\hbar^2}{2m}\frac{d^2}{dx^2} + \frac{1}{2}m\omega^2 x^2$

计算动能期望值：

$\langle T \rangle = -\frac{\hbar^2}{2m} \int_{-\infty}^{\infty} \psi^* \frac{d^2\psi}{dx^2} dx = \frac{\hbar^2 \alpha}{2m}$

计算势能期望值：

$\langle V \rangle = \frac{1}{2}m\omega^2 \int_{-\infty}^{\infty} x^2 |\psi|^2 dx = \frac{m\omega^2}{8\alpha}$

总能量期望值：

$E(\alpha) = \frac{\hbar^2 \alpha}{2m} + \frac{m\omega^2}{8\alpha}$

对 $\alpha$ 求极小值：

$\frac{dE}{d\alpha} = \frac{\hbar^2}{2m} - \frac{m\omega^2}{8\alpha^2} = 0$

解得：

$\alpha = \frac{m\omega}{2\hbar}$

代回：

$E_{\min} = \frac{\hbar\omega}{2}$

我们得到了精确解！ 因为谐振子的基态恰好就是高斯函数。

graph LR
    A[高斯试探函数] -->|"计算 ⟨T⟩ + ⟨V⟩"| B["E(α) = ℏ²α/2m + mω²/8α"]
    B -->|求极小值| C["α = mω/2ℏ"]
    C -->|代回| D["E_min = ℏω/2
精确解！"]
    
    style D fill:#e8f5e9

7.5 数值例子 I：无限深势阱的变分估算

7.5.1 问题描述

一维无限深势阱：

V(x) = \begin{cases} 0, & 0< x < L \\ \infty, & \text{其他} \end{cases}

精确基态能量： $E_1 = \frac{\pi^2\hbar^2}{2mL^2} \approx 4.9348 \frac{\hbar^2}{mL^2}$

精确基态波函数： $\psi_1(x) = \sqrt{\frac{2}{L}} \sin\left(\frac{\pi x}{L}\right)$

7.5.2 试探波函数

选择简单的多项式试探函数（满足边界条件 $\psi(0)=\psi(L)=0$ ）：

$\psi(x) = A x(L-x)$

这是一个抛物线，在势阱中心最大，边界处为零——符合物理直觉。

7.5.3 归一化

$\int_0^L |A|^2 x^2(L-x)^2 dx = |A|^2 \frac{L^5}{30} = 1$

$A = \sqrt{\frac{30}{L^5}}$

7.5.4 计算能量期望值

动能：

$\frac{d^2\psi}{dx^2} = -2A$

$\langle T \rangle = -\frac{\hbar^2}{2m} \int_0^L \psi \frac{d^2\psi}{dx^2} dx = \frac{\hbar^2}{m} A^2 \int_0^L x(L-x) dx$

$= \frac{\hbar^2}{m} \cdot \frac{30}{L^5} \cdot \frac{L^3}{6} = \frac{5\hbar^2}{mL^2}$

势能：在势阱内 $V=0$ ，所以 $\langle V \rangle = 0$ 。

7.5.5 结果与对比

$E_{\text{var}} = \frac{5\hbar^2}{mL^2} = 5 \frac{\hbar^2}{mL^2}$

与精确解对比：

精确： $E_1 \approx 4.9348 \frac{\hbar^2}{mL^2}$
变分： $E_{\text{var}} = 5 \frac{\hbar^2}{mL^2}$
误差仅约 1.3%

物理意义：试探函数（抛物线）与真实解（正弦曲线）形状不同，但变分法给出的能量非常接近真实值。这验证了变分原理的威力——即使"猜"得不完全对，能量估算仍然很好。

7.6 数值例子 II：氦原子基态的详细计算

7.6.1 物理设置

氦原子：核电荷 $Z=2$ ，两个电子。哈密顿量（原子单位， $\hbar = m_e = e = 1$ ）：

$H = -\frac{1}{2}\nabla_1^2 - \frac{1}{2}\nabla_2^2 - \frac{2}{r_1} - \frac{2}{r_2} + \frac{1}{r_{12}}$

最后一项是电子-电子排斥，使问题不可精确求解。

7.6.2 试探波函数与参数

物理直觉：每个电子受到另一个电子的"屏蔽"，感受到的有效核电荷小于 $2e$ 。

试探波函数用类氢波函数，但把核电荷 $Z=2$ 替换为有效核电荷 $Z_{\text{eff}}$ ：

$\psi = \frac{Z_{\text{eff}}^3}{\pi} e^{-Z_{\text{eff}}(r_1 + r_2)}$

7.6.3 期望值计算

动能（两个独立电子，核电荷为 $Z_{\text{eff}}$ ）：

$\langle T \rangle = 2 \times \frac{Z_{\text{eff}}^2}{2} = Z_{\text{eff}}^2$

电子-核吸引（真实核电荷 $Z=2$ ）：

$\langle V_{en} \rangle = 2 \times (-2Z_{\text{eff}}) = -4Z_{\text{eff}}$

电子-电子排斥（对于类氢波函数）：

$\langle V_{ee} \rangle = \frac{5}{8}Z_{\text{eff}}$

7.6.4 总能量与优化

$E(Z_{\text{eff}}) = Z_{\text{eff}}^2 - 4Z_{\text{eff}} + \frac{5}{8}Z_{\text{eff}} = Z_{\text{eff}}^2 - \frac{27}{8}Z_{\text{eff}}$

对 $Z_{\text{eff}}$ 求导：

$\frac{dE}{dZ_{\text{eff}}} = 2Z_{\text{eff}} - \frac{27}{8} = 0$

$Z_{\text{eff}} = \frac{27}{16} = 1.6875$

7.6.5 数值结果

代回能量表达式：

E = \left(\frac{27}{16}\right)^2 - \frac{27}{8} \times \frac{27}{16} = \frac{729}{256} - \frac{729}{128} = -\frac{729}{256} \approx -2.8477 \text{（原子单位）}

转换为 eV（1 原子单位 = 27.2 eV）：

$E = -2.8477 \times 27.2 \approx -77.5 \text{ eV}$

结果对比表：

方法	基态能量估算	误差
忽略电子排斥（ $Z=2$ 类氢）	$-108.8$ eV	偏大 29 eV
一阶微扰理论	$-74.8$ eV	偏大 4.2 eV
简单变分法（ $Z_{\text{eff}}=1.69$ ）	$-77.5$ eV	偏大 1.5 eV
更复杂的试探函数	$-78.8$ eV	偏大 0.2 eV
实验值	$-79.0$ eV	—

变分法的威力：用一个参数的调整，就把误差从 29 eV 降到 1.5 eV。

7.6.6 Hylleraas方法与关联波函数

1929年，挪威物理学家Hylleraas引入了包含 $r_{12} = |\vec{r}_1 - \vec{r}_2|$ 的试探函数：

$\psi = e^{-Z_{\text{eff}}(r_1 + r_2)} \cdot f(r_{12})$

用了仅6个参数，Hylleraas就得到了 $-78.98$ eV——与实验值仅差 $0.02$ eV！

历史意义：Hylleraas的工作是量子化学的里程碑。它证明了好的试探函数不仅要捕捉"单粒子"物理，还要捕捉"多粒子关联"——这正是现代量子化学方法（如组态相互作用CI和密度泛函理论DFT）的核心追求。

graph TD
    A[简单变分法] -->|独立电子近似| B["Z_eff = 1.69
误差 1.5 eV"]
    A -->|局限| C[忽略电子关联]
    D["Hylleraas 1929"] -->|"引入 r₁₂"| E[关联波函数]
    E -->|6个参数| F["-78.98 eV
误差 0.02 eV"]
    F -->|启发| G["现代量子化学
CI, DFT"]
    
    style F fill:#e8f5e9
    style G fill:#fff3e0

7.7 氢分子离子：化学键的量子起源

7.7.1 问题设置

$H_2^+$ ：两个质子 + 一个电子。电子在两个质子之间运动，形成化学键。

哈密顿量：

$H = -\frac{\hbar^2}{2m}\nabla^2 - \frac{e^2}{4\pi\varepsilon_0}\left(\frac{1}{r_1} + \frac{1}{r_2}\right)$

其中 $r_1, r_2$ 是电子到两个质子的距离。

7.7.2 分子轨道试探函数

物理直觉：电子可能在质子1附近，也可能在质子2附近。两个情况对称。

线性组合试探函数（LCAO）：

$\psi = c_1 \psi_1 + c_2 \psi_2$

由对称性， $c_1 = \pm c_2$ ：

成键轨道（对称， $c_1 = c_2$ ）：电子集中在两质子之间，能量降低
反键轨道（反对称， $c_1 = -c_2$ ）：电子在两质子外侧，能量升高

graph TD
    subgraph "H₂⁺的分子轨道"
        A["质子1 + 电子"] -->|叠加| C["成键轨道 σ
对称 + 电子在中间"]
        B["质子2 + 电子"] -->|叠加| C
        A -->|叠加| D["反键轨道 σ*
反对称 + 电子在外侧"]
        B -->|叠加| D
    end
    
    style C fill:#e8f5e9
    style D fill:#ffebee

7.7.3 数值例子：氢分子离子的能量曲线

重叠积分：

$S = \langle \psi_1 | \psi_2 \rangle = e^{-R/a_0}\left(1 + \frac{R}{a_0} + \frac{R^2}{3a_0^2}\right)$

其中 $R$ 是两个质子间距， $a_0$ 是玻尔半径。

哈密顿矩阵元：

H_{11} = H_{22} = E_1 + \frac{e^2}{4\pi\varepsilon_0 R} - \text{（电子与另一质子的吸引修正）} H_{12} = H_{21} = (E_1 + \frac{e^2}{4\pi\varepsilon_0 R})S - \text{（交换积分）}

能量本征值：

$E_\pm = \frac{H_{11} \pm H_{12}}{1 \pm S}$

$E_+$ （成键）：在 $R \approx 1.06$ Å 处有极小值，结合能约 2.7 eV
$E_-$ （反键）：单调递减，无束缚态

计算数值（ $R = 2a_0 \approx 1.06$ Å）：

$S \approx 0.58$
$E_+ \approx -15.4$ eV（相对于分离的 $H + H^+$ ，结合能约 2.7 eV）
实验值：结合能约 2.65 eV，键长约 1.06 Å

化学键的本质：当成键轨道形成时，电子在两质子之间的概率增加，有效屏蔽了质子间的库仑排斥，同时电子与两个质子都保持吸引——净效果是能量降低。

graph TD
    A["H₂⁺ 变分解"] -->|电子基态| B["成键轨道 σ"]
    B -->|核运动| C["振动量子化
v = 0,1,2,..."]
    C -->|整体转动| D["转动量子化
J = 0,1,2,..."]
    B -->|激发| E["电子跃迁
分子光谱"]
    
    style B fill:#e8f5e9
    style C fill:#fff3e0
    style D fill:#e3f2fd
    style E fill:#fce4ec

7.8 激发态的变分法

变分原理只保证基态能量是上界。对于激发态，我们需要额外约束。

7.8.1 正交约束变分法

定理：如果试探波函数 $\psi$ 与所有低能态正交，则：

$\langle \psi | H | \psi \rangle \geq E_{n+1}$

操作方式：要估算第一激发态，要求试探波函数与基态正交：

$\langle \psi_{\text{trial}} | \psi_{\text{gs}} \rangle = 0$

7.8.2 数值例子：谐振子第一激发态

问题：用变分法估算一维谐振子第一激发态能量。

解答：

已知基态是高斯函数（偶宇称），第一激发态必须是奇宇称。

选择试探函数 $\psi(x) = A x e^{-\alpha x^2}$ （奇函数，自动与基态正交）。

归一化：

$A^2 \int_{-\infty}^{\infty} x^2 e^{-2\alpha x^2} dx = A^2 \frac{\sqrt{\pi}}{2(2\alpha)^{3/2}} = 1$

$A = \left(\frac{4\alpha^3}{\pi}\right)^{1/4} \cdot \sqrt{2}$

动能：

$\langle T \rangle = \frac{3\hbar^2\alpha}{2m}$

势能：

$\langle V \rangle = \frac{3m\omega^2}{8\alpha}$

总能量：

$E(\alpha) = \frac{3\hbar^2\alpha}{2m} + \frac{3m\omega^2}{8\alpha}$

求极小值：