第十一章电子的相对论理论：狄拉克方程的革命

"这个方程似乎能解释很多东西，但它有这些负能量解，我无法理解。"
—— Paul Dirac, 回忆发现正电子的时刻

故事引入：双面硬币

2073年，考古队在旧时代实验室的废墟中发现了一台古怪的"自旋共振仪"。研究员陈默启动设备后，粒子束在磁场中分裂成两道——不是两道对称的弧线，而是一道向上、一道向下，仿佛每个电子都携带一枚"双面硬币"。更令人震惊的是，当能量超过某个阈值时，检测屏上竟出现了与电子质量相同但电荷相反的轨迹。陈默的手微微颤抖：这就是传说中的"反物质"吗？电子如何在高速运动时保持概率守恒？为什么自旋必须取半整数值？这些问题的答案，都藏在1928年那个冬天——一位28岁的英国年轻人写下了一个方程，它不仅统一了量子力学与狭义相对论，还预言了整个反物质世界的存在。

前置知识：狭义相对论基础

在Dirac写下他的方程之前，我们需要理解狭义相对论的核心框架。这不仅是数学准备，更是理解Dirac"为什么要这样做"的物理动机。

相对性原理与洛伦兹变换

爱因斯坦1905年的狭义相对论建立在两条公理上：

相对性原理：物理定律在所有惯性参考系中形式相同
光速不变原理：真空中的光速 $c$ 对所有观察者都相同

从这两条公理出发，可以推导出洛伦兹变换——联系两个相对匀速运动的惯性系的坐标变换。

设参考系 $S'$ 以速度 $v$ 沿 $x$ 轴相对 $S$ 运动，则坐标变换为：

$x' = \gamma(x - vt)$

$t' = \gamma\left(t - \frac{vx}{c^2}\right)$

$y' = y$

$z' = z$

其中 洛伦兹因子：

$\gamma = \frac{1}{\sqrt{1 - v^2/c^2}} = \frac{1}{\sqrt{1 - \beta^2}}, \quad \beta = \frac{v}{c}$

四维矢量

相对论的自然语言是四维时空。定义四维坐标：

$x^\mu = (ct, x, y, z) = (ct, \mathbf{r})$

度规张量（闵可夫斯基度规）：

$g_{\mu\nu} = \text{diag}(1, -1, -1, -1)$

两个事件之间的时空间隔：

$ds^2 = g_{\mu\nu} dx^\mu dx^\nu = c^2dt^2 - dx^2 - dy^2 - dz^2$

间隔 $ds^2$ 是洛伦兹不变量——在所有惯性系中数值相同。

四维动量与能动量关系

定义四维动量：

$p^\mu = (E/c, \mathbf{p}) = (mc\gamma, m\gamma\mathbf{v})$

其不变量（在所有参考系中相同）：

$p^\mu p_\mu = \frac{E^2}{c^2} - \mathbf{p}^2 = m^2c^2$

这就是著名的相对论性能量-动量关系：

$E^2 = (pc)^2 + (mc^2)^2$

展开能量：

$E = \gamma mc^2 = \frac{mc^2}{\sqrt{1 - v^2/c^2}} = mc^2 + \frac{1}{2}mv^2 + \frac{3}{8}m\frac{v^4}{c^2} + \cdots$

第一项 $mc^2$ 是静止能量；第二项 $\frac{1}{2}mv^2$ 是非相对论动能；高阶项是相对论修正。

数值例题：验证洛伦兹变换的不变性

题目：在参考系 $S$ 中，事件1发生在 $(t_1 = 0, x_1 = 0)$ ，事件2发生在 $(t_2 = 10^{-8} \text{ s}, x_2 = 3 \text{ m})$ 。参考系 $S'$ 以 $v = 0.6c$ 沿 $x$ 轴运动。计算：

(a) $S$ 系中的间隔 $ds^2$
(b) $S'$ 系中事件2的坐标 $(t'_2, x'_2)$
© 验证 $S'$ 系中的间隔相同
(d) 这两个事件的时间顺序在两个参考系中是否相同？（讨论因果性）

解答：

(a) $S$ 系中的间隔：

$ds^2 = c^2(\Delta t)^2 - (\Delta x)^2 = (3 \times 10^8)^2 \times (10^{-8})^2 - 3^2$

$ds^2 = 9 - 9 = 0$

间隔为零！这意味着两个事件之间可以通过光信号联系（光锥上的事件）。

(b) 洛伦兹因子：

$\gamma = \frac{1}{\sqrt{1 - 0.6^2}} = \frac{1}{0.8} = 1.25$

$S'$ 系中的坐标：

$x'_2 = \gamma(x_2 - vt_2) = 1.25 \times (3 - 0.6 \times 3 \times 10^8 \times 10^{-8}) = 1.25 \times (3 - 1.8) = 1.5 \text{ m}$

$t'_2 = \gamma\left(t_2 - \frac{vx_2}{c^2}\right) = 1.25 \times \left(10^{-8} - \frac{0.6 \times 3 \times 10^8 \times 3}{(3 \times 10^8)^2}\right)$

$t'_2 = 1.25 \times \left(10^{-8} - 0.6 \times 10^{-8}\right) = 1.25 \times 0.4 \times 10^{-8} = 0.5 \times 10^{-8} \text{ s}$

ds'^2 = c^2(\Delta t')^2 - (\Delta x')^2 = 9 \times (0.5 \times 10^{-8})^2 - (1.5)^2 ds'^2 = 9 \times 0.25 \times 10^{-16} - 2.25 = 2.25 \times 10^{-16} \times 9 \times 10^{16} \text{ ???}

让我重新计算：

$c\Delta t' = 3 \times 10^8 \times 0.5 \times 10^{-8} = 1.5 \text{ m}$

所以：

ds'^2 = (c\Delta t')^2 - (\Delta x')^2 = (1.5)^2 - (1.5)^2 = 0 \checkmark

(d) 时间顺序：

在 $S$ 系中： $t_2 - t_1 = 10^{-8} \text{ s} > 0$ ，事件2在事件1之后
在 $S'$ 系中： $t'_2 - t'_1 = 0.5 \times 10^{-8} \text{ s} > 0$ ，事件2仍在事件1之后

由于间隔为零（类光间隔），两个事件可以通过光信号联系，因此因果性在所有参考系中保持不变。如果事件是类空间隔（ $ds^2 < 0$ ），时间顺序在不同参考系中可能反转，但这些事件没有因果联系。

graph TD
    A[相对性原理] --> B[光速不变]
    B --> C[洛伦兹变换]
    C --> D[四维时空]
    D --> E[时空间隔不变]
    E --> F["类时: ds²>0"]
    E --> G["类光: ds²=0"]
    E --> H["类空: ds²<0"]
    F --> I[因果联系确定]
    G --> J[光信号联系]
    H --> K[无因果联系]
    style A fill:#1a1a2e,color:#fff
    style E fill:#e94560,color:#fff
    style I fill:#ffd93d,color:#000

11.1 危机：薛定谔方程的相对论缺陷

11.1.1 非相对论性量子力学的边界

薛定谔方程：

$i\hbar \frac{\partial \psi}{\partial t} = \left(-\frac{\hbar^2}{2m}\nabla^2 + V\right)\psi$

是基于非相对论性能量-动量关系 $E = \frac{p^2}{2m} + V$ 构建的。但当我们面对高速电子（例如在原子核附近，电子速度 $v \sim \alpha c \approx \frac{c}{137}$ ）时，必须考虑相对论效应。

狭义相对论给出的能量-动量关系是：

$E^2 = (pc)^2 + (m_0 c^2)^2$

如果我们天真地做"算符替换" $E \rightarrow i\hbar \frac{\partial}{\partial t}$ ， $p_i \rightarrow -i\hbar \frac{\partial}{\partial x_i}$ ，会得到克莱因-戈尔登方程：

$\left(\frac{1}{c^2}\frac{\partial^2}{\partial t^2} - \nabla^2 + \frac{m_0^2 c^2}{\hbar^2}\right)\psi = 0$

11.1.2 克莱因-戈尔登方程的问题

克莱因-戈尔登方程是洛伦兹不变的，但它有两个致命缺陷：

含时间的二阶导数：需要同时指定初始波函数 $\psi(\mathbf{r}, 0)$ 和其时间导数 $\dot{\psi}(\mathbf{r}, 0)$ ，这与量子力学的概率诠释不兼容——概率密度 $\rho = |\psi|^2$ 不再是正定的守恒量。
负能量解： $E = \pm\sqrt{p^2 c^2 + m_0^2 c^4}$ 包含负能分支。在非相对论极限下，我们可以忽略负能量解；但相对论性理论中，它们无法被简单地丢弃。

graph TD
    A["相对论性能量\nE²=p²c²+m²c⁴"] --> B{"如何做量子化?"}
    B -->|"直接替换"| C["克莱因-戈尔登方程\n∂²/∂t² - ∇² + m²"]
    C --> D["问题1: 二阶时间导数\n概率不守恒"]
    C --> E["问题2: 负能量解\nE=-√(p²c²+m²c⁴)"]
    D --> F["Dirac的洞见:\n需要一阶方程!"]
    E --> F

11.2 狄拉克方程的诞生：开平方的艺术

11.2.1 因式分解的数学挑战

Dirac的天才在于：他试图对能量-动量关系"开平方"，将其写为一阶线性的形式。

假设存在一组系数 $\gamma^\mu = (\gamma^0, \gamma^1, \gamma^2, \gamma^3)$ 使得：

$E = \gamma^0 (\gamma^1 p_x c + \gamma^2 p_y c + \gamma^3 p_z c + \gamma^4 m c^2)$

更准确地说，Dirac要求：

$(\gamma^\mu p_\mu + m c)(\gamma^\nu p_\nu - m c) = p^\mu p_\mu - m^2 c^2 = 0$

展开后，这要求 $\gamma$ 矩阵满足狄拉克代数：

$\{\gamma^\mu, \gamma^\nu\} = 2g^{\mu\nu}$

其中 $g^{\mu\nu} = \text{diag}(1, -1, -1, -1)$ 是闵可夫斯基度规，反对易子定义为 $\{A, B\} = AB + BA$ 。

11.2.2 γ矩阵的显式表示

Dirac代数至少需要 $4 \times 4$ 矩阵实现。最常用的表示（Dirac-Pauli表示）为：

$\gamma^0 = \begin{pmatrix} I & 0 \\ 0 & -I \end{pmatrix}, \quad \gamma^i = \begin{pmatrix} 0 & \sigma^i \\ -\sigma^i & 0 \end{pmatrix}$

其中 $\sigma^i$ 是泡利矩阵：

$\sigma^1 = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}, \quad \sigma^2 = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}, \quad \sigma^3 = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}$

验证 $\{\gamma^\mu, \gamma^\nu\} = 2g^{\mu\nu}$ ：

$(\gamma^0)^2 = I = g^{00}$
$(\gamma^i)^2 = \begin{pmatrix} 0 & \sigma^i \\ -\sigma^i & 0 \end{pmatrix}\begin{pmatrix} 0 & \sigma^i \\ -\sigma^i & 0 \end{pmatrix} = \begin{pmatrix} -(\sigma^i)^2 & 0 \\ 0 & -(\sigma^i)^2 \end{pmatrix} = -I = g^{ii}$
$\{\gamma^0, \gamma^i\} = 0$ （因为 $\sigma^i$ 和 $-\sigma^i$ 抵消）

graph LR
    subgraph "γ矩阵的结构"
        G0["γ⁰ = (I  0)\n      (0 -I)"]
        G1["γ¹ = (0   σ₁)\n      (-σ₁  0)"]
        G2["γ² = (0   σ₂)\n      (-σ₂  0)"]
        G3["γ³ = (0   σ₃)\n      (-σ₃  0)"]
    end
    
    subgraph "泡利矩阵"
        S1["σ₁ = (0 1)\n     (1 0)"]
        S2["σ₂ = (0 -i)\n     (i  0)"]
        S3["σ₃ = (1  0)\n     (0 -1)"]
    end

11.2.3 狄拉克方程的最终形式

进行算符替换 $p_\mu \rightarrow -i\hbar \partial_\mu$ ，得到狄拉克方程：

$i\hbar \gamma^\mu \partial_\mu \psi - m c \psi = 0$

或写成：

i\hbar \frac{\partial \psi}{\partial t} = \left(-i\hbar c \boldsymbol{\alpha} \cdot \nabla + \beta m c^2\right)\psi

其中 \boldsymbol{\alpha} = \gamma^0 \boldsymbol{\gamma} = \begin{pmatrix} 0 & \boldsymbol{\sigma} \\ \boldsymbol{\sigma} & 0 \end{pmatrix}， $\beta = \gamma^0$ 。

波函数 $\psi$ 现在有四个分量——即四分量旋量（4-spinor）：

$\psi = \begin{pmatrix} \psi_1 \\ \psi_2 \\ \psi_3 \\ \psi_4 \end{pmatrix}$

11.3 洛伦兹不变性：方程的相对论血统

11.3.1 洛伦兹变换下的旋量行为

狄拉克方程必须在洛伦兹变换下保持形式不变。考虑一个沿 $x$ 方向的洛伦兹 boost，变换矩阵为：

$\Lambda(\eta) = \begin{pmatrix} \cosh\eta & -\sinh\eta & 0 & 0 \\ -\sinh\eta & \cosh\eta & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix}$

其中快度 $\eta$ 满足 $\tanh\eta = v/c$ 。旋量 $\psi$ 在此变换下按：

$\psi'(x') = S(\Lambda)\psi(x)$

其中变换矩阵：

$S(\Lambda) = \exp\left(-\frac{\omega_{\mu\nu}}{4}\sigma^{\mu\nu}\right)$

这里 $\sigma^{\mu\nu} = \frac{i}{2}[\gamma^\mu, \gamma^\nu]$ ， $\omega_{\mu\nu}$ 是洛伦兹变换的无穷小参数。

11.3.2 协变量与守恒流

利用狄拉克方程，可以构造守恒的四维概率流：

$j^\mu = \bar{\psi}\gamma^\mu \psi = (\rho c, \mathbf{j})$

其中 $\bar{\psi} = \psi^\dagger \gamma^0$ 是狄拉克伴随。概率密度为：

$\rho = \psi^\dagger \psi = |\psi_1|^2 + |\psi_2|^2 + |\psi_3|^2 + |\psi_4|^2 \geq 0$

这正是我们想要的——正定概率密度！同时满足连续性方程：

$\partial_\mu j^\mu = \frac{\partial \rho}{\partial t} + \nabla \cdot \mathbf{j} = 0$

graph TD
    A["洛伦兹变换 x'=Λx"] --> B["旋量变换 ψ'=S(Λ)ψ"]
    B --> C["要求 S⁻¹γᵘS = Λᵘᵥγᵛ"]
    C --> D["构造守恒流\njᵘ = ψ̄γᵘψ"]
    D --> E["ρ = ψ†ψ ≥ 0\n正定!"]
    D --> F["∂ᵤjᵘ = 0\n概率守恒!"]
    
    style E fill:#4ecdc4
    style F fill:#4ecdc4

11.4 自由电子的运动：从平面波到自旋

11.4.1 平面波解的结构

对于自由电子，寻找形如 $\psi(\mathbf{r}, t) = u(\mathbf{p}) e^{i(\mathbf{p}\cdot\mathbf{r} - Et)/\hbar}$ 的解。代入狄拉克方程：

$\begin{pmatrix} E - mc^2 & -c\mathbf{\sigma}\cdot\mathbf{p} \\ -c\mathbf{\sigma}\cdot\mathbf{p} & E + mc^2 \end{pmatrix} \begin{pmatrix} u_A \\ u_B \end{pmatrix} = 0$

其中 $u = \begin{pmatrix} u_A \\ u_B \end{pmatrix}$ 是二分量的"大分量"和"小分量"。

11.4.2 正能量解

对于正能量 $E = +\sqrt{p^2 c^2 + m^2 c^4} \equiv E_p$ ，解为：

$u^{(1)} = \mathcal{N} \begin{pmatrix} 1 \\ 0 \\ \frac{c p_z}{E_p + mc^2} \\ \frac{c(p_x + ip_y)}{E_p + mc^2} \end{pmatrix}, \quad u^{(2)} = \mathcal{N} \begin{pmatrix} 0 \\ 1 \\ \frac{c(p_x - ip_y)}{E_p + mc^2} \\ \frac{-c p_z}{E_p + mc^2} \end{pmatrix}$

归一化常数 $\mathcal{N} = \sqrt{\frac{E_p + mc^2}{2E_p}}$ 。

在非相对论极限 $|\mathbf{p}| \ll mc$ 下：

$u^{(1)} \approx \begin{pmatrix} 1 \\ 0 \\ \frac{p_z}{2mc} \\ \frac{p_x + ip_y}{2mc} \end{pmatrix}, \quad u^{(2)} \approx \begin{pmatrix} 0 \\ 1 \\ \frac{p_x - ip_y}{2mc} \\ \frac{-p_z}{2mc} \end{pmatrix}$

小分量 $u_B$ 被压低了 $v/c$ 因子，这正是我们熟悉的非相对论性二分量自旋态。

11.4.3 自旋的自动出现

这是Dirac方程最令人震惊的成果之一：自旋不需要被"引入"，它从方程的结构中自然涌现。

考虑非相对论极限，从狄拉克方程导出泡利方程：

i\hbar \frac{\partial \phi}{\partial t} = \left[\frac{\mathbf{p}^2}{2m} - \frac{e\hbar}{2m}\boldsymbol{\sigma}\cdot\mathbf{B}\right]\phi

其中 $\phi$ 是大分量。电子磁矩为：

\boldsymbol{\mu} = -\frac{e\hbar}{2m}\boldsymbol{\sigma} = -g_s \frac{e}{2m}\mathbf{S}

其中自旋 \mathbf{S} = \frac{\hbar}{2}\boldsymbol{\sigma}， $g_s = 2$ 。Dirac方程自动给出了正确的朗德g因子 $g_s = 2$ （实验值 $g_s \approx 2.002319...$ ，微小偏差由QED辐射修正解释）。

graph TD
    A["狄拉克方程\n4分量旋量"] --> B["非相对论极限\np << mc"]
    B --> C["大分量 φ = (ψ₁,ψ₂)"]
    C --> D["泡利方程:\niℏ∂φ/∂t = [p²/2m - μ·B]φ"]
    D --> E["自旋 S = ℏσ/2\n自动出现!"]
    E --> F["g因子 = 2\n实验验证"]
    
    style E fill:#ffd93d
    style F fill:#4ecdc4

数值例题：自由电子Dirac方程的解

题目：一个动能为 $K = 100 \text{ keV}$ 的自由电子沿 $z$ 轴运动。计算：

(a) 总能量、动量和洛伦兹因子
(b) 正能量旋量的大分量与小分量之比
© 非相对论极限下小分量的近似值
(d) 速度 $v$ 并与光速比较

已知： $m_e c^2 = 511 \text{ keV}$

解答：

(a) 总能量：

$E = K + mc^2 = 100 + 511 = 611 \text{ keV}$

洛伦兹因子：

$\gamma = \frac{E}{mc^2} = \frac{611}{511} = 1.196$

速度：

$\beta = \sqrt{1 - 1/\gamma^2} = \sqrt{1 - 1/1.196^2} = \sqrt{1 - 0.699} = \sqrt{0.301} = 0.549$

$v = 0.549c = 1.65 \times 10^8 \text{ m/s}$

约55%光速——这个电子已经相当相对论性了！

动量：

$pc = \sqrt{E^2 - (mc^2)^2} = \sqrt{611^2 - 511^2} = \sqrt{373321 - 261121} = \sqrt{112200} = 335 \text{ keV}$

p = \frac{335 \times 10^3 \times 1.6 \times 10^{-19}}{3 \times 10^8} = 1.79 \times 10^{-22} \text{ kg·m/s}

(b) 大分量与小分量之比：
对于沿 $z$ 轴运动的电子， $p_x = p_y = 0$ ， $p_z = p$ 。正能量解为：

$u = \mathcal{N} \begin{pmatrix} 1 \\ 0 \\ \frac{cp}{E + mc^2} \\ 0 \end{pmatrix}$

大小分量之比：

$\frac{|u_B|}{|u_A|} = \frac{cp}{E + mc^2} = \frac{335}{611 + 511} = \frac{335}{1122} = 0.298$

约30%！这意味着对于这个能量的电子，"小分量"已经不可忽略。非相对论近似 ( $p \ll mc$ ) 失效。

$\frac{|u_B|}{|u_A|} \approx \frac{p}{2mc} = \frac{pc}{2mc^2} = \frac{335}{2 \times 511} = 0.328$

与精确值0.298接近，但已有约10%的偏差。

(d) 验证速度：

$v = \frac{p}{m\gamma} = \frac{pc}{mc^2 \gamma} \times c = \frac{335}{511 \times 1.196} c = 0.549c \checkmark$

与之前计算的 $\beta = 0.549$ 一致。

11.5 极坐标变换与精细结构

11.5.1 球坐标下的分离变量

对于氢原子问题，需要求解在库仑势 $V(r) = -\frac{Ze^2}{4\pi\varepsilon_0 r}$ 中的狄拉克方程。引入球坐标，将旋量按角动量本征态展开。

总角动量：

$\mathbf{J} = \mathbf{L} + \mathbf{S}$

其中轨道角动量 $\mathbf{L} = \mathbf{r} \times \mathbf{p}$ ，自旋 \mathbf{S} = \frac{\hbar}{2}\boldsymbol{\Sigma}，\boldsymbol{\Sigma} = \begin{pmatrix} \boldsymbol{\sigma} & 0 \\ 0 & \boldsymbol{\sigma} \end{pmatrix}。

11.5.2 好量子数与旋量球谐函数

由于 $[H, J^2] = 0$ ， $[H, J_z] = 0$ ，好量子数是 $j$ 和 $m_j$ 。此外，引入轨道-自旋耦合算符：

K = \gamma^0(\boldsymbol{\Sigma}\cdot\mathbf{L} + \hbar)

满足 $[H, K] = 0$ ，其本征值 $\kappa = \pm(j + \frac{1}{2})$ 区分 $l = j \pm \frac{1}{2}$ 两种情况。

旋量的径向部分满足耦合方程：

$\frac{d}{dr}\begin{pmatrix} G \\ F \end{pmatrix} = \begin{pmatrix} -\frac{\kappa}{r} + \frac{V}{\hbar c} & \frac{m c}{\hbar} + \frac{E}{\hbar c} - \frac{V}{\hbar c} \\ -\frac{m c}{\hbar} + \frac{E}{\hbar c} - \frac{V}{\hbar c} & \frac{\kappa}{r} - \frac{V}{\hbar c} \end{pmatrix}\begin{pmatrix} G \\ F \end{pmatrix}$

11.5.3 精细结构公式：相对论、自旋与QED的统一

狄拉克方程精确求解给出氢原子能级：

$E_{n,j} = mc^2 \left[1 + \frac{(Z\alpha)^2}{\left(n - \delta_j\right)^2}\right]^{-1/2}$

其中 $\alpha \approx \frac{1}{137}$ 是精细结构常数， $\delta_j = j + \frac{1}{2} - \sqrt{(j + \frac{1}{2})^2 - (Z\alpha)^2}$ 是相对论修正。

展开到 $(Z\alpha)^4$ 阶：

$E_{n,j} \approx mc^2 - \frac{m(Z\alpha)^2 c^2}{2n^2} \left[1 + \frac{(Z\alpha)^2}{n}\left(\frac{1}{j+1/2} - \frac{3}{4n}\right)\right]$

第一项 $mc^2$ 是静止能量；第二项 $\frac{m(Z\alpha)^2 c^2}{2n^2} = \frac{13.6 \text{ eV}}{n^2}$ 是玻尔能量；方括号内的修正就是精细结构——包含：

相对论动能修正： $\frac{p^4}{8m^3c^2}$ 项
自旋-轨道耦合：\boldsymbol{L}\cdot\boldsymbol{S} 项
达尔文项：接触相互作用

数值例题：氢原子精细结构分裂

题目：计算氢原子 $n=2$ 能级的精细结构分裂，比较 $2p_{1/2}$ 和 $2p_{3/2}$ 态的能量差。

解答：

对于 $n=2$ ：

$2p_{1/2}$ ： $j = 1/2$ ， $\kappa = -1$ ， $\delta_{1/2} = 1 - \sqrt{1 - \alpha^2} \approx \frac{\alpha^2}{2}$
$2p_{3/2}$ ： $j = 3/2$ ， $\kappa = +2$ ， $\delta_{3/2} = 2 - \sqrt{4 - \alpha^2} \approx \frac{\alpha^2}{4}$

展开能量公式到 $(Z\alpha)^4$ 阶（ $Z=1$ ）：

$E_{n,j} = mc^2 - \frac{mc^2\alpha^2}{2n^2} - \frac{mc^2\alpha^4}{2n^3}\left(\frac{1}{j+1/2} - \frac{3}{4n}\right) + O(\alpha^6)$

$2p_{1/2}$ 的能量修正：

$\Delta E_{1/2} = -\frac{mc^2\alpha^4}{16}\left(\frac{1}{1} - \frac{3}{8}\right) = -\frac{mc^2\alpha^4}{16} \times \frac{5}{8} = -\frac{5mc^2\alpha^4}{128}$

$2p_{3/2}$ 的能量修正：

$\Delta E_{3/2} = -\frac{mc^2\alpha^4}{16}\left(\frac{1}{2} - \frac{3}{8}\right) = -\frac{mc^2\alpha^4}{16} \times \frac{1}{8} = -\frac{mc^2\alpha^4}{128}$

能量差：

$\Delta E = E_{2,1/2} - E_{2,3/2} = -\frac{5mc^2\alpha^4}{128} + \frac{mc^2\alpha^4}{128} = -\frac{mc^2\alpha^4}{32}$

$|\Delta E| = \frac{mc^2\alpha^4}{32} = \frac{511 \times 10^3 \times (1/137)^4}{32} \text{ eV}$

$|\Delta E| = \frac{5.11 \times 10^5}{32 \times 3.5 \times 10^8} = \frac{5.11 \times 10^5}{1.12 \times 10^{10}} \text{ ???}$

让我重新计算：

$\alpha^4 = (1/137)^4 = 1/3.5 \times 10^8 \approx 2.87 \times 10^{-9}$

$mc^2 \alpha^4 = 511 \times 10^3 \times 2.87 \times 10^{-9} = 1.47 \times 10^{-3} \text{ eV}$

$|\Delta E| = \frac{1.47 \times 10^{-3}}{32} = 4.6 \times 10^{-5} \text{ eV}$

转换为频率：

$\nu = \frac{\Delta E}{h} = \frac{4.6 \times 10^{-5}}{4.14 \times 10^{-15}} = 1.1 \times 10^{10} \text{ Hz} = 11 \text{ GHz}$

转换为波长：

$\lambda = \frac{c}{\nu} = \frac{3 \times 10^8}{1.1 \times 10^{10}} = 2.7 \times 10^{-2} \text{ m} = 2.7 \text{ cm}$

这就是著名的 21 cm线 的精细结构对应（实际上是 $2p$ 态的超精细和精细结构混合）。不过精确的 $2p$ 精细结构对应的波长更短。

实际上，更精确的数值是 $4.53 \times 10^{-5} \text{ eV} \approx 10.9 \text{ GHz}$ 。这个分裂虽然微小，但Dirac方程精确预言了它的存在。

历史注记：1947年，Lamb和Retherford测量发现 $2s_{1/2}$ 和 $2p_{1/2}$ 之间还有一个额外的分裂（约1058 MHz），这就是著名的兰姆位移。兰姆位移不能由狄拉克方程解释，它是量子电动力学（QED）辐射修正的结果，标志着QED的诞生。

graph TD
    A["氢原子能级\nE_n = -13.6/n² eV"] --> B["狄拉克方程精确解"]
    B --> C["E_nⱼ = mc²[1+(Zα)²/(n-δⱼ)²]^(-1/2)"]
    C --> D["展开: 精细结构\nΔE_FS ~ (Zα)⁴"]
    
    D --> E["相对论修正\np⁴/8m³c²"]
    D --> F["自旋-轨道耦合\nL·S"]
    D --> G["达尔文项\nδ(r)接触项"]
    
    C --> H["兰姆位移\nQED辐射修正\n~ (Zα)⁵ ln(1/α)"]

11.6 负能海的革命：正电子理论

11.6.1 负能量解的困境

狄拉克方程给出能谱：

$E = \pm \sqrt{p^2 c^2 + m^2 c^4}$

正能量解从 $+mc^2$ 延伸到 $+\infty$ ，负能量解从 $-\infty$ 延伸到 $-mc^2$ 。中间存在一个 $2mc^2$ 的能隙。

如果负能态真的被占据，电子会持续向更低能量跃迁，辐射出无限能量——这与物理现实矛盾。Dirac被迫面对一个激进的假设。

11.6.2 狄拉克海假说

1930年，Dirac提出了震惊物理学界的解释：真空是所有负能态被电子填满的态——即"狄拉克海"。

根据泡利不相容原理，负能电子不能向已被占据的更低能态跃迁（没有空位）。真空是稳定的海。

graph TD
    A["能谱结构"] --> B["E > +mc²\n正能态\n电子可占据"]
    A --> C["-mc² < E < +mc²\n能隙\n2mc² = 1.022 MeV"]
    A --> D["E < -mc²\n负能态\n全部填满"]
    
    D --> E["真空 = 负能海填满"]
    E --> F["负能电子吸收\n≥2mc²光子"]
    F --> G["跃迁到正能态\n留下空穴"]
    G --> H["空穴 = 正电子!\n质量m, 电荷+e"]
    
    style H fill:#ff6b6b,stroke:#333

11.6.3 空穴理论：反物质的诞生

如果负能海中的一个电子吸收了能量 $\geq 2mc^2$ 的光子，它会跃迁到正能态。结果：

正能量电子出现
负能海中留下一个"空穴"

这个空穴的行为像一个质量为正、电荷为正的粒子——这就是正电子（positron）！

1932年，Carl Anderson 在云室实验中观测到了正电子的轨迹，证实了Dirac的预言。这是理论物理史上最辉煌的预言之一。

数值例题：电子对产生阈值与能量守恒

题目：一个高能光子 $\gamma$ 与一个重原子核相互作用，产生电子-正电子对 $\gamma \rightarrow e^+ + e^-$ 。

已知： $m_e c^2 = 0.511 \text{ MeV}$

解答：

(a) 阈值能量：
在原子核静止参考系中，设光子能量为 $E_\gamma$ ，原子核初始四动量 $(Mc, 0)$ 。

末态四动量守恒：

$E_\gamma + Mc^2 = E_{e^-} + E_{e^+} + E_{\text{nucleus}}$

$\mathbf{p}_\gamma = \mathbf{p}_{e^-} + \mathbf{p}_{e^+} + \mathbf{p}_{\text{nucleus}}$

在阈值时，电子和正电子在质心系中静止，以相同速度运动。利用不变量：

$(p_\gamma + p_N)^2 = (p_{e^-} + p_{e^+} + p'_N)^2$

初态不变量：

$(p_\gamma + p_N)^2 = m_\gamma^2 c^2 + M^2 c^2 + 2p_\gamma \cdot p_N = 0 + M^2c^2 + 2ME_\gamma$

（因为光子质量为零， $p_\gamma = (E_\gamma/c, \mathbf{p}_\gamma)$ ， $p_N = (Mc, 0)$ ）

末态在阈值时：
电子和正电子以零相对动量运动（即它们像一个复合系统）：

$(p_{e^-} + p_{e^+})^2 = (2m_e c)^2 = 4m_e^2 c^2$

总末态：

$(p_{e^-} + p_{e^+} + p'_N)^2 = 4m_e^2 c^2 + M^2 c^2 + 2M E_{\text{COM}}$

实际上，更简单的方法是利用：

(p_\gamma + p_N - p_{e^-} - p_{e^+})^2 = p'^2_N = M^2 c^2

展开并利用 $p_\gamma^2 = 0$ ， $p_{e^\pm}^2 = m_e^2 c^2$ ：

$0 + M^2c^2 + 2m_e^2c^2 + 2p_\gamma \cdot p_N - 2p_\gamma \cdot p_{e^-} - 2p_\gamma \cdot p_{e^+} - 2p_{e^-}\cdot p_{e^+} - 2p_N\cdot p_{e^-} - 2p_N\cdot p_{e^+} = M^2c^2$

这太复杂了。让我们用更简单的方法：在原子核静止系中，阈值时光子能量刚好够产生两个静止的电子（在质心系中）。

利用能量-动量守恒，阈值光子能量为：

$E_\gamma^{\text{th}} = 2m_e c^2 \left(1 + \frac{m_e}{M}\right)$

对于 $M \gg m_e$ ：

$E_\gamma^{\text{th}} \approx 2m_e c^2 = 1.022 \text{ MeV}$

(b) 原子核反冲动能：

$K_N = \frac{p_N^2}{2M} = \frac{(2m_e c)^2}{2M} = \frac{2m_e^2 c^2}{M}$

$K_N = \frac{2 \times (0.511)^2}{100 \times 931.5} \text{ MeV} = \frac{0.522}{93150} \text{ MeV} = 5.6 \times 10^{-6} \text{ MeV} = 5.6 \text{ eV}$

反冲动能很小，但在精确计算中不可忽略。

p_\gamma = (E_\gamma/c, 0, 0, E_\gamma/c) \text{（设光子沿x轴）}

$p_N = (Mc, 0, 0, 0)$

末态（阈值时，电子和正电子静止在质心系中，一起以某速度运动）：
实际上在阈值时，在实验室系中，电子和正电子以相同速度向前运动。

利用 $E_\gamma^{\text{th}} \approx 2m_e c^2 = 1.022 \text{ MeV}$ ：

$p_\text{total} = (Mc + E_\gamma/c, E_\gamma/c, 0, 0)$

末态原子核四动量：

$p'_N = (Mc + K_N/c, -2m_e c, 0, 0)$

（ $K_N \ll Mc^2$ ，所以 $E'_N \approx Mc^2$ ）

验证： $E'_N = \sqrt{(Mc^2)^2 + (2m_e c^2)^2} \approx Mc^2 + \frac{2m_e^2 c^2}{M}$

(d) 单个光子在真空中不能产生对：
在真空中（没有原子核），设光子产生对：

$\gamma \rightarrow e^+ + e^-$

四动量守恒：

$p_\gamma = p_{e^-} + p_{e^+}$

在光子静止参考系中（虽然光子没有静止系，但考虑质心系）， $E_\gamma = 0$ 。但电子和正电子的总能量至少为 $2m_e c^2 > 0$ ，矛盾。

更严格地，考虑洛伦兹不变量：

$p_\gamma^2 = 0$

$(p_{e^-} + p_{e^+})^2 = 2m_e^2 c^2 + 2p_{e^-}\cdot p_{e^+} \geq 4m_e^2 c^2 > 0$

因为电子和正电子的时间分量（能量）同号， $p_{e^-}\cdot p_{e^+} = E_{e^-}E_{e^+}/c^2 - \mathbf{p}_{e^-}\cdot\mathbf{p}_{e^+} \geq m_e^2 c^2$ 。

所以 $0 = p_\gamma^2 = (p_{e^-} + p_{e^+})^2 \geq 4m_e^2 c^2 > 0$ ，矛盾！

必须有第三方（原子核）参与，提供动量而不提供太多能量，使得四动量守恒得以满足。

11.6.4 现代观点：量子场论的解释

在量子场论中，我们不再需要"狄拉克海"的图像。电子和正电子是同一个狄拉克场的两种激发：

产生一个电子 = 产生算符 $c_\mathbf{p}^\dagger$ 作用
产生一个正电子 = 产生算符 $d_\mathbf{p}^\dagger$ 作用（在旧语言中，这是"湮灭一个负能电子"）

反粒子的存在是相对论性量子理论的必然结果，而非人为假设。CPT定理进一步保证了：每个粒子都有一个质量相同、寿命相同但内部量子数相反的反粒子。

graph LR
    subgraph "狄拉克海图像"
        A1["负能海填满"]
        A2["光子入射"]
        A3["电子跃迁到正能态"]
        A4["留下空穴 = 正电子"]
    end
    
    subgraph "QFT图像"
        B1["真空 = 场的基态"]
        B2["激发 = 产生算符作用"]
        B3["电子: c†|0⟩"]
        B4["正电子: d†|0⟩"]
    end
    
    A1 --> A2 --> A3 --> A4
    B1 --> B2 --> B3
    B2 --> B4
    
    A4 -.等价.-> B4

11.7 狄拉克的历史地位：反物质的预言者

11.7.1 1928年：一个方程改变物理学

1928年1月，年仅25岁的Dirac在剑桥大学完成了他的革命性论文《The Quantum Theory of the Electron》。这篇论文的目标是找到一个同时满足量子力学和狭义相对论的电子方程。Dirac没有想到的是，这个方程将揭开反物质世界的大门。

Dirac最初试图消除负能量解。他尝试了各种方法：重新定义能量零点、引入投影算符、修改方程……但都失败了。负能量解是方程数学结构的必然产物，无法消除。

1930年，Dirac在《量子力学原理》中提出了他的"空穴理论"。这一理论在数学上是自洽的，但在物理上却极其激进——整个宇宙被填满了不可见的负能电子！许多物理学家（包括玻尔和泡利）对此持怀疑态度。

11.7.2 Anderson的发现：从预言到证实

1932年8月2日，美国物理学家Carl Anderson在帕萨迪纳的威尔逊山实验室中，用云室研究宇宙射线时，发现了一条奇特的粒子轨迹。这条轨迹在磁场中弯曲的方向与电子相反，但弯曲程度（意味着质量与电荷比）与电子完全相同。

Anderson意识到：这是一个带正电的电子！他将这个粒子命名为"正电子"（positron）。

这一发现震惊了物理学界。Dirac的理论不再是数学游戏——它预言了一个真实存在的粒子。这是人类历史上第一次通过纯粹的理论推导预言了一种新粒子，随后被实验证实。

11.7.3 反物质时代的开启

正电子的发现开启了反物质研究的时代：

1955年：Segrè和Chamberlain发现了反质子
1965年：CERN发现了反氘核（反质子和反中子束缚态）
1995年：CERN首次在实验室中产生反氢原子（正电子+反质子）
2011年：CERN的ASACUSA实验首次测量反氢原子的光谱
今天：反物质被用于医学成像（PET扫描）和基础物理研究

Dirac方程还启发了更广泛的反物质概念：如果电子有反粒子，那么所有粒子都可能有反粒子。今天我们知道：质子有反质子，中子有反中子，夸克有反夸克，甚至中微子可能有反中微子。

11.7.4 数学之美与物理真理

Dirac曾写道："一个物理定律必须具有数学上的美。"狄拉克方程完美地践行了这一信念。

从数学上看，狄拉克方程是对能量-动量关系的"一阶线性化"——将二次方程分解为两个一次因子的乘积。这种因式分解需要引入4×4矩阵，而这4×4矩阵的结构自然地包含了自旋。

从物理上看，狄拉克方程是通往量子场论的桥梁。它证明了：相对论性量子理论必然要求反粒子的存在，自旋是相对论性量子效应的自然产物，而不仅仅是人为引入的自由度。

从美学上看，狄拉克方程证明了深刻的物理真理往往藏在最简洁的数学形式中。4×4矩阵、反对易关系、洛伦兹不变性、正定概率——这些看似独立的数学要求，在狄拉克方程中完美地统一在一起。

11.8 本章总结：方程之美

graph TD
    A["iℏγᵘ∂ᵤψ = mcψ\n狄拉克方程"] --> B["一阶导数\n概率守恒"]
    A --> C["4分量旋量\n自然包含自旋"]
    A --> D["洛伦兹不变\n完全相对论性"]
    A --> E["负能量解\n→ 反物质!"]
    
    B --> F["克服KG方程缺陷"]
    C --> G["g因子=2\n自动出现"]
    D --> H["精细结构精确解"]
    E --> I["正电子预言\n1932年证实"]
    
    F --> J["现代QFT基石"]
    G --> J
    H --> J
    I --> J
    
    style A fill:#ffd93d,stroke:#333
    style I fill:#ff6b6b

狄拉克方程 $i\hbar\gamma^\mu \partial_\mu \psi = mc\psi$ 是20世纪物理学最美的方程之一。它在一张4×4矩阵的网中，编织了量子力学、狭义相对论和自旋的完整图景。更令人惊叹的是，这个方程"不情愿地"预言了反物质的存在——Dirac最初试图通过方程的数学结构来避免负能解，却最终被迫接受了它们，并从中发现了正电子。

从数学上看，狄拉克方程是对能量-动量关系的"一阶线性化"；从物理上看，它是通往量子场论的桥梁；从美学上看，它证明了深刻的物理真理往往藏在最简洁的数学形式中。Dirac曾写道："一个物理定律必须具有数学上的美。"他的方程完美地践行了这一信念。

练习与思考

γ矩阵的表示无关性：证明在狄拉克方程中，概率密度 $\rho = \psi^\dagger \psi$ 和概率流 $j^i = \psi^\dagger \alpha^i \psi$ 在洛伦兹变换下确实像四维矢量一样变换。提示：验证 $S^\dagger \gamma^0 S = \gamma^0$ 对于 boost 变换成立。
非相对论极限推导：从狄拉克方程出发，通过消去小分量 $u_B$ ，系统地推导出包含自旋-轨道耦合和达尔文项的非相对论性哈密顿量。证明对于 $s$ 态（ $l=0$ ），达尔文项给出修正 $\Delta E_D = \frac{\pi Z e^2 \hbar^2}{2m^2 c^2} |\psi(0)|^2$ 。
正电子的产生阈值：计算光子产生电子-正电子对的阈值能量。如果反应发生在原子核附近（借助原子核的反冲吸收动量），证明阈值降低到 $E_\gamma = 2mc^2$ 。讨论为什么真空中单个光子不能产生对（提示：考虑四动量守恒）。

"The equation seemed to be able to explain a lot of things, but it had these negative-energy solutions which I could not make sense of." — Paul Dirac, 回忆发现正电子的时刻

第十一章 电子的相对论理论：狄拉克方程的革命