第III章 表象:量子力学的坐标变换

📑 目录

第III章 表象:量子力学的坐标变换


前置知识:广义函数与Dirac Delta函数

Dirac在第三章引入了量子力学中最具争议的数学工具——δ函数。说它"最具争议",是因为当Dirac在1920年代使用它时,大多数数学家认为这不是一个"合法的函数"。直到1940-1950年代,Laurent Schwartz发展了分布理论(Distribution Theory),δ函数才获得严格的数学基础。

为什么需要广义函数?

经典函数把每个点映射到一个数值。但物理中经常遇到"理想化"的概念:

  • 质点:质量集中在无限小的体积内
  • 点电荷:电荷集中在无限小的空间内
  • 位置本征态:粒子精确处于某一点

这些概念在传统函数框架下无法表达——一个"无限高、无限窄"的峰不是普通函数。

分布的严格定义

分布(广义函数)不是通过"每一点的数值"定义的,而是通过它对测试函数的作用定义的。

一个分布 TT 是从"足够好"的函数空间(通常是光滑、快速衰减的函数空间,称为Schwartz空间 S\mathcal{S})到复数的线性映射:

T:SCT: \mathcal{S} \rightarrow \mathbb{C}

Dirac delta分布 δa\delta_a 定义为:

δa[ϕ]=ϕ(a)\delta_a[\phi] = \phi(a)

也就是说,δ分布"吃掉"一个测试函数 ϕ\phi,吐出它在 aa 点的值。

关键洞察:分布不回答"δ(x)\delta(x)x=0x=0 处的值是多少"(这没有定义),而是回答"δ\delta 对测试函数 ϕ\phi 的作用是什么"。

δ函数作为极限

虽然 δ(x)\delta(x) 不是普通函数,但它可以看作一系列普通函数在分布意义下的极限:

limnfn(x)ϕ(x)dx=ϕ(0)\lim_{n\to\infty} \int_{-\infty}^{\infty} f_n(x)\phi(x)dx = \phi(0)

其中 fn(x)f_n(x) 是一系列普通函数(如高斯函数、矩形函数、sinc函数等)。

高斯序列

fσ(x)=12πσex2/(2σ2)f_\sigma(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-x^2/(2\sigma^2)}

对任意光滑测试函数 ϕ\phi

limσ0fσ(x)ϕ(x)dx=ϕ(0)\lim_{\sigma\to 0} \int_{-\infty}^{\infty} f_\sigma(x)\phi(x)dx = \phi(0)

矩形序列

fϵ(x)={12ϵx<ϵ0xϵf_\epsilon(x) = \begin{cases} \frac{1}{2\epsilon} & |x| < \epsilon \\ 0 & |x| \geq \epsilon \end{cases}

limϵ0fϵ(x)ϕ(x)dx=ϕ(0)\lim_{\epsilon\to 0} \int_{-\infty}^{\infty} f_\epsilon(x)\phi(x)dx = \phi(0)

重要理解:"δ(x)=limσ0fσ(x)\delta(x) = \lim_{\sigma\to 0} f_\sigma(x)"不是一个逐点的极限(因为逐点极限在 x=0x=0 处发散),而是一个分布极限——它说的是积分后的结果收敛。

δ函数的导数

在分布理论中,δ函数的导数 δ(x)\delta'(x) 定义为:

δ(xa)ϕ(x)dx=ϕ(a)\int_{-\infty}^{\infty} \delta'(x-a)\phi(x)dx = -\phi'(a)

这是通过分部积分定义的(测试函数在无穷远处为零)。δ函数的导数在物理中对应偶极子——比如两个无限靠近、符号相反的点电荷。

Dirac的实用主义 vs 数学严格性

Dirac在书中自由地使用δ函数,进行各种"不合法"的操作:

  • 乘以普通函数:f(x)δ(xa)=f(a)δ(xa)f(x)\delta(x-a) = f(a)\delta(x-a)
  • 复合:δ(g(x))=iδ(xxi)g(xi)\delta(g(x)) = \sum_i \frac{\delta(x-x_i)}{|g'(x_i)|}(其中 g(xi)=0g(x_i)=0
  • 导数:xδ(x)=δ(x)x\delta'(x) = -\delta(x)

这些公式在分布理论中都可以严格证明。Dirac的直觉惊人地准确——他在数学严格化之前就掌握了正确的"物理规则"。

哲学启示:在物理学中,"形式操作"往往先于"严格证明"。Diracδ函数的历史告诉我们:一个好的物理直觉,即使暂时缺乏数学基础,也可以引领正确的方向。


故事场景:同一座城市的三张地图

一位旅行家来到一座古老的城市。她在书店买到三张地图:第一张是等高线地形图,用海拔标记每座山丘;第二张是街道交通图,标注了所有公交线路;第三张是美食地图,只标出餐厅和食肆。

三张地图描述的是同一座城市,但侧重点不同。她用第一张找到高地俯瞰全城,用第二张规划出行路线,用第三张决定晚餐去哪。没有一个地图是"最真实"的——它们只是同一实体的不同投影。

Dirac 在第三章告诉我们:量子态就是这座城市,而表象(representation)就是地图。态空间本身是抽象的,不依赖于任何具体描述。但当我们想计算——计算概率、计算演化、计算测量结果——我们必须选择一套基矢量,把抽象态写成具体的数。

坐标系可以变,但城市不变。


3.1 基本矢量与完备集

3.1.1 离散基矢

回顾第一章和第二章的核心发现:

  1. 量子态构成 Hilbert 空间
  2. 可观测量 A^\hat{A} 的厄米性保证了本征态正交归一
  3. 可观测量的定义要求本征态完备

这三点合在一起,意味着:每个可观测量都定义了一套基矢

设可观测量 A^\hat{A} 有本征态 {ai}\{|a_i\rangle\},满足:

aiaj=δij={1i=j0ij\langle a_i|a_j\rangle = \delta_{ij} = \begin{cases} 1 & i=j \\ 0 & i \neq j \end{cases}

正交归一性

以及:

iaiai=I^\sum_i |a_i\rangle\langle a_i| = \hat{I}

完备性

3.1.2 连续基矢的推广

位置 x^\hat{x} 和动量 p^\hat{p} 的本征值是连续的——任何实数都可以是位置或动量的本征值。

对于连续谱,求和变为积分:

xxdx=I^\int |x\rangle\langle x| dx = \hat{I}

xx=δ(xx)\langle x|x'\rangle = \delta(x-x')

这里的 δ(xx)\delta(x-x') 就是大名鼎鼎的Dirac delta 函数——Dirac 自己发明的数学工具。

graph TD
    subgraph "基矢类型"
        A["离散谱
如能量 Eₙ"] --> B["Σ|n⟩⟨n| = Î"] A --> C["⟨n|m⟩ = δₙₘ"] D["连续谱
如位置 x"] --> E["∫|x⟩⟨x|dx = Î"] D --> F["⟨x|x'⟩ = δ(x-x')"] G[混合谱] --> H["离散+连续两部分"] end style A fill:#9f6,stroke:#333 style D fill:#96f,stroke:#333

3.2 Dirac Delta 函数:连续谱的基石

3.2.1 Delta 函数的定义

Dirac delta 函数 δ(x)\delta(x) 不是传统意义上的"函数"——它是一个广义函数(generalized function)分布(distribution)

形式上定义为:

δ(x)={x=00x0\delta(x) = \begin{cases} \infty & x = 0 \\ 0 & x \neq 0 \end{cases}

且满足:

δ(x)dx=1\int_{-\infty}^{\infty} \delta(x) dx = 1

3.2.2 Delta 函数的本质

更严格的理解:δ(x)\delta(x) 是一系列普通函数在极限意义下的结果。

例如,高斯函数的极限:

δ(x)=limσ012πσex2/(2σ2)\delta(x) = \lim_{\sigma \to 0} \frac{1}{\sqrt{2\pi}\sigma} e^{-x^2/(2\sigma^2)}

σ\sigma 越来越小时,高斯峰越来越窄、越来越高,但总面积保持为 1。

graph TD
    A["高斯函数
σ=1.0"] --> B["σ=0.5
更窄更高"] B --> C["σ=0.2
更窄更高"] C --> D["σ→0
极限: δ函数"] D --> E["性质:
∫δ(x)dx = 1"] D --> F["性质:
δ(x)=0 (x≠0)"] D --> G["性质:
∫f(x)δ(x-a)dx = f(a)"] style D fill:#f66,stroke:#333,stroke-width:3px

3.2.3 筛选性质

Delta 函数最重要的性质是筛选(sifting)

f(x)δ(xa)dx=f(a)\int_{-\infty}^{\infty} f(x)\delta(x-a) dx = f(a)

这在物理上意味着:delta 函数"挑出"函数 ffx=ax=a 处的值。

在量子力学中,这对应于:如果系统精确处于位置 x=ax=a,测量其他位置的权重为 0。

3.2.4 Fourier 表示

Delta 函数有一个极其优美的 Fourier 表示:

δ(x)=12πeikxdk\delta(x) = \frac{1}{2\pi}\int_{-\infty}^{\infty} e^{ikx} dk

这说明 delta 函数是所有平面波(所有频率)的等权叠加——在数学上"无限平坦"的频谱。

3.2.5 数值例子:高斯极限验证

让我们用具体的数值验证 δ\delta 函数作为高斯极限的性质。

高斯函数的积分(必须等于1):

12πσex2/(2σ2)dx\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma} e^{-x^2/(2\sigma^2)} dx

u=x/(2σ)u = x/(\sqrt{2}\sigma),则 dx=2σdudx = \sqrt{2}\sigma du

=12πσ2σeu2du=1ππ=1= \frac{1}{\sqrt{2\pi}\sigma} \cdot \sqrt{2}\sigma \int_{-\infty}^{\infty} e^{-u^2} du = \frac{1}{\sqrt{\pi}} \cdot \sqrt{\pi} = 1

验证成功——无论 σ\sigma 取何值,面积恒为1。

筛选性质的数值验证:取测试函数 ϕ(x)=x2+1\phi(x) = x^2 + 1,在 a=2a=2 处验证:

ϕ(2)=22+1=5\phi(2) = 2^2 + 1 = 5

计算积分(σ=0.01\sigma = 0.01,数值近似):

12π0.01ex2/(20.0001)((x2)2+1)dx\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\cdot 0.01} e^{-x^2/(2 \cdot 0.0001)} \cdot ((x-2)^2 + 1) dx

由于高斯峰极窄(宽度约 2σ=0.022\sigma = 0.02),在峰内 (x2)2+11(x-2)^2 + 1 \approx 1,所以积分近似等于 1×1=11 \times 1 = 1?等等——让我重新计算。

实际上,如果 ϕ(x)=(x2)2+1\phi(x) = (x-2)^2 + 1,那么 ϕ(2)=1\phi(2) = 1

更准确的测试:令 ϕ(x)=ex\phi(x) = e^x,则 ϕ(0)=1\phi(0) = 1

12πσex2/(2σ2)exdx\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma} e^{-x^2/(2\sigma^2)} e^x dx

利用高斯积分公式 eax2+bxdx=π/aeb2/(4a)\int e^{-ax^2 + bx} dx = \sqrt{\pi/a} \cdot e^{b^2/(4a)}

a=1/(2σ2)a = 1/(2\sigma^2)b=1b = 1

=12πσ2πσeσ2/2=eσ2/2= \frac{1}{\sqrt{2\pi}\sigma} \cdot \sqrt{2\pi}\sigma \cdot e^{\sigma^2/2} = e^{\sigma^2/2}

σ0\sigma \to 0 时,eσ2/21=ϕ(0)e^{\sigma^2/2} \to 1 = \phi(0)。验证成功!

数值收敛

σ\sigmaeσ2/2e^{\sigma^2/2}误差
1.01.648764.9%
0.51.133113.3%
0.11.00500.5%
0.011.000050.005%

σ<0.1\sigma < 0.1 时,高斯函数在数值上已经非常接近 δ\delta 函数的行为。

graph LR
    A["δ(x) 在x空间"] --> B["Fourier变换"]
    B --> C["δ̃(k) = 1/(2π)
在k空间为常数"] C --> D["所有k分量等权贡献"] D --> E["位置完全确定 =
动量完全不确定"] style E fill:#f96,stroke:#333,stroke-width:2px

3.3 基本矢量的性质

3.3.1 基矢的变换

假设我们有两套完备基矢:

  • 表象 A:{ai}\{|a_i\rangle\}
  • 表象 B:{bj}\{|b_j\rangle\}

同一态 ψ|\psi\rangle 在两套基下有不同的展开:

ψ=iciai=jdjbj|\psi\rangle = \sum_i c_i |a_i\rangle = \sum_j d_j |b_j\rangle

其中:

ci=aiψ,dj=bjψc_i = \langle a_i|\psi\rangle, \quad d_j = \langle b_j|\psi\rangle

两组系数之间的关系:

dj=ibjaicid_j = \sum_i \langle b_j|a_i\rangle c_i

3.3.2 变换矩阵

定义变换矩阵 U^\hat{U}

Uji=bjaiU_{ji} = \langle b_j|a_i\rangle

则:

dj=iUjicid_j = \sum_i U_{ji} c_i

或者用矩阵记号:d=U^c\mathbf{d} = \hat{U} \mathbf{c}

关键性质:由于两套基都是正交归一的,变换矩阵 U^\hat{U}幺正矩阵(unitary)

U^U^=U^U^=I^\hat{U}^\dagger \hat{U} = \hat{U}\hat{U}^\dagger = \hat{I}

这意味着表象变换保持内积不变——不同表象只是同一个抽象空间的"旋转"。

graph TD
    A["态 |ψ⟩"] --> B["表象A:
cᵢ = ⟨aᵢ|ψ⟩"] A --> C["表象B:
dⱼ = ⟨bⱼ|ψ⟩"] B --> D["变换: dⱼ = ΣUⱼᵢcᵢ"] D --> E["Uⱼᵢ = ⟨bⱼ|aᵢ⟩"] E --> F["幺正性: U†U = Î"] C --> D style A fill:#f96,stroke:#333,stroke-width:3px style F fill:#9f6,stroke:#333

3.4 线性算符的表示

3.4.1 算符的矩阵元

算符 A^\hat{A} 在一组基 {i}\{|i\rangle\} 下的矩阵表示

Aij=iA^jA_{ij} = \langle i|\hat{A}|j\rangle

这就是算符的矩阵元(matrix element)

3.4.2 算符在不同表象下的变换

A^\hat{A} 在表象 1 下的矩阵为 A(1)A^{(1)},在表象 2 下的矩阵为 A(2)A^{(2)}

则:

A(2)=U^A(1)U^A^{(2)} = \hat{U} A^{(1)} \hat{U}^\dagger

这就是相似变换(similarity transformation)。对于幺正变换,这保持了算符的本征值不变。

3.4.3 位置表象下的动量算符

在连续的位置表象 x|x\rangle 中,动量算符 p^\hat{p} 的表示是:

xp^ψ=ixψ(x)\langle x|\hat{p}|\psi\rangle = -i\hbar \frac{\partial}{\partial x} \psi(x)

其中 ψ(x)=xψ\psi(x) = \langle x|\psi\rangle 是波函数。

推导直觉:动量产生空间平移。考虑无穷小平移 ϵ\epsilon

T^(ϵ)x=x+ϵ\hat{T}(\epsilon)|x\rangle = |x+\epsilon\rangle

动量算符是平移的生成元:

T^(ϵ)=eip^ϵ/1+ip^ϵ\hat{T}(\epsilon) = e^{i\hat{p}\epsilon/\hbar} \approx 1 + \frac{i\hat{p}\epsilon}{\hbar}

将平移作用于波函数:

ψ(x+ϵ)=ψ(x)+ϵdψdx\psi(x+\epsilon) = \psi(x) + \epsilon \frac{d\psi}{dx}

对比得到 p^=ix\hat{p} = -i\hbar \frac{\partial}{\partial x}

graph TD
    A["算符 Â"] --> B["矩阵元: Aᵢⱼ = ⟨i|Â|j⟩"]
    B --> C["位置表象:
⟨x|x̂|ψ⟩ = x·ψ(x)"] B --> D["位置表象:
⟨x|p̂|ψ⟩ = -iℏ ∂ψ/∂x"] D --> E[动量是空间平移的生成元] C --> F[位置算符就是乘x] style B fill:#bbf,stroke:#333,stroke-width:2px style D fill:#9f6,stroke:#333

3.5 概率幅:波函数的本质

3.5.1 从抽象态到波函数

在位置表象中,态 ψ|\psi\rangle 展开为:

ψ=ψ(x)xdx|\psi\rangle = \int_{-\infty}^{\infty} \psi(x) |x\rangle dx

其中展开系数:

ψ(x)=xψ\psi(x) = \langle x|\psi\rangle

这就是波函数(wave function)

3.5.2 概率诠释

Born 在 1926 年提出的概率诠释:

ψ(x)2dx=xψ2dx|\psi(x)|^2 dx = |\langle x|\psi\rangle|^2 dx

表示粒子在位置 xx 附近 dxdx 范围内被发现的概率

归一化条件:

ψ(x)2dx=1\int_{-\infty}^{\infty} |\psi(x)|^2 dx = 1

这正对应于抽象态的归一化:

ψψ=1\langle\psi|\psi\rangle = 1

3.5.3 动量空间波函数

类似地,在动量表象中:

ψ~(p)=pψ\tilde{\psi}(p) = \langle p|\psi\rangle

位置波函数和动量波函数通过 Fourier 变换联系:

ψ~(p)=12πψ(x)eipx/dx\tilde{\psi}(p) = \frac{1}{\sqrt{2\pi\hbar}} \int_{-\infty}^{\infty} \psi(x) e^{-ipx/\hbar} dx

ψ(x)=12πψ~(p)eipx/dp\psi(x) = \frac{1}{\sqrt{2\pi\hbar}} \int_{-\infty}^{\infty} \tilde{\psi}(p) e^{ipx/\hbar} dp

物理意义:位置和动量表象通过 Fourier 变换联系,这正是海森堡不确定性关系的数学根源——位置窄则动量宽(Fourier 对偶性)。

graph TD
    A["抽象态 |ψ⟩"] --> B["位置表象: ψ(x) = ⟨x|ψ⟩"]
    A --> C["动量表象: ψ̃(p) = ⟨p|ψ⟩"]
    
    B --> D["|ψ(x)|² = 位置概率密度"]
    C --> E["|ψ̃(p)|² = 动量概率密度"]
    
    B -->|Fourier变换| C
    
    D --> F["位置确定
→ ψ(x)=δ(x)
→ ψ̃(p)=常数
→ 动量完全不确定"] style A fill:#f96,stroke:#333,stroke-width:3px style F fill:#f66,stroke:#333

3.6 可观测量的函数与表象无关性

3.6.1 算符函数在任意表象下的形式

在第二章我们定义了算符函数 f(A^)f(\hat{A})

f(A^)=if(ai)aiaif(\hat{A}) = \sum_i f(a_i) |a_i\rangle\langle a_i|

这个定义是表象无关的——它只依赖于 A^\hat{A} 的本征值和本征态,不依赖于我们选择哪套基来描述它们。

3.6.2 例:哈密顿量的时间演化

量子态随时间演化由薛定谔方程决定:

itψ(t)=H^ψ(t)i\hbar \frac{\partial}{\partial t}|\psi(t)\rangle = \hat{H}|\psi(t)\rangle

形式解为:

ψ(t)=eiH^t/ψ(0)|\psi(t)\rangle = e^{-i\hat{H}t/\hbar}|\psi(0)\rangle

在能量表象(H^\hat{H} 的本征态 En|E_n\rangle)中:

ψ(t)=ncneiEnt/En|\psi(t)\rangle = \sum_n c_n e^{-iE_n t/\hbar} |E_n\rangle

每个能量本征态以各自的频率 En/E_n/\hbar 旋转——这就是量子力学中的"拍频"和干涉。

graph TD
    A["哈密顿量 Ĥ"] --> B["本征态 |Eₙ⟩"]
    B --> C["时间演化算符: Û(t) = e^(-iĤt/ℏ)"]
    C --> D["在能量表象:
Û = Σ e^(-iEₙt/ℏ)|Eₙ⟩⟨Eₙ|"] D --> E["每个本征态独立旋转
频率 ωₙ = Eₙ/ℏ"] E --> F["叠加态产生干涉和拍频"] style C fill:#f9f,stroke:#333,stroke-width:3px

3.7 符号的发展:Dirac 记号的威力

3.7.1 为什么发明 Bra-Ket?

在 Dirac 之前,量子力学有两种记法:

  • 矩阵力学(海森堡、玻恩、约当):用矩阵和向量
  • 波动力学(薛定谔):用波函数 ψ(x)\psi(x) 和微分算符

Dirac 在 1939 年的论文 "A New Notation for Quantum Mechanics" 中提出了 bra-ket 记号。其天才之处在于:

  1. 抽象与具体分离ψ|\psi\rangle 是抽象态,不依赖表象;xψ=ψ(x)\langle x|\psi\rangle = \psi(x) 是具体波函数
  2. 内积自然浮现ϕψ\langle\phi|\psi\rangle 天然是内积
  3. 外积即算符aa|a\rangle\langle a| 天然是投影算符
  4. 完备性简洁ii=I^\sum |i\rangle\langle i| = \hat{I} 一行概括了整个表象理论

3.7.2 符号的力量

看一个例子:计算 ϕA^ψ\langle\phi|\hat{A}|\psi\rangle

在 bra-ket 记号中,我们可以插入完备性关系(选择任意表象):

ϕA^ψ=iϕaiaiA^ψ=iϕ(ai)(A^ψ)(ai)\langle\phi|\hat{A}|\psi\rangle = \sum_i \langle\phi|a_i\rangle\langle a_i|\hat{A}|\psi\rangle = \sum_i \phi^*(a_i) (\hat{A}\psi)(a_i)

这看起来简单,但 Dirac 的记号让这个"插入完备性关系"的操作变得几乎本能——符号引导直觉。

3.7.3 与波动力学的对照

概念Dirac 记号波动力学记号
ψ|\psi\rangleψ(x)\psi(x)
内积ϕψ\langle\phi|\psi\rangleϕ(x)ψ(x)dx\int \phi^*(x)\psi(x) dx
期望值ψA^ψ\langle\psi|\hat{A}|\psi\rangleψ(x)A^ψ(x)dx\int \psi^*(x) \hat{A} \psi(x) dx
完备性ii=I^\sum |i\rangle\langle i| = \hat{I}ϕi(x)ϕi(x)=δ(xx)\sum \phi_i^*(x)\phi_i(x') = \delta(x-x')
本征方程A^a=aa\hat{A}|a\rangle = a|a\rangleA^ψa(x)=aψa(x)\hat{A}\psi_a(x) = a\psi_a(x)

Dirac 记号在所有表象下形式相同;波动力学记号只在位置表象下简洁。

graph TD
    A["Dirac记号: ⟨φ|Â|ψ⟩"] --> B["插入完备性:
Σ|i⟩⟨i| = Î"] B --> C["⟨φ|Â|ψ⟩ = Σ⟨φ|i⟩⟨i|Â|ψ⟩"] C --> D["= Σ φ*(aᵢ) (Âψ)(aᵢ)"] D --> E["在任意表象都成立"] F["波函数记号"] F --> G["∫φ*(x)Âψ(x)dx"] G --> H["只在位置表象简洁"] style A fill:#f96,stroke:#333,stroke-width:3px style E fill:#9f6,stroke:#333

3.8 位置表象 vs 动量表象:两个最重要的例子

3.8.1 位置表象

基矢:{x}\{|x\rangle\}

  • 完备性:xxdx=I^\int |x\rangle\langle x| dx = \hat{I}
  • 正交归一:xx=δ(xx)\langle x|x'\rangle = \delta(x-x')
  • 位置算符:x^x=xx\hat{x}|x\rangle = x|x\rangle,矩阵元 xx^x=xδ(xx)\langle x|\hat{x}|x'\rangle = x\delta(x-x')
  • 动量算符:xp^ψ=ixψ(x)\langle x|\hat{p}|\psi\rangle = -i\hbar \frac{\partial}{\partial x}\psi(x)
  • 动量本征态:xp=12πeipx/\langle x|p\rangle = \frac{1}{\sqrt{2\pi\hbar}} e^{ipx/\hbar}(平面波)

3.8.2 动量表象

基矢:{p}\{|p\rangle\}

  • 完备性:ppdp=I^\int |p\rangle\langle p| dp = \hat{I}
  • 正交归一:pp=δ(pp)\langle p|p'\rangle = \delta(p-p')
  • 动量算符:p^p=pp\hat{p}|p\rangle = p|p\rangle
  • 位置算符:px^ψ=ipψ~(p)\langle p|\hat{x}|\psi\rangle = i\hbar \frac{\partial}{\partial p}\tilde{\psi}(p)
  • 位置本征态:px=12πeipx/\langle p|x\rangle = \frac{1}{\sqrt{2\pi\hbar}} e^{-ipx/\hbar}

3.8.3 对称之美

位置和动量表象有完美的对偶性:

xp,ixipx \leftrightarrow p, \quad -i\hbar\frac{\partial}{\partial x} \leftrightarrow i\hbar\frac{\partial}{\partial p}

这就是经典力学中正则变换的量子版本。

3.8.4 数值例子:高斯波包的 Fourier 变换

让我们用一个具体的数值例子来验证位置表象和动量表象之间的 Fourier 变换关系。

高斯波包(位置表象):

ψ(x)=(12πσx2)1/4ex2/(4σx2)\psi(x) = \left(\frac{1}{2\pi\sigma_x^2}\right)^{1/4} e^{-x^2/(4\sigma_x^2)}

其中 σx\sigma_x 是位置的标准差。归一化验证:

ψ(x)2dx=12πσx2ex2/(2σx2)dx=12πσx22πσx2=1\int_{-\infty}^{\infty} |\psi(x)|^2 dx = \sqrt{\frac{1}{2\pi\sigma_x^2}} \int_{-\infty}^{\infty} e^{-x^2/(2\sigma_x^2)} dx = \sqrt{\frac{1}{2\pi\sigma_x^2}} \cdot \sqrt{2\pi\sigma_x^2} = 1

Fourier 变换到动量表象

ψ~(p)=12πψ(x)eipx/dx\tilde{\psi}(p) = \frac{1}{\sqrt{2\pi\hbar}} \int_{-\infty}^{\infty} \psi(x) e^{-ipx/\hbar} dx

对于高斯函数,利用标准的高斯积分公式:

eax2+bxdx=πaeb2/(4a)\int_{-\infty}^{\infty} e^{-ax^2 + bx} dx = \sqrt{\frac{\pi}{a}} e^{b^2/(4a)}

a=14σx2a = \frac{1}{4\sigma_x^2}b=ip/b = -ip/\hbar

ψ~(p)=12π(12πσx2)1/44πσx2ep2σx2/2\tilde{\psi}(p) = \frac{1}{\sqrt{2\pi\hbar}} \left(\frac{1}{2\pi\sigma_x^2}\right)^{1/4} \sqrt{4\pi\sigma_x^2} \cdot e^{-p^2\sigma_x^2/\hbar^2}

=(2σx2π2)1/4ep2/(4σp2)= \left(\frac{2\sigma_x^2}{\pi\hbar^2}\right)^{1/4} e^{-p^2/(4\sigma_p^2)}

其中:

σp=2σx\sigma_p = \frac{\hbar}{2\sigma_x}

关键结果:动量表象的波函数也是高斯型,但宽度为 σp=/(2σx)\sigma_p = \hbar/(2\sigma_x)

不确定性关系的验证

σxσp=σx2σx=2\sigma_x \cdot \sigma_p = \sigma_x \cdot \frac{\hbar}{2\sigma_x} = \frac{\hbar}{2}

这正好达到海森堡不确定性原理的下限!高斯波包是最小不确定态——它在位置和动量的"模糊度"之间取得了最优平衡。

具体数值:设一个电子波包,位置宽度 σx=1\sigma_x = 1 nm =109= 10^{-9} m:

  • 动量宽度:σp=2σx=1.055×10342×109=5.28×1026\sigma_p = \frac{\hbar}{2\sigma_x} = \frac{1.055 \times 10^{-34}}{2 \times 10^{-9}} = 5.28 \times 10^{-26} kg·m/s
  • 速度宽度:σv=σpme=5.28×10269.11×10315.8×104\sigma_v = \frac{\sigma_p}{m_e} = \frac{5.28 \times 10^{-26}}{9.11 \times 10^{-31}} \approx 5.8 \times 10^4 m/s =58= 58 km/s

这意味着:如果一个电子被限制在1纳米范围内,其速度的不确定性至少为58 km/s。这就是为什么电子在原子尺度上不能被视为经典粒子——其动量的不确定性远大于经典热运动速度。

位置宽度 σx\sigma_x动量宽度 σp\sigma_p速度宽度 σv\sigma_v
1 m5.3×10355.3 \times 10^{-35} kg·m/s5.8×1055.8 \times 10^{-5} m/s
1 mm5.3×10325.3 \times 10^{-32} kg·m/s5.8×1025.8 \times 10^{-2} m/s
1 μm5.3×10295.3 \times 10^{-29} kg·m/s5.8×1015.8 \times 10^{1} m/s
1 nm5.3×10265.3 \times 10^{-26} kg·m/s5.8×1045.8 \times 10^{4} m/s
0.1 nm (原子尺度)5.3×10255.3 \times 10^{-25} kg·m/s5.8×1055.8 \times 10^{5} m/s

随着位置越来越确定,动量越来越不确定。这就是不确定性原理的日常表达。

graph LR
    subgraph "位置表象"
        A["基矢 |x⟩"] --- B["x̂ = x (乘法)"]
        B --- C["p̂ = -iℏ ∂/∂x"]
    end
    
    subgraph "动量表象"
        D["基矢 |p⟩"] --- E["p̂ = p (乘法)"]
        E --- F["x̂ = iℏ ∂/∂p"]
    end
    
    A -->|Fourier变换| D
    B -->|对偶| E
    C -->|对偶| F
    
    style A fill:#96f,stroke:#333
    style D fill:#6f9,stroke:#333

3.9 历史背景:从具体到抽象

3.9.1 薛定谔的波函数

1926年,薛定谔发表了他的波动力学。对氢原子,他解出了漂亮的波函数 ψnlm(r,θ,ϕ)\psi_{nlm}(r,\theta,\phi),有明确的图像——电子云。

物理学家们兴奋地发现:量子问题可以像解微分方程一样处理。波函数 ψ(x)\psi(x) 看起来如此真实,如此具体。

3.9.2 Dirac 的抽象革命

但 Dirac 看到了问题:波函数依赖于坐标 xx——这不是本质的。坐标只是我们选择的一种"观察方式"。

就像同一物体从不同角度拍照会得到不同图像,但物体本身是同一个。Dirac 想找到"物体本身"——抽象的态,不依赖于任何表象。

他的 bra-ket 记号就是这个抽象化的产物。ψ|\psi\rangle 不是函数,不是向量,它是一个抽象的存在——只在被某个表象"投影"时才变成具体的数。

3.9.3 冯·诺依曼的公理化

1932年,冯·诺依曼(von Neumann)在《量子力学的数学基础》中将 Dirac 的思想严格化:

  • 态空间 = 希尔伯特空间
  • 可观测量 = 自伴算符
  • 测量 = 投影到本征子空间
  • 表象 = 选择一组完备基

这使得量子力学成为一门严格的数学理论——尽管物理学家仍然喜欢 Dirac 那种更直觉化的风格。

timeline
    title 表象理论的历史演进
    1926 : Erwin Schrödinger
         : 波动力学
具体波函数 ψ(x) 1925-1930 : Paul Dirac : 抽象态与算符
q-数理论 1930 : Paul Dirac : 《量子力学原理》 : Bra-Ket记号 1932 : John von Neumann : 希尔伯特空间公理化
数学严格基础 1939 : Paul Dirac : "A New Notation..." : Bra-Ket正式论文

3.10 本章总结

核心思想回顾

表象理论是量子力学的"坐标变换"。Dirac 的核心洞见在于:

  1. 态本身是抽象的——ψ|\psi\rangle 不依赖于任何表示
  2. 表象 = 选择基矢——每个可观测量定义一套基
  3. 波函数 = 展开系数——ψ(x)=xψ\psi(x) = \langle x|\psi\rangle 只是坐标表象下的系数
  4. 变换 = 幺正变换——不同表象之间由幺正矩阵联系
  5. Delta 函数 = 连续基的正交归一化——广义函数让连续谱的数学自洽
  6. 位置与动量表象通过 Fourier 变换联系——不确定性关系的数学根源
  7. Dirac 记号的威力——抽象与具体分离,让计算简洁而普适
graph TD
    A["抽象态 |ψ⟩"] --> B["选择表象:
基矢 {|aᵢ⟩}"] B --> C["展开: |ψ⟩ = Σ cᵢ|aᵢ⟩"] C --> D["系数 cᵢ = ⟨aᵢ|ψ⟩
即'波函数'"] A --> E["另一表象 {|bⱼ⟩}"] E --> F["dⱼ = ⟨bⱼ|ψ⟩"] C --> G["幺正变换:
dⱼ = ΣUⱼᵢcᵢ"] F --> G D --> H["位置表象:
ψ(x) = ⟨x|ψ⟩"] F --> I["动量表象:
ψ̃(p) = ⟨p|ψ⟩"] H -->|Fourier变换| I style A fill:#f96,stroke:#333,stroke-width:4px style H fill:#96f,stroke:#333 style I fill:#6f9,stroke:#333

Dirac的独特视角

这一章,Dirac做了什么与众不同的事?

他把"表象"(representation)这个概念从背景提升到了舞台中央。 在1930年,大多数物理学家要么用矩阵力学计算,要么解薛定谔方程——他们选定一个"工作基"(通常是位置表象),然后在这个基下操作。表象被视为一种"方便的选择",而非物理学的核心结构。

但Dirac问了一个更深层的问题:量子力学的物理内容,哪些依赖于表象的选择,哪些不依赖?

他的答案是:

  1. 态矢量是表象无关的ψ|\psi\rangle 不依赖于任何基。它是"物理实在"在数学中的体现——就像一座城市不依赖于我们选择画哪种地图。

  2. 可观测量的本征结构是表象无关的:算符的本征值、对易关系、谱分解,这些都是在抽象空间中定义的,不依赖于具体的表示。

  3. 只有"展开系数"依赖于表象ψ(x)=xψ\psi(x) = \langle x|\psi\rangleψ~(p)=pψ\tilde{\psi}(p) = \langle p|\psi\rangle 只是抽象态矢在不同基下的"坐标"。同一个态,在位置表象中是一个函数,在动量表象中是另一个函数,在能量表象中是一个数列——但它们都是同一个 ψ|\psi\rangle 的投影。

Dirac的独特贡献在于:他发明了一套符号系统(bra-ket),让表象无关的计算变得自然。ϕA^ψ\langle\phi|\hat{A}|\psi\rangle 这个表达式——它在任何表象下形式相同。如果你想切换到位置表象,就插入 xxdx=I^\int |x\rangle\langle x| dx = \hat{I};想切换到动量表象,就插入 ppdp=I^\int |p\rangle\langle p| dp = \hat{I}。 bra-ket 记号的结构本身就"引导"你进行这些操作。

这种抽象化的视角有深远的后果:

  • 它让不同表象之间的变换成为一阶操作,而非需要重新推导的复杂计算
  • 它揭示了位置表象和动量表象的对称性——它们在数学上完全平等,只是"坐标轴"不同
  • 它为后来的量子场论和量子信息论铺平了道路——在这些领域,选择"正确的表象"往往是解决问题的关键

Dirac在第三章中展现的,不仅是一套数学技巧,更是一种物理世界观:物理定律应该以最抽象、最对称的形式表达,具体的数值计算只是这种抽象结构在特定坐标系下的投影。


练习与思考

  1. (计算) 证明 px^ψ=ipψ~(p)\langle p|\hat{x}|\psi\rangle = i\hbar \frac{\partial}{\partial p}\tilde{\psi}(p)。提示:利用 px^x=xpx=x12πeipx/\langle p|\hat{x}|x\rangle = x\langle p|x\rangle = x \cdot \frac{1}{\sqrt{2\pi\hbar}}e^{-ipx/\hbar},插入完备性关系 xxdx=I^\int |x\rangle\langle x| dx = \hat{I},然后对 xx 积分。

  2. (应用) 考虑一个一维无限深势阱中的粒子,能量本征态为 ψn(x)=2Lsin(nπxL)\psi_n(x) = \sqrt{\frac{2}{L}}\sin(\frac{n\pi x}{L}),对应能量 En=n2π222mL2E_n = \frac{n^2\pi^2\hbar^2}{2mL^2}。若粒子初始处于 ψ(x,0)=12(ψ1(x)+ψ2(x))\psi(x,0) = \frac{1}{\sqrt{2}}(\psi_1(x) + \psi_2(x)),写出 ψ(x,t)\psi(x,t) 的表达式。计算 t=πE2E1t = \frac{\pi\hbar}{E_2 - E_1} 时刻的波函数,并解释为什么此时波函数与 t=0t=0 时不同(画出示意图)。

  3. (思考) Dirac delta 函数不是"真正的函数",而是广义函数。在物理中,我们总是假设存在 x|x\rangle 这样的"位置本征态",尽管它们的波函数 xx=δ(xx)\langle x'|x\rangle = \delta(x'-x) 不是平方可积的(因此严格来说不属于 Hilbert 空间)。物理学家对此并不担心—— Dirac 本人也是如此。你觉得这种"实用主义"态度是合理的吗?数学上可以通过" rigged Hilbert space(装备希尔伯特空间)"来严格处理这个问题。查阅资料,简述 rigged Hilbert space 如何解决连续谱本征态的数学困难。


"A representation is just a way of looking at the abstract states and operators by means of a particular set of basis vectors."
— Paul Dirac