第3章 形式主义:向量、算符与测量

📑 目录

"波函数是一个向量。算符是矩阵。测量是特征值提取。"

这是量子力学的"操作系统层"——抽象,但强大。


第3章 形式主义:量子力学的操作系统


0. 前置知识:线性代数基础

量子力学的形式主义建立在线性代数之上。如果你熟悉向量空间,这一章会很自然;如果不熟悉,先补这几个概念。

0.1 向量空间

一组对象(向量)的集合,满足:

  • 向量可以相加:u+v=w\vec{u} + \vec{v} = \vec{w}
  • 向量可以数乘:ava\vec{v} 仍在空间中
  • 存在零向量 0\vec{0}
  • 满足分配律、结合律等

类比:三维空间中的所有箭头(有大小和方向),头尾相接相加,数乘改变长度。

0.2 内积与正交归一

内积 u,v\langle \vec{u}, \vec{v} \rangle 是一个把两个向量映射到标量的运算。在三维空间中,内积就是点积:

ab=axbx+ayby+azbz\vec{a} \cdot \vec{b} = a_x b_x + a_y b_y + a_z b_z

内积满足:

  • 正定性:v,v0\langle \vec{v}, \vec{v} \rangle \geq 0,等于0当且仅当 v=0\vec{v} = 0
  • 共轭对称性:u,v=v,u\langle \vec{u}, \vec{v} \rangle = \langle \vec{v}, \vec{u} \rangle^*

正交u,v=0\langle \vec{u}, \vec{v} \rangle = 0,表示两个向量"垂直"。

归一v,v=1\langle \vec{v}, \vec{v} \rangle = 1,表示长度为1。

正交归一集:一组向量 {e1,e2,...}\{\vec{e}_1, \vec{e}_2, ...\},满足 ei,ej=δij\langle \vec{e}_i, \vec{e}_j \rangle = \delta_{ij}

0.3 完备性

如果空间中的任何向量都可以写成基向量的线性组合:

v=iciei\vec{v} = \sum_i c_i \vec{e}_i

则称 {ei}\{\vec{e}_i\}完备基

类比:三维空间中,x^,y^,z^\hat{x}, \hat{y}, \hat{z} 是完备基——任何向量都可以写成 (vx,vy,vz)(v_x, v_y, v_z)

0.4 矩阵与线性变换

矩阵是线性变换的表示。矩阵 MM 作用于向量 v\vec{v}

v=Mv\vec{v}' = M\vec{v}

厄米矩阵M=MM = M^\dagger(共轭转置等于自身)。厄米矩阵的本征值都是实数,本征向量互相正交。

幺正矩阵UU=IU^\dagger U = I。幺正变换保持内积不变——就像三维空间中的旋转。

0.5 数值例题:矩阵的本征值与本征向量

问题:求矩阵 M=(3113)M = \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} 的本征值和本征向量。

解答
第一步:写特征方程 det(MλI)=0\det(M - \lambda I) = 0

det(3λ113λ)=(3λ)21=λ26λ+8=0\det\begin{pmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{pmatrix} = (3-\lambda)^2 - 1 = \lambda^2 - 6\lambda + 8 = 0

第二步:解二次方程

(λ2)(λ4)=0λ1=2,λ2=4(\lambda - 2)(\lambda - 4) = 0 \Rightarrow \lambda_1 = 2, \lambda_2 = 4

两个本征值都是实数——因为 MM 是厄米矩阵(M=MTM = M^T,实对称矩阵是厄米矩阵的特例)。

第三步:求本征向量

对于 λ1=2\lambda_1 = 2

(1111)(v1v2)=0v1=v2\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = 0 \Rightarrow v_1 = -v_2

归一化:v1=12(11)\vec{v}_1 = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ -1 \end{pmatrix}

对于 λ2=4\lambda_2 = 4

(1111)(v1v2)=0v1=v2\begin{pmatrix} -1 & 1 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = 0 \Rightarrow v_1 = v_2

归一化:v2=12(11)\vec{v}_2 = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix}

第四步:验证正交性

v1v2=12(11)=0\vec{v}_1 \cdot \vec{v}_2 = \frac{1}{2}(1 - 1) = 0

结论:厄米矩阵的本征值是实数,本征向量正交归一。这就是量子力学中"可观测量对应厄米算符"的矩阵类比。


3.1 故事:量子态图书馆的管理员

2177年,人类建成了"量子态图书馆"——存储全宇宙已知量子系统的数字孪生。

管理员老周每天的工作是:当物理学家提交一个查询"这个粒子在做什么?"时,他需要从图书馆中提取对应的态,并用正确的"测量仪器"(算符)去读取答案。

但今天,一个实习生闯了大祸。

"我把电子的自旋态和位置态放混了!"实习生小李满脸慌张,"我用了位置算符去读一个自旋态,结果出来一堆乱码!"

老周叹了口气:"你犯的是最基本的错误——算符和态空间必须匹配。位置算符只在位置表象里有意义。如果你要读自旋,就得用自旋算符,在自旋的希尔伯特空间里操作。"

"希尔伯特空间?"

"想象一个无限维的图书馆。每一本书是一个可能的量子态。任何真实的态,都是这些书按特定比例(复数系数)叠加成的。叠加规则是线性的——这就是矢量空间

但量子图书馆比普通图书馆多一个要求:每本书之间要’正交’——不能互相泄露信息。而且我们要能计算’内积’,求出重叠程度。这种带内积的完备矢量空间,就是希尔伯特空间。"

小李似懂非懂:"那算符是什么?"

"算符是图书分类规则。有些规则只是重新排列(么正算符),有些规则能提取书的’编号’(厄米算符)。你想知道粒子的能量?用哈密顿算符。想知道位置?用位置算符。"

"那测量呢?"

老周顿了顿:"测量是……最诡异的部分。测量不是’读取’,而是让系统坍缩到某个本征态上。"

小李沉默了很久:"这太反直觉了。"

"这就是量子力学。"老周拍了拍他的肩膀,"你的任务不是’理解’它,而是学会正确操作它。测量前要明确:你想测什么?用什么算符?得到结果的概率是多少?测量后态变成什么?"


3.2 希尔伯特空间:态的栖身之所

3.2.1 从波函数到态矢量

第1-2章我们把波函数 Ψ(x,t)\Psi(x,t) 看作关于 xx 的函数。现在换一个视角:Ψ\Psi 看作一个抽象的矢量(态矢量),Ψ|\Psi\rangle

xx 只是这个矢量在某套"坐标轴"(表象)下的分量。就像三维向量 v\vec{v} 可以在直角坐标系下写成 (vx,vy,vz)(v_x, v_y, v_z),也可以在球坐标系下写成 (vr,vθ,vϕ)(v_r, v_\theta, v_\phi)——向量本身是不变的,只是表示方式不同。

波函数 Ψ(x)\Psi(x) 就是 Ψ|\Psi\rangle位置表象下的分量:

Ψ(x)=xΨ\Psi(x) = \langle x | \Psi \rangle

graph TD
    subgraph 表象变换
        A["抽象态矢量 |Ψ⟩"] -->|位置表象| B["波函数 Ψ(x) = ⟨x|Ψ⟩"]
        A -->|动量表象| C["动量空间 Φ(p) = ⟨p|Ψ⟩"]
        A -->|能量表象| D["系数 cₙ = ⟨n|Ψ⟩"]
    end
    
    style A fill:#e3f2fd
    style B fill:#e8f5e9
    style C fill:#fff3e0
    style D fill:#fce4ec

物理直觉:想象你站在一座山上,描述"山顶"这个位置。你可以说"向东走3公里,向北走2公里"(直角坐标),也可以说"距离原点3.6公里,方向东北偏北30度"(极坐标)。山顶本身没有变,只是描述方式变了。量子态 Ψ|\Psi\rangle 就是那座"山顶",而 Ψ(x)\Psi(x)Φ(p)\Phi(p)cnc_n 只是不同的坐标描述。

严格定义:什么是希尔伯特空间?

希尔伯特空间 H\mathcal{H} 是一个满足以下条件的向量空间:

  1. 复数域上的向量空间:态矢量可以乘以复数系数,可以相加
  2. 定义了内积ϕΨ\langle \phi | \Psi \rangle 是复数,满足
    • 正定性:ΨΨ0\langle \Psi | \Psi \rangle \geq 0,等于0当且仅当 Ψ=0|\Psi\rangle = 0
    • 共轭对称性:ϕΨ=Ψϕ\langle \phi | \Psi \rangle = \langle \Psi | \phi \rangle^*
    • 对第一变量的线性性、对第二变量的反线性性
  3. 完备性:任何柯西序列都收敛到空间内的某个矢量(没有"漏洞")

有限维 vs 无限维

  • 自旋-1/2系统:二维希尔伯特空间(基矢 ,|\uparrow\rangle, |\downarrow\rangle
  • 一维位置空间:无限维希尔伯特空间(基矢 x|x\ranglex(,)x \in (-\infty, \infty)
  • 无限深势阱中的粒子:可数无限维(基矢 n|n\ranglen=1,2,3,...n = 1, 2, 3, ...

物理意义:希尔伯特空间是量子态的"栖身之所"。任何一个物理上可实现的量子态,都必须是希尔伯特空间中的一个矢量——这意味着它必须可归一化(模有限),必须能用完备基展开。


3.2.2 狄拉克符号:量子力学的语法

1939年,英国物理学家保罗·狄拉克(Paul Dirac)发明了这套符号系统。它的优雅之处在于:抽象运算不依赖具体表象。

符号含义类比
Ψ|\Psi\rangle列向量(ket)三维空间中的列向量 v\vec{v}
Ψ\langle\Psi|行向量(bra),$\Psi\rangle$ 的厄米共轭
$\langle\phi\Psi\rangle$内积,复数
$\langle\Psi\Psi\rangle$模方,等于 $\int
ΨΦ|\Psi\rangle\langle\Phi|外积,算符矩阵 $

正交归一性

fmfn=δmn\langle f_m | f_n \rangle = \delta_{mn}

这就像三维空间中 x^y^=0\hat{x} \cdot \hat{y} = 0x^x^=1\hat{x} \cdot \hat{x} = 1。正交意味着两个态"互不干涉",归一意味着概率总和为1。

历史注记:狄拉克这套符号的诞生颇具戏剧性。据说他是在散步时突然想到的,回家后在黑板上写了几行就定义了整个量子力学的数学语言。爱因斯坦曾感叹:"狄拉克的符号让量子力学变得像诗歌一样优雅。"

graph LR
    subgraph 狄拉克符号的运算规则
        A["|Ψ⟩: ket
列向量"] -->|"⟨Φ|Ψ⟩"| B["内积
复数标量"] C["⟨Φ|: bra
行向量"] -->|"Ψ⟩⟨Φ"| D["外积
算符/矩阵"] B -->|模方| E["⟨Ψ|Ψ⟩ = 1
归一化"] D -->|投影算符| F["|n⟩⟨n|
测量到n后的态"] end style A fill:#e3f2fd style C fill:#e3f2fd style B fill:#e8f5e9 style D fill:#fff3e0 style E fill:#fce4ec style F fill:#fce4ec

3.2.3 完备性:任何态都可以被展开

希尔伯特空间中的任何态都可以按一组完备基展开:

Ψ=ncnn|\Psi\rangle = \sum_n c_n |n\rangle

其中系数 cn=nΨc_n = \langle n | \Psi \rangle。这就是广义傅里叶展开

为什么叫"完备"? 就像三维空间中,x^,y^,z^\hat{x}, \hat{y}, \hat{z} 三个基向量可以组合出任何向量。希尔伯特空间的基向量 n|n\rangle 也足够多,可以组合出任何量子态。

与第2章的联系:第2章我们学过势阱中的能量本征态 ψn(x)\psi_n(x)。它们构成了一组完备基——任何在势阱中的波函数都可以写成这些本征态的叠加。

graph LR
    A["任意态 |Ψ⟩"] -->|展开| B["Σ cₙ|n⟩"]
    B -->|"cₙ = ⟨n|Ψ⟩"| C["基矢 |n⟩的投影"]
    C -->|完备性| D[所有可能态的集合]
    D -->|正交归一| E["⟨m|n⟩ = δₘₙ"]
    
    style A fill:#e3f2fd
    style B fill:#e8f5e9
    style C fill:#fff3e0
    style D fill:#fce4ec

例题:一个粒子处于一维无限深势阱中,其波函数为 Ψ=12(1+2)|\Psi\rangle = \frac{1}{\sqrt{2}}(|1\rangle + |2\rangle),其中 n|n\rangle 是能量本征态。求测量能量得到 E1E_1E2E_2 的概率各是多少?

解答

c1=1Ψ=12,c2=2Ψ=12c_1 = \langle 1 | \Psi \rangle = \frac{1}{\sqrt{2}}, \quad c_2 = \langle 2 | \Psi \rangle = \frac{1}{\sqrt{2}}

概率为 c12=12|c_1|^2 = \frac{1}{2}c22=12|c_2|^2 = \frac{1}{2}。这就是我们在第2章见过的叠加态。


3.3 可观测量与算符

3.3.1 线性算符:态的变换规则

算符 Q^\hat{Q} 把态矢量映射到另一个态矢量:

Q^Ψ=Ψ\hat{Q}|\Psi\rangle = |\Psi'\rangle

在位置表象中,算符通常是微分或乘法操作。例如:

可观测量算符(位置表象)算符类型
位置 xxx^=x\hat{x} = x(乘法)乘法算符
动量 ppp^=ix\hat{p} = -i\hbar\frac{\partial}{\partial x}(微分)微分算符
能量 EEH^=22m2x2+V(x)\hat{H} = -\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2} + V(x)哈密顿算符

物理直觉:算符就像是"提问机器"。你输入一个态 Ψ|\Psi\rangle,算符 x^\hat{x} 问"这个态的平均位置是多少?",算符 p^\hat{p} 问"这个态的平均动量是多少?",算符 H^\hat{H} 问"这个态的能量是多少?"

线性性:算符必须满足线性性质:

Q^(aΨ+bΦ)=aQ^Ψ+bQ^Φ\hat{Q}(a|\Psi\rangle + b|\Phi\rangle) = a\hat{Q}|\Psi\rangle + b\hat{Q}|\Phi\rangle

这是叠加原理的数学要求。

graph TD
    subgraph 算符的物理对应
        A["可观测量
位置、动量、能量"] --> B["对应算符
x̂, p̂, Ĥ"] B -->|作用于| C["量子态 |Ψ⟩"] C -->|输出| D["新的态 |Ψ'⟩"] D -->|测量| E["本征值 qₙ
实数结果"] end style A fill:#e3f2fd style B fill:#fff3e0 style C fill:#e8f5e9 style E fill:#fce4ec

3.3.2 厄米算符:为什么测量结果必须是实数?

能被"测量"的物理量,对应厄米算符(Hermitian Operator),满足:

Q^=Q^\hat{Q} = \hat{Q}^\dagger

fQ^g=Q^fg\langle f | \hat{Q} g \rangle = \langle \hat{Q} f | g \rangle

为什么必须是厄米算符?

因为测量结果必须是实数。厄米算符的本征值保证是实数。

证明:设 Q^q=qq\hat{Q}|q\rangle = q|q\rangle,取厄米共轭:

qQ^=qq\langle q|\hat{Q}^\dagger = q^*\langle q|

由于 Q^=Q^\hat{Q} = \hat{Q}^\dagger

qQ^=qq\langle q|\hat{Q} = q^*\langle q|

再作用到 q|q\rangle

qQ^q=qqq=qqq\langle q|\hat{Q}|q\rangle = q^*\langle q|q\rangle = q\langle q|q\rangle

因此 q=qq^* = q,即 qq 为实数。

历史背景:厄米(Charles Hermite)在19世纪研究矩阵理论时提出了这个概念。他绝对想不到,自己的纯数学工作会在20世纪成为量子力学的基石。

3.3.3 本征值与本征态:确定的测量对应确定的态

算符 Q^\hat{Q}本征方程

Q^qn=qnqn\hat{Q}|q_n\rangle = q_n|q_n\rangle

  • qn|q_n\rangle:本征态(对应确定测量结果的态)
  • qnq_n:本征值(测量时读出的数值)

关键定理:厄米算符的不同本征值对应的本征态互相正交。

证明:设 Q^qm=qmqm\hat{Q}|q_m\rangle = q_m|q_m\rangleQ^qn=qnqn\hat{Q}|q_n\rangle = q_n|q_n\rangle,且 qmqnq_m \neq q_n

qmQ^qn=qnqmqn\langle q_m|\hat{Q}|q_n\rangle = q_n\langle q_m|q_n\rangle

qmQ^qn=Q^qmqn=qmqmqn\langle q_m|\hat{Q}|q_n\rangle = \langle \hat{Q}q_m|q_n\rangle = q_m\langle q_m|q_n\rangle

所以 (qnqm)qmqn=0(q_n - q_m)\langle q_m|q_n\rangle = 0,由于 qnqmq_n \neq q_m,必有 qmqn=0\langle q_m|q_n\rangle = 0

graph TD
    subgraph 测量的数学结构
        A["厄米算符 Q̂"] -->|本征方程| B["Q̂|qₙ⟩ = qₙ|qₙ⟩"]
        B --> C["本征值 qₙ: 实数"]
        B --> D["本征态 |qₙ⟩: 正交归一"]
        D --> E[构成完备基]
        E --> F[任意态可展开]
        F --> G["|Ψ⟩ = Σ cₙ|qₙ⟩"]
    end
    
    style C fill:#e8f5e9
    style D fill:#e8f5e9
    style E fill:#fff3e0

3.4 广义统计诠释:测量的本质

3.4.1 测量什么?

对一个处于 Ψ|\Psi\rangle 的系统,测量可观测量 Q^\hat{Q}

  1. 可能结果Q^\hat{Q} 的本征值 qnq_n
  2. 得到 qnq_n 的概率cn2|c_n|^2,其中 cn=qnΨc_n = \langle q_n | \Psi \rangle
  3. 测量后:系统坍缩到对应的本征态 qn|q_n\rangle

这就是投影假说(Projection Postulate)。

广义统计诠释的完整表述

Griffiths 将量子力学的统计诠释概括为以下公理化体系

公理1(态矢量):量子系统的状态由希尔伯特空间中的归一化矢量 Ψ|\Psi\rangle 描述。

公理2(可观测量):每个可观测量对应一个厄米算符 Q^\hat{Q}

公理3(测量结果):测量 Q^\hat{Q} 的结果只能是其本征值 qnq_n

公理4(测量概率):得到 qnq_n 的概率为 cn2|c_n|^2,其中 cn=qnΨc_n = \langle q_n | \Psi \rangle

公理5(测量后态):测量后,系统坍缩到对应的本征态 qn|q_n\rangle(投影假说)。

公理6(期望值):大量重复测量的平均值为 Q=ΨQ^Ψ=nqncn2\langle Q \rangle = \langle \Psi | \hat{Q} | \Psi \rangle = \sum_n q_n |c_n|^2

这五条公理(加上薛定谔方程描述的时间演化)构成了非相对论量子力学的完整数学框架。第3章的所有内容,都是这五条公理在不同表象下的展开。


例题详解:一个粒子处于态 Ψ=131+232|\Psi\rangle = \frac{1}{\sqrt{3}}|1\rangle + \sqrt{\frac{2}{3}}|2\rangle,其中 1|1\rangle2|2\rangle 是某厄米算符 Q^\hat{Q} 的本征态,对应本征值 q1=3q_1 = 3q2=7q_2 = 7。求测量 Q^\hat{Q} 的期望值。

分步推导

Q=ΨQ^Ψ\langle Q \rangle = \langle \Psi | \hat{Q} | \Psi \rangle

=(131+232)Q^(131+232)= \left(\frac{1}{\sqrt{3}}\langle 1| + \sqrt{\frac{2}{3}}\langle 2|\right) \hat{Q} \left(\frac{1}{\sqrt{3}}|1\rangle + \sqrt{\frac{2}{3}}|2\rangle\right)

= \frac{1}{3}\langle 1|\hat{Q}|1\rangle + \frac{2}{3}\langle 2|\hat{Q}|2\rangle + \text{交叉项}

交叉项由于正交性为零:1Q^2=q212=0\langle 1|\hat{Q}|2\rangle = q_2\langle 1|2\rangle = 0

Q=133+237=1+143=1735.67\langle Q \rangle = \frac{1}{3} \cdot 3 + \frac{2}{3} \cdot 7 = 1 + \frac{14}{3} = \frac{17}{3} \approx 5.67

3.4.2 期望值与不确定性

期望值

Q=ΨQ^Ψ=nqncn2\langle Q \rangle = \langle \Psi | \hat{Q} | \Psi \rangle = \sum_n q_n |c_n|^2

物理直觉:期望值不是"最可能的值",而是大量重复测量的平均值。就像掷骰子,期望是3.5,但你永远掷不出3.5——它是长期平均。

不确定性(标准差)

σQ=Q2Q2\sigma_Q = \sqrt{\langle Q^2 \rangle - \langle Q \rangle^2}

如果系统处于本征态 qn|q_n\rangle,则 σQ=0\sigma_Q = 0——测量结果完全确定。这就是"本征态"的含义:在这个态上,对应的物理量有确定值。

graph LR
    A["量子态 |Ψ⟩"] -->|展开| B["Σ cₙ|qₙ⟩"]
    B -->|"测量qₙ概率"| C["|cₙ|²"]
    B -->|测量后坍缩| D["|qₙ⟩"]
    C -->|加权平均| E["⟨Q⟩ = Σ qₙ|cₙ|²"]
    E -->|涨落| F["σ_Q = √⟨Q²⟩ - ⟨Q⟩²"]
    
    style A fill:#e3f2fd
    style B fill:#e8f5e9
    style D fill:#ffebee
    style F fill:#fff3e0

3.4.3 故事续集:管理员的秘密

小李在图书馆加班,终于理解了测量问题的真正含义。

"所以,"他对着老周说,"当我们’测量电子位置’时,我们不是’去看它本来在哪’——而是强迫电子从叠加态中选一个位置本征态?"

"对。"老周点头,"测量是主动的、破坏性的。你测量完,原来的态就没了。"

"那如果我不测量呢?"

"电子就保持叠加态,同时存在于多个位置。只有测量让它’决定’自己在哪里。"

小李沉默了很久:"这太反直觉了。"

"这就是量子力学。"老周拍了拍他的肩膀,"你的任务不是’理解’它,而是学会正确操作它。测量前要明确:你想测什么?用什么算符?得到结果的概率是多少?测量后态变成什么?"

与第1章的联系:第1章的双缝实验中,电子"同时通过两个缝"就是叠加态。但如果你在缝后放探测器测量电子从哪个缝通过,电子就被迫坍缩到"左缝"或"右缝"本征态,干涉条纹消失。这就是测量破坏叠加态的直接体现。


3.5 不确定性原理的一般形式

3.5.1 对易子:两个可观测量能否"和平共处"?

两个算符的对易子

[A^,B^]=A^B^B^A^[\hat{A}, \hat{B}] = \hat{A}\hat{B} - \hat{B}\hat{A}

如果对易子为零,说明两个可观测量可以同时精确测量(有共同本征态)。

如果不对易,测量一个会干扰另一个。

例题:计算 [x^,p^][\hat{x}, \hat{p}]

分步推导:对任意波函数 ψ(x)\psi(x)

[x^,p^]ψ=x^p^ψp^x^ψ[\hat{x}, \hat{p}]\psi = \hat{x}\hat{p}\psi - \hat{p}\hat{x}\psi

=x(iψx)(ix)(xψ)= x\left(-i\hbar\frac{\partial\psi}{\partial x}\right) - \left(-i\hbar\frac{\partial}{\partial x}\right)(x\psi)

=ixψx+i(ψ+xψx)= -i\hbar x\frac{\partial\psi}{\partial x} + i\hbar\left(\psi + x\frac{\partial\psi}{\partial x}\right)

=iψ= i\hbar\psi

因此:

[x^,p^]=i[\hat{x}, \hat{p}] = i\hbar

这是量子力学最基本的关系式,与第2章的德布罗意关系 p=kp = \hbar k 本质相连。

graph LR
    A["对易子 [A,B] = 0"] --> B["A,B可同时精确测量"]
    A -->|有共同本征态| C["σ_A = σ_B = 0"]
    D["对易子 [A,B] ≠ 0"] --> E["A,B不能同时精确测量"]
    E --> F["σₐσᵦ ≥ ½|⟨[A,B]⟩|"]
    E -->|测量A会扰动B| G[互补性原理]
    
    style B fill:#e8f5e9
    style C fill:#e8f5e9
    style F fill:#ffebee
    style G fill:#fff3e0

3.5.2 广义不确定性原理

对于任意两个可观测量 A^\hat{A}B^\hat{B}

σAσB12[A^,B^]\sigma_A \sigma_B \geq \frac{1}{2}|\langle [\hat{A}, \hat{B}] \rangle|

特例

  • 位置与动量:[x^,p^]=i[\hat{x}, \hat{p}] = i\hbar,所以 σxσp2\sigma_x \sigma_p \geq \frac{\hbar}{2}
  • 能量与时间:[H^,t^][\hat{H}, \hat{t}] 形式上有 ii\hbar,所以 ΔEΔt2\Delta E \Delta t \geq \frac{\hbar}{2}

物理直觉:不确定性不是"我们测量不够精确",而是"自然界不允许同时确定"。就像你无法同时知道一首歌的确切频率和确切持续时间——频率精确意味着时间无限长,时间短暂意味着频率弥散。这不是仪器的缺陷,是傅里叶变换的数学本质。量子力学的不确定性是同样的道理。

广义不确定性原理的证明

Griffiths 在书中给出了简洁的证明。这里我们概述核心步骤:

目标:证明 σAσB12[A^,B^]\sigma_A \sigma_B \geq \frac{1}{2}|\langle [\hat{A}, \hat{B}] \rangle|

第一步:定义"偏移算符"

A^=A^A,B^=B^B\hat{A}' = \hat{A} - \langle A \rangle, \quad \hat{B}' = \hat{B} - \langle B \rangle

σA2=(A^)2\sigma_A^2 = \langle (\hat{A}')^2 \rangleσB2=(B^)2\sigma_B^2 = \langle (\hat{B}')^2 \rangle

第二步:考虑辅助态
定义 f=A^Ψ|f\rangle = \hat{A}'|\Psi\rangleg=B^Ψ|g\rangle = \hat{B}'|\Psi\rangle

由柯西-施瓦茨不等式:

ffggfg2\langle f|f\rangle \langle g|g\rangle \geq |\langle f|g\rangle|^2

即:

σA2σB2A^B^2\sigma_A^2 \sigma_B^2 \geq |\langle \hat{A}'\hat{B}' \rangle|^2

第三步:分解 A^B^\hat{A}'\hat{B}'
将算符分解为厄米部分和反厄米部分:

A^B^=12[A^,B^]+12{A^,B^}\hat{A}'\hat{B}' = \frac{1}{2}[\hat{A}', \hat{B}'] + \frac{1}{2}\{\hat{A}', \hat{B}'\}

其中 [A^,B^]=[A^,B^][\hat{A}', \hat{B}'] = [\hat{A}, \hat{B}](因为常数对易子为零),而 {A^,B^}\{\hat{A}', \hat{B}'\} 是反对易子。

厄米部分的期望值是实数,反厄米部分的期望值是纯虚数。因此:

A^B^2=14[A^,B^]2+14{A^,B^}2|\langle \hat{A}'\hat{B}' \rangle|^2 = \frac{1}{4}|\langle [\hat{A}, \hat{B}] \rangle|^2 + \frac{1}{4}|\langle \{\hat{A}', \hat{B}'\} \rangle|^2

第四步:放缩
由于第二项非负:

σA2σB214[A^,B^]2\sigma_A^2 \sigma_B^2 \geq \frac{1}{4}|\langle [\hat{A}, \hat{B}] \rangle|^2

开方得到:

σAσB12[A^,B^]\sigma_A \sigma_B \geq \frac{1}{2}|\langle [\hat{A}, \hat{B}] \rangle|

证毕

物理直觉:这个证明的核心是柯西-施瓦茨不等式——它是内积空间的普遍性质。不确定性原理不是量子力学的"附加假设",而是内积空间几何的必然结果。只要物理理论用希尔伯特空间描述,不确定性就不可避免。


3.5.3 最小不确定态:高斯波包

什么态能达到不确定性的下限?答案是高斯波包。这也解释了为什么谐振子的基态是高斯型的——它在位置和动量之间取得了最优平衡。

推导:对于位置和动量,不等式取等号时:

(p^p)Ψ=iλ(x^x)Ψ(\hat{p} - \langle p \rangle)|\Psi\rangle = i\lambda(\hat{x} - \langle x \rangle)|\Psi\rangle

其中 λ\lambda 是实数。解这个微分方程得到高斯型波函数:

Ψ(x)=Aeλ(xx)2/2eipx/\Psi(x) = A e^{-\lambda(x - \langle x \rangle)^2/2\hbar} e^{i\langle p \rangle x/\hbar}

这正是谐振子基态波函数的形式!所以谐振子基态是"最确定的态"——在位置和动量的不确定性之间取得了最佳妥协。

graph TD
    A[不确定性原理] --> B["σ_x σ_p ≥ ℏ/2"]
    A --> C["ΔE Δt ≥ ℏ/2"]
    B -->|取等号| D[最小不确定态]
    D --> E[高斯波包]
    E --> F[谐振子基态]
    C -->|能级寿命| G[自然线宽]
    
    style B fill:#e3f2fd
    style C fill:#e3f2fd
    style E fill:#e8f5e9
    style F fill:#fff3e0
    style G fill:#fce4ec

3.6 表象与表象变换

3.6.1 位置表象 vs 动量表象

同一个态矢量,可以在不同表象下表示:

位置表象动量表象
波函数Ψ(x)\Psi(x)Φ(p)\Phi(p)
位置算符xx(乘法)ipi\hbar\frac{\partial}{\partial p}
动量算符ix-i\hbar\frac{\partial}{\partial x}pp(乘法)
内积ψϕdx\int \psi^* \phi \, dxΦΦ~dp\int \Phi^* \tilde{\Phi} \, dp

变换关系(傅里叶变换)

Φ(p)=12πΨ(x)eipx/dx\Phi(p) = \frac{1}{\sqrt{2\pi\hbar}} \int_{-\infty}^{\infty} \Psi(x) e^{-ipx/\hbar} dx

graph TD
    A["态矢量 |Ψ⟩"] -->|傅里叶变换| B["动量表象 Φ(p)"]
    A -->|恒等| C["位置表象 Ψ(x)"]
    B -->|逆傅里叶变换| A
    C -->|逆变换| A
    
    style A fill:#e3f2fd
    style B fill:#fff3e0
    style C fill:#e8f5e9

例题详解:一个粒子处于态 Ψ(x)=Aeax\Psi(x) = A e^{-a|x|},求动量表象的波函数 Φ(p)\Phi(p)

分步推导

Φ(p)=12πAeaxeipx/dx\Phi(p) = \frac{1}{\sqrt{2\pi\hbar}} \int_{-\infty}^{\infty} A e^{-a|x|} e^{-ipx/\hbar} dx

=A2π[0eaxeipx/dx+0eaxeipx/dx]= \frac{A}{\sqrt{2\pi\hbar}} \left[\int_{0}^{\infty} e^{-ax} e^{-ipx/\hbar} dx + \int_{-\infty}^{0} e^{ax} e^{-ipx/\hbar} dx\right]

=A2π[1a+ip/+1aip/]= \frac{A}{\sqrt{2\pi\hbar}} \left[\frac{1}{a + ip/\hbar} + \frac{1}{a - ip/\hbar}\right]

=A2π2aa2+(p/)2= \frac{A}{\sqrt{2\pi\hbar}} \cdot \frac{2a}{a^2 + (p/\hbar)^2}

这正是洛伦兹型(Cauchy)分布!位置空间的指数衰减对应动量空间的双曲线衰减。位置越局域化(aa 越大),动量越弥散化——这正是不确定性原理的体现。

表象变换的矩阵形式

表象变换可以更抽象地理解为基变换。设 {ei}\{|e_i\rangle\}{fj}\{|f_j\rangle\} 是两套不同的完备正交归一基。

变换矩阵

Sji=fjeiS_{ji} = \langle f_j | e_i \rangle

矩阵 SS幺正矩阵SS=IS^\dagger S = I

态矢量的变换

Ψ=iciei=jdjfj|\Psi\rangle = \sum_i c_i |e_i\rangle = \sum_j d_j |f_j\rangle

系数之间的关系:

dj=iSjicid_j = \sum_i S_{ji} c_i

算符的变换
算符 Q^\hat{Q} 在基 {ei}\{|e_i\rangle\} 下的矩阵元为 Qij=eiQ^ejQ_{ij} = \langle e_i | \hat{Q} | e_j \rangle。在新基下:

Q=SQSQ' = S Q S^\dagger

物理直觉:表象变换就像换坐标系。向量本身没变,只是分量变了。算符本身也没变,只是矩阵表示变了。幺正变换保持内积不变——就像三维空间中的旋转不改变向量的长度和夹角。

特例:位置→动量表象

连续基的变换"矩阵"就是傅里叶变换核:

S(p,x)=px=12πeipx/S(p, x) = \langle p | x \rangle = \frac{1}{\sqrt{2\pi\hbar}} e^{-ipx/\hbar}

这正是我们之前写出的傅里叶变换公式!


3.6.2 能量表象:为什么本征态如此重要?

能量表象(也称为"本征能量表象"或"粒子数表象")是最常用的表象之一。对于哈密顿量 H^\hat{H},其本征态 n|n\rangle 满足:

H^n=Enn\hat{H}|n\rangle = E_n|n\rangle

在能量表象中,哈密顿量是对角矩阵:

Hmn=mH^n=EnδmnH_{mn} = \langle m|\hat{H}|n\rangle = E_n\delta_{mn}

物理直觉:能量表象就像是"自然坐标系"。在这个坐标系里,能量是"坐标轴",态矢量在这些轴上的投影就是能量本征态的叠加系数。演化方程变得特别简单——每个本征态独立演化,相位因子为 eiEnt/e^{-iE_nt/\hbar}

graph LR
    subgraph 表象变换的类比
        A["态矢量 |Ψ⟩"] -->|位置表象| B["Ψ(x)"]
        A -->|动量表象| C["Φ(p)"]
        A -->|能量表象| D["cₙ(t)"]
        B -->|傅里叶变换| C
        D -->|时间演化| E["cₙ(0)e^(-iEₙt/ℏ)"]
    end
    
    style A fill:#e3f2fd
    style B fill:#e8f5e9
    style C fill:#fff3e0
    style D fill:#fce4ec
    style E fill:#fce4ec

数值例题:表象变换中的矩阵计算

问题:考虑一个二维希尔伯特空间,基矢为 1|1\rangle2|2\rangle。算符 A^\hat{A} 在此基下的矩阵为:

A=(3113)A = \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix}

一个态 Ψ=12(1+2)|\Psi\rangle = \frac{1}{\sqrt{2}}(|1\rangle + |2\rangle)

求:

  1. 测量 A^\hat{A} 的可能结果和概率
  2. 期望值 A\langle A \rangle
  3. 不确定性 σA\sigma_A

解答
第一步:求 A^\hat{A} 的本征值和本征态

从0.5节的例题已知:

  • λ1=2\lambda_1 = 2,对应 a1=12(12)|a_1\rangle = \frac{1}{\sqrt{2}}(|1\rangle - |2\rangle)
  • λ2=4\lambda_2 = 4,对应 a2=12(1+2)|a_2\rangle = \frac{1}{\sqrt{2}}(|1\rangle + |2\rangle)

第二步:将 Ψ|\Psi\rangleA^\hat{A} 的本征态展开

注意到 Ψ=a2|\Psi\rangle = |a_2\rangle

所以:

c1=a1Ψ=0,c2=a2Ψ=1c_1 = \langle a_1 | \Psi \rangle = 0, \quad c_2 = \langle a_2 | \Psi \rangle = 1

第三步:测量结果和概率

  • 测得 λ1=2\lambda_1 = 2 的概率:c12=0|c_1|^2 = 0
  • 测得 λ2=4\lambda_2 = 4 的概率:c22=1|c_2|^2 = 1

结论Ψ|\Psi\rangle 恰好是 A^\hat{A} 的本征态 a2|a_2\rangle,所以测量结果完全确定为4。

第四步:验证期望值和不确定性

A=ΨA^Ψ=4\langle A \rangle = \langle \Psi | \hat{A} | \Psi \rangle = 4

A2=ΨA^2Ψ=16\langle A^2 \rangle = \langle \Psi | \hat{A}^2 | \Psi \rangle = 16

σA=1616=0\sigma_A = \sqrt{16 - 16} = 0

结论:在本征态上测量,不确定性为零——这与我们的理论完全一致。

延伸思考:如果 Ψ=1|\Psi\rangle = |1\rangle,则 Ψ|\Psi\rangle 不是 A^\hat{A} 的本征态。此时:

c1=a11=12,c2=a21=12c_1 = \langle a_1 | 1 \rangle = \frac{1}{\sqrt{2}}, \quad c_2 = \langle a_2 | 1 \rangle = \frac{1}{\sqrt{2}}

概率各为 1/21/2

A=122+124=3\langle A \rangle = \frac{1}{2} \cdot 2 + \frac{1}{2} \cdot 4 = 3

A2=124+1216=10\langle A^2 \rangle = \frac{1}{2} \cdot 4 + \frac{1}{2} \cdot 16 = 10

σA=109=1\sigma_A = \sqrt{10 - 9} = 1

结论:在非本征态上测量,结果有不确定性。这正是量子力学概率性的核心体现。


3.7 本章总结

graph TD
    A[第3章核心] --> B[希尔伯特空间]
    A --> C[厄米算符]
    A --> D[广义统计诠释]
    A --> E[不确定性原理]
    A --> F[表象变换]
    
    B -->|结构| G["矢量空间 + 内积 + 完备性"]
    C -->|性质| H["本征值实数 + 本征态正交"]
    D -->|内容| I["测量 = 投影到本征态"]
    E -->|形式| J["σₐσᵦ ≥ ½|⟨[A,B]⟩|"]
    F -->|本质| K[同一态的不同坐标描述]
    
    G --> L["狄拉克符号
|Ψ⟩, ⟨Φ|, 内积"] H --> M[可观测量的数学基础] I --> N[测量后态坍缩] J --> O["位置-动量
能量-时间"] K --> P["位置/动量/能量表象"] L --> Q["第1-2章的波函数
是位置表象分量"] M --> R["第4章氢原子
能级是H的本征值"] N --> S["第5章全同粒子
对称性要求"] O --> T["第2章谐振子
基态=最小不确定态"] style G fill:#e3f2fd style M fill:#e8f5e9 style N fill:#ffebee style O fill:#fff3e0

带走的三句话:

  1. 态是矢量,算符是操作,测量是投影。 这是量子力学的"操作系统",抽象但强大。
  2. 厄米算符保证本征值为实数,本征态构成完备正交基。 这是测量有确定结果的数学基础。
  3. 不对易的算符不能同时精确测量——这是不确定性的根源,不是技术限制。 它是量子世界的基本属性。

"量子力学的形式主义像一台精密的机器。你不需要理解为什么它工作,只需要知道如何正确操作它——然后,奇迹般地,它总是能给出正确的答案。" —— Griffiths


3.8 练习与思考

  1. 算符性质:证明位置算符 x^\hat{x} 和动量算符 p^\hat{p} 都是厄米算符。提示:对 p^\hat{p} 用分部积分,波函数在无穷远处为零。

  2. 表象变换:一个粒子处于态 Ψ(x)=Aeax\Psi(x) = A e^{-a|x|},求动量表象的波函数 Φ(p)\Phi(p)。验证归一化条件在两种表象中都成立,并讨论 aa 的物理意义(与不确定性原理的联系)。

  3. 对易子计算:证明 [x^,p^2]=2ip^[\hat{x}, \hat{p}^2] = 2i\hbar\hat{p}。然后用这个结果说明:为什么动能和动量可以同时测量,但位置和动能不能?进一步思考:[x^,H^][\hat{x}, \hat{H}] 的对易子与什么物理量有关?

  4. 投影算符:证明 nn|n\rangle\langle n| 是投影到本征态 n|n\rangle 的投影算符。对于态 Ψ=ncnn|\Psi\rangle = \sum_n c_n|n\rangle,计算 P^nΨ\hat{P}_n|\Psi\rangle,并解释为什么测量概率是 cn2|c_n|^2