第4章 公理化讨论:量子力学的游戏规则

📑 目录

第4章 公理化讨论:量子力学的游戏规则

"量子力学的公理不是凭空创造的。它们是对实验事实的数学提炼,就像欧几里得公理是对空间经验的提炼一样。"


故事场景:新世界的游戏规则手册

2123年,人类首次接触了一个平行宇宙的文明。这个宇宙的物理规律与地球截然不同——物体可以同时处于多个位置,观察行为会改变被观察的对象,确定性预言被概率取代。地球的外交官带着牛顿力学和经典电磁学的"地球规则手册"试图与他们交流,却发现完全无法描述这个宇宙的现象。平行宇宙的物理学家微笑着递给外交官一本薄薄的手册:"你们需要先学会我们世界的基本规则——不是因为我们更喜欢这些规则,而是这是唯一能与实验一致的方式。"外交官翻开手册,第一页写着:"规则一:系统的状态由希尔伯特空间中的向量描述。规则二:可观测量由厄米算符表示…"

这就是Shankar在第4章呈现的内容——量子力学的公理体系。这不是哲学思辨,而是将第2-3章的实验事实提炼为数学规则。


前置知识:概率论基础

概率的基本概念

概率 P(A)P(A):事件 AA 发生的可能性,满足 0P(A)10 \leq P(A) \leq 1,且所有互斥事件的概率之和为1。

期望值(均值):如果随机变量 XX 取值 xix_i 的概率为 PiP_i,则

X=ixiPi\langle X \rangle = \sum_i x_i P_i

方差:衡量随机变量偏离期望的程度

(ΔX)2=X2X2=i(xiX)2Pi(\Delta X)^2 = \langle X^2 \rangle - \langle X \rangle^2 = \sum_i (x_i - \langle X \rangle)^2 P_i

标准差 ΔX=(ΔX)2\Delta X = \sqrt{(\Delta X)^2} 表示"不确定性"的大小。

独立事件:如果两个事件 AABB 独立,则 P(A and B)=P(A)P(B)P(A \text{ and } B) = P(A)P(B)

数值例子:掷一个公平的六面骰子

  • 每个面的概率:Pi=1/6P_i = 1/6i=1,2,,6i = 1, 2, \ldots, 6
  • 期望值:X=1+2+3+4+5+66=3.5\langle X \rangle = \frac{1+2+3+4+5+6}{6} = 3.5
  • 方差:(ΔX)2=(13.5)2+(23.5)2++(63.5)26=35122.92(\Delta X)^2 = \frac{(1-3.5)^2 + (2-3.5)^2 + \cdots + (6-3.5)^2}{6} = \frac{35}{12} \approx 2.92
  • 标准差:ΔX1.71\Delta X \approx 1.71

概率与量子力学的联系

量子力学中的概率与经典概率有本质区别:

  • 经典概率反映"无知"(我们不知道骰子的结果,但结果已经确定)
  • 量子概率反映"内禀不确定性"(系统在被测量前没有确定的属性)

在量子力学中,概率不是因为我们"不知道",而是因为自然本身不允许同时确定某些属性。


4.1 为什么要公理化

4.1.1 从实验到公理

回顾第2-3章的五大实验危机:

  • 黑体辐射 → 能量量子化
  • 光电效应/康普顿散射 → 光具有粒子性
  • 原子稳定性 → 轨道必须量子化
  • 斯特恩-盖拉赫 → 角动量空间量子化

这些实验事实无法用经典力学的框架解释。物理学家被迫寻找一套全新的数学结构。

公理化的目的

  1. 将实验规律提炼为少数基本假设
  2. 从公理出发,通过数学推导获得所有物理预言
  3. 明确理论的适用范围和基本限制
  4. 为后续应用(原子物理、固体物理、粒子物理等)提供统一基础
graph TD
    A[实验事实] --> B[黑体辐射]
    A --> C[光电效应]
    A --> D[原子光谱]
    A --> E["Stern-Gerlach"]
    
    B --> F[归纳提炼]
    C --> F
    D --> F
    E --> F
    
    F --> G[数学公理]
    G --> H[希尔伯特空间]
    G --> I[厄米算符]
    G --> J[测量公设]
    G --> K[演化方程]
    
    H --> L["态矢量 |ψ⟩"]
    I --> M["可观测量 Â"]
    J --> N[概率解释]
    K --> O[幺正演化]
    
    L --> P[所有物理推论]
    M --> P
    N --> P
    O --> P

4.2 公理一:态矢量与状态空间

4.2.1 公理陈述

公理 I:量子系统的每一个可能状态对应于一个希尔伯特空间 H\mathcal{H} 中的向量(称为态矢量或态函数),记作 ψ|\psi\rangle。如果 ψ|\psi\ranglecψc|\psi\ranglecc 为任意非零复数)描述同一个物理状态。

4.2.2 希尔伯特空间的严格结构

希尔伯特空间是一个完备的内积空间。让我们拆解这个定义:

  1. 向量空间结构:态矢量可以相加、数乘

    ψ+ϕH,aψH|\psi\rangle + |\phi\rangle \in \mathcal{H}, \quad a|\psi\rangle \in \mathcal{H}

  2. 内积结构:可以计算两个态的"重叠"

    ψϕ=ψ(x)ϕ(x)dx\langle\psi|\phi\rangle = \int \psi^*(x)\phi(x)\,dx

  3. 完备性:柯西序列收敛到空间内的向量(保证数学上的良好行为)

4.2.3 归一化与物理意义

由于 ψ|\psi\ranglecψc|\psi\rangle 描述同一物理状态,我们通常选择归一化

ψψ=1\langle\psi|\psi\rangle = 1

即使归一化后,仍存在一个整体相位自由度ψ|\psi\rangleeiθψe^{i\theta}|\psi\rangle 在物理上等价。相位不影响任何测量结果。

物理直觉:态矢量不是"物理实体在空间中的分布",而是编码了系统所有信息的数学对象。就像程序代码不是计算机硬件,但包含了运行所需的一切指令。

graph LR
    A["公理I: 态矢量"] --> B["希尔伯特空间 ℋ"]
    
    B --> C[向量空间]
    B --> D[内积结构]
    B --> E[完备性]
    
    C --> F[叠加原理]
    F --> G["|ψ⟩ = α|1⟩ + β|2⟩"]
    
    D --> H[概率幅]
    H --> I["⟨ψ|φ⟩ = 复数"]
    
    J[等价类] --> K["|ψ⟩ ~ c|ψ⟩"]
    K --> L[选择归一化]
    L --> M["⟨ψ|ψ⟩ = 1"]
    
    M --> N[剩余相位自由度]
    N --> O["e^(iθ)|ψ⟩ ≡ |ψ⟩"]

4.3 公理二:可观测量与厄米算符

4.3.1 公理陈述

公理 II:量子系统的每一个可观测量(可测量的物理量)对应于一个厄米算符 A^\hat{A},作用在希尔伯特空间上。

4.3.2 为什么必须是厄米算符

谱定理告诉我们厄米算符的三个关键性质:

  1. 本征值为实数A^a=aa\hat{A}|a\rangle = a|a\rangle,其中 aRa \in \mathbb{R}

    物理原因:测量结果必须是实数,因为我们用实数刻度尺读数

  2. 不同本征值的本征向量正交aa=0\langle a|a'\rangle = 0 如果 aaa \neq a'

    物理原因:不同测量结果互相排斥,对应态之间没有重叠

  3. 本征向量构成完备基:任何态可以展开为

    ψ=acaa|\psi\rangle = \sum_a c_a |a\rangle

    物理原因:完备性保证我们可以用测量结果"重建"任何状态

4.3.3 谱分解

厄米算符可以进行谱分解(对角化):

A^=aaaa\hat{A} = \sum_a a |a\rangle\langle a|

如果存在连续谱:

A^=aaada\hat{A} = \int a |a\rangle\langle a|\,da

物理意义:可观测量 A^\hat{A} "由所有可能的测量结果 aa 及其对应的投影算符 aa|a\rangle\langle a| 组成"。

graph TD
    A["公理II: 可观测量"] --> B["厄米算符 Â"]
    
    B --> C[谱定理]
    C --> D["本征值: 实数"]
    C --> E["本征向量: 正交归一"]
    C --> F["完备性: 构成基"]
    
    D --> G[测量结果是实数]
    E --> H[结果互斥]
    F --> I[可以展开任意态]
    
    J[谱分解] --> K["Â = ∑a|a⟩⟨a|"]
    K --> L["投影算符 Pₐ = |a⟩⟨a|"]
    L --> M["Pₐ² = Pₐ"]
    M --> N["幂等性 = 重复测量不变"]

4.4 公理三:测量的概率解释

4.4.1 公理陈述

公理 III:对处于状态 ψ|\psi\rangle 的系统测量可观测量 A^\hat{A},得到本征值 aa概率为:

P(a)=aψ2P(a) = |\langle a|\psi\rangle|^2

测量后,系统的状态"坍缩"到相应的本征态:

|\psi\rangle \xrightarrow{\text{测得 } a} |a\rangle

4.4.2 玻恩规则的物理内涵

这个公理由马克斯·玻恩在1926年提出,因此称为玻恩规则(Born rule)。它是量子力学最核心的概率解释。

展开 ψ|\psi\rangleA^\hat{A} 的本征基下:

ψ=acaa,ca=aψ|\psi\rangle = \sum_a c_a |a\rangle, \quad c_a = \langle a|\psi\rangle

P(a)=ca2P(a) = |c_a|^2。系数 cac_a 称为概率幅(probability amplitude)。

关键洞察

  • 概率幅 cac_a 是复数,可以是正、负或纯虚数
  • 概率 ca2|c_a|^2 是实数且非负
  • 不同路径的概率幅可以干涉(相加后再取模平方),这是量子干涉的根源

4.4.3 期望值与不确定性

如果进行大量相同准备态的测量,结果的平均值(期望值)为:

A=aaP(a)=ψA^ψ\langle A \rangle = \sum_a a P(a) = \langle\psi|\hat{A}|\psi\rangle

方差(不确定性的平方)为:

(ΔA)2=A2A2=ψ(A^A)2ψ(\Delta A)^2 = \langle A^2 \rangle - \langle A \rangle^2 = \langle\psi|(\hat{A} - \langle A\rangle)^2|\psi\rangle

数值例子:自旋-1/2系统

考虑态 ψ=12(++)|\psi\rangle = \frac{1}{\sqrt{2}}(|+\rangle + |-\rangle),测量 SzS_z

  • SzS_z 的本征态:+|+\rangle(本征值 +/2+\hbar/2),|-\rangle(本征值 /2-\hbar/2
  • 概率幅:c+=+ψ=12c_+ = \langle +|\psi\rangle = \frac{1}{\sqrt{2}}c=ψ=12c_- = \langle -|\psi\rangle = \frac{1}{\sqrt{2}}
  • 概率:P(+)=c+2=12P(+) = |c_+|^2 = \frac{1}{2}P()=c2=12P(-) = |c_-|^2 = \frac{1}{2}
  • 期望值:Sz=212+(2)12=0\langle S_z \rangle = \frac{\hbar}{2} \cdot \frac{1}{2} + (-\frac{\hbar}{2}) \cdot \frac{1}{2} = 0
  • 方差:(ΔSz)2=Sz2Sz2=240=24(\Delta S_z)^2 = \langle S_z^2 \rangle - \langle S_z \rangle^2 = \frac{\hbar^2}{4} - 0 = \frac{\hbar^2}{4}
  • 标准差:ΔSz=2\Delta S_z = \frac{\hbar}{2}
graph TD
    A["公理III: 测量"] --> B[玻恩规则]
    
    B --> C["概率幅 cₐ = ⟨a|ψ⟩"]
    B --> D["概率 P(a) = |cₐ|²"]
    
    C --> E["复数: 可干涉"]
    D --> F["实数: 非负"]
    
    E --> G[量子干涉]
    G --> H[双缝实验]
    
    I[测量后] --> J[态坍缩]
    J --> K["|ψ⟩ → |a⟩"]
    
    L[统计量] --> M["期望值 ⟨A⟩"]
    L --> N["方差 (ΔA)²"]
    M --> O["⟨ψ|Â|ψ⟩"]
    N --> P["⟨ψ|(Â-⟨A⟩)²|ψ⟩"]

4.5 公理四:时间演化——薛定谔方程

4.5.1 公理陈述

公理 IV:封闭量子系统的时间演化由薛定谔方程描述:

itψ(t)=H^ψ(t)i\hbar \frac{\partial}{\partial t}|\psi(t)\rangle = \hat{H}|\psi(t)\rangle

其中 H^\hat{H} 是系统的哈密顿算符(能量可观测量)。

4.5.2 幺正演化

薛定谔方程的解可以形式地写成:

ψ(t)=U^(t)ψ(0)|\psi(t)\rangle = \hat{U}(t)|\psi(0)\rangle

其中演化算符(propagator):

U^(t)=exp(iH^t)\hat{U}(t) = \exp\left(-\frac{i\hat{H}t}{\hbar}\right)

关键性质U^(t)\hat{U}(t)幺正算符(unitary),即:

U^U^=U^U^=I^\hat{U}^\dagger \hat{U} = \hat{U} \hat{U}^\dagger = \hat{I}

物理意义

  1. 概率守恒ψ(t)ψ(t)=ψ(0)U^U^ψ(0)=ψ(0)ψ(0)=1\langle\psi(t)|\psi(t)\rangle = \langle\psi(0)|\hat{U}^\dagger\hat{U}|\psi(0)\rangle = \langle\psi(0)|\psi(0)\rangle = 1
  2. 可逆性:幺正演化是确定的、可逆的(与测量的不可逆性形成对比)
  3. 保持内积ϕ(t)ψ(t)=ϕ(0)ψ(0)\langle\phi(t)|\psi(t)\rangle = \langle\phi(0)|\psi(0)\rangle,正交态保持正交
graph LR
    A["公理IV: 时间演化"] --> B[薛定谔方程]
    B --> C["iℏ∂ₜ|ψ⟩ = Ĥ|ψ⟩"]
    
    C --> D[形式解]
    D --> E["|ψ(t)⟩ = Û(t)|ψ(0)⟩"]
    
    E --> F[演化算符]
    F --> G["Û(t) = exp("\\"-iĤt/ℏ\\"")"]
    
    G --> H[幺正性]
    H --> I["Û†Û = Î"]
    
    I --> J[概率守恒]
    I --> K[可逆性]
    I --> L[保持正交性]
    
    M[对比] --> N["演化: 确定, 幺正, 可逆"]
    M --> O["测量: 随机, 投影, 不可逆"]

4.5.3 能量本征态与定态

如果 ψ(0)|\psi(0)\rangleH^\hat{H} 的本征态(能量本征态):

H^E=EE\hat{H}|E\rangle = E|E\rangle

那么:

E(t)=eiEt/E|E(t)\rangle = e^{-iEt/\hbar}|E\rangle

关键观察:概率密度不随时间变化:

ψ(x,t)2=xE(t)2=eiEt/xE2=xE2=ψ(x,0)2|\psi(x,t)|^2 = |\langle x|E(t)\rangle|^2 = |e^{-iEt/\hbar}\langle x|E\rangle|^2 = |\langle x|E\rangle|^2 = |\psi(x,0)|^2

因此称为定态(stationary state)。这就是为什么原子能级是稳定的——电子处于能量本征态时,其空间分布不随时间变化(虽然相位在旋转)。


4.6 公理五:复合系统的张量积结构

4.6.1 公理陈述

公理 V:如果系统1的状态空间是 H1\mathcal{H}_1,系统2的状态空间是 H2\mathcal{H}_2,那么复合系统(系统1+系统2)的状态空间是它们的张量积

H=H1H2\mathcal{H} = \mathcal{H}_1 \otimes \mathcal{H}_2

4.6.2 物理意义

这个公理不是从前面四个公理"推导"出来的,而是对"多粒子系统如何描述"的独立假设。它告诉我们:

  • 如果系统1有 N1N_1 个基态,系统2有 N2N_2 个基态,那么复合系统有 N1×N2N_1 \times N_2 个基态
  • 复合系统的态一般不能写成 ψ1ψ2|\psi_1\rangle \otimes |\psi_2\rangle 的形式——这种不可分离的态就是纠缠态
  • 对复合系统的一个子系统做测量,会"瞬间"影响另一个子系统的状态(但不会产生可传递信息的超光速通信)

数值例子:两个自旋-1/2粒子

粒子1的态:ψ1=α+1+β1|\psi_1\rangle = \alpha|+\rangle_1 + \beta|-\rangle_1
粒子2的态:ψ2=γ+2+δ2|\psi_2\rangle = \gamma|+\rangle_2 + \delta|-\rangle_2

可分离态(product state):

|\Psi\rangle = |\psi_1\rangle \otimes |\psi_2\rangle = \alpha\gamma|++\rangle + \alpha\delta|+-\rangle + \beta\gamma|-+\rangle + \beta\delta|--\rangle

纠缠态(不可分离):

Ψ=12(++)|\Psi\rangle = \frac{1}{\sqrt{2}}(|+-\rangle - |-+\rangle)

这个态不能写成两个单粒子态的张量积。如果测量粒子1的 SzS_z 得到 +/2+\hbar/2,那么粒子2的 SzS_z 必然是 /2-\hbar/2——即使它们相距遥远。


4.7 相容可观测量与对易关系

4.7.1 相容性的定义

两个可观测量 A^\hat{A}B^\hat{B} 称为相容的(compatible),如果它们可以同时被精确测量——即存在一组完备的共同本征态。

4.7.2 相容性的数学判据

定理A^\hat{A}B^\hat{B} 相容 \Leftrightarrow [A^,B^]=0[\hat{A}, \hat{B}] = 0

证明概要

  • 如果对易,则存在完备的共同本征基 {a,b}\{|a,b\rangle\} 满足:

    A^a,b=aa,b,B^a,b=ba,b\hat{A}|a,b\rangle = a|a,b\rangle, \quad \hat{B}|a,b\rangle = b|a,b\rangle

  • 在共同本征态中,A^\hat{A}B^\hat{B} 都有确定值,可以同时测量
  • 如果本征值有简并,需要额外选择基使其同时对角化

4.7.3 对易子的物理意义

对易子 [A^,B^][\hat{A}, \hat{B}] 衡量了两个可观测量"不能同时确定"的程度:

  • [A^,B^]=0[\hat{A}, \hat{B}] = 0:可以完全独立地测量,互不影响
  • [A^,B^]0[\hat{A}, \hat{B}] \neq 0:测量一个会"扰动"另一个

数值例子:自旋算符的对易关系

对于自旋-1/2系统,定义:

S^x=2(0110),S^y=2(0ii0),S^z=2(1001)\hat{S}_x = \frac{\hbar}{2}\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}, \quad \hat{S}_y = \frac{\hbar}{2}\begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}, \quad \hat{S}_z = \frac{\hbar}{2}\begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}

计算 [S^x,S^y][\hat{S}_x, \hat{S}_y]

S^xS^y=24(0110)(0ii0)=24(i00i)\hat{S}_x \hat{S}_y = \frac{\hbar^2}{4}\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix} = \frac{\hbar^2}{4}\begin{pmatrix} i & 0 \\ 0 & -i \end{pmatrix}

S^yS^x=24(0ii0)(0110)=24(i00i)\hat{S}_y \hat{S}_x = \frac{\hbar^2}{4}\begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} = \frac{\hbar^2}{4}\begin{pmatrix} -i & 0 \\ 0 & i \end{pmatrix}

[S^x,S^y]=S^xS^yS^yS^x=24(2i002i)=i2(1001)=iS^z[\hat{S}_x, \hat{S}_y] = \hat{S}_x \hat{S}_y - \hat{S}_y \hat{S}_x = \frac{\hbar^2}{4}\begin{pmatrix} 2i & 0 \\ 0 & -2i \end{pmatrix} = i\hbar \cdot \frac{\hbar}{2}\begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} = i\hbar \hat{S}_z

这就是著名的角动量对易关系:[S^x,S^y]=iS^z[\hat{S}_x, \hat{S}_y] = i\hbar \hat{S}_z(以及循环置换)。

4.7.4 不相容可观测量的后果

如果 [A^,B^]0[\hat{A}, \hat{B}] \neq 0,则不存在完备的共同本征基。测量 A^\hat{A} 得到确定值后,系统坍缩到 A^\hat{A} 的本征态,这个态一般不是 B^\hat{B} 的本征态——再测量 B^\hat{B} 将得到一个概率分布。

这就是不确定性原理的数学根源

graph TD
    A[相容可观测量] --> B["[Â,B̂] = 0"]
    
    B --> C[共同本征基]
    C --> D["|a,b⟩"]
    D --> E["Â|a,b⟩ = a|a,b⟩"]
    D --> F["B̂|a,b⟩ = b|a,b⟩"]
    
    E --> G[可以同时精确测量]
    F --> G
    
    H[不相容可观测量] --> I["[Â,B̂] ≠ 0"]
    I --> J[无共同本征基]
    J --> K[测A后B不确定]
    K --> L[不确定性原理]
    
    M[例子] --> N["x和p: [x̂,p̂] = iℏ"]
    M --> O["Lz和Lx: [Lz,Lx] = iℏLy"]
    N --> P[不能同时确定位置和动量]

4.8 不确定性原理的严格证明

4.8.1 一般形式的不确定性原理

对于任意态 ψ|\psi\rangle 和任意两个厄米算符 A^\hat{A}B^\hat{B}

(ΔA)2(ΔB)214ψ[A^,B^]ψ2(\Delta A)^2 (\Delta B)^2 \geq \frac{1}{4}|\langle\psi|[\hat{A}, \hat{B}]|\psi\rangle|^2

其中 ΔA=ψ(A^A)2ψ\Delta A = \sqrt{\langle\psi|(\hat{A} - \langle A\rangle)^2|\psi\rangle} 是标准差。

4.8.2 严格证明步骤

定义涨落算符

δA^=A^A,δB^=B^B\delta\hat{A} = \hat{A} - \langle A\rangle, \quad \delta\hat{B} = \hat{B} - \langle B\rangle

步骤 1:应用柯西-施瓦茨不等式

对于任意两个向量 α=δA^ψ|\alpha\rangle = \delta\hat{A}|\psi\rangleβ=δB^ψ|\beta\rangle = \delta\hat{B}|\psi\rangle

ααββαβ2\langle\alpha|\alpha\rangle\langle\beta|\beta\rangle \geq |\langle\alpha|\beta\rangle|^2

即:

(ΔA)2(ΔB)2ψδA^δB^ψ2(\Delta A)^2 (\Delta B)^2 \geq |\langle\psi|\delta\hat{A}\delta\hat{B}|\psi\rangle|^2

步骤 2:分解 δA^δB^\delta\hat{A}\delta\hat{B}

δA^δB^=12[δA^,δB^]+12{δA^,δB^}\delta\hat{A}\delta\hat{B} = \frac{1}{2}[\delta\hat{A}, \delta\hat{B}] + \frac{1}{2}\{\delta\hat{A}, \delta\hat{B}\}

其中 [,][\cdot,\cdot] 是对易子,{,}\{\cdot,\cdot\} 是反对易子。

步骤 3:利用厄米性

  • [δA^,δB^][\delta\hat{A}, \delta\hat{B}] 是反厄米的 \Rightarrow 其期望是纯虚数
  • {δA^,δB^}\{\delta\hat{A}, \delta\hat{B}\} 是厄米的 \Rightarrow 其期望是实数

因此:

ψδA^δB^ψ2=14[A^,B^]2+14{δA^,δB^}2|\langle\psi|\delta\hat{A}\delta\hat{B}|\psi\rangle|^2 = \frac{1}{4}|\langle[\hat{A}, \hat{B}]\rangle|^2 + \frac{1}{4}|\langle\{\delta\hat{A}, \delta\hat{B}\}\rangle|^2

步骤 4:得到不等式

由于第二项非负:

(ΔA)2(ΔB)214[A^,B^]2(\Delta A)^2 (\Delta B)^2 \geq \frac{1}{4}|\langle[\hat{A}, \hat{B}]\rangle|^2

这就是不确定性原理的一般形式

4.8.3 海森堡不确定性原理

对于位置和动量:

[x^,p^]=i[\hat{x}, \hat{p}] = i\hbar

代入一般形式:

(Δx)2(Δp)224(\Delta x)^2 (\Delta p)^2 \geq \frac{\hbar^2}{4}

即:

ΔxΔp2\Delta x \cdot \Delta p \geq \frac{\hbar}{2}

数值例子:验证自旋-1/2的不确定性原理

在态 +|+\rangleSzS_z 的本征态,Sz=+/2S_z = +\hbar/2)中:

ΔSxΔSy2[Sx,Sy]=2iSz=24\Delta S_x \cdot \Delta S_y \geq \frac{\hbar}{2}|\langle [S_x, S_y] \rangle| = \frac{\hbar}{2}|\langle i\hbar S_z \rangle| = \frac{\hbar^2}{4}

计算 ΔSx\Delta S_x

  • Sx=+Sx+=0\langle S_x \rangle = \langle + | S_x | + \rangle = 0
  • Sx2=24\langle S_x^2 \rangle = \frac{\hbar^2}{4}
  • (ΔSx)2=24(\Delta S_x)^2 = \frac{\hbar^2}{4}

同理 (ΔSy)2=24(\Delta S_y)^2 = \frac{\hbar^2}{4}

验证:

\Delta S_x \cdot \Delta S_y = \frac{\hbar}{2} \cdot \frac{\hbar}{2} = \frac{\hbar^2}{4} \geq \frac{\hbar^2}{4}$$ ✓ 等号成立——这意味着 $|+\rangle$ 是"最不确定" $S_x$ 和 $S_y$ 的态之一。
graph TD
    A[不确定性原理证明] --> B["步骤1: 柯西-施瓦茨"]
    A --> C["步骤2: 分解算符"]
    A --> D["步骤3: 利用厄米性"]
    A --> E["步骤4: 得到不等式"]
    
    B --> B1["|⟨α|β⟩|² ≤ ⟨α|α⟩⟨β|β⟩"]
    C --> C1["δÂδB̂ = ½[\"δÂ,δB̂\"] + ½{"\\"δÂ,δB̂\\""}"]
    D --> D1["对易子: 纯虚期望"]
    D --> D2["反对易子: 实期望"]
    E --> E1["(ΔA)²(ΔB)² ≥ ¼|⟨[Â,B̂]⟩|²"]
    
    E1 --> F["位置-动量"]
    F --> G["[x̂,p̂] = iℏ"]
    G --> H["Δx·Δp ≥ ℏ/2"]
    
    E1 --> I["能量-时间"]
    I --> J["[Ĥ, t] = iℏ"]
    J --> K["ΔE·Δt ≥ ℏ/2"]
--- ## 4.9 态矢量的"坍缩"与测量问题 ### 4.9.1 量子测量的双重性质 量子力学中有两种截然不同的演化: 1. **幺正演化**(薛定谔方程):连续、确定、可逆 2. **投影测量**:瞬时、随机、不可逆 ### 4.9.2 测量公设的深层含义 当测量 $\hat{A}$ 得到本征值 $a$ 时: $$|\psi\rangle = \sum_a c_a |a\rangle \xrightarrow{\text{测量}} |a\rangle

关键特征

  • 随机性:即使知道 ψ|\psi\rangle,也无法预测单次测量结果,只能预测概率
  • 不可逆性:测量后无法从 a|a\rangle 恢复原始叠加态 ψ|\psi\rangle
  • 非幺正性:投影操作 aa|a\rangle\langle a| 不是幺正算符

4.9.3 测量问题的讨论

为什么薛定谔方程(线性、幺正)与测量公设(非线性、投影)看起来矛盾?这是量子力学的测量问题(measurement problem),至今仍是量子基础研究的活跃领域。

主流解释包括:

  • 哥本哈根解释:测量是基本的、不可还原的过程
  • 多世界解释:没有坍缩,所有分支都实现
  • 退相干理论:环境与系统的相互作用导致"表观坍缩"

Shankar在书中采取实用主义立场:在计算层面,公设 III 给出正确的概率预言;在哲学层面,测量问题是开放问题。

graph TD
    A[量子测量] --> B[幺正演化]
    A --> C[投影测量]
    
    B --> B1[薛定谔方程]
    B --> B2["连续, 确定, 可逆"]
    B --> B3[保持叠加态]
    
    C --> C1[玻恩规则]
    C --> C2["瞬时, 随机, 不可逆"]
    C --> C3[态坍缩到本征态]
    
    D[测量问题] --> E["为什么两种演化?"]
    E --> F[哥本哈根解释]
    E --> G[多世界解释]
    E --> H[退相干理论]
    
    F --> I[测量是基本公设]
    G --> J[所有分支都存在]
    H --> K[环境导致表观坍缩]
    
    L[Shankar立场] --> M[实用主义]
    M --> N["计算: 公设III有效"]
    M --> O["哲学: 开放问题"]

4.10 密度矩阵——纯态与混合态的统一描述

4.10.1 纯态与混合态

纯态(pure state):可以用单个态矢量 ψ|\psi\rangle 描述的状态。纯态满足:

ρ^2=ρ^\hat{\rho}^2 = \hat{\rho}

混合态(mixed state):系统以概率 pip_i 处于状态 ψi|\psi_i\rangle。混合态不能用单个态矢量描述。

4.10.2 密度算符的定义

密度算符(density operator):

ρ^=ipiψiψi\hat{\rho} = \sum_i p_i |\psi_i\rangle\langle\psi_i|

其中 pi0p_i \geq 0ipi=1\sum_i p_i = 1

4.10.3 密度矩阵的性质与物理意义

  1. 厄米性ρ^=ρ^\hat{\rho}^\dagger = \hat{\rho}
  2. 正定性ρ^\hat{\rho} 的所有本征值非负
  3. 迹为1Tr(ρ^)=1\text{Tr}(\hat{\rho}) = 1
  4. 纯态判据Tr(ρ^2)=1\text{Tr}(\hat{\rho}^2) = 1(混合态 Tr(ρ^2)<1\text{Tr}(\hat{\rho}^2) < 1

期望值

A=Tr(ρ^A^)\langle A \rangle = \text{Tr}(\hat{\rho}\hat{A})

物理意义:密度矩阵统一描述了:

  • 纯态的量子不确定性(叠加态的内禀概率)
  • 混合态的经典不确定性("不知道系统处于哪个态")

数值例子:纯态与混合态的对比

考虑自旋-1/2系统。

纯态(叠加态):

ψ=12(++)|\psi\rangle = \frac{1}{\sqrt{2}}(|+\rangle + |-\rangle)

密度矩阵:

ρ^pure=ψψ=12(1111)\hat{\rho}_{pure} = |\psi\rangle\langle\psi| = \frac{1}{2}\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}

验证纯态:Tr(ρ^2)=Tr(14(2222))=14(2+2)=1\text{Tr}(\hat{\rho}^2) = \text{Tr}\left(\frac{1}{4}\begin{pmatrix} 2 & 2 \\ 2 & 2 \end{pmatrix}\right) = \frac{1}{4}(2+2) = 1

混合态(经典混合):

ρ^mixed=12+++12=12(1001)\hat{\rho}_{mixed} = \frac{1}{2}|+\rangle\langle+| + \frac{1}{2}|-\rangle\langle-| = \frac{1}{2}\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}

验证混合态:Tr(ρ^2)=Tr(14(1001))=14(1+1)=12<1\text{Tr}(\hat{\rho}^2) = \text{Tr}\left(\frac{1}{4}\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\right) = \frac{1}{4}(1+1) = \frac{1}{2} < 1

关键区别:虽然两种情况下测量 SzS_z 都得到 ±/2\pm\hbar/2 各50%概率,但测量 SxS_x 时:

  • 纯态:100%概率得到 +/2+\hbar/2(因为 ψ|\psi\rangleSxS_x 的本征态)
  • 混合态:50%概率得到 +/2+\hbar/2,50%概率得到 /2-\hbar/2

这说明密度矩阵编码了比单纯概率分布更多的信息——它包含了量子相干性的信息。

graph LR
    A[密度矩阵] --> B[纯态]
    A --> C[混合态]
    
    B --> D["ρ = |ψ⟩⟨ψ|"]
    B --> E["Tr(ρ²) = 1"]
    B --> F[量子不确定性]
    
    C --> G["ρ = ∑pᵢ|ψᵢ⟩⟨ψᵢ|"]
    C --> H["Tr(ρ²) < 1"]
    C --> I["经典+量子不确定性"]
    
    J[应用] --> K[热平衡态]
    J --> L[量子统计力学]
    J --> M[开放量子系统]
    J --> N[量子信息]
    
    K --> O["ρ = exp("\\"-βĤ\\"")/Z"]
    O --> P[正则系综]

4.11 公理体系的总览

4.11.1 五大公理的结构

graph TD
    A[量子力学公理体系] --> B["公理I: 态矢量"]
    A --> C["公理II: 可观测量"]
    A --> D["公理III: 测量"]
    A --> E["公理IV: 时间演化"]
    A --> F["公理V: 复合系统"]
    
    B --> B1["|ψ⟩ ∈ ℋ"]
    B --> B2[叠加原理]
    B --> B3["等价类: c|ψ⟩ ≡ |ψ⟩"]
    
    C --> C1[" = †"]
    C --> C2[谱定理]
    C --> C3["本征值 = 测量结果"]
    
    D --> D1["P(a) = |⟨a|ψ⟩|²"]
    D --> D2["坍缩: |ψ⟩ → |a⟩"]
    D --> D3["期望值 ⟨A⟩ = ⟨ψ|Â|ψ⟩"]
    
    E --> E1["iℏ∂ₜ|ψ⟩ = Ĥ|ψ⟩"]
    E --> E2[幺正演化]
    E --> E3[概率守恒]
    
    F --> F1["ℋ = ℋ₁ ⊗ ℋ₂"]
    F --> F2[纠缠态]
    F --> F3[多粒子系统]
    
    B2 --> G[量子干涉]
    C2 --> H[不确定性原理]
    D1 --> I[概率性]
    E2 --> J[可逆性]
    F2 --> K[非定域性]
    
    G --> L[核心预测]
    H --> L
    I --> L
    J --> L
    K --> L
    
    L --> M[所有物理应用]
    M --> N[原子物理]
    M --> O[固体物理]
    M --> P[量子化学]
    M --> Q[粒子物理]

4.11.2 与经典力学的对比

graph TD
    subgraph 经典力学
    A1[状态] --> B1["相空间点 q,p"]
    C1[可观测量] --> D1["相空间函数 f("\\"q,p\\"")"]
    E1[测量] --> F1[不扰动系统]
    G1[演化] --> H1[哈密顿方程]
    I1[确定性] --> J1[可以精确预言]
    K1[复合系统] --> L1[相空间直和]
    end
    
    subgraph 量子力学
    A2[状态] --> B2["希尔伯特空间向量 |ψ⟩"]
    C2[可观测量] --> D2["厄米算符 Â"]
    E2[测量] --> F2["扰动系统, 态坍缩"]
    G2[演化] --> H2[薛定谔方程]
    I2[概率性] --> J2[只能预言概率]
    K2[复合系统] --> L2["张量积 ℋ₁⊗ℋ₂"]
    end
    
    B1 -.->|对应| B2
    D1 -.->|对应| D2
    F1 -.->|根本不同| F2
    H1 -.->|对应| H2
    J1 -.->|根本不同| J2
    L1 -.->|根本不同| L2

本章总结

graph TD
    A["第4章: 公理化讨论"] --> B[五大公理]
    A --> C[相容可观测量]
    A --> D[不确定性原理]
    A --> E[测量问题]
    A --> F[密度矩阵]
    
    B --> B1["I: 态矢量"]
    B --> B2["II: 厄米算符"]
    B --> B3["III: 玻恩规则"]
    B --> B4["IV: 薛定谔方程"]
    B --> B5["V: 张量积结构"]
    
    C --> C1["[Â,B̂] = 0 ↔ 相容"]
    D --> D1["ΔA·ΔB ≥ ½|⟨[Â,B̂]⟩|"]
    E --> E1[演化 vs 测量]
    F --> F1["纯态/混合态统一"]
    
    B1 --> G[叠加原理]
    B2 --> H[谱分解]
    B3 --> I[概率解释]
    B4 --> J[幺正性]
    B5 --> K[纠缠]
    
    G --> L[量子力学核心框架]
    H --> L
    I --> L
    J --> L
    K --> L
    C1 --> L
    D1 --> L
    F1 --> L
    
    style A fill:#e1f5fe
    style L fill:#fff3e0

核心要点

  1. 五大公理构成了量子力学的完整数学框架——态矢量、厄米算符、玻恩规则、薛定谔方程、张量积结构
  2. 相容可观测量对应于对易算符,它们可以同时精确测量
  3. 不确定性原理是柯西-施瓦茨不等式和对易关系的直接数学推论
  4. 测量引入的投影过程与幺正演化在数学性质上截然不同——这是测量问题
  5. 密度矩阵提供了描述纯态和混合态的统一语言
  6. 复合系统的张量积结构预言了量子纠缠的存在

与后续章节的联系

  • 第5章:用这些公理求解简单势场的定态薛定谔方程
  • 第6-7章:将公理应用于角动量理论
  • 第8-12章:用公理化框架处理微扰、散射等实际问题

练习与思考

  1. 证明题:从公理 I-III 出发,证明对任意归一化态 ψ|\psi\rangle 和厄米算符 A^\hat{A},有 A2A2\langle A^2 \rangle \geq \langle A \rangle^2。并说明等号成立的条件是什么,物理上对应什么情况。

  2. 计算题:考虑自旋-1/2系统,其希尔伯特空间由基 {+,}\{|+\rangle, |-\rangle\} 张成。定义算符 S^z=2(++)\hat{S}_z = \frac{\hbar}{2}(|+\rangle\langle+| - |-\rangle\langle-|)S^x=2(+++)\hat{S}_x = \frac{\hbar}{2}(|+\rangle\langle-| + |-\rangle\langle+|)

    • 计算 [S^x,S^z][\hat{S}_x, \hat{S}_z][S^x,S^y][\hat{S}_x, \hat{S}_y](其中 S^y=2i(++)\hat{S}_y = \frac{\hbar}{2i}(|+\rangle\langle-| - |-\rangle\langle+|)
    • 验证不确定性原理对态 +|+\rangle 中的 S^x\hat{S}_xS^y\hat{S}_y
    • 如果系统处于 +|+\rangle,测量 S^x\hat{S}_x 可能得到什么结果?各自的概率是多少?
  3. 计算题:构造并比较以下两个密度矩阵:

    • 纯态:ψ=12(++)|\psi\rangle = \frac{1}{\sqrt{2}}(|+\rangle + |-\rangle)
    • 混合态:50%概率处于 +|+\rangle,50%概率处于 |-\rangle

    计算两者在 SzS_zSxS_x 基下的期望值和标准差,说明它们的区别。

  4. 思考题:Shankar将量子力学的公理体系与欧几里得几何的公理体系类比。在欧几里得几何中,公理决定了定理,但公理本身不能从定理"推导"出来——它们是对空间经验的提炼。同样,量子力学的公理是对微观实验事实的提炼。讨论:

    • 为什么物理学家选择了希尔伯特空间、厄米算符和幺正演化这些数学结构,而不是其他可能的数学框架?
    • 如果未来的实验发现量子力学的某个公理需要修正,最可能从哪一个开始?为什么?
    • 量子力学的公理体系中,哪一个最让你感到"不自然"?为什么?

"公理不是约束,它们是解放——一旦接受了这些规则,你就获得了预言一切微观现象的能力。" ✍️🔥