第II章 动力学变量与可观测量:算符的王国

📑 目录

第II章 动力学变量与可观测量:算符的王国


前置知识:线性算符的矩阵表示

Dirac书中的"算符"非常抽象——他称之为"q-数"(q-numbers),强调它们不一定对易。但为了让这些抽象概念落地,我们需要一个具体的心理模型。矩阵表示是最自然的桥梁。

什么是线性算符?

一个线性算符 A^\hat{A} 是从向量空间到自身的映射,满足线性条件:

A^(c1ψ1+c2ψ2)=c1A^ψ1+c2A^ψ2\hat{A}(c_1|\psi_1\rangle + c_2|\psi_2\rangle) = c_1\hat{A}|\psi_1\rangle + c_2\hat{A}|\psi_2\rangle

在有限维空间中,选择一组基 \{|e_1\rangle, |e_2\rangle, \dots, |e_n\rangle\} 后,每个算符对应一个矩阵

算符的矩阵表示

算符 A^\hat{A} 在基 {ei}\{|e_i\rangle\} 下的矩阵元定义为:

Aij=eiA^ejA_{ij} = \langle e_i|\hat{A}|e_j\rangle

整个算符对应矩阵:

A^(A11A12A21A22)\hat{A} \longleftrightarrow \begin{pmatrix} A_{11} & A_{12} & \cdots \\ A_{21} & A_{22} & \cdots \\ \vdots & \vdots & \ddots \end{pmatrix}

关键理解:同一个算符在不同基下有不同的矩阵,但算符本身是基无关的抽象对象。这正如一个线性变换在不同坐标系下有不同的矩阵表示,但变换本身不变。

厄米共轭 = 共轭转置

在矩阵语言中,厄米共轭就是先转置,再对每个元素取复共轭

(A)ij=Aji(A^\dagger)_{ij} = A_{ji}^*

例如:

A=(12+i3i4)A=(13+i2i4)A = \begin{pmatrix} 1 & 2+i \\ 3-i & 4 \end{pmatrix} \quad \Rightarrow \quad A^\dagger = \begin{pmatrix} 1 & 3+i \\ 2-i & 4 \end{pmatrix}

厄米矩阵(自伴矩阵)满足 A=AA^\dagger = A,即 Aij=AjiA_{ij} = A_{ji}^*

本征值问题的矩阵版本

算符的本征方程 A^a=aa\hat{A}|a\rangle = a|a\rangle 在矩阵语言中就是:

Av=av\mathbf{A}\mathbf{v} = a\mathbf{v}

即寻找矩阵 A\mathbf{A} 的特征值 aa 和特征向量 v\mathbf{v}

线性代数定理:厄米矩阵的特征值都是实数,不同特征值对应的特征向量正交。

这个定理恰好对应Dirac算符理论中的两个核心结论:

  1. 厄米算符的本征值是实数(对应可观测量的测量结果必须是实数)
  2. 不同本征值对应的本征态正交

从有限维到无限维

Dirac的伟大之处在于,他把有限维的矩阵直觉推广到了无限维(甚至连续谱)。在无限维中,"矩阵"有无限多行无限多列,求和变成积分。但核心的代数结构——线性性、厄米性、本征值问题——保持不变。

理解这一点至关重要:Dirac不是在发明一套全新的数学,而是在把线性代数的直觉扩展到量子力学的全部领域。


故事场景:魔术师的手套

一个老魔术师登上舞台,手里只有一双手套。他向观众展示:左手手套只有左手的形状,右手手套只有右手的形状。然后他做了一个不可思议的动作——将两只手套叠在一起。"现在,"他说,"这不是左手套,也不是右手套。它是一个全新的东西:一双手套。但如果你只从左边看,你会看到左手;只从右边看,你会看到右手。"

一位物理学家在台下微笑。魔术师不懂量子力学,但他碰巧触碰到了真相。

Dirac 在第二章中告诉我们:动力学变量在量子力学中不是数,而是算符。当你"观察"一个系统时,你不是在读取一个预先存在的数值——你是在用算符作用于态,迫使它给出结果。手套不是左也不是右,直到你选择从哪边看。


2.1 线性算符:作用在态空间上的变换

2.1.1 什么是算符?

上一章我们建立了态空间——一个复矢量空间。现在,我们需要在这个空间中引入动力学变量

在经典力学中,动力学变量如位置 xx、动量 pp、能量 EE 都是普通的数(或数的函数)。在量子力学中,它们变成了算符(operators)——作用在态矢量上,产生新的态矢量。

A^ψ=ϕ\hat{A}|\psi\rangle = |\phi\rangle

2.1.2 线性性

Dirac 要求所有动力学变量对应的算符必须是线性算符

A^(c1ψ1+c2ψ2)=c1A^ψ1+c2A^ψ2\hat{A}(c_1|\psi_1\rangle + c_2|\psi_2\rangle) = c_1\hat{A}|\psi_1\rangle + c_2\hat{A}|\psi_2\rangle

为什么必须是线性的?

因为叠加原理!如果态可以线性叠加,那么动力学变量的作用必须与叠加"兼容"。如果 A^\hat{A} 不是线性的,就会导致一个悖论:先叠加再作用,与先作用再叠加,结果不同——叠加原理就被破坏了。

graph TD
    A["态空间 ℋ"] --> B["线性算符 Â"]
    B --> C["新态空间 ℋ"]
    
    D["|ψ₁⟩ + |ψ₂⟩"] --> E["Â(|ψ₁⟩+|ψ₂⟩)
= Â|ψ₁⟩ + Â|ψ₂⟩"] D --> F["线性要求:
叠加后作用 = 作用后叠加"] style B fill:#f9f,stroke:#333,stroke-width:3px

2.2 共轭关系:厄米共轭

2.2.1 算符的对偶

算符 A^\hat{A} 作用在 ket 上:A^ψ\hat{A}|\psi\rangle。我们如何让它作用于 bra?

Dirac 引入厄米共轭(Hermitian conjugate)

(A^ψ)=ψA^(\hat{A}|\psi\rangle)^\dagger = \langle\psi|\hat{A}^\dagger

其中 A^\hat{A}^\daggerA^\hat{A} 的厄米共轭算符。

2.2.2 矩阵类比

如果我们在有限维中把 ket 看作列向量,bra 看作行向量,算符看作矩阵:

  • A^\hat{A} 是矩阵
  • A^\hat{A}^\dagger共轭转置(先转置,再对每个元素取复共轭)

A=(AT)A^\dagger = (A^T)^*

2.2.3 厄米算符的定义

如果一个算符满足:

A^=A^\hat{A}^\dagger = \hat{A}

则称 A^\hat{A}厄米算符(Hermitian operator)自伴算符(self-adjoint)

厄米算符的物理意义:所有可观测的物理量(位置、动量、能量等)都必须用厄米算符表示。厄米性保证了本征值是实数——测量结果必须是实数。

graph LR
    A["算符 Â"] --> B["厄米共轭 †"]
    B --> C{"† =  ?"}
    C -->|是| D["厄米算符
对应可观测量"] C -->|否| E["非厄米算符
一般不能测量"] style D fill:#9f6,stroke:#333,stroke-width:3px

2.3 本征值与本征向量

2.3.1 本征方程

算符 A^\hat{A}本征值问题

A^a=aa\hat{A}|a\rangle = a|a\rangle

其中:

  • a|a\rangle本征向量(eigenvector/eigenstate)
  • aa本征值(eigenvalue)

物理诠释:当系统处于 a|a\rangle 态时,测量 A^\hat{A} 得到确定值 aa,没有不确定性。

2.3.2 厄米算符本征值的实数性

证明:设 A^\hat{A} 是厄米算符,A^a=aa\hat{A}|a\rangle = a|a\rangle

a\langle a| 左乘两边:

aA^a=aaa=a\langle a|\hat{A}|a\rangle = a\langle a|a\rangle = a

另一方面,取厄米共轭:

(aA^a)=aA^a=aA^a(\langle a|\hat{A}|a\rangle)^* = \langle a|\hat{A}^\dagger|a\rangle = \langle a|\hat{A}|a\rangle

所以 aA^a\langle a|\hat{A}|a\rangle 是实数,即 aRa \in \mathbb{R}

2.3.3 本征向量的正交性

厄米算符不同本征值对应的本征向量正交

A^a1=a1a1,A^a2=a2a2,a1a2\hat{A}|a_1\rangle = a_1|a_1\rangle, \quad \hat{A}|a_2\rangle = a_2|a_2\rangle, \quad a_1 \neq a_2

a1a2=0\Rightarrow \langle a_1|a_2\rangle = 0

证明:由 a1A^a2=a2a1a2\langle a_1|\hat{A}|a_2\rangle = a_2\langle a_1|a_2\rangle,同时

a1A^a2=(A^a1)a2=a1a1a2\langle a_1|\hat{A}|a_2\rangle = (\hat{A}|a_1\rangle)^\dagger|a_2\rangle = a_1\langle a_1|a_2\rangle

所以 (a1a2)a1a2=0(a_1 - a_2)\langle a_1|a_2\rangle = 0,因 a1a2a_1 \neq a_2,故 a1a2=0\langle a_1|a_2\rangle = 0

graph TD
    subgraph "厄米算符 Â 的本征结构"
        A["|a₁⟩: 本征值 a₁"] --- B["|a₂⟩: 本征值 a₂"]
        C["|a₃⟩: 本征值 a₃"] --- D["..."]
        
        A -.-|正交| B
        B -.-|正交| C
        A -.-|正交| C
    end
    
    E["任意态 |ψ⟩ = Σ cᵢ|aᵢ⟩"] --> F["测量概率: P(aᵢ) = |cᵢ|²"]
    
    style A fill:#f96,stroke:#333
    style B fill:#96f,stroke:#333
    style C fill:#6f9,stroke:#333

2.4 可观测量的定义

2.4.1 从算符到可观测量

Dirac 对**可观测量(observable)**给出了严格定义:

可观测量:一个动力学变量,如果其厄米算符的本征向量构成态空间的完备集,则称其为可观测量。

关键条件:完备性(completeness)

  • 不是所有厄米算符都是可观测量
  • 可观测量要求本征向量"足够多",能展开任意态
  • 在实际物理中,位置、动量、能量、角动量等都是可观测量

2.4.2 谱分解

对于可观测量 A^\hat{A},有谱分解(spectral decomposition)

A^=iaiaiai\hat{A} = \sum_i a_i |a_i\rangle\langle a_i|

其中 aia_i 是本征值,aiai|a_i\rangle\langle a_i| 是投影到本征空间的投影算符。

这相当于"把算符拆解成它在各本征方向上的贡献"。

graph LR
    A["可观测量 Â"] --> B["谱分解:
 = Σ aᵢ|aᵢ⟩⟨aᵢ|"] B --> C["投影算符:
Pᵢ = |aᵢ⟩⟨aᵢ|"] C --> D["测量得到 aᵢ 的概率:
P(aᵢ) = ⟨ψ|Pᵢ|ψ⟩ = |⟨aᵢ|ψ⟩|²"] style B fill:#bbf,stroke:#333,stroke-width:2px

2.5 离散谱与连续谱:归一化的关键区别

Dirac原著中一个极其重要但容易被忽略的主题是:离散本征值与连续本征值的归一化方式不同。这不仅是一个数学细节,而是理解量子力学测量理论的核心。

2.5.1 离散谱:可归一化的本征态

对于离散本征值 ana_n,对应本征态 an|a_n\rangle 可以归一化为:

anam=δnm={1n=m0nm\langle a_n|a_m\rangle = \delta_{nm} = \begin{cases} 1 & n=m \\ 0 & n \neq m \end{cases}

这意味着每个本征态都是"单位长度"的矢量。例如,氢原子的能级本征态 n,l,m|n,l,m\rangle、谐振子的能量本征态 n|n\rangle、自旋1/2的 +|+\rangle|-\rangle,都可以如此归一化。

2.5.2 连续谱:δ函数归一化

对于连续本征值(如位置 xx 或动量 pp),情况完全不同。位置本征态 x|x'\rangle 满足:

xx=δ(xx)\langle x'|x''\rangle = \delta(x'-x'')

这里的 δ(xx)\delta(x'-x'') 是Dirac delta函数——它在 x=xx'=x'' 处"无穷大",其他地方为零,且积分等于1。

关键区别x|x'\rangle 不是平方可积的!严格来说,xx=δ(0)=\langle x'|x'\rangle = \delta(0) = \infty,所以 x|x'\rangle 不属于Hilbert空间。

2.5.3 为什么连续谱态不能归一化到1?

直观理解:如果 x|x'\rangle 代表粒子精确处于位置 xx',那它必须是一个无限窄的峰。根据不确定性原理,位置完全确定意味着动量完全不确定——这个态包含所有可能的动量成分,"展开"到了整个空间。

数学上:

x=ppxdp=peipx/2πdp|x'\rangle = \int_{-\infty}^{\infty} |p\rangle\langle p|x'\rangle dp = \int_{-\infty}^{\infty} |p\rangle \frac{e^{-ipx'/\hbar}}{\sqrt{2\pi\hbar}} dp

这个态由所有动量本征态等权叠加而成——它"伸展"到了整个动量空间,因此无法在位置空间归一化为有限值。

2.5.4 Dirac的实用主义

Dirac对这一数学困难的态度非常实用:他直接使用 δ\delta 函数归一化,不担心严格性问题。他在书中写道:

"连续本征态的归一化是一个形式问题,不影响物理结果。"

后来,数学家用**装备Hilbert空间(rigged Hilbert space)**理论严格化了这一处理——连续谱本征态作为"广义矢量"(分布)存在,不属于Hilbert空间本身,但可以与Hilbert空间中的态产生内积(得到有限的结果)。

特征离散谱连续谱
例子能量 EnE_n、自旋 SzS_z位置 xx、动量 pp
归一化$\langle nm\rangle = \delta_{nm}$
完备性$\sumn\rangle\langle n
本征态是否在Hilbert空间否(严格来说)
物理可制备性可直接制备是理想化极限

2.5.5 数值例子:两种归一化的对比

离散例子(自旋1/2)

++=(10)(10)=1\langle +|+\rangle = \begin{pmatrix} 1 & 0 \end{pmatrix} \begin{pmatrix} 1 \\ 0 \end{pmatrix} = 1

+=(10)(01)=0\langle +|-\rangle = \begin{pmatrix} 1 & 0 \end{pmatrix} \begin{pmatrix} 0 \\ 1 \end{pmatrix} = 0

完美符合 δnm\delta_{nm}

连续例子(位置表象)

假设一个近似的位置本征态——一个非常窄的高斯波包:

ψx0(x)=(12πσ2)1/4e(xx0)2/(4σ2)\psi_{x_0}(x) = \left(\frac{1}{2\pi\sigma^2}\right)^{1/4} e^{-(x-x_0)^2/(4\sigma^2)}

σ0\sigma \to 0 时,这个波包越来越窄,趋近于 δ(xx0)\delta(x-x_0)。但它的归一化始终保持为1:

ψx0(x)2dx=1\int_{-\infty}^{\infty} |\psi_{x_0}(x)|^2 dx = 1

真正的位置本征态 x0|x_0\rangle 是这个极限——一个"无限高、无限窄"的峰,不能作为普通函数归一化,只能用 δ\delta 函数理解。


2.6 观测量的函数

2.6.1 函数作为算符的函数

给定可观测量 A^\hat{A} 和函数 f(x)f(x),如何定义 f(A^)f(\hat{A})

利用谱分解:

f(A^)=if(ai)aiaif(\hat{A}) = \sum_i f(a_i) |a_i\rangle\langle a_i|

直觉:在每个本征方向上,算符的作用由函数 ff 作用于本征值决定。

2.6.2 例子:能量的指数

考虑 f(H^)=eH^/kBTf(\hat{H}) = e^{\hat{H}/k_B T},这在统计物理中非常重要(配分函数)。

eH^/kBT=ieEi/kBTEiEie^{\hat{H}/k_B T} = \sum_i e^{E_i/k_B T} |E_i\rangle\langle E_i|

这就是密度算符的雏形。


2.7 物理诠释的一般形式

2.6.1 测量假设的完整表述

现在我们能够完整表述量子测量的规则了。

设系统处于态 ψ|\psi\rangle,可观测量 A^\hat{A} 的本征态为 {ai}\{|a_i\rangle\},对应本征值 {ai}\{a_i\}

测量规则

  1. 结果:测量得到 aia_i 的概率为 P(ai)=aiψ2P(a_i) = |\langle a_i|\psi\rangle|^2
  2. 坍缩:测量后态"坍缩"到对应的本征态 ai|a_i\rangle
  3. 期望值:多次测量平均值 A^=ψA^ψ\langle\hat{A}\rangle = \langle\psi|\hat{A}|\psi\rangle

2.6.2 期望值公式的推导

A^=iaiP(ai)=iaiaiψ2\langle\hat{A}\rangle = \sum_i a_i P(a_i) = \sum_i a_i |\langle a_i|\psi\rangle|^2

=iaiψaiaiψ=ψ(iaiaiai)ψ= \sum_i a_i \langle\psi|a_i\rangle\langle a_i|\psi\rangle = \langle\psi|\left(\sum_i a_i |a_i\rangle\langle a_i|\right)|\psi\rangle

=ψA^ψ= \langle\psi|\hat{A}|\psi\rangle

这就是 Dirac 著名的期望值公式

graph TD
    A["系统态 |ψ⟩"] --> B["Â 的本征态 |aᵢ⟩"]
    B --> C["展开: |ψ⟩ = Σ cᵢ|aᵢ⟩"]
    C --> D["测量得到 aᵢ 的概率: |cᵢ|²"]
    D --> E["期望值: ⟨A⟩ = Σ aᵢ|cᵢ|² = ⟨ψ|Â|ψ⟩"]
    
    style E fill:#f9f,stroke:#333,stroke-width:3px

2.8 对易性与相容性

2.7.1 对易子的定义

两个算符 A^\hat{A}B^\hat{B}对易子(commutator)

[A^,B^]=A^B^B^A^[\hat{A}, \hat{B}] = \hat{A}\hat{B} - \hat{B}\hat{A}

如果 [A^,B^]=0[\hat{A}, \hat{B}] = 0,称它们对易(commute)

2.7.2 对易性的物理意义

核心定理:两个可观测量可以同时被精确测量(有共同本征态完备集),当且仅当它们对易。

[A^,B^]=0{n},A^n=ann,B^n=bnn[\hat{A}, \hat{B}] = 0 \Leftrightarrow \exists \{|n\rangle\}, \hat{A}|n\rangle = a_n|n\rangle, \hat{B}|n\rangle = b_n|n\rangle

2.7.3 不相容可观测量

如果 [A^,B^]0[\hat{A}, \hat{B}] \neq 0,则不存在共同本征态完备集。系统不能同时处于 A^\hat{A}B^\hat{B} 的本征态。

典型例子:位置 x^\hat{x} 和动量 p^\hat{p}

[x^,p^]=i[\hat{x}, \hat{p}] = i\hbar

这就是著名的海森堡不确定性关系的代数根源。

2.7.4 不确定性关系的一般推导

A^\hat{A}B^\hat{B} 是两个可观测量,定义:

ΔA=A^2A^2\Delta A = \sqrt{\langle\hat{A}^2\rangle - \langle\hat{A}\rangle^2}

ΔB=B^2B^2\Delta B = \sqrt{\langle\hat{B}^2\rangle - \langle\hat{B}\rangle^2}

则:

ΔAΔB12[A^,B^]\Delta A \cdot \Delta B \geq \frac{1}{2}|\langle[\hat{A}, \hat{B}]\rangle|

对于位置和动量:

ΔxΔp2\Delta x \cdot \Delta p \geq \frac{\hbar}{2}

graph TD
    subgraph "相容 vs 不相容"
        A["对易: [Â,B̂] = 0"] --> B["共同本征态完备集"]
        B --> C["可同时精确测量"]
        
        D["不对易: [Â,B̂] ≠ 0"] --> E["无共同本征态完备集"]
        E --> F["不能同时精确测量"]
        F --> G["不确定性关系"]
    end
    
    H["位置 x̂"] --- I["动量 p̂"]
    I --- J["[x̂,p̂] = iℏ"]
    J --- K["Δx·Δp ≥ ℏ/2"]
    
    style A fill:#9f6,stroke:#333
    style D fill:#f66,stroke:#333

2.9 历史背景:从矩阵到算符

2.9.1 海森堡的矩阵

1925年夏天,24岁的海森堡在赫尔戈兰岛(Helgoland)治疗花粉症。他有了一个疯狂的想法:放弃电子轨道的可视化图像,只用可观测的跃迁频率和强度来建立理论。

他发明了矩阵力学。位置 xx 和动量 pp 不再是数,而是无限维矩阵:

xnm,pnmx_{nm}, \quad p_{nm}

并且他发现了一个惊人的关系:

xppx=i2πIxp - px = \frac{i\hbar}{2\pi} I

矩阵不对易!

2.9.2 Dirac 的抽象化

海森堡用矩阵,薛定谔用微分方程。两个理论给出同样的结果,但形式完全不同。

Dirac 在 1925 年看到海森堡的论文后,迅速认识到:关键在于对易关系,而不是矩阵的具体形式。他发展了 q-数(q-numbers)理论——抽象的、不一定对易的量。

Dirac 的方法更抽象,但更普适。矩阵力学和波动力学只是这个抽象理论在特定表象下的具体实现。

timeline
    title 算符理论的历史演进
    1925 : Werner Heisenberg
         : 矩阵力学
[x, p] = iℏ 1925 : Paul Dirac : q-数理论
抽象算符代数 1926 : Erwin Schrödinger : 波动力学
微分算符 1930 : Paul Dirac : 《量子力学原理》 : 算符作为公理化基础

2.10 自旋 1/2:一个具体例子

2.10.1 泡利矩阵

电子自旋是最简单的非平凡例子。自旋角动量 S^\hat{S} 的三个分量用**泡利矩阵(Pauli matrices)**表示:

S^x=2σx,S^y=2σy,S^z=2σz\hat{S}_x = \frac{\hbar}{2}\sigma_x, \quad \hat{S}_y = \frac{\hbar}{2}\sigma_y, \quad \hat{S}_z = \frac{\hbar}{2}\sigma_z

其中:

σx=(0110),σy=(0ii0),σz=(1001)\sigma_x = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}, \quad \sigma_y = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}, \quad \sigma_z = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}

2.10.2 对易关系

[S^x,S^y]=iS^z[\hat{S}_x, \hat{S}_y] = i\hbar\hat{S}_z

(以及循环排列)

这是角动量的普遍代数结构。

2.10.3 本征态

S^z\hat{S}_z 的本征态:

+=(10),=(01)|+\rangle = \begin{pmatrix} 1 \\ 0 \end{pmatrix}, \quad |-\rangle = \begin{pmatrix} 0 \\ 1 \end{pmatrix}

对应本征值 +/2+\hbar/2/2-\hbar/2

S^x\hat{S}_x 的本征态:

+x=12(++),x=12(+)|+\rangle_x = \frac{1}{\sqrt{2}}(|+\rangle + |-\rangle), \quad |-\rangle_x = \frac{1}{\sqrt{2}}(|+\rangle - |-\rangle)

一个关键事实:+x|+\rangle_x 不是 S^z\hat{S}_z 的本征态!测量 S^z\hat{S}_z 会给出不确定的结果。S^x\hat{S}_xS^z\hat{S}_z 不相容。

2.10.4 数值计算:矩阵运算实战

让我们用具体的矩阵运算来验证这些抽象关系。

验证对易关系 [σx,σy]=2iσz[\sigma_x, \sigma_y] = 2i\sigma_z

σxσy=(0110)(0ii0)=(i00i)\sigma_x \sigma_y = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix} = \begin{pmatrix} i & 0 \\ 0 & -i \end{pmatrix}

σyσx=(0ii0)(0110)=(i00i)\sigma_y \sigma_x = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix} \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} = \begin{pmatrix} -i & 0 \\ 0 & i \end{pmatrix}

[σx,σy]=σxσyσyσx=(2i002i)=2iσz[\sigma_x, \sigma_y] = \sigma_x\sigma_y - \sigma_y\sigma_x = \begin{pmatrix} 2i & 0 \\ 0 & -2i \end{pmatrix} = 2i\sigma_z

验证成功!

S^x\hat{S}_x 的本征值和本征态

S^x=2(0110)\hat{S}_x = \frac{\hbar}{2}\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}

本征方程:

2(0110)(ab)=λ(ab)\frac{\hbar}{2}\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix} = \lambda\begin{pmatrix} a \\ b \end{pmatrix}

特征方程:

det(λ/2/2λ)=λ224=0\det\begin{pmatrix} -\lambda & \hbar/2 \\ \hbar/2 & -\lambda \end{pmatrix} = \lambda^2 - \frac{\hbar^2}{4} = 0

所以 λ=±/2\lambda = \pm \hbar/2

对于 λ=+/2\lambda = +\hbar/2

2(0110)(ab)=2(ab)b=a\frac{\hbar}{2}\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix} = \frac{\hbar}{2}\begin{pmatrix} a \\ b \end{pmatrix} \Rightarrow b = a

归一化:a2+b2=2a2=1a=1/2|a|^2 + |b|^2 = 2|a|^2 = 1 \Rightarrow a = 1/\sqrt{2}

所以:

+x=12(11)=12(++)|+\rangle_x = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix} = \frac{1}{\sqrt{2}}(|+\rangle + |-\rangle)

计算测量概率:设系统处于 +x|+\rangle_x 态,测量 SzS_z

P(Sz=+/2)=++x2=(10)12(11)2=122=12P(S_z = +\hbar/2) = |\langle +|+\rangle_x|^2 = \left|\begin{pmatrix} 1 & 0 \end{pmatrix} \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix}\right|^2 = \left|\frac{1}{\sqrt{2}}\right|^2 = \frac{1}{2}

P(Sz=/2)=+x2=(01)12(11)2=122=12P(S_z = -\hbar/2) = |\langle -|+\rangle_x|^2 = \left|\begin{pmatrix} 0 & 1 \end{pmatrix} \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix}\right|^2 = \left|\frac{1}{\sqrt{2}}\right|^2 = \frac{1}{2}

2.10.5 数值例子:谐振子的升降算符

一维谐振子是无限维系统的经典例子。定义升降算符:

a^=12(x^x0+ip^p0),a^=12(x^x0ip^p0)\hat{a} = \frac{1}{\sqrt{2}}\left(\frac{\hat{x}}{x_0} + i\frac{\hat{p}}{p_0}\right), \quad \hat{a}^\dagger = \frac{1}{\sqrt{2}}\left(\frac{\hat{x}}{x_0} - i\frac{\hat{p}}{p_0}\right)

其中 x0=/(mω)x_0 = \sqrt{\hbar/(m\omega)}p0=mωp_0 = \sqrt{m\hbar\omega}

对易关系

[a^,a^]=1[\hat{a}, \hat{a}^\dagger] = 1

哈密顿量

H^=ω(a^a^+12)=ω(n^+12)\hat{H} = \hbar\omega\left(\hat{a}^\dagger\hat{a} + \frac{1}{2}\right) = \hbar\omega\left(\hat{n} + \frac{1}{2}\right)

具体数值:对于电子在原子尺度(m=9.11×1031m = 9.11 \times 10^{-31} kg)的谐振子,频率 ω=1015\omega = 10^{15} rad/s(可见光频率):

  • ω=1.055×1034×1015=1.055×1019\hbar\omega = 1.055 \times 10^{-34} \times 10^{15} = 1.055 \times 10^{-19} J =0.66= 0.66 eV
  • 基态能量:E0=12ω=0.33E_0 = \frac{1}{2}\hbar\omega = 0.33 eV
  • 零点振动幅度:x0=/(mω)=1.055×10349.11×1031×10153.4×1010x_0 = \sqrt{\hbar/(m\omega)} = \sqrt{\frac{1.055 \times 10^{-34}}{9.11 \times 10^{-31} \times 10^{15}}} \approx 3.4 \times 10^{-10} m =0.34= 0.34 nm

这些数值告诉我们:量子谐振子的基态能量不为零(零点能),且零点振动幅度在原子尺度——这正是化学键振动的典型数量级。

graph TD
    subgraph "自旋1/2的态空间 ℂ²"
        A["|+⟩: S_z = +ℏ/2"] --- B["|-⟩: S_z = -ℏ/2"]
        C["|+⟩_x: S_x = +ℏ/2"] --- D["|-⟩_x: S_x = -ℏ/2"]
        
        A -.-> C["|+⟩_x = (|+⟩+|-⟩)/√2"]
        A -.-> D["|-⟩_x = (|+⟩-|-⟩)/√2"]
    end
    
    E["测量 S_z 在 |+⟩_x 态"] --> F["结果: +ℏ/2 或 -ℏ/2
各50%概率"] style E fill:#f96,stroke:#333

2.11 本章总结

核心思想回顾

这一章,Dirac 把我们从抽象的态空间带到了物理测量的核心。

  1. 动力学变量 = 线性算符——作用在态上产生新态
  2. 厄米共轭与厄米算符——保证测量结果的实数性
  3. 本征值与本征态——测量确定性的状态
  4. 可观测量——本征态构成完备集的厄米算符
  5. 谱分解——把任意算符拆解为投影的叠加
  6. 对易性——决定两个量能否同时精确测量
  7. 不确定性关系——不对易性的直接物理后果
graph TD
    A["线性算符 Â"] --> B["厄米共轭 †"]
    B --> C["厄米算符 †=Â"]
    C --> D["可观测量
本征态完备集"] D --> E["本征值 aᵢ"] D --> F["本征态 |aᵢ⟩"] E --> G[测量结果] F --> H[测量后态坍缩] C --> I["谱分解  = Σaᵢ|aᵢ⟩⟨aᵢ|"] I --> J["函数 f = Σf(aᵢ)|aᵢ⟩⟨aᵢ|"] C --> K["对易关系 [Â,B̂]"] K --> L{"=0 ?"} L -->|是| M["相容可观测量
可同时测量"] L -->|否| N["不相容可观测量
不确定性关系"] style A fill:#f96,stroke:#333 style C fill:#9f6,stroke:#333,stroke-width:3px style N fill:#f66,stroke:#333

Dirac的独特视角

这一章,Dirac做了什么与众不同的事?

他不是从具体的物理量(位置、动量、能量)出发,而是从"动力学变量"的抽象代数结构出发。 在1930年,矩阵力学已经把位置表示为无限维矩阵,波动力学已经把位置表示为乘法算符 xψ(x)x \cdot \psi(x)。大多数物理学家在两种形式之间选择——要么用矩阵计算,要么解微分方程。

但Dirac问了一个更深层的问题:"位置"和"动量"作为量子力学概念,它们的共同本质是什么?

他的答案是:它们都是算符,都是作用在态空间上的线性变换。矩阵力学和波动力学的区别只是"表象"(第三章的主题)——同一个抽象算符在不同基下的不同实现。

Dirac的独特贡献在于:

  1. 算符优先于表象:他不是先选一个表象(如位置表象),再定义算符。而是先定义抽象算符的代数规则(线性性、厄米性、对易关系),然后才进入具体表象。

  2. 对易关系作为核心:他看到海森堡的 xppx=ixp - px = i\hbar 不是矩阵的特殊性质,而是算符代数的普遍特征。对易子 [A^,B^][\hat{A}, \hat{B}] 成为量子力学的"结构常数"——它决定了测量的相容性、不确定性的来源、甚至整个动力学演化(见第四章)。

  3. 可观测量作为公理化定义:Dirac不假设"位置可以测量"或"能量可以测量",而是先定义"可观测量"的数学条件(厄米+本征态完备),然后验证物理量是否满足。这使量子力学的测量理论成为数学结构的推论,而非额外假设。

这种"从抽象到具体"的路径,后来被数学家(von Neumann)严格化为Hilbert空间上的自伴算符理论。但Dirac的洞见先于严格化——他用物理直觉和代数美感,构建了一座从线性代数通向量子世界的桥梁。


练习与思考

  1. (计算) 证明对于任意算符 A^\hat{A}B^\hat{B}(A^B^)=B^A^(\hat{A}\hat{B})^\dagger = \hat{B}^\dagger\hat{A}^\dagger。用这个结果说明:如果 A^\hat{A}B^\hat{B} 都是厄米算符,那么 [A^,B^][\hat{A}, \hat{B}] 是反厄米的(即 [A^,B^]=[A^,B^][\hat{A}, \hat{B}]^\dagger = -[\hat{A}, \hat{B}]),而 i[A^,B^]i[\hat{A}, \hat{B}] 是厄米的。

  2. (应用) 考虑一个二维系统,可观测量 A^\hat{A} 在基 {1,2}\{|1\rangle, |2\rangle\} 下的矩阵表示为 A^=(3ii1)\hat{A} = \begin{pmatrix} 3 & i \\ -i & 1 \end{pmatrix}。求其本征值和归一化本征向量,并验证它们正交。若系统处于 ψ=12(1+2)|\psi\rangle = \frac{1}{\sqrt{2}}(|1\rangle + |2\rangle),求测量 A^\hat{A} 的期望值和各结果的概率。

  3. (思考) Dirac 将可观测量定义为"本征向量构成完备集的厄米算符"。你能构造一个厄米算符但其本征向量不完备的例子吗?(提示:考虑无限维空间中某些特殊算符,或者查阅"自伴算符 vs 厄米算符"的区别。这在数学上很重要,但在物理中我们通常假设所有物理量都是可观测量。)


"The only observable quantities in quantum mechanics are the eigenvalues of operators."
— Paul Dirac