第II章动力学变量与可观测量：算符的王国

前置知识：线性算符的矩阵表示

Dirac书中的"算符"非常抽象——他称之为"q-数"（q-numbers），强调它们不一定对易。但为了让这些抽象概念落地，我们需要一个具体的心理模型。矩阵表示是最自然的桥梁。

什么是线性算符？

一个线性算符 $\hat{A}$ 是从向量空间到自身的映射，满足线性条件：

$\hat{A}(c_1|\psi_1\rangle + c_2|\psi_2\rangle) = c_1\hat{A}|\psi_1\rangle + c_2\hat{A}|\psi_2\rangle$

在有限维空间中，选择一组基 \{|e_1\rangle, |e_2\rangle, \dots, |e_n\rangle\} 后，每个算符对应一个矩阵。

算符的矩阵表示

算符 $\hat{A}$ 在基 $\{|e_i\rangle\}$ 下的矩阵元定义为：

$A_{ij} = \langle e_i|\hat{A}|e_j\rangle$

整个算符对应矩阵：

$\hat{A} \longleftrightarrow \begin{pmatrix} A_{11} & A_{12} & \cdots \\ A_{21} & A_{22} & \cdots \\ \vdots & \vdots & \ddots \end{pmatrix}$

关键理解：同一个算符在不同基下有不同的矩阵，但算符本身是基无关的抽象对象。这正如一个线性变换在不同坐标系下有不同的矩阵表示，但变换本身不变。

厄米共轭 = 共轭转置

在矩阵语言中，厄米共轭就是先转置，再对每个元素取复共轭：

$(A^\dagger)_{ij} = A_{ji}^*$

例如：

$A = \begin{pmatrix} 1 & 2+i \\ 3-i & 4 \end{pmatrix} \quad \Rightarrow \quad A^\dagger = \begin{pmatrix} 1 & 3+i \\ 2-i & 4 \end{pmatrix}$

厄米矩阵（自伴矩阵）满足 $A^\dagger = A$ ，即 $A_{ij} = A_{ji}^*$ 。

本征值问题的矩阵版本

算符的本征方程 $\hat{A}|a\rangle = a|a\rangle$ 在矩阵语言中就是：

$\mathbf{A}\mathbf{v} = a\mathbf{v}$

即寻找矩阵 $\mathbf{A}$ 的特征值 $a$ 和特征向量 $\mathbf{v}$ 。

线性代数定理：厄米矩阵的特征值都是实数，不同特征值对应的特征向量正交。

这个定理恰好对应Dirac算符理论中的两个核心结论：

厄米算符的本征值是实数（对应可观测量的测量结果必须是实数）
不同本征值对应的本征态正交

从有限维到无限维

Dirac的伟大之处在于，他把有限维的矩阵直觉推广到了无限维（甚至连续谱）。在无限维中，"矩阵"有无限多行无限多列，求和变成积分。但核心的代数结构——线性性、厄米性、本征值问题——保持不变。

理解这一点至关重要：Dirac不是在发明一套全新的数学，而是在把线性代数的直觉扩展到量子力学的全部领域。

故事场景：魔术师的手套

一个老魔术师登上舞台，手里只有一双手套。他向观众展示：左手手套只有左手的形状，右手手套只有右手的形状。然后他做了一个不可思议的动作——将两只手套叠在一起。"现在，"他说，"这不是左手套，也不是右手套。它是一个全新的东西：一双手套。但如果你只从左边看，你会看到左手；只从右边看，你会看到右手。"

一位物理学家在台下微笑。魔术师不懂量子力学，但他碰巧触碰到了真相。

Dirac 在第二章中告诉我们：动力学变量在量子力学中不是数，而是算符。当你"观察"一个系统时，你不是在读取一个预先存在的数值——你是在用算符作用于态，迫使它给出结果。手套不是左也不是右，直到你选择从哪边看。

2.1 线性算符：作用在态空间上的变换

2.1.1 什么是算符？

上一章我们建立了态空间——一个复矢量空间。现在，我们需要在这个空间中引入动力学变量。

在经典力学中，动力学变量如位置 $x$ 、动量 $p$ 、能量 $E$ 都是普通的数（或数的函数）。在量子力学中，它们变成了算符（operators）——作用在态矢量上，产生新的态矢量。

$\hat{A}|\psi\rangle = |\phi\rangle$

2.1.2 线性性

Dirac 要求所有动力学变量对应的算符必须是线性算符：

$\hat{A}(c_1|\psi_1\rangle + c_2|\psi_2\rangle) = c_1\hat{A}|\psi_1\rangle + c_2\hat{A}|\psi_2\rangle$

为什么必须是线性的？

因为叠加原理！如果态可以线性叠加，那么动力学变量的作用必须与叠加"兼容"。如果 $\hat{A}$ 不是线性的，就会导致一个悖论：先叠加再作用，与先作用再叠加，结果不同——叠加原理就被破坏了。

graph TD
    A["态空间 ℋ"] --> B["线性算符 Â"]
    B --> C["新态空间 ℋ"]
    
    D["|ψ₁⟩ + |ψ₂⟩"] --> E["Â(|ψ₁⟩+|ψ₂⟩)
= Â|ψ₁⟩ + Â|ψ₂⟩"]
    D --> F["线性要求:
叠加后作用 = 作用后叠加"]
    
    style B fill:#f9f,stroke:#333,stroke-width:3px

2.2 共轭关系：厄米共轭

2.2.1 算符的对偶

算符 $\hat{A}$ 作用在 ket 上： $\hat{A}|\psi\rangle$ 。我们如何让它作用于 bra？

Dirac 引入厄米共轭（Hermitian conjugate）：

$(\hat{A}|\psi\rangle)^\dagger = \langle\psi|\hat{A}^\dagger$

其中 $\hat{A}^\dagger$ 是 $\hat{A}$ 的厄米共轭算符。

2.2.2 矩阵类比

如果我们在有限维中把 ket 看作列向量，bra 看作行向量，算符看作矩阵：

$\hat{A}$ 是矩阵
$\hat{A}^\dagger$ 是共轭转置（先转置，再对每个元素取复共轭）

$A^\dagger = (A^T)^*$

2.2.3 厄米算符的定义

如果一个算符满足：

$\hat{A}^\dagger = \hat{A}$

则称 $\hat{A}$ 为厄米算符（Hermitian operator）或自伴算符（self-adjoint）。

厄米算符的物理意义：所有可观测的物理量（位置、动量、能量等）都必须用厄米算符表示。厄米性保证了本征值是实数——测量结果必须是实数。

graph LR
    A["算符 Â"] --> B["厄米共轭 Â†"]
    B --> C{"Â† = Â ?"}
    C -->|是| D["厄米算符
对应可观测量"]
    C -->|否| E["非厄米算符
一般不能测量"]
    
    style D fill:#9f6,stroke:#333,stroke-width:3px

2.3 本征值与本征向量

2.3.1 本征方程

算符 $\hat{A}$ 的本征值问题：

$\hat{A}|a\rangle = a|a\rangle$

其中：

$|a\rangle$ ：本征向量（eigenvector/eigenstate）
$a$ ：本征值（eigenvalue）

物理诠释：当系统处于 $|a\rangle$ 态时，测量 $\hat{A}$ 得到确定值 $a$ ，没有不确定性。

2.3.2 厄米算符本征值的实数性

证明：设 $\hat{A}$ 是厄米算符， $\hat{A}|a\rangle = a|a\rangle$ 。

用 $\langle a|$ 左乘两边：

$\langle a|\hat{A}|a\rangle = a\langle a|a\rangle = a$

另一方面，取厄米共轭：

$(\langle a|\hat{A}|a\rangle)^* = \langle a|\hat{A}^\dagger|a\rangle = \langle a|\hat{A}|a\rangle$

所以 $\langle a|\hat{A}|a\rangle$ 是实数，即 $a \in \mathbb{R}$ 。

2.3.3 本征向量的正交性

厄米算符不同本征值对应的本征向量正交：

$\hat{A}|a_1\rangle = a_1|a_1\rangle, \quad \hat{A}|a_2\rangle = a_2|a_2\rangle, \quad a_1 \neq a_2$

$\Rightarrow \langle a_1|a_2\rangle = 0$

证明：由 $\langle a_1|\hat{A}|a_2\rangle = a_2\langle a_1|a_2\rangle$ ，同时

$\langle a_1|\hat{A}|a_2\rangle = (\hat{A}|a_1\rangle)^\dagger|a_2\rangle = a_1\langle a_1|a_2\rangle$

所以 $(a_1 - a_2)\langle a_1|a_2\rangle = 0$ ，因 $a_1 \neq a_2$ ，故 $\langle a_1|a_2\rangle = 0$ 。

graph TD
    subgraph "厄米算符 Â 的本征结构"
        A["|a₁⟩: 本征值 a₁"] --- B["|a₂⟩: 本征值 a₂"]
        C["|a₃⟩: 本征值 a₃"] --- D["..."]
        
        A -.-|正交| B
        B -.-|正交| C
        A -.-|正交| C
    end
    
    E["任意态 |ψ⟩ = Σ cᵢ|aᵢ⟩"] --> F["测量概率: P(aᵢ) = |cᵢ|²"]
    
    style A fill:#f96,stroke:#333
    style B fill:#96f,stroke:#333
    style C fill:#6f9,stroke:#333

2.4 可观测量的定义

2.4.1 从算符到可观测量

Dirac 对**可观测量（observable）**给出了严格定义：

可观测量：一个动力学变量，如果其厄米算符的本征向量构成态空间的完备集，则称其为可观测量。

关键条件：完备性（completeness）。

不是所有厄米算符都是可观测量
可观测量要求本征向量"足够多"，能展开任意态
在实际物理中，位置、动量、能量、角动量等都是可观测量

2.4.2 谱分解

对于可观测量 $\hat{A}$ ，有谱分解（spectral decomposition）：

$\hat{A} = \sum_i a_i |a_i\rangle\langle a_i|$

其中 $a_i$ 是本征值， $|a_i\rangle\langle a_i|$ 是投影到本征空间的投影算符。

这相当于"把算符拆解成它在各本征方向上的贡献"。

graph LR
    A["可观测量 Â"] --> B["谱分解:
Â = Σ aᵢ|aᵢ⟩⟨aᵢ|"]
    B --> C["投影算符:
Pᵢ = |aᵢ⟩⟨aᵢ|"]
    C --> D["测量得到 aᵢ 的概率:
P(aᵢ) = ⟨ψ|Pᵢ|ψ⟩ = |⟨aᵢ|ψ⟩|²"]
    
    style B fill:#bbf,stroke:#333,stroke-width:2px

2.5 离散谱与连续谱：归一化的关键区别

Dirac原著中一个极其重要但容易被忽略的主题是：离散本征值与连续本征值的归一化方式不同。这不仅是一个数学细节，而是理解量子力学测量理论的核心。

2.5.1 离散谱：可归一化的本征态

对于离散本征值 $a_n$ ，对应本征态 $|a_n\rangle$ 可以归一化为：

$\langle a_n|a_m\rangle = \delta_{nm} = \begin{cases} 1 & n=m \\ 0 & n \neq m \end{cases}$

这意味着每个本征态都是"单位长度"的矢量。例如，氢原子的能级本征态 $|n,l,m\rangle$ 、谐振子的能量本征态 $|n\rangle$ 、自旋1/2的 $|+\rangle$ 和 $|-\rangle$ ，都可以如此归一化。

2.5.2 连续谱：δ函数归一化

对于连续本征值（如位置 $x$ 或动量 $p$ ），情况完全不同。位置本征态 $|x'\rangle$ 满足：

$\langle x'|x''\rangle = \delta(x'-x'')$

这里的 $\delta(x'-x'')$ 是Dirac delta函数——它在 $x'=x''$ 处"无穷大"，其他地方为零，且积分等于1。

关键区别： $|x'\rangle$ 不是平方可积的！严格来说， $\langle x'|x'\rangle = \delta(0) = \infty$ ，所以 $|x'\rangle$ 不属于Hilbert空间。

2.5.3 为什么连续谱态不能归一化到1？

直观理解：如果 $|x'\rangle$ 代表粒子精确处于位置 $x'$ ，那它必须是一个无限窄的峰。根据不确定性原理，位置完全确定意味着动量完全不确定——这个态包含所有可能的动量成分，"展开"到了整个空间。

数学上：

$|x'\rangle = \int_{-\infty}^{\infty} |p\rangle\langle p|x'\rangle dp = \int_{-\infty}^{\infty} |p\rangle \frac{e^{-ipx'/\hbar}}{\sqrt{2\pi\hbar}} dp$

这个态由所有动量本征态等权叠加而成——它"伸展"到了整个动量空间，因此无法在位置空间归一化为有限值。

2.5.4 Dirac的实用主义

Dirac对这一数学困难的态度非常实用：他直接使用 $\delta$ 函数归一化，不担心严格性问题。他在书中写道：

"连续本征态的归一化是一个形式问题，不影响物理结果。"

后来，数学家用**装备Hilbert空间（rigged Hilbert space）**理论严格化了这一处理——连续谱本征态作为"广义矢量"（分布）存在，不属于Hilbert空间本身，但可以与Hilbert空间中的态产生内积（得到有限的结果）。

特征	离散谱	连续谱
例子	能量 $E_n$ 、自旋 $S_z$	位置 $x$ 、动量 $p$
归一化	$\langle n	m\rangle = \delta_{nm}$
完备性	$\sum	n\rangle\langle n
本征态是否在Hilbert空间	是	否（严格来说）
物理可制备性	可直接制备	是理想化极限

2.5.5 数值例子：两种归一化的对比

离散例子（自旋1/2）：

$\langle +|+\rangle = \begin{pmatrix} 1 & 0 \end{pmatrix} \begin{pmatrix} 1 \\ 0 \end{pmatrix} = 1$

$\langle +|-\rangle = \begin{pmatrix} 1 & 0 \end{pmatrix} \begin{pmatrix} 0 \\ 1 \end{pmatrix} = 0$

完美符合 $\delta_{nm}$ 。

连续例子（位置表象）：

假设一个近似的位置本征态——一个非常窄的高斯波包：

$\psi_{x_0}(x) = \left(\frac{1}{2\pi\sigma^2}\right)^{1/4} e^{-(x-x_0)^2/(4\sigma^2)}$

当 $\sigma \to 0$ 时，这个波包越来越窄，趋近于 $\delta(x-x_0)$ 。但它的归一化始终保持为1：

$\int_{-\infty}^{\infty} |\psi_{x_0}(x)|^2 dx = 1$

真正的位置本征态 $|x_0\rangle$ 是这个极限——一个"无限高、无限窄"的峰，不能作为普通函数归一化，只能用 $\delta$ 函数理解。

2.6 观测量的函数

2.6.1 函数作为算符的函数

给定可观测量 $\hat{A}$ 和函数 $f(x)$ ，如何定义 $f(\hat{A})$ ？

利用谱分解：

$f(\hat{A}) = \sum_i f(a_i) |a_i\rangle\langle a_i|$

直觉：在每个本征方向上，算符的作用由函数 $f$ 作用于本征值决定。

2.6.2 例子：能量的指数

考虑 $f(\hat{H}) = e^{\hat{H}/k_B T}$ ，这在统计物理中非常重要（配分函数）。

$e^{\hat{H}/k_B T} = \sum_i e^{E_i/k_B T} |E_i\rangle\langle E_i|$

这就是密度算符的雏形。

2.7 物理诠释的一般形式

2.6.1 测量假设的完整表述

现在我们能够完整表述量子测量的规则了。

设系统处于态 $|\psi\rangle$ ，可观测量 $\hat{A}$ 的本征态为 $\{|a_i\rangle\}$ ，对应本征值 $\{a_i\}$ 。

测量规则：

结果：测量得到 $a_i$ 的概率为 $P(a_i) = |\langle a_i|\psi\rangle|^2$
坍缩：测量后态"坍缩"到对应的本征态 $|a_i\rangle$
期望值：多次测量平均值 $\langle\hat{A}\rangle = \langle\psi|\hat{A}|\psi\rangle$

2.6.2 期望值公式的推导

$\langle\hat{A}\rangle = \sum_i a_i P(a_i) = \sum_i a_i |\langle a_i|\psi\rangle|^2$

$= \langle\psi|\hat{A}|\psi\rangle$

这就是 Dirac 著名的期望值公式。

graph TD
    A["系统态 |ψ⟩"] --> B["Â 的本征态 |aᵢ⟩"]
    B --> C["展开: |ψ⟩ = Σ cᵢ|aᵢ⟩"]
    C --> D["测量得到 aᵢ 的概率: |cᵢ|²"]
    D --> E["期望值: ⟨A⟩ = Σ aᵢ|cᵢ|² = ⟨ψ|Â|ψ⟩"]
    
    style E fill:#f9f,stroke:#333,stroke-width:3px

2.8 对易性与相容性

2.7.1 对易子的定义

两个算符 $\hat{A}$ 和 $\hat{B}$ 的对易子（commutator）：

$[\hat{A}, \hat{B}] = \hat{A}\hat{B} - \hat{B}\hat{A}$

如果 $[\hat{A}, \hat{B}] = 0$ ，称它们对易（commute）。

2.7.2 对易性的物理意义

核心定理：两个可观测量可以同时被精确测量（有共同本征态完备集），当且仅当它们对易。

$[\hat{A}, \hat{B}] = 0 \Leftrightarrow \exists \{|n\rangle\}, \hat{A}|n\rangle = a_n|n\rangle, \hat{B}|n\rangle = b_n|n\rangle$

2.7.3 不相容可观测量

如果 $[\hat{A}, \hat{B}] \neq 0$ ，则不存在共同本征态完备集。系统不能同时处于 $\hat{A}$ 和 $\hat{B}$ 的本征态。

典型例子：位置 $\hat{x}$ 和动量 $\hat{p}$ 。

$[\hat{x}, \hat{p}] = i\hbar$

这就是著名的海森堡不确定性关系的代数根源。

2.7.4 不确定性关系的一般推导

设 $\hat{A}$ 和 $\hat{B}$ 是两个可观测量，定义：

$\Delta A = \sqrt{\langle\hat{A}^2\rangle - \langle\hat{A}\rangle^2}$

$\Delta B = \sqrt{\langle\hat{B}^2\rangle - \langle\hat{B}\rangle^2}$

则：

$\Delta A \cdot \Delta B \geq \frac{1}{2}|\langle[\hat{A}, \hat{B}]\rangle|$

对于位置和动量：

$\Delta x \cdot \Delta p \geq \frac{\hbar}{2}$

graph TD
    subgraph "相容 vs 不相容"
        A["对易: [Â,B̂] = 0"] --> B["共同本征态完备集"]
        B --> C["可同时精确测量"]
        
        D["不对易: [Â,B̂] ≠ 0"] --> E["无共同本征态完备集"]
        E --> F["不能同时精确测量"]
        F --> G["不确定性关系"]
    end
    
    H["位置 x̂"] --- I["动量 p̂"]
    I --- J["[x̂,p̂] = iℏ"]
    J --- K["Δx·Δp ≥ ℏ/2"]
    
    style A fill:#9f6,stroke:#333
    style D fill:#f66,stroke:#333

2.9 历史背景：从矩阵到算符

2.9.1 海森堡的矩阵

1925年夏天，24岁的海森堡在赫尔戈兰岛（Helgoland）治疗花粉症。他有了一个疯狂的想法：放弃电子轨道的可视化图像，只用可观测的跃迁频率和强度来建立理论。

他发明了矩阵力学。位置 $x$ 和动量 $p$ 不再是数，而是无限维矩阵：

$x_{nm}, \quad p_{nm}$

并且他发现了一个惊人的关系：

$xp - px = \frac{i\hbar}{2\pi} I$

矩阵不对易！

2.9.2 Dirac 的抽象化

海森堡用矩阵，薛定谔用微分方程。两个理论给出同样的结果，但形式完全不同。

Dirac 在 1925 年看到海森堡的论文后，迅速认识到：关键在于对易关系，而不是矩阵的具体形式。他发展了 q-数（q-numbers）理论——抽象的、不一定对易的量。

Dirac 的方法更抽象，但更普适。矩阵力学和波动力学只是这个抽象理论在特定表象下的具体实现。

timeline
    title 算符理论的历史演进
    1925 : Werner Heisenberg
         : 矩阵力学
[x, p] = iℏ
    1925 : Paul Dirac
         : q-数理论
抽象算符代数
    1926 : Erwin Schrödinger
         : 波动力学
微分算符
    1930 : Paul Dirac
         : 《量子力学原理》
         : 算符作为公理化基础

2.10 自旋 1/2：一个具体例子

2.10.1 泡利矩阵

电子自旋是最简单的非平凡例子。自旋角动量 $\hat{S}$ 的三个分量用**泡利矩阵（Pauli matrices）**表示：

$\hat{S}_x = \frac{\hbar}{2}\sigma_x, \quad \hat{S}_y = \frac{\hbar}{2}\sigma_y, \quad \hat{S}_z = \frac{\hbar}{2}\sigma_z$

其中：

$\sigma_x = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}, \quad \sigma_y = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}, \quad \sigma_z = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}$

2.10.2 对易关系

$[\hat{S}_x, \hat{S}_y] = i\hbar\hat{S}_z$

（以及循环排列）

这是角动量的普遍代数结构。

2.10.3 本征态

$\hat{S}_z$ 的本征态：

$|+\rangle = \begin{pmatrix} 1 \\ 0 \end{pmatrix}, \quad |-\rangle = \begin{pmatrix} 0 \\ 1 \end{pmatrix}$

对应本征值 $+\hbar/2$ 和 $-\hbar/2$ 。

$\hat{S}_x$ 的本征态：

$|+\rangle_x = \frac{1}{\sqrt{2}}(|+\rangle + |-\rangle), \quad |-\rangle_x = \frac{1}{\sqrt{2}}(|+\rangle - |-\rangle)$

一个关键事实： $|+\rangle_x$ 不是 $\hat{S}_z$ 的本征态！测量 $\hat{S}_z$ 会给出不确定的结果。 $\hat{S}_x$ 和 $\hat{S}_z$ 不相容。

2.10.4 数值计算：矩阵运算实战

让我们用具体的矩阵运算来验证这些抽象关系。

验证对易关系 $[\sigma_x, \sigma_y] = 2i\sigma_z$ ：

$\sigma_x \sigma_y = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix} = \begin{pmatrix} i & 0 \\ 0 & -i \end{pmatrix}$

$\sigma_y \sigma_x = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix} \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} = \begin{pmatrix} -i & 0 \\ 0 & i \end{pmatrix}$

$[\sigma_x, \sigma_y] = \sigma_x\sigma_y - \sigma_y\sigma_x = \begin{pmatrix} 2i & 0 \\ 0 & -2i \end{pmatrix} = 2i\sigma_z$

验证成功！

求 $\hat{S}_x$ 的本征值和本征态：

$\hat{S}_x = \frac{\hbar}{2}\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}$

本征方程：

$\frac{\hbar}{2}\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix} = \lambda\begin{pmatrix} a \\ b \end{pmatrix}$

特征方程：

$\det\begin{pmatrix} -\lambda & \hbar/2 \\ \hbar/2 & -\lambda \end{pmatrix} = \lambda^2 - \frac{\hbar^2}{4} = 0$

所以 $\lambda = \pm \hbar/2$ 。

对于 $\lambda = +\hbar/2$ ：

$\frac{\hbar}{2}\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix} = \frac{\hbar}{2}\begin{pmatrix} a \\ b \end{pmatrix} \Rightarrow b = a$

归一化： $|a|^2 + |b|^2 = 2|a|^2 = 1 \Rightarrow a = 1/\sqrt{2}$

所以：

$|+\rangle_x = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix} = \frac{1}{\sqrt{2}}(|+\rangle + |-\rangle)$

计算测量概率：设系统处于 $|+\rangle_x$ 态，测量 $S_z$ 。

$P(S_z = +\hbar/2) = |\langle +|+\rangle_x|^2 = \left|\begin{pmatrix} 1 & 0 \end{pmatrix} \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix}\right|^2 = \left|\frac{1}{\sqrt{2}}\right|^2 = \frac{1}{2}$

$P(S_z = -\hbar/2) = |\langle -|+\rangle_x|^2 = \left|\begin{pmatrix} 0 & 1 \end{pmatrix} \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix}\right|^2 = \left|\frac{1}{\sqrt{2}}\right|^2 = \frac{1}{2}$

2.10.5 数值例子：谐振子的升降算符

一维谐振子是无限维系统的经典例子。定义升降算符：

$\hat{a} = \frac{1}{\sqrt{2}}\left(\frac{\hat{x}}{x_0} + i\frac{\hat{p}}{p_0}\right), \quad \hat{a}^\dagger = \frac{1}{\sqrt{2}}\left(\frac{\hat{x}}{x_0} - i\frac{\hat{p}}{p_0}\right)$

其中 $x_0 = \sqrt{\hbar/(m\omega)}$ ， $p_0 = \sqrt{m\hbar\omega}$ 。

对易关系：

$[\hat{a}, \hat{a}^\dagger] = 1$

哈密顿量：

$\hat{H} = \hbar\omega\left(\hat{a}^\dagger\hat{a} + \frac{1}{2}\right) = \hbar\omega\left(\hat{n} + \frac{1}{2}\right)$

具体数值：对于电子在原子尺度（ $m = 9.11 \times 10^{-31}$ kg）的谐振子，频率 $\omega = 10^{15}$ rad/s（可见光频率）：

$\hbar\omega = 1.055 \times 10^{-34} \times 10^{15} = 1.055 \times 10^{-19}$ J $= 0.66$ eV
基态能量： $E_0 = \frac{1}{2}\hbar\omega = 0.33$ eV
零点振动幅度： $x_0 = \sqrt{\hbar/(m\omega)} = \sqrt{\frac{1.055 \times 10^{-34}}{9.11 \times 10^{-31} \times 10^{15}}} \approx 3.4 \times 10^{-10}$ m $= 0.34$ nm

这些数值告诉我们：量子谐振子的基态能量不为零（零点能），且零点振动幅度在原子尺度——这正是化学键振动的典型数量级。

graph TD
    subgraph "自旋1/2的态空间 ℂ²"
        A["|+⟩: S_z = +ℏ/2"] --- B["|-⟩: S_z = -ℏ/2"]
        C["|+⟩_x: S_x = +ℏ/2"] --- D["|-⟩_x: S_x = -ℏ/2"]
        
        A -.-> C["|+⟩_x = (|+⟩+|-⟩)/√2"]
        A -.-> D["|-⟩_x = (|+⟩-|-⟩)/√2"]
    end
    
    E["测量 S_z 在 |+⟩_x 态"] --> F["结果: +ℏ/2 或 -ℏ/2
各50%概率"]
    
    style E fill:#f96,stroke:#333

2.11 本章总结

核心思想回顾

这一章，Dirac 把我们从抽象的态空间带到了物理测量的核心。

动力学变量 = 线性算符——作用在态上产生新态
厄米共轭与厄米算符——保证测量结果的实数性
本征值与本征态——测量确定性的状态
可观测量——本征态构成完备集的厄米算符
谱分解——把任意算符拆解为投影的叠加
对易性——决定两个量能否同时精确测量
不确定性关系——不对易性的直接物理后果

graph TD
    A["线性算符 Â"] --> B["厄米共轭 Â†"]
    B --> C["厄米算符 Â†=Â"]
    C --> D["可观测量
本征态完备集"]
    D --> E["本征值 aᵢ"]
    D --> F["本征态 |aᵢ⟩"]
    E --> G[测量结果]
    F --> H[测量后态坍缩]
    
    C --> I["谱分解 Â = Σaᵢ|aᵢ⟩⟨aᵢ|"]
    I --> J["函数 fÂ = Σf(aᵢ)|aᵢ⟩⟨aᵢ|"]
    
    C --> K["对易关系 [Â,B̂]"]
    K --> L{"=0 ?"}
    L -->|是| M["相容可观测量
可同时测量"]
    L -->|否| N["不相容可观测量
不确定性关系"]
    
    style A fill:#f96,stroke:#333
    style C fill:#9f6,stroke:#333,stroke-width:3px
    style N fill:#f66,stroke:#333

Dirac的独特视角

这一章，Dirac做了什么与众不同的事？

他不是从具体的物理量（位置、动量、能量）出发，而是从"动力学变量"的抽象代数结构出发。 在1930年，矩阵力学已经把位置表示为无限维矩阵，波动力学已经把位置表示为乘法算符 $x \cdot \psi(x)$ 。大多数物理学家在两种形式之间选择——要么用矩阵计算，要么解微分方程。

但Dirac问了一个更深层的问题："位置"和"动量"作为量子力学概念，它们的共同本质是什么？

他的答案是：它们都是算符，都是作用在态空间上的线性变换。矩阵力学和波动力学的区别只是"表象"（第三章的主题）——同一个抽象算符在不同基下的不同实现。

Dirac的独特贡献在于：

算符优先于表象：他不是先选一个表象（如位置表象），再定义算符。而是先定义抽象算符的代数规则（线性性、厄米性、对易关系），然后才进入具体表象。
对易关系作为核心：他看到海森堡的 $xp - px = i\hbar$ 不是矩阵的特殊性质，而是算符代数的普遍特征。对易子 $[\hat{A}, \hat{B}]$ 成为量子力学的"结构常数"——它决定了测量的相容性、不确定性的来源、甚至整个动力学演化（见第四章）。
可观测量作为公理化定义：Dirac不假设"位置可以测量"或"能量可以测量"，而是先定义"可观测量"的数学条件（厄米+本征态完备），然后验证物理量是否满足。这使量子力学的测量理论成为数学结构的推论，而非额外假设。

这种"从抽象到具体"的路径，后来被数学家（von Neumann）严格化为Hilbert空间上的自伴算符理论。但Dirac的洞见先于严格化——他用物理直觉和代数美感，构建了一座从线性代数通向量子世界的桥梁。

练习与思考

（计算） 证明对于任意算符 $\hat{A}$ 和 $\hat{B}$ ， $(\hat{A}\hat{B})^\dagger = \hat{B}^\dagger\hat{A}^\dagger$ 。用这个结果说明：如果 $\hat{A}$ 和 $\hat{B}$ 都是厄米算符，那么 $[\hat{A}, \hat{B}]$ 是反厄米的（即 $[\hat{A}, \hat{B}]^\dagger = -[\hat{A}, \hat{B}]$ ），而 $i[\hat{A}, \hat{B}]$ 是厄米的。
（应用） 考虑一个二维系统，可观测量 $\hat{A}$ 在基 $\{|1\rangle, |2\rangle\}$ 下的矩阵表示为 $\hat{A} = \begin{pmatrix} 3 & i \\ -i & 1 \end{pmatrix}$ 。求其本征值和归一化本征向量，并验证它们正交。若系统处于 $|\psi\rangle = \frac{1}{\sqrt{2}}(|1\rangle + |2\rangle)$ ，求测量 $\hat{A}$ 的期望值和各结果的概率。
（思考） Dirac 将可观测量定义为"本征向量构成完备集的厄米算符"。你能构造一个厄米算符但其本征向量不完备的例子吗？（提示：考虑无限维空间中某些特殊算符，或者查阅"自伴算符 vs 厄米算符"的区别。这在数学上很重要，但在物理中我们通常假设所有物理量都是可观测量。）

"The only observable quantities in quantum mechanics are the eigenvalues of operators."
— Paul Dirac

第II章 动力学变量与可观测量：算符的王国