第1章 数学导引:建造量子力学的脚手架

📑 目录

第1章 数学导引:建造量子力学的脚手架

"在数学的脚手架上,物理学家建造了理解宇宙的大厦。"


故事场景:失落的建筑师的日记

公元2147年,火星殖民地的工程师艾琳发现了一栋"无法理解"的建筑——它的结构似乎悬浮在空中,没有任何可见的支撑。当地球来的结构专家仔细检查后,他笑了:"这栋建筑使用了我们三百年前就掌握的数学原理——只是你还没学会读它的’蓝图’。"艾琳困惑地问:"为什么物理结构需要数学才能理解?"专家回答:"因为数学不是装饰,它是脚手架。没有它,你只能看到碎片;有了它,你才能看见整体。"

这就是Shankar在第1章想告诉我们的:量子力学不是魔法,它建立在坚实的数学地基之上。如果你跳过了这些"枯燥的数学",后面的物理定理就会像没有脚手架的建筑一样摇摇欲坠。


前置知识:从高中向量到抽象向量空间

高中向量的"熟悉感"

在高中物理中,向量是"有大小和方向的量"。我们习惯了在二维或三维空间中画箭头:

v=(vx,vy,vz)\vec{v} = (v_x, v_y, v_z)

我们可以对它们做两件事:

  • 加法:将两个向量首尾相接
  • 数乘:将向量缩放某个倍数

以及一个"度量"操作:

  • 点积ab=abcosθ=axbx+ayby+azbz\vec{a} \cdot \vec{b} = |a||b|\cos\theta = a_x b_x + a_y b_y + a_z b_z

这些操作让你可以计算功(W=FdW = \vec{F} \cdot \vec{d})、判断垂直(点积为零)、求投影。

向量的"本质"是什么?

现在,让我们做一个思想实验:如果去掉坐标系,向量还存在吗?

答案是:存在。一个向量是空间中独立于坐标系的几何对象。坐标 (vx,vy,vz)(v_x, v_y, v_z) 只是向量在某组基下的"电话号码"——换了基(比如旋转坐标系),号码变了,但向量本身没变。

这就引出了Shankar的核心洞察:向量的本质不是它的分量,而是它在加法、数乘、内积下的行为。一旦我们抓住了这些行为特征,就可以把向量空间的概念推广到完全没有"几何图像"的情境——比如量子态。

从三维到n维:为什么需要抽象?

经典力学中,一个粒子的状态由6个数描述(3个位置 + 3个动量)。但量子力学中:

  • 一个自旋-1/2粒子只有两个可能的内部状态("上"或"下")
  • 一个谐振子的状态空间是无限维的
  • 两个粒子的状态空间是各自空间的"乘积"(张量积),维度相乘

这些空间无法"画出来",但它们的数学结构与三维向量空间完全相同——它们都是线性向量空间

生活类比:想象你管理一家公司的员工信息。每个员工有"姓名、部门、工龄、绩效评分"——这不是几何向量,但你仍然可以做"合并部门"(类似加法)和"全员绩效乘以系数"(类似数乘)。只要满足同样的规则,它就是一个向量空间。


1.1 为什么量子力学需要数学脚手架

经典力学给人的感觉是"直观的"——一个球飞出去,你可以画抛物线,可以用牛顿定律 F=maF=ma 描述。但到了量子世界,我们描述的是电子、光子这些我们无法直接"看见"的实体。它们的状态不是位置 x(t)x(t) 和动量 p(t)p(t) 这么简单。

在量子力学中:

  • 状态是一个向量(在"状态空间"中)
  • 可观测量是算符(作用在状态上的操作)
  • 测量是内积运算(从向量中提取数值)
  • 演化是线性变换(保持向量空间结构)

这些概念听起来抽象,但它们有一个共同的名字:线性代数。Shankar在第1章做的就是带我们系统性地建立这套数学语言,让后续的物理内容不再是"魔法",而是定理。

graph TD
    A[经典力学] -->|状态| B["位置x, 动量p"]
    A -->|演化方程| C["牛顿定律 F=ma"]
    A -->|数学工具| D[微积分]
    
    E[量子力学] -->|状态| F["态矢量 |ψ⟩"]
    E -->|可观测量| G["厄米算符 Â"]
    E -->|测量| H["内积 ⟨ψ|Â|ψ⟩"]
    E -->|演化| I[薛定谔方程]
    E -->|数学工具| J["线性代数 + 泛函分析"]
    
    D -.->|升级| J

1.2 线性向量空间基础

1.2.1 什么是向量空间

一个向量空间 VV 定义在一个数域 FF(通常是复数域 C\mathbb{C})上,是一个满足以下八条公理的集合:

  1. 加法封闭性u,vV\forall |u\rangle, |v\rangle \in Vu+vV|u\rangle + |v\rangle \in V
  2. 加法交换律u+v=v+u|u\rangle + |v\rangle = |v\rangle + |u\rangle
  3. 加法结合律(u+v)+w=u+(v+w)(|u\rangle + |v\rangle) + |w\rangle = |u\rangle + (|v\rangle + |w\rangle)
  4. 零向量存在0V\exists |0\rangle \in V,使 v+0=v|v\rangle + |0\rangle = |v\rangle
  5. 逆元存在vV\forall |v\rangle \in Vv\exists -|v\rangle,使 v+(v)=0|v\rangle + (-|v\rangle) = |0\rangle
  6. 数乘封闭性aF,vV\forall a \in F, |v\rangle \in VavVa|v\rangle \in V
  7. 数乘分配律a(u+v)=au+ava(|u\rangle + |v\rangle) = a|u\rangle + a|v\rangle
  8. 数域分配律(a+b)v=av+bv(a+b)|v\rangle = a|v\rangle + b|v\rangle

附加公理(数乘相容性):
9. a(bv)=(ab)va(b|v\rangle) = (ab)|v\rangle
10. 1v=v1|v\rangle = |v\rangle

Shankar使用Dirac符号 v|v\rangle(读作"ket v")来表示向量。这个符号的发明者Dirac说,这个符号就像"bra"和"ket"组成"bracket"一样简洁优美。

graph LR
    subgraph 向量空间公理体系
    A[加法群结构] --> B[封闭性]
    A --> C[交换律]
    A --> D[结合律]
    A --> E[零元与逆元]
    
    F[数乘结构] --> G[封闭性]
    F --> H[分配律]
    F --> I[相容性]
    end

生活类比:想象一个调色盘。所有可能的颜色混合在一起,形成一个"颜色空间"。

  • 加法封闭性:红 + 蓝 = 紫(还是一种颜色)
  • 零向量:"透明"——加到任何颜色上都不改变它
  • 数乘:将红色稀释2倍得到浅红
  • 逆元:红色的"负"——某种与红色混合后变透明的颜色(在减法混色模型中确实存在)

1.2.2 线性独立性与基

线性独立性:一组向量 {v1,v2,,vn}\{|v_1\rangle, |v_2\rangle, \ldots, |v_n\rangle\} 是线性独立的,当且仅当

i=1naivi=0ai=0i\sum_{i=1}^n a_i |v_i\rangle = |0\rangle \Rightarrow a_i = 0 \quad \forall i

换句话说,没有一个向量可以被其他向量"表示"。

基(Basis):如果一组线性独立的向量可以表示空间中的任意向量,这组向量就构成一个基。基的向量个数称为空间的维度

如果 {ei}i=1n\{|e_i\rangle\}_{i=1}^n 是一组基,那么任意向量可以唯一地表示为:

v=i=1nviei|v\rangle = \sum_{i=1}^n v_i |e_i\rangle

其中 viv_iv|v\rangle 在基 {ei}\{|e_i\rangle\} 下的分量坐标

graph TD
    A["向量 |v⟩"] -->|展开| B["v₁|e₁⟩ + v₂|e₂⟩ + v₃|e₃⟩"]
    B --> C["v₁"]
    B --> D["v₂"]
    B --> E["v₃"]
    C --> F["分量: 坐标"]
    D --> F
    E --> F
    
    G["基 {|eᵢ⟩}"] --> H[线性独立]
    G --> I["完备性: 张成全空间"]
    H --> J[唯一表示定理]
    I --> J

物理直觉:在三维空间中,基就像"坐标轴"。在量子力学中,基的选择对应于"用什么表象来描述系统"。位置表象、动量表象、能量表象——这些都是不同的基选择。

数值例子:考虑二维复向量空间 C2\mathbb{C}^2(这是自旋-1/2系统的状态空间)。

标准基为:

e1=(10),e2=(01)|e_1\rangle = \begin{pmatrix} 1 \\ 0 \end{pmatrix}, \quad |e_2\rangle = \begin{pmatrix} 0 \\ 1 \end{pmatrix}

向量 v=(3+2i1+i)|v\rangle = \begin{pmatrix} 3+2i \\ -1+i \end{pmatrix} 可以表示为:

v=(3+2i)e1+(1+i)e2|v\rangle = (3+2i)|e_1\rangle + (-1+i)|e_2\rangle

分量 v1=3+2iv_1 = 3+2iv2=1+iv_2 = -1+i


1.3 内积空间——给向量空间装上"度量"

1.3.1 内积的严格定义

光有向量空间还不够。我们需要一种方法来度量向量的大小、判断向量之间的"角度"。这就是内积(inner product)的作用。

内积是一个映射 :V×VC\langle \cdot | \cdot \rangle : V \times V \rightarrow \mathbb{C},满足:

  1. 线性于第二个参数

    uαv+βw=αuv+βuw\langle u | \alpha v + \beta w \rangle = \alpha \langle u | v \rangle + \beta \langle u | w \rangle

  2. 共轭对称性

    uv=vu\langle u | v \rangle = \langle v | u \rangle^*

  3. 正定性

    \langle v | v \rangle \geq 0, \quad \text{且 } \langle v | v \rangle = 0 \Leftrightarrow |v\rangle = |0\rangle

注意:由于共轭对称性,内积对第一个参数是反线性的(anti-linear):

αu+βvw=αuw+βvw\langle \alpha u + \beta v | w \rangle = \alpha^* \langle u | w \rangle + \beta^* \langle v | w \rangle

graph LR
    A[内积空间] --> B[向量空间结构]
    A --> C[内积结构]
    
    C --> D[线性于第二参数]
    C --> E[共轭对称性]
    C --> F[正定性]
    
    D --> G[可以提取系数]
    E --> H["⟨u|v⟩ = ⟨v|u⟩*"]
    F --> I["⟨v|v⟩ ≥ 0"]
    I --> J["诱导范数: ||v|| = √⟨v|v⟩"]

1.3.2 由内积诱导的范数与距离

内积自动定义了范数(长度):

v=vv\| |v\rangle \| = \sqrt{\langle v | v \rangle}

以及距离

d(u,v)=uvd(|u\rangle, |v\rangle) = \| |u\rangle - |v\rangle \|

这使得内积空间成为一个度量空间,我们可以谈论"收敛"、"连续性"、"极限"——这些概念对量子力学至关重要。

柯西-施瓦茨不等式

uv2uuvv|\langle u | v \rangle|^2 \leq \langle u | u \rangle \langle v | v \rangle

或等价地:

uvuv|\langle u | v \rangle| \leq \|u\| \cdot \|v\|

这个不等式在量子力学中就是不确定性原理的数学前身!当 uuvv 对应两个不对易的可观测量时,这个不等式给出了测量精度之间的基本限制。

数值例子:验证柯西-施瓦茨不等式

考虑二维空间中的向量:

u=(1i),v=(21+i)|u\rangle = \begin{pmatrix} 1 \\ i \end{pmatrix}, \quad |v\rangle = \begin{pmatrix} 2 \\ 1+i \end{pmatrix}

计算:

  • uu=12+i2=1+1=2\langle u | u \rangle = 1^2 + |i|^2 = 1 + 1 = 2
  • vv=22+1+i2=4+2=6\langle v | v \rangle = 2^2 + |1+i|^2 = 4 + 2 = 6
  • uv=12+(i)(1+i)=2ii2=2i+1=3i\langle u | v \rangle = 1 \cdot 2 + (-i)(1+i) = 2 - i - i^2 = 2 - i + 1 = 3 - i
  • uv2=3i2=9+1=10|\langle u | v \rangle|^2 = |3-i|^2 = 9 + 1 = 10

验证不等式:102×6=1210 \leq 2 \times 6 = 12


1.4 对偶空间与Dirac符号——Bra-Ket的魔法

1.4.1 对偶空间 VV^* 的严格定义

对于每个向量空间 VV,存在一个对偶空间 VV^*,它由所有从 VV 到数域 FF线性泛函(linear functional)组成:

V={f:VFf(αu+βv)=αf(u)+βf(v)}V^* = \{ f: V \rightarrow F \, | \, f(\alpha|u\rangle + \beta|v\rangle) = \alpha f(|u\rangle) + \beta f(|v\rangle) \}

对偶空间本身也是一个向量空间,其加法和数乘定义为:

  • (f+g)(v)=f(v)+g(v)(f + g)(|v\rangle) = f(|v\rangle) + g(|v\rangle)
  • (af)(v)=af(v)(af)(|v\rangle) = a \cdot f(|v\rangle)

Riesz表示定理(有限维):在内积空间中,每个线性泛函都可以唯一地表示为与某个固定向量的内积:

f(v)=fvf(|v\rangle) = \langle f | v \rangle

其中 f|f\rangleVV 中的某个向量。这意味着对偶空间与原始空间"同构"——它们有相同的维度,元素一一对应。

1.4.2 Dirac符号体系

Dirac发明了这套优雅的符号系统:

  • Ket v|v\rangle:表示向量空间 VV 中的向量(列向量)
  • Bra v\langle v|:表示对偶空间 VV^* 中的对应泛函(行向量/共轭转置)

Bra和Ket通过内积"配对":

uv=(u)(v)\langle u | v \rangle = (\langle u|) \cdot (|v\rangle)

这就像一个"括号"(bracket)——左边是bra,右边是ket,合起来构成一个复数。

graph LR
    A[Dirac符号] --> B["|v⟩ : Ket"]
    A --> C["⟨v| : Bra"]
    
    B --> D[列向量]
    C --> E["行向量/共轭转置"]
    
    D --> F[向量空间 V]
    E --> G["对偶空间 V*"]
    
    H["⟨u|v⟩"] --> I["内积 = 复数"]
    H --> J[Bra作用在Ket上]
    
    B -.->|共轭转置| C

数值例子:在 C2\mathbb{C}^2

v=(1+i2i)v=(1i2+i)|v\rangle = \begin{pmatrix} 1+i \\ 2-i \end{pmatrix} \Rightarrow \langle v| = \begin{pmatrix} 1-i & 2+i \end{pmatrix}

如果 u=(3i)|u\rangle = \begin{pmatrix} 3 \\ i \end{pmatrix},则:

vu=(1i)3+(2+i)i=33i+2i+i2=3i1=2i\langle v | u \rangle = (1-i) \cdot 3 + (2+i) \cdot i = 3-3i + 2i + i^2 = 3 - i - 1 = 2 - i

1.4.3 正交归一基与展开

一组基 {ei}\{|e_i\rangle\}正交归一的,如果:

eiej=δij\langle e_i | e_j \rangle = \delta_{ij}

其中 δij\delta_{ij} 是克罗内克符号(Kronecker delta):

δij={1i=j0ij\delta_{ij} = \begin{cases} 1 & i = j \\ 0 & i \neq j \end{cases}

在正交归一基下,向量的分量可以通过内积简单计算:

vi=eivv_i = \langle e_i | v \rangle

这是因为:

eiv=eijvjej=jvjeiej=jvjδij=vi\langle e_i | v \rangle = \langle e_i | \sum_j v_j |e_j\rangle = \sum_j v_j \langle e_i | e_j \rangle = \sum_j v_j \delta_{ij} = v_i

这就是正交归一基的美妙之处——分量就是投影。

完备性关系

ieiei=I^\sum_i |e_i\rangle \langle e_i| = \hat{I}

其中 I^\hat{I} 是恒等算符。这个关系看似平凡,却是量子力学中最常用的计算工具之一。它告诉我们:任何向量都可以通过这组基"分解"和"重组"。

graph TD
    A["正交归一基 {|eᵢ⟩}"] --> B["⟨eᵢ|eⱼ⟩ = δᵢⱼ"]
    B --> C["分量 = 投影"]
    C --> D["vᵢ = ⟨eᵢ|v⟩"]
    
    E[完备性] --> F["∑|eᵢ⟩⟨eᵢ| = Î"]
    F --> G[可以插入任意位置]
    G --> H[计算矩阵元的利器]
    
    D --> I[Parseval恒等式]
    I --> J["||v||² = ∑|vᵢ|²"]

1.5 子空间、直和与张量积

1.5.1 子空间

VV子空间 WWVV 的一个子集,同时自身也是一个向量空间。如果 {wi}\{|w_i\rangle\}WW 的基,那么 WW正交补空间 WW^\perp 定义为:

W={vVvw=0wW}W^\perp = \{ |v\rangle \in V \, | \, \langle v | w \rangle = 0 \quad \forall |w\rangle \in W \}

每个向量 vV|v\rangle \in V 可以唯一地分解为:

v=w+w,wW,wW|v\rangle = |w\rangle + |w^\perp\rangle, \quad |w\rangle \in W, \, |w^\perp\rangle \in W^\perp

这在量子力学中对应于"投影测量"——你将态矢量投影到某个本征子空间上。

数值例子:在三维实空间 R3\mathbb{R}^3 中,设 WWxyxy 平面,即所有 z=0z=0 的向量。那么:

  • WW 的基:{ex,ey}\{|e_x\rangle, |e_y\rangle\}
  • WW^\perpzz 轴,基为 {ez}\{|e_z\rangle\}
  • 任意向量 v=(1,2,3)|v\rangle = (1, 2, 3) 可分解为:(1,2,0)+(0,0,3)(1, 2, 0) + (0, 0, 3)

1.5.2 直和(Direct Sum)

两个向量空间 V1V_1V2V_2直和 V1V2V_1 \oplus V_2 是一个新的向量空间,其元素是序对 (v1,v2)(|v_1\rangle, |v_2\rangle),运算按分量进行:

(v1,v2)+(w1,w2)=(v1+w1,v2+w2)(|v_1\rangle, |v_2\rangle) + (|w_1\rangle, |w_2\rangle) = (|v_1\rangle + |w_1\rangle, |v_2\rangle + |w_2\rangle)

维度满足:

dim(V1V2)=dim(V1)+dim(V2)\dim(V_1 \oplus V_2) = \dim(V_1) + \dim(V_2)

物理意义:如果一个量子系统可以处于"类型A"或"类型B"的状态,且这两种状态互不重叠,那么系统的状态空间就是两个子空间的直和。

1.5.3 张量积(Tensor Product)

张量积 V1V2V_1 \otimes V_2 是构造复合系统状态空间的核心工具。如果 {ei(1)}\{|e_i^{(1)}\rangle\}V1V_1 的基,{ej(2)}\{|e_j^{(2)}\rangle\}V2V_2 的基,那么 V1V2V_1 \otimes V_2 的基为:

ei(1)ej(2)|e_i^{(1)}\rangle \otimes |e_j^{(2)}\rangle

维度满足:

dim(V1V2)=dim(V1)×dim(V2)\dim(V_1 \otimes V_2) = \dim(V_1) \times \dim(V_2)

注意:直和让维度相加,张量积让维度相乘。这是关键区别!

例子

  • 两个二能级系统(qubit):
    • 直和:C2C2=C4\mathbb{C}^2 \oplus \mathbb{C}^2 = \mathbb{C}^4(系统可以处于"qubit 1"或"qubit 2"模式)
    • 张量积:C2C2=C4\mathbb{C}^2 \otimes \mathbb{C}^2 = \mathbb{C}^4(系统同时涉及两个qubit)

在量子力学中,张量积对应于多粒子系统。两个电子的状态空间是每个电子状态空间的张量积,不是直和。

数值例子:两个自旋-1/2粒子

粒子1的状态:+1=(10)|+\rangle_1 = \begin{pmatrix} 1 \\ 0 \end{pmatrix}1=(01)|-\rangle_1 = \begin{pmatrix} 0 \\ 1 \end{pmatrix}

粒子2的状态:+2=(10)|+\rangle_2 = \begin{pmatrix} 1 \\ 0 \end{pmatrix}2=(01)|-\rangle_2 = \begin{pmatrix} 0 \\ 1 \end{pmatrix}

复合系统的基(4维):

+1+2=(1000),+12=(0100)|+\rangle_1 \otimes |+\rangle_2 = \begin{pmatrix} 1 \\ 0 \\ 0 \\ 0 \end{pmatrix}, \quad |+\rangle_1 \otimes |-\rangle_2 = \begin{pmatrix} 0 \\ 1 \\ 0 \\ 0 \end{pmatrix}

1+2=(0010),12=(0001)|-\rangle_1 \otimes |+\rangle_2 = \begin{pmatrix} 0 \\ 0 \\ 1 \\ 0 \end{pmatrix}, \quad |-\rangle_1 \otimes |-\rangle_2 = \begin{pmatrix} 0 \\ 0 \\ 0 \\ 1 \end{pmatrix}

纠缠态的例子(不可分离为单个粒子状态的乘积):

Ψ=12(+121+2)|\Psi\rangle = \frac{1}{\sqrt{2}}(|+\rangle_1 \otimes |-\rangle_2 - |-\rangle_1 \otimes |+\rangle_2)

这个态不能写成 a1b2|a\rangle_1 \otimes |b\rangle_2 的形式。这就是量子纠缠。

graph LR
    A[空间构造] --> B["直和 ⊕"]
    A --> C["张量积 ⊗"]
    
    B --> D[维度相加]
    B --> E[互斥选择]
    B --> F["V₁ ⊕ V₂ = 二元组"]
    
    C --> G[维度相乘]
    C --> H[复合系统]
    C --> I[多粒子系统]
    
    J["例子: 两个Qubit"] --> K["直和: 4维, 互斥"]
    J --> L["张量积: 4维, 纠缠"]
    
    L --> M[纠缠态不可分离]
    M --> N["|Ψ⟩ ≠ |a⟩⊗|b⟩"]

1.6 算符(Operators)——向量空间上的"动作"

1.6.1 线性算符的定义

一个线性算符 A^\hat{A} 是从向量空间到自身的线性映射:

A^(αu+βv)=αA^u+βA^v\hat{A}(\alpha |u\rangle + \beta |v\rangle) = \alpha \hat{A}|u\rangle + \beta \hat{A}|v\rangle

算符的"乘法"是复合(composition):

(A^B^)v=A^(B^v)(\hat{A}\hat{B})|v\rangle = \hat{A}(\hat{B}|v\rangle)

重要:算符一般不交换!A^B^B^A^\hat{A}\hat{B} \neq \hat{B}\hat{A}。这个非交换性正是量子力学的核心特征之一。

1.6.2 矩阵表示

在正交归一基 {ei}\{|e_i\rangle\} 下,算符 A^\hat{A} 可以表示为矩阵:

Aij=eiA^ejA_{ij} = \langle e_i | \hat{A} | e_j \rangle

算符作用在向量上的效果变成矩阵乘法:

(A^v)i=jAijvj(\hat{A}|v\rangle)_i = \sum_j A_{ij} v_j

物理意义:矩阵元 AijA_{ij} 代表"从状态 jj 到状态 ii 的跃迁振幅"。

graph TD
    A["线性算符 Â"] --> B["矩阵表示 Aᵢⱼ"]
    B --> C["Aᵢⱼ = ⟨eᵢ|Â|eⱼ⟩"]
    
    D[算符作用] --> E["Â|v⟩ = |w⟩"]
    E --> F["矩阵形式: A·v = w"]
    
    G[矩阵乘法] --> H["(ÂB̂)ᵢⱼ = ∑ₖ AᵢₖBₖⱼ"]
    H --> I[对应算符复合]
    
    J[对偶作用] --> K["⟨u|Â|v⟩ = 复数"]
    K --> L["期望值/矩阵元"]

1.6.3 伴随算符(Adjoint)

算符 A^\hat{A}伴随(adjoint,记作 A^\hat{A}^\dagger)定义为:

uA^v=vA^u\langle u | \hat{A}^\dagger | v \rangle = \langle v | \hat{A} | u \rangle^*

在矩阵表示中,伴随对应于共轭转置(conjugate transpose):

(A)ij=Aji(A^\dagger)_{ij} = A_{ji}^*

自伴算符(Self-adjoint / Hermitian):如果 A^=A^\hat{A}^\dagger = \hat{A},则称 A^\hat{A} 是厄米的(Hermitian)。

物理意义:量子力学中所有可观测量(可以测量的物理量)都对应厄米算符。这是因为厄米算符的本征值是实数——测量结果必须是实数!


1.7 算符的本征值问题——量子力学的"谱"

1.7.1 本征值与本征向量

如果算符 A^\hat{A} 作用在某个向量 a|a\rangle 上,只改变它的长度而不改变方向:

A^a=aa\hat{A}|a\rangle = a|a\rangle

那么 a|a\rangle 称为 A^\hat{A}本征向量(eigenvector),aa 称为本征值(eigenvalue)。

特征方程:在有限维空间中,本征值通过解特征方程得到:

det(A^aI^)=0\det(\hat{A} - a\hat{I}) = 0

谱定理:对于有限维厄米算符:

  1. 所有本征值都是实数
  2. 不同本征值对应的本征向量正交
  3. 本征向量构成空间的完备基

这意味着任何厄米算符都可以"对角化":

A^=iaiaiai\hat{A} = \sum_i a_i |a_i\rangle \langle a_i|

其中 aia_i 是本征值,ai|a_i\rangle 是相应的归一化本征向量。

graph TD
    A[本征值问题] --> B["Â|a⟩ = a|a⟩"]
    B --> C["特征方程: det - aÎ = 0"]
    C --> D["本征值 aᵢ"]
    D --> E["本征向量 |aᵢ⟩"]
    
    F[厄米算符] --> G["本征值: 实数"]
    F --> H["本征向量: 正交归一"]
    F --> I["完备性: 构成基"]
    
    I --> J[谱分解]
    J --> K["Â = ∑aᵢ|aᵢ⟩⟨aᵢ|"]
    K --> L[对角化]

1.7.2 简并情况(Degeneracy)

当多个线性独立的本征向量对应同一个本征值时,称为简并(degenerate)。

定义:如果本征值 aagg 个线性独立的本征向量 {a,k}k=1g\{|a, k\rangle\}_{k=1}^g,则称 aa 是**gg 重简并**的。

关键性质

  1. 简并本征向量之间不一定正交——但可以通过Gram-Schmidt正交化构造出一组正交的简并本征向量
  2. 简并子空间中的任何向量都是本征值为 aa 的本征向量
  3. 简并意味着存在与 A^\hat{A} 对易的其他算符(Casimir算符或守恒量)

物理意义:简并通常与系统的对称性相关。例如,氢原子能级 EnE_n 对不同的角动量量子数 ll 和磁量子数 mm 是简并的(在没有外场的情况下)。这种简并来源于库仑势的球对称性。

数值例子:2×2矩阵的本征值问题

考虑厄米矩阵:

A^=(3ii1)\hat{A} = \begin{pmatrix} 3 & i \\ -i & 1 \end{pmatrix}

步骤1:解特征方程

det(A^aI^)=det(3aii1a)=(3a)(1a)(i)(i)=0\det(\hat{A} - a\hat{I}) = \det\begin{pmatrix} 3-a & i \\ -i & 1-a \end{pmatrix} = (3-a)(1-a) - (i)(-i) = 0

(3a)(1a)1=0(3-a)(1-a) - 1 = 0

34a+a21=03 - 4a + a^2 - 1 = 0

a24a+2=0a^2 - 4a + 2 = 0

a=4±1682=4±222=2±2a = \frac{4 \pm \sqrt{16-8}}{2} = \frac{4 \pm 2\sqrt{2}}{2} = 2 \pm \sqrt{2}

所以 a1=2+23.414a_1 = 2 + \sqrt{2} \approx 3.414a2=220.586a_2 = 2 - \sqrt{2} \approx 0.586

步骤2:求本征向量

对于 a1=2+2a_1 = 2 + \sqrt{2}

(3(2+2)ii1(2+2))(xy)=0\begin{pmatrix} 3-(2+\sqrt{2}) & i \\ -i & 1-(2+\sqrt{2}) \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix} = 0

(12ii12)(xy)=0\begin{pmatrix} 1-\sqrt{2} & i \\ -i & -1-\sqrt{2} \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix} = 0

从第一行:(12)x+iy=0y=i(21)x(1-\sqrt{2})x + iy = 0 \Rightarrow y = i(\sqrt{2}-1)x

归一化本征向量:

a1=1422(1i(21))|a_1\rangle = \frac{1}{\sqrt{4-2\sqrt{2}}}\begin{pmatrix} 1 \\ i(\sqrt{2}-1) \end{pmatrix}

类似地,对于 a2=22a_2 = 2 - \sqrt{2}

a2=14+22(1i(2+1))|a_2\rangle = \frac{1}{\sqrt{4+2\sqrt{2}}}\begin{pmatrix} 1 \\ -i(\sqrt{2}+1) \end{pmatrix}

验证a1a2=0\langle a_1 | a_2 \rangle = 0(正交性),且本征值为实数。

1.7.3 对易关系与本征值的同时确定

两个算符的对易子(commutator)定义为:

[A^,B^]=A^B^B^A^[\hat{A}, \hat{B}] = \hat{A}\hat{B} - \hat{B}\hat{A}

关键定理:如果 [A^,B^]=0[\hat{A}, \hat{B}] = 0(对易),那么它们可以同时对角化,即存在一组共同的正交归一本征基。如果本征值有简并,则需要额外构造。

物理意义:如果两个可观测量对应的算符对易,那么它们可以同时被精确测量。如果不 commuting(如位置和动量),则存在不确定性原理的限制。

1.7.4 不确定性原理的数学前身

对于任意两个厄米算符 A^\hat{A}B^\hat{B},定义:

(ΔA)2=A2A2(\Delta A)^2 = \langle A^2 \rangle - \langle A \rangle^2

(ΔB)2=B2B2(\Delta B)^2 = \langle B^2 \rangle - \langle B \rangle^2

其中 =ψψ\langle \cdot \rangle = \langle \psi | \cdot | \psi \rangle 是期望值。

不确定性原理的严格表述是:

ΔAΔB12[A^,B^]\Delta A \cdot \Delta B \geq \frac{1}{2} |\langle [\hat{A}, \hat{B}] \rangle|

如果 [A^,B^]=i[\hat{A}, \hat{B}] = i\hbar(如位置和动量),则得到著名的海森堡不确定性原理:

ΔxΔp2\Delta x \cdot \Delta p \geq \frac{\hbar}{2}

graph TD
    A[两个可观测量] --> B["对易? [Â,B̂] = 0?"]
    
    B -->|是| C[可以同时精确测量]
    B -->|否| D[存在不确定性限制]
    
    C --> E[共同本征基]
    C --> F[同时本征态]
    
    D --> G["ΔA·ΔB ≥ ½|⟨[Â,B̂]⟩|"]
    G --> H["位置-动量: Δx·Δp ≥ ℏ/2"]
    G --> I["能量-时间: ΔE·Δt ≥ ℏ/2"]
    
    J[非对易性的物理] --> K[测量A会扰动B]
    K --> L[量子测量的本质]

1.8 函数空间与连续谱——从矩阵到算符

1.8.1 从有限维到无限维

量子力学中的许多系统(如自由粒子)具有无限维的状态空间。这时,离散的指标 ii 变成连续变量 xx

v=ivieiψ=dxψ(x)x|v\rangle = \sum_i v_i |e_i\rangle \quad \rightarrow \quad |\psi\rangle = \int dx \, \psi(x) |x\rangle

基向量 x|x\rangle 满足连续正交归一性

xx=δ(xx)\langle x | x' \rangle = \delta(x - x')

其中 δ(xx)\delta(x-x') 是狄拉克delta函数——它在 x=xx=x' 处"无穷大",其他地方为零,且积分归一:

δ(x)dx=1\int_{-\infty}^{\infty} \delta(x) dx = 1

1.8.2 完备性关系的连续形式

dxxx=I^\int_{-\infty}^{\infty} dx \, |x\rangle \langle x| = \hat{I}

这允许我们将任何态矢量"展开"为波函数:

ψ(x)=xψ\psi(x) = \langle x | \psi \rangle

并且:

ψϕ=dxψ(x)ϕ(x)\langle \psi | \phi \rangle = \int_{-\infty}^{\infty} dx \, \psi^*(x) \phi(x)

graph LR
    A[离散有限维] --> B[连续无限维]
    
    A --> C["基: |eᵢ⟩"]
    B --> D["基: |x⟩"]
    
    A --> E["分量: vᵢ"]
    B --> F["波函数: ψ(x) = ⟨x|ψ⟩"]
    
    A --> G["求和: ∑ᵢ"]
    B --> H["积分: ∫dx"]
    
    A --> I["正交: δᵢⱼ"]
    B --> J["正交: δ("\\"x-x'\\"")"]
    
    A --> K["完备: ∑|eᵢ⟩⟨eᵢ| = Î"]
    B --> L["完备: ∫|x⟩⟨x|dx = Î"]

1.9 本章总结

Shankar在第1章为我们搭建的数学脚手架可以概括为以下结构:

graph TD
    A[量子力学的数学基础] --> B[线性向量空间]
    A --> C[内积空间]
    A --> D[对偶空间与Dirac符号]
    A --> E[算符理论]
    A --> F[本征值问题]
    
    B --> B1["线性独立/基/维度"]
    C --> C1["范数/距离/柯西-施瓦茨"]
    D --> D1["Bra-Ket符号/完备性"]
    E --> E1["厄米算符/伴随/矩阵表示"]
    F --> F1["谱定理/简并/不确定性原理"]
    
    B1 --> G["后续: 态矢量"]
    C1 --> G
    D1 --> G
    E1 --> H["后续: 可观测量"]
    F1 --> H
    
    G --> I["第2-4章: 物理应用"]
    H --> I
    
    style A fill:#e1f5fe
    style I fill:#fff3e0

核心要点

  1. 量子态是向量空间中的向量(Ket)
  2. 可观测量是厄米算符,其本征值是实数,本征向量正交归一
  3. 简并本征值对应一个子空间,需要额外选择基
  4. 测量对应于将态矢量投影到可观测量本征子空间
  5. 对易关系决定了哪些物理量可以同时确定
  6. 不确定性原理是柯西-施瓦茨不等式的直接推论
  7. 张量积构造复合系统,直和描述互斥选择

练习与思考

  1. 证明题:证明如果 A^\hat{A}B^\hat{B} 都是厄米算符,那么 [A^,B^][\hat{A}, \hat{B}] 是反厄米的(即 [A^,B^]=[A^,B^][\hat{A}, \hat{B}]^\dagger = -[\hat{A}, \hat{B}])。由此说明为什么不确定性原理中的 ii\hbar 是必要的。

  2. 计算题:考虑二维复向量空间中的算符 A^=(3ii1)\hat{A} = \begin{pmatrix} 3 & i \\ -i & 1 \end{pmatrix}B^=(1002)\hat{B} = \begin{pmatrix} 1 & 0 \\ 0 & 2 \end{pmatrix}。求:

    • A^\hat{A} 的本征值和本征向量(检查是否有简并)
    • [A^,B^][\hat{A}, \hat{B}]
    • A^\hat{A} 的本征态中测量 B^\hat{B} 的期望值
  3. 计算题:验证Gram-Schmidt正交化。给定三个向量(在 R3\mathbb{R}^3 中):

    v1=(110),v2=(101),v3=(011)|v_1\rangle = \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix}, \quad |v_2\rangle = \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix}, \quad |v_3\rangle = \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix}

    使用Gram-Schmidt过程构造一组正交归一基。

  4. 思考题:Shankar说"数学是量子力学的语言,而不是它的装饰"。结合你学过的经典力学(使用微积分和向量分析),讨论为什么量子力学需要比经典力学更抽象的数学工具。量子系统的哪些特征使得线性代数成为"必需"而不是"便利"?


"第1章记录完毕。这是所有后续章节的起点——没有这些脚手架,量子力学的大厦无法建造。" ✍️🔥