【AI基础】【线性代数】最小二乘法中正规方程的推导

推导正规方程 ATAx=ATb

正规方程的推导可以从两个角度理解:一个是几何上的投影,一个是代数上的求导。下面我们从投影的角度出发,展示如何从最小二乘法的 Ax=b 得到正规方程 ATAx=ATb


§1. 问题背景

我们有一个线性系统:

Ax=b

其中 A 是一个 m×n 的矩阵(通常 m>n ), b 是一个 m 维观测向量, x n 维未知参数向量。由于方程个数多于未知数个数,方程组通常是超定的,没有精确解,即 b 不在 A 的列空间中。

最小二乘法的目标:寻找一个 x^ ,使得 Ax^ 尽可能接近 b ,即最小化残差 bAx22 (右下角的2是L2范数的意思,类似常规意义上的欧氏距离)。

§2. 投影的几何解释

矩阵 A 的列向量张成一个 n 维子空间,称为列空间 C(A) 。对于任意 x Ax 就是该空间中的一个向量。

我们希望在这个子空间中找到一点 p=Ax^ ,使得它到 b 的距离最短。根据欧几里得空间中的正交投影定理,这个最短距离点就是 b 在列空间上的正交投影

记投影为 p ,那么残差向量 r=bp 必须垂直于列空间 C(A) 。也就是说, r A 的每一个列向量都正交。

§3. 用正交条件推导方程

A 的列向量为 a1,a2,,an 。正交条件意味着:

ajT(bAx^)=0,j=1,2,,n.

将这 n 个等式合并成矩阵形式:

AT(bAx^)=0.

移项即得:

ATAx^=ATb.

这就是正规方程

§4. 代数推导(求导)作为印证

也可以从最小化误差平方和的角度推导。定义目标函数:

f(x)=Axb2=(Axb)T(Axb).

展开:

f(x)=xTATAx2bTAx+bTb.

x 求梯度并令其为零:

f(x)=2ATAx2ATb=0,

同样得到 ATAx=ATb

§5. 解的存在性与唯一性

正规方程的解 x^ 就是最小二乘估计。当 A 列满秩时, ATA 是可逆矩阵,解唯一:

x^=(ATA)1ATb.

此时投影向量 p=Ax^=A(ATA)1ATb ,而矩阵 P=A(ATA)1AT 就是到列空间上的投影矩阵。

§总结

Ax=b 出发,利用残差与列空间正交这一几何条件,自然导出了正规方程 ATAx=ATb 。它将一个无解的方程组转化为一个有唯一解(在列满秩下)的线性方程组,从而得到最优的近似解。


【AI基础】【线性代数】最小二乘法中正规方程的推导
http://example.com/2026/03/15/Normal-Equation/
作者
William Lu/Linkun Lu
发布于
2026年3月15日
许可协议