矩阵分析与应用-1.9-Moore-Penrose逆矩阵-Section1

前言

本文学习过程来源是《矩阵分析与应用-张贤达》一书. 可以通过 z-lib 下载.

我们之前一节的广义逆矩阵已经包含了逆矩阵、左逆矩阵和右逆矩阵

我们现在面临一个问题: 最小二乘解是非唯一的, 其会有通解. 这就会引申出两个问题

  • 是否存在某种意义下的唯一解?

  • 若存在唯一解,那么广义逆矩阵 \(AGA = A\) 是否仍旧有效?

为此, 我们引入了涵义更为广泛的广义逆矩阵: \(Moore-Penrose\) 逆矩阵

\(Moore-Penrose\) 逆矩阵的定义与性质

我们用 \(P_S\) 表示到向量空间 \(S\) 上的正交投影. 明显的, 有 \(P_Sx\) 在空间 \(S\) 上,且 \(x-P_Sx\) 与子空间 \(S\) 正交.

对于任意一个 \(m \times n\) 的复矩阵 \(G\) 我们使用 \(Range(G)\) 来表示其值域空间.

\(\mathrm{Moore}\) 则证明出了, 矩阵 \(G\) 的广义逆矩阵 \(G^{\dagger}\) 必须满足条件:

\[ GG^{\dagger} = P_{Range(G)},\qquad G^{\dagger}G = P_{Range(G^H)} \tag{1} \]

我们将上述两条件称为 \(\mathrm{Moore}\) 条件, 而满足 \(\mathrm{Moore}\) 条件的矩阵 \(G^{\dagger}\) 被称为 \(\mathrm{Moore}\) 逆矩阵

此外, 由于上述条件不好使用, \(\mathrm{Penrose}\) 提出的另外一组条件

1. \(Moore-Penrose\) 条件

定义 1: 令A是任意的 \(m \times n\) 矩阵, 若称矩阵 \(G\)\(A\) 的广义逆矩阵, 则需要满足下面四个条件 (\(\mathrm{Moore-Penrose}\) 条件):

  • \((1) \ AGA = A\)

  • \((2) \ GAG = G\)

  • \((3) \ AG\)\(\mathrm{Hermitian}\) 矩阵, 即 \((AG)^{\mathrm{H}} = AG\)

  • \((4) \ GA\)\(\mathrm{Hermitian}\) 矩阵, 即 \((GA)^H = GA\)

然后 \(\mathrm{Rado}\) 证明了 \(\mathrm{Penrose}\) 的定义与 \(\mathrm{Moore}\) 的定义等价.

2. 以条件满足数目分类

  • 自反广义逆矩阵: 只满足条件 (1) 和 (2) 的矩阵 \(G=A^{\dagger}\) 称为 \(A\) 的自反广义矩阵.

  • 正规化广义逆矩阵: 只满足条件(1)、(2) 和 (3) 的矩阵 \(A^{\dagger}\) 称为 \(A\) 的正规化广义逆矩阵.

  • 弱广义逆矩阵: 只满足条件(1)、(2) 和 (4) 的矩阵 \(A^{\dagger}\) 称为 \(A\) 的弱广义逆矩阵.

  • \(Moore-Penrose\) 逆矩阵: 满足 4 个条件

3. 一般广义矩阵的特性

定理 1:

\(A^g\) 是矩阵 \(A\) 的任意一种广义逆矩阵, 则有:

\[ \mathrm{rank}(A^g) \geq \mathrm{rank}(A) = \mathrm{rank}(A^gA) = \mathrm{rank}(AA^g) \]

\(\mathrm{rank}(A^g) = \mathrm{rank}(A)\) 的一个充要条件:\(A^g\)\(A\) 的自反广义逆矩阵

我们上面的 \(Moore-Penrose\) 条件可以引申到下面的几条性质:

  • \((A^H) ^{\dagger} = (A^{\dagger}) ^H\)

  • \(A^{\dagger} AA^H = A^H AA^{\dagger} = A^H\)

  • \(AA^H (A^H) ^{\dagger} = (A^H) ^{\dagger} A^HA = A\)

  • \(AA^{\dagger} ,\ A^{\dagger}A ,\ (I-AA^{\dagger}) ,\ (I-A^{\dagger}A)\) 均为幂等矩阵

之前几篇博客里的广义逆矩阵的特例

  • \(n \times n\) 的正方非奇异矩阵 \(A_{n \times n}\) 的逆矩阵 \(A^{-1}\) 满足 4 个条件

  • \(m \times n\)\(A_{m \times n} (m > n)\) 的左伪逆矩阵 \((A^HA) ^{-1} A^H\) 满足 4 个条件

  • \(m \times n\)\(A_{m \times n} (m < n)\) 的右伪逆矩阵 \(A^H (AA^H) ^{-1}\) 满足 4 个条件

  • 满足 \(LA_{m \times n} = I_n\) 的一般左逆矩阵 \(L_{n \times m}\) 满足 (1), (2)和 (4) 条件, 是弱广义逆矩阵

  • 满足 \(A_{m \times n}R = I_m\) 的一般右逆矩阵 \(R_{n \times m}\) 满足 (1), (2)和 (3)条件, 是正规化广义逆矩阵

  • 广义逆矩阵 \(A^{-}\) 只满足条件 (1)

不同于左逆矩阵 \(L\) 右逆矩阵 \(R\) 和广义逆矩阵 \(A^{-}\) 的多值性, \(\mathrm{Moore-Penrose}\) 逆矩阵定义唯一.

一般的, 我们使用广义逆矩阵直接当作 \(\mathrm{Moore-Penrose}\) 逆矩阵的简称, 使用 \(A^{\dagger}\) 表示.

而原来的广义逆矩阵 (即只用条件 (1) \(AGA = A\) 定义的) 广义逆矩阵只用 \(A^{-}\) 表示.

一般情况下, \(A^{\dagger}\) 并不满足逆矩阵的性质 \((AB)^{-1} = B^{-1} A^{-1}\), 即有:

\[ (AB)^{\dagger} \neq B^{\dagger} A^{\dagger} \]

定理 2:

\(A,B\) 均为使得矩阵 \(AB\) 存在的任意矩阵, 则 \((AB)^{\dagger} = B^{\dagger} A^{\dagger}\) 的充要条件为以下之一:

  • $A^{}AB B^H A^H = BB^H A^H $ 和 $ BB^{} A^HAB = A^HAB$

  • \(A^{\dagger} ABB^H\)\(A^HA BB^{\dagger}\) 都是 \(\mathrm{Heritian}\) 矩阵

  • \(A^{\dagger}A BB^H A^HA BB^{\dagger} = BB^H A^HA\)

  • \(A^{\dagger}AB = B(AB)^{\dagger}AB\)\(BB^{\dagger} A^H = A^HAB (AB)^{\dagger}\)

4. \(\mathrm{Moore-Penrose}\) 逆矩阵 \(A^{\dagger}\) 的性质

  • 广义逆矩阵 \(A^{\dagger}\) 唯一

  • \((A^H) ^{\dagger} = (A^{\dagger}) ^H = A^{\dagger H} = A^{H \dagger}\)

  • \((A^{\dagger}) ^{\dagger} = A\)

  • 若 $c $,则有 $ (cA)^{} = A^{}$

  • \(D = diag(d_{11},d_{22},\cdots,d_{nn})\)\(n \times n\) 对角矩阵, 则 \(D^{\dagger} = diag(d_{11}^{\dagger}, d_{22}^{\dagger}, \cdots, d_{nn}^{\dagger})\) (其中 \(d_{ii}^{\dagger} = d_{ii}^{-1}\)\(d_{ii}^{\dagger} = 0\) )

  • 零矩阵的广义逆矩阵为零矩阵, 即: \(O_{m \times n}^{\dagger} = O_{n \times m}\)

  • 向量 $ x $ 的Moore-Penrose逆矩阵为: \(x^{\dagger} = (x^Hx) ^{-1} x^H\)

  • 关于几个真假的判断:

    • \(AA^{\dagger} \neq I_{m}\)

    • \(A^{\dagger}A \neq I_{n}\)

    • \(A^H (A^H) ^{\dagger} \neq I_{n}\)

    • \((A^H) ^{\dagger} A^H \neq I_{m}\)

    • \(A^{\dagger}A A^H = A^H\)

    • \(A^{H} AA^{\dagger} = A^{H}\)

    • \(A^{H} AA^{\dagger} = A^{H}\)

    • \(A^{H} A^{\dagger}A = A^{H}\)

    • \(A A^{\dagger} (A^{\dagger}) ^H = (A^{\dagger}) ^H\)

    • \((A^{\dagger}) ^H A^{\dagger} A = (A^{\dagger}) ^H\) 这里存疑。。。

    • \((A^H) ^{\dagger} A^H A = A\)

    • \(A A^H (A^H) ^{\dagger} = A\)

    • \(A^H (A^{\dagger}) ^H A^{\dagger} = A^{\dagger}\)

    • \(A^{\dagger} (A^{\dagger}) ^H A^H = A^{\dagger}\)

  • 任何矩阵 \(A_{m \times n}\) 的广义逆矩阵都可以用 \(A^{\dagger} = (A^H A) ^{\dagger} A^H\) 或者 \(A^{\dagger} = A^H (AA^H) ^{\dagger}\) 确定, 且他们有特殊情况:

    • \(A\) 列满秩, 则 \(A^{\dagger} = (A^HA) ^{-1} A^{\dagger}\) , 此时退化为左伪逆矩阵

    • \(A\) 行满秩, 则 \(A^{\dagger} = A^H (AA^H) ^{-1}\) , 此时退化为右伪逆矩阵

    • \(A\) 为非奇异的正方矩阵, 则 \(A^{\dagger} = A^{-1}\) , 此时退化为逆矩阵

  • \(A^H A = PDP^H\) , 其中 \(PP^H = P^HP = I\) , 且 \(D\) 为对角矩阵 , 则 \(A^{\dagger} = PD^{\dagger} P^H A^H\)

  • \(A = BC\) , 且 \(B\) 列满秩 , \(C\) 行满秩, 则有:

\[ A^{\dagger} = C^{\dagger} B^{\dagger} = C^H (CC^H) ^{-1} (B^HB) ^{-1} B^H \]

  • 若 $A^H = A $ ,其 $ A^2 = A $ ,则 $ A^{} = A$

  • 如矩阵 \(A_{i}\) 相互正交, 即 \(A_i^H A_j = O\) , 则我们有:

\[ (A_1 + A_2 + \cdots + A_m) ^{\dagger} = A_1^{\dagger} + A_2^{\dagger} + \cdots + A_m^{\dagger} \]

  • \((AA^H) ^{\dagger} = (A^{\dagger}) ^H A^{\dagger}\)

  • \((AA^H) ^{\dagger} (AA^H) = AA^{\dagger}\)

  • 一般来说 \((A^m) ^{\dagger} \neq (A^{\dagger}) ^m\) , 但只要 \(AA^H = A^HA\) , 则有 \((A^m) ^{\dagger} = (A^{\dagger}) ^m\)

  • \(A\)\(m \times n\) 矩阵,则有:

\[ \begin{bmatrix} A_{m \times n} & O_{m \times q} \\ O_{p \times n} & O_{p \times q} \\ \end{bmatrix} ^{\dagger} = \begin{bmatrix} (A^{\dagger})_{n \times m} & O_{n \times p} \\ O_{q \times m} & O_{q \times p} \\ \end{bmatrix} \]

\[ \begin{bmatrix} O_{p \times q} & O_{p \times n} \\ O_{m \times q} & A_{m \times n} \\ \end{bmatrix} ^{\dagger} = \begin{bmatrix} O_{q \times p} & O_{q \times m} \\ O_{m \times q} & (A^{\dagger})_{n \times m} \\ \end{bmatrix} \]

  • 对于广义逆矩阵的秩, 有:

\[ \begin{aligned} \mathrm{rank}(A^{\dagger}) & = \mathrm{rank}(A) = \mathrm{rank}(A^H) \\ &= \mathrm{rank}(A^{\dagger}A) = \mathrm{rank}(AA^{\dagger}) \\ &= \mathrm{rank}(AA^{\dagger}A) = \mathrm{rank}(A^{\dagger}AA^{\dagger}) \\ \end{aligned} \]

  • 广义逆矩阵 \(A^{\dagger}\)\(A^H\) 的行空间相同 (即他们的行空间都互相包含)

  • 广义逆矩阵 \(A^{\dagger}\)\(A^H\) 的列空间相同 ( 即 \(\mathrm{Span}(A^{\dagger}) = \mathrm{Span}(A^H)\) 或者 \(\mathrm{Range}(A^{\dagger}) = \mathrm{Range}(A^H)\) )

  • 对于 \(m > n\) , 且 \(\mathrm{rank}(A) = n\) 时, 我们有广义逆矩阵 (左伪逆矩阵) \(A^{\dagger} = (A^HA) ^{-1} A^H\)

    • \(A\)\(AA^{\dagger}\) 的列空间相同

    • \((I_m -AA^{\dagger})\) 的列空间是矩阵 \(A\) 的列空间的正交补

    • \(AA^{\dagger} = A(A^HA) ^{-1} A^H\) 是幂等矩阵

    • \(I_m-AA^{\dagger}\) 是幂等矩阵

  • 对于 \(m < n\) , 且 \(\mathrm{rank}(A) = m\) 时, 我们有广义逆矩阵 (右伪逆矩阵) \(A^{\dagger} = A^H (AA^H) ^{-1}\)

    • \(A^{\dagger}\)\(A^{\dagger}A\) 的列空间相同

    • \((I_n -A^{\dagger}A)\) 的列空间是矩阵 \(A^H\) 的列空间的正交补

    • \(A^{\dagger}A = A^H (AA^H) ^{-1} A\) 是幂等矩阵

    • \(I_n - A^{\dagger}A\) 是幂等矩阵

  • \(A_{m \times n} , B_{m \times p}\) , 则我们有:

    \[ \begin{bmatrix} A,& B \\ \end{bmatrix} ^{\dagger} = \begin{bmatrix} A^{\dagger} - A^{\dagger} B (C^{\dagger}+D) \\ C^{\dagger}+D \end{bmatrix} \]

    其中, 我们有 \(C = (I_m - AA^{\dagger})B\) , 且 \(D = (I_p - C^{\dagger}C) [I_p + (I_p-C^{\dagger}C) B^H (A^{\dagger}) ^H B (I_p - C^{\dagger}C)] ^{-1} B^H (A^{\dagger}) ^H (I_m - BC^{\dagger})\)

  • \(A_{m \times n} , B_{p \times n}\) , 则我们有:

    \[ \begin{bmatrix} A \\ B \\ \end{bmatrix} ^{\dagger} = \begin{bmatrix} A^{\dagger} - TBA^{\dagger}, &T \end{bmatrix} \]

    其中, 我们有 \(T = E^{\dagger} + (I_n -E^{\dagger}B) A^{\dagger} (A^{\dagger}) ^H B^H K(I_p-EE^{\dagger})\) , 且 \(K = [I_p + (I_p - EE^{\dagger}) BA^{\dagger} (A^{\dagger}) ^H B^H (I_p - EE^{\dagger})]^{-1}\)