Bootstrap

循环矩阵和BCCB矩阵与向量乘积的快速计算——矩阵向量乘积与频域乘积之间的转换

循环矩阵(Circulant Matrix)和块循环对称矩阵(Block Circulant with Circulant Blocks, BCCB)是两种具有特殊结构的矩阵。循环矩阵和BCCB矩阵与向量的乘积可以利用快速傅里叶变换(FFT)来高效计算,解决大规模的线性系统问题。

循环矩阵

循环矩阵的定义

循环矩阵是一种特殊的方阵,它的每一行都是前一行向右循环移位一个位置的结果。如果矩阵 C C C n × n n \times n n×n的循环矩阵,那么它可以由第一行的 n n n个元素完全确定。假设 c 0 , c 1 , . . . , c n − 1 c_0, c_1, ..., c_{n-1} c0,c1,...,cn1是矩阵 C C C的第一行,则矩阵的形式如下:

C = [ c 0 c n − 1 … c 2 c 1 c 1 c 0 c n − 1 c 2 ⋮ c 1 c 0 ⋱ ⋮ c n − 2 ⋱ ⋱ c n − 1 c n − 1 c n − 2 … c 1 c 0 ] C = \begin{bmatrix} c_0 & c_{n-1} & \dots & c_2 & c_1 \\ c_1 & c_0 & c_{n-1} & & c_2 \\ \vdots & c_1 & c_0 & \ddots & \vdots \\ c_{n-2} & & \ddots & \ddots & c_{n-1} \\ c_{n-1} & c_{n-2} & \dots & c_1 & c_0 \\ \end{bmatrix} C= c0c1cn2cn1cn1c0c1cn2cn1c0c2c1c1c2cn1c0
一个 n × n n \times n n×n的循环矩阵 C C C可以完全由其第一行 c = [ c 0 , c 1 , . . . , c n − 1 ] c = [c_0, c_1, ..., c_{n-1}] c=[c0,c1,...,cn1]决定。

特征值与特征向量

循环矩阵 C C C的特征值可以通过离散傅里叶变换(DFT)来计算,具体来说,如果 c c c C C C的第一行,则 C C C的特征值为 λ k = ∑ j = 0 n − 1 c j e − i 2 π j k / n \lambda_k = \sum_{j=0}^{n-1} c_j e^{- i2\pi jk / n} λk=j=0n1cjei2πjk/n k = 0 , 1 , . . . , n − 1 k = 0, 1, ..., n-1 k=0,1,...,n1

利用 FFT,可以高效地计算循环矩阵的特征值和特征向量,从而实现矩阵的快速对角化。

循环矩阵的对角化

由于循环矩阵的所有特征向量是正交的,因此循环矩阵可以被对角化。

一个 n × n n×n n×n的循环矩阵 C C C可以通过离散傅里叶变换(DFT)矩阵 F F F进行对角化,即存在一个对角矩阵 Λ Λ Λ,使得:
C = F − 1 Λ F C = F^{-1} \Lambda F C=F1ΛF
其中, F F F是DFT矩阵, Λ \Lambda Λ是对角矩阵,其对角线上的元素是 C C C的特征值,这些特征值可以通过计算 C C C的第一行向量的DFT获得。

循环矩阵与向量的乘积

对于一个 n × n n \times n n×n的循环矩阵 C C C和一个 n n n维向量 x x x,计算 C x Cx Cx的过程可以通过快速傅里叶变换(FFT)来高效实现:

  1. 计算 c c c x x x的 FFT,分别得到 F ( c ) F(c) F(c) F ( x ) F(x) F(x)
  2. F ( c ) F(c) F(c) F ( x ) F(x) F(x)做逐元素相乘,得到结果 Y = F ( c ) ⊙ F ( x ) Y = F(c) \odot F(x) Y=F(c)F(x)
  3. Y Y Y应用逆 FFT (IFFT),得到最终结果 y = I F F T ( Y ) y = IFFT(Y) y=IFFT(Y)

这样,通过使用 FFT,可以高效地计算出循环矩阵与向量的乘积,避免了直接矩阵乘法带来的高计算复杂度。这种方法利用了 FFT 的高效性,将原本需要 O ( n 2 ) O(n^2) O(n2)复杂度的矩阵乘法降低到了 O ( n log ⁡ n ) O(n \log n) O(nlogn)的复杂度,极大地提高了计算效率。

BCCB矩阵

BCCB矩阵的定义

块循环对称矩阵(Block Circulant with Circulant Blocks, BCCB)是由多个循环矩阵(Circulant Matrix)组成的块矩阵(Block Circulant Matrix)。它在每个块上都具有循环矩阵的性质,并且这些块本身也按照循环矩阵的方式排列。

假设有一个大小为 n × n n \times n n×n的BCCB矩阵,其中每个块是一个大小为 m × m m \times m m×m的循环矩阵,则整个BCCB矩阵的大小为 n m × n m nm \times nm nm×nm

B = [ B 0 B n − 1 … B 2 B 1 B 1 B 0 B n − 1 B 2 ⋮ B 1 B 0 ⋱ ⋮ B n − 2 ⋱ ⋱ B n − 1 B n − 1 B n − 2 … B 1 B 0 ] B = \begin{bmatrix} B_0 & B_{n-1} & \dots & B_2 & B_1 \\ B_1 & B_0 & B_{n-1} & & B_2 \\ \vdots & B_1 & B_0 & \ddots & \vdots \\ B_{n-2} & & \ddots & \ddots & B_{n-1} \\ B_{n-1} & B_{n-2} & \dots & B_1 & B_0 \\ \end{bmatrix} B= B0B1Bn2Bn1Bn1B0B1Bn2Bn1B0B2B1B1B2Bn1B0

每个 B i B_i Bi都是一个 m × m m \times m m×m的循环矩阵。

BCCB矩阵的对角化

根据循环矩阵的性质,单个循环矩阵可以通过 FFT 对角化。同样地,BCCB 矩阵也可以通过对每个块进行 FFT 操作来对角化。BCCB矩阵的对角化可以通过两次应用DFT矩阵实现, F n F_n Fn用于处理块循环结构, F m F_m Fm用于处理每个循环矩阵块。这个过程可以形式化地表示为:
B = ( F n ⊗ F m ) − 1 Λ ( F n ⊗ F m ) B = (F_n \otimes F_m)^{-1} \Lambda (F_n \otimes F_m) B=(FnFm)1Λ(FnFm)
这里, ⊗ \otimes 表示Kronecker积, Λ \Lambda Λ是对角矩阵,包含BCCB矩阵的所有特征值。

BCCB 矩阵也可以通过适当的傅里叶变换矩阵 F n ⊗ F m F_n \otimes F_m FnFm ⊗ \otimes 表示克罗内克积)来对角化。 F n F_n Fn n × n n \times n n×n 的DFT矩阵, F m F_m Fm m × m m \times m m×m 的DFT矩阵。

BCCB 矩阵与向量的乘积

当考虑 BCCB 矩阵 A A A与向量 x x x的乘积 y = A x y = Ax y=Ax时,如果直接进行计算,计算复杂度为 O ( n 2 m 2 ) O(n^2m^2) O(n2m2),这在 n n n m m m较大时是非常高的。但是,利用 BCCB 矩阵可以对角化的性质,使用快速傅里叶变换(FFT)来降低计算复杂度到 O ( n m log ⁡ ( n m ) ) O(nm\log(nm)) O(nmlog(nm))

具体步骤如下:

  1. 计算向量 x x x n m nm nm维傅里叶变换 x ^ = ( F n ⊗ F m ) x \hat{x} = (F_n \otimes F_m)x x^=(FnFm)x
  2. 将对角矩阵 Λ A \Lambda_A ΛA x ^ \hat{x} x^相乘,得到 y ^ = Λ x ^ \hat{y} = \Lambda \hat{x} y^=Λx^
  3. 计算 y ^ \hat{y} y^的逆傅里叶变换 y = ( F n ⊗ F m ) − 1 y ^ y = (F_n \otimes F_m)^{-1}\hat{y} y=(FnFm)1y^

这样,我们就得到了 A x Ax Ax的结果 y y y,提高计算效率。

BCCB 矩阵与向量乘积的实现

对于一个 BCCB 矩阵 B B B与一个向量 x x x的乘积 B x Bx Bx,可以通过以下步骤高效地计算:

  1. 特征值计算
    构造矩阵 Z Z Z
    在这里插入图片描述
    在这里插入图片描述

  2. 向量重塑:首先,将向量 x x x重塑成 n × n n \times n n×n的矩阵形式 X X X
    在这里插入图片描述

  3. 二维 FFT:对矩阵 X X X进行二维 FFT 得到 F ( X ) F(X) F(X)
    在这里插入图片描述

  4. 点乘运算:将 F ( X ) F(X) F(X)与前面提到的对角化后的矩阵 Λ \Lambda Λ中对应的特征值进行逐元素点乘,得到新的矩阵 Y Y Y
    在这里插入图片描述

  5. 逆二维 FFT:最后,对 Y Y Y应用逆二维 FFT 得到最终结果 Y Y Y,再将 Y Y Y重新拉平为一个向量,即为 B x Bx Bx的结果。
    在这里插入图片描述

总结

循环矩阵和BCCB 矩阵的对角化和与向量的乘积都可以通过 FFT 相关技术高效地实现。这种高效的算法对于处理大规模数据集尤其重要,可以在保持计算精度的同时显著减少计算时间和资源消耗。

;