Bootstrap

随机变量的线性最小均方估计(LMMSE)——多个观测变量

假设有一个随机变量 x x x需要估计,线性最小均方误差(Linear Minimum Mean Square Error, LMMSE)估计的目标是找到一个线性估计器 x ^ = ∑ i = 0 N − 1 a i y i + b \hat{x} = \sum_{i=0}^{N-1} a_i y_i + b x^=i=0N1aiyi+b,使得估计误差 e = x − x ^ e = x - \hat{x} e=xx^的均方误差 E [ e 2 ] E[e^2] E[e2]最小。

目标函数

估计模型

首先,假设有一个随机变量 x x x,我们希望通过一组观测变量 y = [ y 0 , y 1 , … , y N − 1 ] y = [y_0, y_1, \ldots, y_{N-1}] y=[y0,y1,,yN1]来估计 x x x。估计模型可以表示为:
x ^ = ∑ i = 0 N − 1 a i y i + b \hat{x} = \sum_{i=0}^{N-1} a_i y_i + b x^=i=0N1aiyi+b
其中 a i a_i ai b b b是需要确定的参数。

均方误差(MSE)

均方误差(Mean Squared Error, MSE)定义为估计值 x ^ \hat{x} x^与真实值 x x x之间的差的期望值的平方:
MSE = E [ ( x − x ^ ) 2 ] \text{MSE} = E[(x - \hat{x})^2] MSE=E[(xx^)2]

分量形式

MSE 的具体表达

将估计模型代入 MSE 的定义中,得到:
MSE = E [ ( x − ∑ i = 0 N − 1 a i y i − b ) 2 ] \text{MSE} = E\left[\left(x - \sum_{i=0}^{N-1} a_i y_i - b\right)^2\right] MSE=E (xi=0N1aiyib)2

求导并最小化 MSE

为了找到使 MSE 最小的参数 a i a_i ai b b b,我们需要对 MSE 关于 a i a_i ai b b b求偏导数,并令其等于零。

b b b求导

∂ MSE ∂ b = − 2 E [ ( x − ∑ i = 0 N − 1 a i y i − b ) ] = 0 \frac{\partial \text{MSE}}{\partial b} = -2 E\left[\left(x - \sum_{i=0}^{N-1} a_i y_i - b\right)\right] = 0 bMSE=2E[(xi=0N1aiyib)]=0
解得:
b = E [ x ] − ∑ i = 0 N − 1 a i E [ y i ] b = E[x] - \sum_{i=0}^{N-1} a_i E[y_i] b=E[x]i=0N1aiE[yi]

a i a_i ai求导
∂ MSE ∂ a i = − 2 E [ y i ( x − ∑ j = 0 N − 1 a j y j − b ) ] = 0 \frac{\partial \text{MSE}}{\partial a_i} = -2 E\left[y_i \left(x - \sum_{j=0}^{N-1} a_j y_j - b\right)\right] = 0 aiMSE=2E[yi(xj=0N1ajyjb)]=0
解得:
a i = E [ y i x ] − E [ y i ] E [ x ] E [ y i 2 ] − ( E [ y i ] ) 2 a_i = \frac{E[y_i x] - E[y_i] E[x]}{E[y_i^2] - (E[y_i])^2} ai=E[yi2](E[yi])2E[yix]E[yi]E[x]

最终表达式

a i a_i ai b b b的表达式代入估计模型中,得到最终的 LMMSE 估计器:
x ^ = ∑ i = 0 N − 1 a i y i + b \hat{x} = \sum_{i=0}^{N-1} a_i y_i + b x^=i=0N1aiyi+b
其中:
a i = Cov ( y i , x ) Var ( y i ) a_i = \frac{\text{Cov}(y_i, x)}{\text{Var}(y_i)} ai=Var(yi)Cov(yi,x)
b = E [ x ] − ∑ i = 0 N − 1 a i E [ y i ] b = E[x] - \sum_{i=0}^{N-1} a_i E[y_i] b=E[x]i=0N1aiE[yi]

向量形式

在矩阵形式下,可以将上述表达式写为:
x ^ = a T y + b \hat{x} = \mathbf{a}^T \mathbf{y} + b x^=aTy+b
其中 a = [ a 0 , a 1 , … , a N − 1 ] T \mathbf{a} = [a_0, a_1, \ldots, a_{N-1}]^T a=[a0,a1,,aN1]T y = [ y 0 , y 1 , … , y N − 1 ] T \mathbf{y} = [y_0, y_1, \ldots, y_{N-1}]^T y=[y0,y1,,yN1]T

b b b求导

E [ ( x − E [ x ] − ( y − E [ y ] ) T a ) ] = 0 E\left[\left(x - E[x] - (\mathbf{y} - E[\mathbf{y}])^T \mathbf{a}\right)\right] = 0 E[(xE[x](yE[y])Ta)]=0

解得 b b b

b = E [ x ] − a T E [ y ] b = E[x] - \mathbf{a}^T E[\mathbf{y}] b=E[x]aTE[y]

a a a求导

E [ ( y − E [ y ] ) ( x − E [ x ] − ( y − E [ y ] ) T a ) ] = 0 E\left[\left(\mathbf{y} - E[\mathbf{y}]\right) \left(x - E[x] - (\mathbf{y} - E[\mathbf{y}])^T \mathbf{a}\right)\right] = 0 E[(yE[y])(xE[x](yE[y])Ta)]=0

解得 a a a

a = R y − 1 R y x \mathbf{a} = \mathbf{R}_y^{-1} \mathbf{R}_{yx} a=Ry1Ryx

这里 R y \mathbf{R}_y Ry是观测值 y \mathbf{y} y的协方差矩阵, R y x \mathbf{R}_{yx} Ryx是观测值 y \mathbf{y} y与随机变量 x x x的协方差向量。

最终的 LMMSE 估计器可以表示为:
x ^ = a T y + b \hat{x} = \mathbf{a}^T \mathbf{y} + b x^=aTy+b
其中:
a = R y − 1 R y x \mathbf{a} = \mathbf{R}_y^{-1} \mathbf{R}_{yx} a=Ry1Ryx
b = E [ x ] − a T E [ y ] b = E[x] - \mathbf{a}^T E[\mathbf{y}] b=E[x]aTE[y]

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;