Bootstrap

多元统计分析(1):多元分布(均值、协方差、统计距离)、多元正态分布(密度函数、性质、条件分布)、估计、常用多元分布及抽样分布

10 典型相关分析 | 多元统计分析示例 (pku.edu.cn)

基础知识准备:

参考:回归分析|笔记整理(3)——多元正态分布理论(上) - 知乎 (zhihu.com)

1.1 多元分布的基本概念及性质

https://blog.csdn.net/qq_41035283/article/details/121130346

重要:

1.1.1 均值

1.1.2 协方差阵

一、X与X

一般写做:\sum = D(x)

性质:(1): D(Ax) =AD(x)A^T=A\sum A^T

(2):设X为p维随机变量,期望和协方差存在,记\mu =E(x),\sum = D(x),A为p*p的常数阵,则E(X^TAX)=tr(A\sum )+\mu ^TA\mu

 

二、X与Y

定义:cov(X,Y)= (cov(x_i,y_j)), i,j=1,2,3,...,q

性质:cov(AX,BY)= Acov(X,Y)B^T

1.1.3 随机向量X的相关阵

定义:R = (corr(X_i,X_j))=(r_{jj})_{p\times p}   , 其中r_{jj} = \frac{cov(X_i,Y_j)}{\sqrt{D(X_i)}\sqrt{D(X_j)}}

标准化数据的协方差阵正好是原指标的相关阵

1.2 统计距离

马氏距离,欧式距离

参考:多元统计分析——欧式距离和马氏距离_马氏距离和欧式距离的区别-CSDN博客

1.3 多元正态分布

1.3.1 概率密度函数及其推导过程

参考:https://blog.csdn.net/weixin_45925418/article/details/118494954

 1.3.2 多元正态分布的性质

参考:(https://blog.csdn.net/qq_38406029/article/details/120596820

但是若一个随机向量的任何边缘分布均为正态分布,并不能导出它是多元正态分布。

如:f(x_1,x_2) = \frac{1}{2\pi }e^{-\frac{1}{2}(x_1^2+x_2^2)}[1+x_1x_2e^{-\frac{1}{2}(x_1^2+x_2^2)}]

X\sim N_p(\mu ,\sum ) , 则 d^2 = (X-\mu )^T\sum ^{-1}(X-\mu )\sim \chi ^2(p)      d^2若为定值,随着X的变化,其轨迹为一个椭圆面,是X 的密度函数的等值面。若X给定,则d^2为X到\mu的马氏距离。

1.3.3 条件分布和独立性

一、条件分布

分成两部分:!!!(这个会考哦)

关于多元正态分布的条件分布的证明_多元正态条件分布证明-CSDN博客

X_2已知的条件下:

X_1 的条件分布:均值和方差记为:\mu _{1\cdot 2},\sum _{11 \cdot 2}

分成三部分:

二、独立性

1.4 均值向量与协方差阵的估计

\widehat{\mu} = \overline{X} 是无偏估计

\widehat{\sum _p} = \frac{1}{n}L是极大似然估计,是强相合估计,但是有偏。\widehat{\sum } = \frac{1}{n-1}L是无偏估计。L= \sum _{i=1}^{n}(X_{(i)}-\overline{X})(X_{(i)}-\overline{X})^T

1.5 常用分布及抽样分布

参考:【多元统计分析】05.多元统计的“三大分布”_wilks分布-CSDN博客

;