第二章 随机变量及其分布
1. 随机变量及其分布
1.1 随机变量的定义
定义1.1 随机变量
定义在样本空间 Ω \Omega Ω上的实值函数 X = X ( ω ) X=X(\omega) X=X(ω)称为随机变量,常用大写字母 X , Y , Z X,Y,Z X,Y,Z等表示随机变量,其取值用小写字母 x , y , z x,y,z x,y,z等表示。
加入一个随机变量仅可能取有限个或可列个值,则称其为离散随机变量,加入一个随机变量的可能取值充满数轴上的一个区间 ( a , b ) (a,b) (a,b),则称其为连续随机变量,其中 a a a可以是 − ∞ -\infty −∞, b b b可以是 + ∞ +\infty +∞
1.2 随机变量的分布函数
随机变量
X
X
X是样本点
ω
\omega
ω的一个实值函数,若
B
B
B是某些实数组成的集合,即
B
⊂
R
,
R
B\subset \R,\R
B⊂R,R表示实数集,则
{
X
∈
B
}
\{X\in B\}
{X∈B}表示如下的随机事件:
{
w
:
X
(
w
)
∈
B
}
⊂
Ω
\{w:X(w)\in B\}\subset \Omega
{w:X(w)∈B}⊂Ω
特别的,用等号或不等号把随机变量
X
X
X与某些实数连接起来,用来表示事件,例如
{
X
≤
a
}
、
{
X
>
b
}
\{X\le a\}、\{X>b\}
{X≤a}、{X>b}和
{
a
<
X
<
b
}
\{a<X<b\}
{a<X<b}都是随机事件
定义 2.1 分布函数
设X是一个随机变量,对任意实数
x
x
x,称
F
(
x
)
=
P
(
X
≤
x
)
F(x)=P(X\le x)
F(x)=P(X≤x)
为随机变量
X
X
X的分布函数,且称
X
X
X服从
F
(
x
)
F(x)
F(x),记为
X
∼
F
(
x
)
X\sim F(x)
X∼F(x),有时也用
F
X
(
x
)
F_X(x)
FX(x)来表示
X
X
X的分布函数。
由定义可知,任一随机变量X(离散的或连续的)都有一个分布函数,有了分布函数,就可以计算与随机变量X有关时间的概率。
定理 2.1 分布函数的性质
-
单调性 F ( X ) F(X) F(X)是定义在整个实数轴 ( − ∞ , ∞ ) (-\infty,\infty) (−∞,∞)上的单调非减函数,即对任意的 x 1 < x 2 x_1\lt x_2 x1<x2,有 F ( x 1 ) ≤ F ( x 2 ) F(x_1)\le F(x_2) F(x1)≤F(x2)
-
有界性 对任意的 x x x,有 0 ≤ F ( x ) ≤ 1 0\le F(x)\le 1 0≤F(x)≤1,且
F ( − ∞ ) = lim x → − ∞ F ( x ) = 0 , F ( ∞ ) = lim x → ∞ F ( x ) = 1 F(-\infty)=\lim_{x\rightarrow -\infty}F(x)=0,\\ F(\infty)=\lim_{x\rightarrow \infty}F(x)=1 F(−∞)=x→−∞limF(x)=0,F(∞)=x→∞limF(x)=1 -
右连续性 F ( x ) F(x) F(x)是 x x x的右连续函数,即对任意的 x 0 x_0 x0,有
lim x → x 0 + 0 F ( x ) = F ( x 0 ) 或 F ( x + 0 ) = F ( x 0 ) \lim_{x\rightarrow x_0 +0} F(x)=F(x_0)\ \ 或\ \ F(x+0)=F(x_0) x→x0+0limF(x)=F(x0) 或 F(x+0)=F(x0)
证明p58
这三条基本性质是判别某个函数是否能成为分布函数的充要条件
柯西分布函数
F ( x ) = 1 π ( a r c t a n x + π 2 ) , − ∞ < x < ∞ F(x)=\frac 1\pi (arctan\ x +\frac \pi 2),-\infty<x<\infty F(x)=π1(arctan x+2π),−∞<x<∞
F ( x ) F(x) F(x)在数轴上是连续,严格单增函数,且有 F ( ∞ ) = 1 , F ( − ∞ ) = 0 F(\infty)=1,F(-\infty)=0 F(∞)=1,F(−∞)=0,由于此 F ( x ) F(x) F(x)满足分布函数的三条基本性质,所以它是一个分布函数。称这个分布函数为柯西分布函数。
1.3 离散随机变量的概率分布列
定义 3.1 概率分布列
设
X
X
X是一个离散随机变量,如果
X
X
X的所有可能值是
x
1
,
x
2
,
⋯
,
x
n
,
⋯
x_1,x_2,\cdots,x_n,\cdots
x1,x2,⋯,xn,⋯,则称
X
X
X取
x
i
x_i
xi的概率:
p
i
=
p
(
x
i
)
=
P
(
X
=
x
i
)
,
i
=
1
,
2
,
⋯
,
n
,
⋯
p_i =p(x_i)=P(X=x_i),i=1,2,\cdots,n,\cdots
pi=p(xi)=P(X=xi),i=1,2,⋯,n,⋯
为X的概率分布列或简称为分布列,记为
X
∼
{
p
i
}
X\sim\{p_i\}
X∼{pi}
分布列可用表方式来表示:
或记为
性质 3.1 分布列的基本性质
- 非负性 p ( x i ) ≥ 0 , i = 1 , 2 , ⋯ p(x_i)\ge0,i=1,2,\cdots p(xi)≥0,i=1,2,⋯
- 正则性 ∑ i = 1 ∞ p ( x 1 ) = 1 \sum^\infty_{i=1}p(x_1)=1 ∑i=1∞p(x1)=1
这两个性质是分布列必须具有的性质,也是判别某个数列是否能成为分布列的充要条件
1.4.连续随机变量的概率密度函数
对于随机变量,一切可能取值充满某个区间 ( a , b ) (a,b) (a,b),而在这个区间内有无穷不可列个实数,因此这类随机变量的概率分布不能再用分布列形式表示,而要改用概率密度函数表示。
定义4.1 概率密度函数
设随机变量
X
X
X的分布函数为
F
(
x
)
F(x)
F(x),如果存在实数轴上的一个非负可积函数
p
(
x
)
p(x)
p(x),使得对任意函数
x
x
x有
F
(
x
)
=
∫
−
∞
x
p
(
t
)
d
t
F(x)=\int^x_{-\infty}p(t)dt
F(x)=∫−∞xp(t)dt
则称
p
(
x
)
p(x)
p(x)为
X
X
X的概率密度函数,简称为密度函数或密度,同时称
X
X
X为连续随机变量,称
F
(
x
)
F(x)
F(x)为连续分布函数,由定义式不难推出:
F
′
(
x
)
=
p
(
x
)
F'(x)=p(x)
F′(x)=p(x)
性质4.1 密度函数的基本性质
- 非负性 p ( x ) ≥ 0 p(x)\ge 0 p(x)≥0
- 正则性 ∫ − ∞ ∞ p ( x ) d x = 1 \int_{-\infty}^{\infty}p(x)dx=1 ∫−∞∞p(x)dx=1(含有 p ( x ) p(x) p(x)的可积性)
也是判断某个函数能否成为密度函数的充要条件
除了离散分布和连续分布之外,还有既非离散又非连续的分布:
F
(
x
)
=
{
0
,
x
<
0
,
1
+
x
2
,
0
≤
x
<
1
,
1
,
x
≥
1
F(x)=\left\{ \begin{aligned} 0,&& &x<0,\\ \frac{1+x}2,&& &0\le x\lt 1,\\ 1,&& &x\ge1 \end{aligned} \right.
F(x)=⎩
⎨
⎧0,21+x,1,x<0,0≤x<1,x≥1
可分解为两个分布函数的凸组合。
2.随机变量的数学期望
2.1 数学期望的概念
分赌本问题 (p69)
数学期望这个名称由此而来,其实就是均值,有两种均值计算方式:
-
算术平均
E = ∑ i = 1 k x i n E=\frac{\sum_{i=1}^kx_i}{n} E=n∑i=1kxi -
加权平均
E = 1 n ∑ i = 1 k n i x i = ∑ i = 1 k n i n x i E=\frac{1}n \sum^k_{i=1}n_i x_i = \sum^k _{i=1}\frac{n_i}{n}x_i E=n1i=1∑knixi=i=1∑knnixi
分赌本问题启示我们,用取值的概率作为权重作加权平均是十分合理的
定义 2.1.1 离散随机变量的数学期望
设离散随机变量
X
X
X的分布列为
p
(
x
i
)
=
P
(
x
=
x
i
)
,
i
=
1
,
2
,
⋯
,
n
,
⋯
.
p(x_i) = P(x=x_i),i=1,2,\cdots,n,\cdots.
p(xi)=P(x=xi),i=1,2,⋯,n,⋯.
如果
∑
i
=
1
∞
∣
x
i
∣
p
(
x
i
)
<
∞
,
\sum_{i=1}^\infty |x_i|p(x_i)<\infty ,
i=1∑∞∣xi∣p(xi)<∞,
则称
E
(
X
)
=
∑
i
=
1
∞
x
i
p
(
x
i
)
E(X)=\sum_{i=1}^\infty x_i p(x_i)
E(X)=i=1∑∞xip(xi)
为随机变量
X
X
X的数学期望,或称为该分布的数学期望,简称期望或均值,若级数不收敛,则称
X
X
X的数学期望不存在
定义 2.1.2 连续随机变量的数学期望
设连续随机变量
X
X
X的密度函数为
p
(
x
)
p(x)
p(x),如果:
∫
−
∞
∞
∣
x
∣
p
(
x
)
d
x
<
∞
\int_{-\infty}^{\infty}|x|p(x)dx<\infty
∫−∞∞∣x∣p(x)dx<∞
则称
E
(
X
)
=
∫
−
∞
∞
x
p
(
x
)
d
x
E(X)=\int^{\infty}_{-\infty}xp(x)dx
E(X)=∫−∞∞xp(x)dx
为
X
X
X的数学期望,或称为该分布
p
(
x
)
p(x)
p(x)的数学期望,简称期望或均值,若积分不收敛,则称
X
X
X的数学期望不存在。
均匀分布的期望
设
X
X
X服从区间
(
a
,
b
)
(a,b)
(a,b)上的均匀分布,求
E
(
X
)
E(X)
E(X),即
X
X
X的密度函数为:
p
(
x
)
=
{
1
b
−
a
,
a
<
x
<
b
,
0
,
其他
p(x)=\left\{ \begin{aligned} &\frac{1}{b-a},&a<x<b ,\\ &0,& 其他 \end{aligned} \right.
p(x)=⎩
⎨
⎧b−a1,0,a<x<b,其他
则:
E
(
x
)
=
∫
a
b
x
⋅
1
b
−
a
d
x
=
1
b
−
a
⋅
x
2
2
∣
a
b
=
a
+
b
2
E(x)=\int_a ^bx\cdot \frac{1}{b-a}dx = \frac{1}{b-a}\cdot\frac{x^2}{2}|^b_a = \frac{a+b}2
E(x)=∫abx⋅b−a1dx=b−a1⋅2x2∣ab=2a+b
柯西分布的数学期望不存在,因为积分不收敛
2.2 数学期望的性质
定理 2.2.1 数学期望中的嵌套
若随机变量
X
X
X的分布用分布列
p
(
x
i
)
p(x_i)
p(xi)或用密度函数
p
(
x
)
p(x)
p(x)表示,则
X
X
X的某一函数
g
(
x
)
g(x)
g(x)的数学期望为:
E
[
g
(
x
)
]
=
{
∑
i
g
(
x
i
)
p
(
x
i
)
,
在离散场合
,
∫
−
∞
∞
g
(
x
)
p
(
x
)
d
x
,
在连续场合
.
E[g(x)]=\left\{ \begin{aligned} \sum_i g(x_i)p(x_i),&在离散场合,\\ \int_{-\infty}^\infty g(x)p(x)dx,&在连续场合. \end{aligned} \right.
E[g(x)]=⎩
⎨
⎧i∑g(xi)p(xi),∫−∞∞g(x)p(x)dx,在离散场合,在连续场合.
上述期望都是假设存在的
性质 2.2.1 数学期望的运算性质
- 若 c c c是常数,则 E ( c ) = c E(c)=c E(c)=c
- 对任意常数 a a a,有 E ( a X ) = a E ( X ) E(aX)=aE(X) E(aX)=aE(X)
- 对任意的两个函数 g 1 ( x ) , g 2 ( x ) g_1(x),g_2(x) g1(x),g2(x),有: E [ g 1 ( X ) ± g 2 ( X ) ] = E [ g 1 ( X ) ] ± E [ g 2 ( X ) ] E[g_1(X)\pm g_2(X)]=E[g_1(X)]\pm E[g_2(X)] E[g1(X)±g2(X)]=E[g1(X)]±E[g2(X)]
3.随机变量的方差与标准差
3.1 方差与标准差的定义
定义 3.1.1 方差
若随机变量
X
2
X^2
X2的数学期望
E
(
X
2
)
E(X^2)
E(X2)存在,则称偏差平方
(
X
−
E
(
X
)
)
2
(X-E(X))^2
(X−E(X))2的数学期望
E
(
(
X
−
E
(
X
)
)
2
)
E((X-E(X))^2)
E((X−E(X))2)为随机变量
X
X
X(或相应分布)的方差,记为:
V
a
r
(
X
)
=
E
(
X
−
E
(
X
)
)
2
=
{
∑
i
(
x
i
−
E
(
X
)
)
2
p
(
x
i
)
,
在离散场合
,
∫
−
∞
∞
(
x
−
E
(
X
)
)
2
p
(
x
)
d
x
,
在连续场合
Var(X)=E(X-E(X))^2 = \left\{ \begin{aligned} &\sum_i (x_i-E(X))^2p(x_i),在离散场合,\\ &\int_{-\infty}^{\infty} (x-E(X))^2p(x)dx,在连续场合 \end{aligned} \right.
Var(X)=E(X−E(X))2=⎩
⎨
⎧i∑(xi−E(X))2p(xi),在离散场合,∫−∞∞(x−E(X))2p(x)dx,在连续场合
称方差的正平方根
V
a
r
(
X
)
\sqrt{Var(X)}
Var(X)为随机变量
X
X
X(或相应分布)的标准差,记为
σ
(
X
)
\sigma(X)
σ(X),或
σ
X
\sigma_X
σX
3.2 方差的性质
性质 3.2.1 方差的计算
V a r ( X ) = E ( X 2 ) − [ E ( X ) ] 2 Var(X) = E(X^2)-[E(X)]^2 Var(X)=E(X2)−[E(X)]2
性质 3.2.2 常数的方差为0
性质 3.2.3 方差的线性组合
若
a
,
b
a,b
a,b是常数,则有
V
a
r
(
a
X
+
b
)
=
a
2
V
a
r
(
X
)
Var(aX+b)=a^2Var(X)
Var(aX+b)=a2Var(X)
3.3 切比雪夫不等式
定理 3.3.1 切比雪夫(Chebyshev)不等式
设随机变量
X
X
X的数学期望和方差都存在,则对任意常数
ϵ
>
0
\epsilon > 0
ϵ>0,有
P
(
∣
X
−
E
(
X
)
∣
≥
ϵ
)
≤
V
a
r
(
X
)
ϵ
2
P(|X-E(X)|\ge \epsilon)\le \frac{Var(X)}{\epsilon^2}
P(∣X−E(X)∣≥ϵ)≤ϵ2Var(X)
或
P
(
∣
X
−
E
(
X
)
∣
<
ϵ
)
≥
1
−
V
a
r
(
X
)
ϵ
2
P(|X-E(X)|\lt \epsilon) \ge 1-\frac{Var(X)}{\epsilon^2}
P(∣X−E(X)∣<ϵ)≥1−ϵ2Var(X)
证明:p80
定理 3.3.2 方差为0
若随机变量 X X X的方差存在,则 V a r ( X ) = 0 Var(X)=0 Var(X)=0的充要条件是 X X X几乎处处为某个常数 a a a,即 P ( X = a ) = 1 P(X=a)=1 P(X=a)=1
4. 常用离散分布
4.1 二项分布
4.1.1 二项分布的定义
记
X
X
X为
n
n
n重伯努利试验中成功(记为事件
A
A
A)的次数,则
X
X
X的可能取值为
0
,
1
,
⋯
,
n
0,1,\cdots,n
0,1,⋯,n。不难得出
X
X
X的分布列为:
P
(
X
=
k
)
=
C
n
k
p
k
(
1
−
p
)
n
−
k
,
k
=
0
,
1
,
⋯
,
n
P(X=k)=C^k_np^k(1-p)^{n-k},k=0,1,\cdots,n
P(X=k)=Cnkpk(1−p)n−k,k=0,1,⋯,n
这个分布称为二项分布,记为
X
∼
b
(
n
,
p
)
X\sim b(n,p)
X∼b(n,p)
4.1.2 二点分布
n
=
1
n=1
n=1时的二项分布
b
(
1
,
p
)
b(1,p)
b(1,p)称为二点分布,或称0-1分布,或称伯努利分布,其分布列为:
P
(
X
=
x
)
=
p
x
(
1
−
p
)
1
−
x
,
x
=
0
,
1.
P(X=x)=p^x(1-p)^{1-x},x=0,1.
P(X=x)=px(1−p)1−x,x=0,1.
4.1.3 二项分布的期望和方差
设随机变量
X
∼
b
(
n
,
p
)
X\sim b(n,p)
X∼b(n,p),则:
E
(
X
)
=
n
p
V
a
r
(
X
)
=
n
p
(
1
−
p
)
E(X)=np\\ Var(X) = np(1-p)
E(X)=npVar(X)=np(1−p)
推到过程:p84
4.2 泊松分布
4.2.1 泊松分布的定义
泊松分布时1837年由法国数学家泊松(Poisson,1781——1840)首次提出的,泊松分布的概率分布列是:
P
(
X
=
k
)
=
λ
k
k
!
e
−
λ
,
k
=
0
,
1
,
2
,
⋯
,
P(X=k)=\frac{\lambda ^k}{k!}e^{-\lambda},k=0,1,2,\cdots,
P(X=k)=k!λke−λ,k=0,1,2,⋯,
其中参数
λ
>
0
\lambda >0
λ>0,记为
X
∼
P
(
λ
)
X\sim P(\lambda)
X∼P(λ)
容易验证:
∑
k
=
0
∞
λ
k
k
!
e
−
λ
=
e
−
λ
∑
k
=
0
∞
λ
k
k
!
=
e
−
λ
e
λ
=
1
\sum_{k=0}^\infty \frac{\lambda ^k}{k!}e^{-\lambda}=e^{-\lambda}\sum_{k=0}^\infty\frac{\lambda^k}{k!}=e^{-\lambda}e^{\lambda} =1
k=0∑∞k!λke−λ=e−λk=0∑∞k!λk=e−λeλ=1
泊松分布的和为1。泊松分布是一种常用的离散部分,它常与单位时间(或单位面积、单位产品等)上的计数过程相联系,譬如:
- 在一天内,来到某商场的顾客数
- 在单位时间内,一电路受到外界电磁波的冲击次数
- 1平方米内,玻璃上的气泡数
- 一铸件上的砂眼数
- 在一定时间内,某种放射性物质放射出来的 α − \alpha- α−粒子数
4.2.2 泊松分布的期望和方差
设随机变量
X
∼
P
(
λ
)
X\sim P(\lambda)
X∼P(λ),则:
E
(
X
)
=
λ
V
a
r
(
X
)
=
λ
E(X) = \lambda\\ Var(X) = \lambda
E(X)=λVar(X)=λ
推导过程:p86
4.2.3 二项分布的泊松近似
在二项分布 b ( n , p ) b(n,p) b(n,p)中,当 n n n较大且 p p p较小时可近似为泊松分布,减少二项分布中的计算量:
定理 4.2.1 泊松定理
在
n
n
n重伯努利试验中,记事件
A
A
A在一次试验中发生的概率为
p
n
p_n
pn(与试验次数
n
n
n有关),如果当
n
→
∞
n\rightarrow \infty
n→∞时,有
n
p
n
→
λ
np_n\rightarrow \lambda
npn→λ,则:
lim
n
→
∞
C
n
k
p
n
k
(
1
−
p
n
)
n
−
k
=
λ
k
k
!
e
−
λ
\lim_{n\rightarrow \infty} C_n ^k p_n^k(1-p_n)^{n-k} = \frac{\lambda^k}{k!}e^{-\lambda}
n→∞limCnkpnk(1−pn)n−k=k!λke−λ
证明: p87
也就是说,在计算二项分布
b
(
n
,
p
)
b(n,p)
b(n,p)时,当
n
n
n很大,
p
p
p很小,而乘积
λ
=
n
p
\lambda = np
λ=np大小适中时,可以用泊松分布作近似,即:
C
n
k
p
n
k
(
1
−
p
n
)
n
−
k
=
(
n
p
)
k
k
!
e
−
n
p
,
k
=
0
,
1
,
2
,
⋯
C_n^kp_n^k(1-p_n)^{n-k} = \frac{(np)^k}{k!}e^{-np},k=0,1,2,\cdots
Cnkpnk(1−pn)n−k=k!(np)ke−np,k=0,1,2,⋯
n n n越大, p p p越小,近似程度越好
4.3 超几何分布
从一个有限总体中进行不放回抽样常会遇到超几何分布:
假设有
N
N
N件超频,其中有
M
M
M件不合格品,若从中不放回地随机抽取
n
n
n件,则其中含有的不合格品的件数
X
X
X服从超几何分布,记为
X
∼
h
(
n
,
N
,
M
)
X\sim h(n,N,M)
X∼h(n,N,M),超几何分布的概率分布列为:
P
(
X
=
k
)
=
C
M
k
C
N
−
M
n
−
k
C
N
n
,
k
=
0
,
1
,
⋯
,
r
P(X=k)=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n},k =0,1,\cdots,r
P(X=k)=CNnCMkCN−Mn−k,k=0,1,⋯,r
其中
r
=
m
i
n
{
M
,
m
}
,
M
≤
N
,
n
≤
N
,
N
,
M
r=min\{M,m\},M\le N,n\le N,N,M
r=min{M,m},M≤N,n≤N,N,M均为正整数。
4.3.1 超几何分布的期望和方差
p90
$$
E(X)=n\frac{M}{N}\
Var(X)=\frac{nM(N-M)(N-n)}{N^2(N-1)}
$$
4.3.2 超几何分布的二项近似
当
n
n
n远远小于
N
N
N时,即抽取个数
n
n
n远小于产品总数
N
N
N时,每次抽取后,总体中的不合格品率
p
=
M
N
p=\frac MN
p=NM改变很小,所以不放回抽样可近似看成放回抽样,则此时超几何分布可用二项分布近似:
C
M
k
C
N
−
M
n
−
k
C
N
n
=
C
n
k
p
k
(
1
−
p
)
n
−
k
,
w
i
t
h
p
=
M
N
\frac{C_M^k C_{N-M}^{n-k}}{C_N^n}=C_n^kp^k(1-p)^{n-k},with\ p = \frac MN
CNnCMkCN−Mn−k=Cnkpk(1−p)n−k,with p=NM
4.4 几何分布与负二项分布
4.4.1 几何分布
在伯努利试验序列中,记每次试验中事件
A
A
A发生的概率为
p
p
p,如果
X
X
X为事件
A
A
A首次出现的试验次数,则
X
X
X的可能取值为
1
,
2
,
⋯
,
1,2,\cdots,
1,2,⋯,称
X
X
X服从几何分布,记为
X
∼
G
e
(
p
)
X\sim Ge(p)
X∼Ge(p),其分布列为:
P
(
X
=
k
)
=
(
1
−
p
)
k
−
1
p
,
k
=
1
,
2
,
⋯
P(X=k) = (1-p)^{k-1}p,k=1,2,\cdots
P(X=k)=(1−p)k−1p,k=1,2,⋯
4.4.2 几何分布的期望和方差
p91
E
(
X
)
=
1
p
V
a
r
(
X
)
=
1
−
p
p
2
E(X)=\frac 1p \\ Var(X) =\frac {1-p}{p^2}
E(X)=p1Var(X)=p21−p
定理4.4.1 几何分布的无记忆性
设
X
∼
G
e
(
p
)
X\sim Ge(p)
X∼Ge(p),则对任意正整数
m
m
m与
n
n
n有:
P
(
X
>
m
+
n
∣
X
>
m
)
=
P
(
X
>
n
)
P(X>m+n | X>m) = P(X>n)
P(X>m+n∣X>m)=P(X>n)
含义就是若首次成功($A
)
在前
)在前
)在前m
次试验中没有出现,那假如后续
次试验中没有出现,那假如后续
次试验中没有出现,那假如后续n
次试验也没有出现的概率不变,只与
次试验也没有出现的概率不变,只与
次试验也没有出现的概率不变,只与n
有关,而与之前的
有关,而与之前的
有关,而与之前的m$次试验无关,这就是无记忆性。
证明,条件概率算一下是显然的
4.4.3 负二项分布
也称为帕斯卡分布
在伯努利试验序列中,记每次实验中事件
A
A
A发生的概率为
p
p
p,如果
X
X
X为事件
A
A
A第
r
r
r次出现时的试验次数,则
X
X
X的可能取值为
r
,
r
+
1
,
⋯
,
r
+
m
,
⋯
r,r+1,\cdots,r+m,\cdots
r,r+1,⋯,r+m,⋯,称
X
X
X服从付二项分布,其分布列为:
P
(
X
=
k
)
=
C
k
−
1
r
−
1
p
r
(
1
−
p
)
k
−
r
,
k
=
r
,
r
+
1
,
⋯
P(X=k)=C_{k-1}^{r-1}p^r(1-p)^{k-r},k = r,r+1,\cdots
P(X=k)=Ck−1r−1pr(1−p)k−r,k=r,r+1,⋯
记为
X
∼
N
b
(
r
,
p
)
X\sim Nb(r,p)
X∼Nb(r,p),当
r
=
1
r=1
r=1时,即为几何分布。
其中:
E
(
x
)
=
r
p
V
a
r
(
x
)
=
r
(
1
−
p
)
p
2
E(x)=\frac rp\\ Var(x) = \frac {r(1-p)}{p^2}
E(x)=prVar(x)=p2r(1−p)
5. 常用连续分布
在连续分布中,密度函数和分布函数是可以相互导出的,含有相同信息,但图形上密度函数对各种连续分布的特性能得到直观显示,如正态与偏态、单峰与平顶都是依密度函数图形命名的,因而对密度函数更为关注。
5.1 正态分布
若随机变量
X
X
X的密度函数为
p
(
x
)
=
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
,
−
∞
<
x
<
∞
p(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac {(x-\mu)^2}{2\sigma^2}},-\infty<x<\infty
p(x)=2πσ1e−2σ2(x−μ)2,−∞<x<∞
则称
X
X
X服从正态分布,称
X
X
X为正态变量,记作
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2),其中参数
−
∞
<
μ
<
∞
,
σ
>
0
-\infty <\mu <\infty,\sigma >0
−∞<μ<∞,σ>0,其密度函数
p
(
x
)
p(x)
p(x)和分布函数
F
(
X
)
F(X)
F(X)如下图所示:
正态分布
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2)的分布函数为:
F
(
x
)
=
1
2
π
σ
∫
−
∞
x
e
−
(
t
−
μ
)
2
2
σ
2
d
t
F(x) = \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^x e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt
F(x)=2πσ1∫−∞xe−2σ2(t−μ)2dt
μ
\mu
μ为位置参数,
σ
\sigma
σ为尺度参数,
σ
\sigma
σ越大,曲线就会变得矮而胖,
σ
\sigma
σ越小,曲线就会变得高而瘦。
5.1.1 标准正态分布
称 μ = 0 , σ = 1 \mu = 0,\sigma = 1 μ=0,σ=1时的正态分布 N ( 0 , 1 ) N(0,1) N(0,1)为标准正态分布
通常记标准正态变量为
U
U
U,记标准正态分布的密度函数为
φ
(
u
)
\varphi(u)
φ(u),分布函数为
Φ
(
u
)
\Phi(u)
Φ(u),即:
φ
(
u
)
=
1
2
π
e
−
u
2
2
,
−
∞
<
u
<
∞
\varphi(u) = \frac {1}{\sqrt{2\pi}}e^{\frac{-u^2}{2}} ,-\infty < u < \infty
φ(u)=2π1e2−u2,−∞<u<∞
Φ
(
u
)
=
1
2
π
∫
−
∞
u
e
−
t
2
2
d
t
,
−
∞
<
u
<
∞
\Phi(u) = \frac{1}{\sqrt{2\pi}}\int^u_{-\infty} e^{-\frac{t^2}{2}}dt,-\infty<u<\infty
Φ(u)=2π1∫−∞ue−2t2dt,−∞<u<∞
容易得出:
- Φ ( − u ) = 1 − Φ ( u ) \Phi(-u) = 1-\Phi(u) Φ(−u)=1−Φ(u)
- P ( U > u ) = 1 − Φ ( u ) P(U>u)=1-\Phi(u) P(U>u)=1−Φ(u)
- P ( a < U < b ) = Φ ( b ) − Φ ( a ) P(a<U<b) = \Phi(b)-\Phi(a) P(a<U<b)=Φ(b)−Φ(a)
- P ( ∣ U ∣ < c ) = 2 Φ ( c ) − 1 ( c ≥ 0 ) P(|U|<c) = 2\Phi(c)-1 (c\ge 0) P(∣U∣<c)=2Φ(c)−1(c≥0)
5.1.2 正态分布的标准化
定理 5.1
若随机变量 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2),则 U = ( X − μ ) / σ ∼ N ( 0 , 1 ) U=(X-\mu)/\sigma \sim N(0,1) U=(X−μ)/σ∼N(0,1).
证明 :记
X
X
X与
U
U
U的分布函数分别为
F
x
(
X
)
F_x(X)
Fx(X)与
F
U
(
u
)
F_U(u)
FU(u),则由分布函数的定义知:
F
U
(
u
)
=
P
(
U
≤
u
)
=
P
(
X
−
μ
σ
≤
u
)
=
P
(
X
≤
μ
+
σ
u
)
=
F
x
(
μ
+
σ
u
)
F_U(u)=P(U\le u)=P(\frac{X-\mu}{\sigma}\le u)=P(X\le \mu+\sigma u)=F_x(\mu+\sigma u)
FU(u)=P(U≤u)=P(σX−μ≤u)=P(X≤μ+σu)=Fx(μ+σu)
由于正态分布函数是严格单调增函数,且处处可导,因此若记
X
X
X与
U
U
U的密度函数分别为
p
X
(
x
)
p_X(x)
pX(x)与
p
U
(
u
)
p_U(u)
pU(u),则有:
p
U
(
u
)
=
d
d
u
F
X
(
μ
+
σ
u
)
=
p
X
(
μ
+
σ
u
)
⋅
σ
=
1
2
π
e
−
u
2
/
2
p_U(u)=\frac {d}{du}F_X(\mu+\sigma u) =p_X(\mu+\sigma u)\cdot \sigma = \frac {1}{\sqrt{2\pi}}e^{-u^2/2}
pU(u)=dudFX(μ+σu)=pX(μ+σu)⋅σ=2π1e−u2/2
即得,
U
=
X
−
μ
σ
∼
N
(
0
,
1
)
U=\frac{X-\mu}{\sigma}\sim N(0,1)
U=σX−μ∼N(0,1)
由此可以直接用
Φ
\Phi
Φ来计算一些变量:
P
(
X
≤
c
)
=
Φ
(
c
−
μ
σ
)
P
(
a
<
X
≤
b
)
=
Φ
(
b
−
μ
σ
)
−
Φ
(
a
−
μ
σ
)
P(X\le c) = \Phi(\frac{c-\mu}{\sigma})\\ P(a\lt X\le b) =\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})
P(X≤c)=Φ(σc−μ)P(a<X≤b)=Φ(σb−μ)−Φ(σa−μ)
正态分布的期望和方差
不难得出,若
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2),由于
U
=
x
−
μ
σ
∼
N
(
0
,
1
)
U=\cfrac{x-\mu}{\sigma}\sim N(0,1)
U=σx−μ∼N(0,1),则:
E
(
X
)
=
E
(
μ
)
+
σ
E
(
U
)
=
μ
V
a
r
(
X
)
=
V
a
r
(
μ
+
σ
U
)
=
σ
2
E(X)=E(\mu)+\sigma E(U)=\mu\\ Var(X) = Var(\mu+\sigma U)=\sigma^2
E(X)=E(μ)+σE(U)=μVar(X)=Var(μ+σU)=σ2
正态分布的3 σ \sigma σ原则
设随机变量
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2),则:
P
(
μ
−
k
σ
<
X
<
μ
+
k
σ
)
=
P
(
∣
X
−
μ
σ
∣
<
k
)
=
Φ
(
k
)
−
Φ
(
−
k
)
=
2
Φ
(
k
)
−
1
P(\mu-k\sigma \lt X\lt \mu+k\sigma) =P(|\frac{X-\mu}{\sigma}|\lt k) = \Phi(k)-\Phi(-k)=2\Phi(k)-1
P(μ−kσ<X<μ+kσ)=P(∣σX−μ∣<k)=Φ(k)−Φ(−k)=2Φ(k)−1
当
k
=
1
,
2
,
3
k=1,2,3
k=1,2,3时,有:
P
(
μ
−
σ
<
X
<
μ
+
σ
)
=
2
Φ
(
1
)
−
1
=
0.6825
,
P
(
μ
−
2
σ
<
X
<
μ
+
2
σ
)
=
2
Φ
(
2
)
−
1
=
0.9545
,
P
(
μ
−
3
σ
<
X
<
μ
+
3
σ
)
=
2
Φ
(
3
)
−
1
=
0.9973
,
P(\mu-\sigma<X<\mu+\sigma)=2\Phi(1)-1=0.6825,\\ P(\mu-2\sigma<X<\mu+2\sigma)=2\Phi(2)-1=0.9545,\\ P(\mu-3\sigma<X<\mu+3\sigma)=2\Phi(3)-1=0.9973,\\
P(μ−σ<X<μ+σ)=2Φ(1)−1=0.6825,P(μ−2σ<X<μ+2σ)=2Φ(2)−1=0.9545,P(μ−3σ<X<μ+3σ)=2Φ(3)−1=0.9973,
这是正态分布的重要性质,可用于判断某个随机变量是否近似服从正态分布(三项都基本满足)
在生产中某产品的质量要求常规定在其上、下控制限,若上、下控制限能覆盖区间
(
μ
−
3
σ
,
μ
+
3
σ
)
(\mu-3\sigma,\mu+3\sigma)
(μ−3σ,μ+3σ),则称该生产过程受控制,并称其比值:
C
p
=
上控制限
−
下控制限
6
σ
C_p = \frac{上控制限-下控制限}{6\sigma}
Cp=6σ上控制限−下控制限
为过程能力指数,当
C
p
<
1
C_p<1
Cp<1时,认为生产过程不足;当
C
p
≥
1.33
C_p\ge 1.33
Cp≥1.33时,认为生产过程正常;当为其他值时,认为生产过程不稳定,需要改进
5.2 均匀分布
5.2.1 均匀分布的密度函数和分布函数
若随机变量
X
X
X的密度函数为:
p
(
x
)
=
{
1
b
−
a
,
a
<
x
<
b
0
,
其他
p(x)=\left\{ \begin{aligned} &\frac{1}{b-a} ,&a<x<b\\ &0 ,&其他 \end{aligned} \right.
p(x)=⎩
⎨
⎧b−a1,0,a<x<b其他
则称
X
X
X服从区间
(
a
,
b
)
(a,b)
(a,b)上的均匀分布,记作
X
∼
U
(
a
,
b
)
X\sim U(a,b)
X∼U(a,b),其分布函数为:
F
(
x
)
=
{
0
,
x
<
a
x
−
a
b
−
a
,
a
≤
x
<
b
1
,
x
≥
b
F(x)=\left\{ \begin{aligned} & 0,&x<a\\ &\frac{x-a}{b-a},&a\le x<b\\ &1,&x\ge b \end{aligned} \right.
F(x)=⎩
⎨
⎧0,b−ax−a,1,x<aa≤x<bx≥b
均匀分布又称为平顶分布。
5.2.2 均匀分布的期望和方差
若
X
∼
U
(
a
,
b
)
,
X\sim U(a,b),
X∼U(a,b),则
E
(
X
)
=
∫
a
b
x
b
−
a
d
x
=
b
2
−
a
2
2
(
b
−
a
)
=
a
+
b
2
V
a
r
(
X
)
=
(
b
−
a
)
2
12
E(X)=\int_a^b \frac{x}{b-a}dx = \frac{b^2-a^2}{2(b-a)}=\frac{a+b}2\\ Var(X) =\frac{(b-a)^2}{12}
E(X)=∫abb−axdx=2(b−a)b2−a2=2a+bVar(X)=12(b−a)2
5.3 指数分布
5.3.1 指数分布的密度函数和分布函数
若随机变量
X
X
X的密度函数为:
p
(
x
)
=
{
λ
e
−
λ
x
,
x
≥
0
,
0
,
x
<
0
p(x)=\left\{ \begin{aligned} & \lambda e^{-\lambda x},&x\ge0,\\ & 0 ,&x<0 \end{aligned} \right.
p(x)={λe−λx,0,x≥0,x<0
则称
X
X
X服从指数分布,记作
X
∼
E
x
p
(
λ
)
X\sim Exp(\lambda)
X∼Exp(λ),其中参数
λ
>
0
\lambda >0
λ>0,指数分布的分布函数为
F
(
x
)
=
{
1
−
e
−
λ
x
,
x
≥
0
0
,
x
<
0
F(x) =\left\{ \begin{aligned} &1-e^{-\lambda x},&x\ge 0\\ &0,&x <0 \end{aligned} \right.
F(x)={1−e−λx,0,x≥0x<0
指数分布是一种偏态分布,由于指数分布只可能取非负实数,所以指数分布通常被用作各种"寿命"分布
5.3.2 指数分布的期望和方差
设随机变量
X
∼
E
x
p
(
λ
)
X\sim Exp(\lambda)
X∼Exp(λ),则
E
(
X
)
=
1
λ
V
a
r
(
X
)
=
1
λ
2
E(X)=\frac 1\lambda\\ Var(X) = \frac {1}{\lambda^2}
E(X)=λ1Var(X)=λ21
定理 5.2 指数分布的无记忆性
如果随机变量
X
∼
E
x
p
(
λ
)
X\sim Exp(\lambda)
X∼Exp(λ),则对任意
s
>
0
,
t
>
0
s>0,t>0
s>0,t>0有:
P
(
X
>
s
+
t
∣
X
>
s
)
=
P
(
X
>
t
)
P(X>s+t| X>s) = P(X>t)
P(X>s+t∣X>s)=P(X>t)
和几何分布的无记忆性类似的含义,证明也是类似的,用条件概率算算
5.4 伽马分布
称以下函数:
Γ
(
α
)
=
∫
0
∞
x
α
−
1
e
−
x
d
x
\Gamma(\alpha)=\int_0 ^\infty x^{\alpha-1}e^{-x}dx
Γ(α)=∫0∞xα−1e−xdx
为伽马函数,其中参数
α
>
0
\alpha>0
α>0,伽马函数具有如下性质:
- Γ ( 1 ) = 1 , Γ ( 1 2 ) = π \Gamma(1) = 1,\Gamma(\frac 12) = \sqrt {\pi} Γ(1)=1,Γ(21)=π
- Γ ( α + 1 ) = α Γ ( α ) \Gamma(\alpha+1) = \alpha \Gamma(\alpha) Γ(α+1)=αΓ(α),当 α \alpha α为自然数 n n n时,有 Γ ( n + 1 ) = n Γ ( n ) = n ! \Gamma(n+1) = n\Gamma(n) = n! Γ(n+1)=nΓ(n)=n!
5.4.1 伽马分布
若随机变量
X
X
X的密度函数为
p
(
x
)
=
{
λ
α
Γ
(
α
)
x
α
−
1
e
−
λ
x
,
x
≥
0
,
0
,
x
<
0
,
p(x) = \left \{ \begin{aligned} & \frac{\lambda ^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x},&x\ge 0,\\ &0,&x<0, \end{aligned} \right.
p(x)=⎩
⎨
⎧Γ(α)λαxα−1e−λx,0,x≥0,x<0,
则称
X
X
X服从伽马分布,记作
X
∼
G
a
(
α
,
λ
)
X\sim Ga(\alpha,\lambda)
X∼Ga(α,λ)。其中
α
\alpha
α为形状参数,
λ
>
0
\lambda>0
λ>0为尺度参数,如下图所示:
- 当 0 < α < 1 0<\alpha<1 0<α<1时, p ( x ) p(x) p(x)是严格下降函数,且在 x = 0 x=0 x=0处有奇异点
- 当 α = 1 \alpha=1 α=1时, p ( x ) p(x) p(x)是严格下降函数,且在 x = 0 x=0 x=0处, p ( 0 ) = λ p(0)=\lambda p(0)=λ
- 当 1 < α ≤ 2 1<\alpha\le 2 1<α≤2时, p ( x ) p(x) p(x)是单峰函数,先上凸、后下凸
- 当 2 < α 2<\alpha 2<α时, p ( x ) p(x) p(x)是单峰函数,先下凸、中间上凸、后下凸,且 α \alpha α越大, p ( x ) p(x) p(x)越近似于正态密度函数,但伽马分布总是偏态分布, α \alpha α越小其偏斜程度越严重
5.4.2 伽马分布的期望和方差
若
X
∼
G
a
(
α
,
λ
)
X\sim Ga(\alpha,\lambda)
X∼Ga(α,λ),则:
E
(
X
)
=
α
λ
V
a
r
(
X
)
=
α
λ
2
E(X) = \frac {\alpha}{\lambda}\\ Var(X) = \frac{\alpha}{\lambda^2}
E(X)=λαVar(X)=λ2α
5.4.3 伽马分布的两个特例
伽马分布有两个常用的特例:
-
α = 1 \alpha=1 α=1时的伽马分布就是指数分布,即
G a ( 1 , λ ) = E x p ( λ ) Ga(1,\lambda) = Exp(\lambda) Ga(1,λ)=Exp(λ) -
称 α = n 2 , λ = 1 2 \alpha=\frac n2,\lambda =\frac 12 α=2n,λ=21时的伽马分布是自由度为 n n n的 χ 2 \chi^2 χ2(卡方分布),记为 χ 2 ( n ) \chi^2(n) χ2(n),即
G a ( n 2 , 1 2 ) = χ 2 ( n ) Ga(\frac n2,\frac 12) = \chi^2(n) Ga(2n,21)=χ2(n)
其密度函数为:
p ( x ) = { 1 2 n 2 Γ ( n 2 ) e − x 2 x n 2 − 1 , x ≥ 0 0 , x < 0 p(x)=\left\{ \begin{aligned} &\frac {1}{2^{\frac n2}\Gamma(\frac n2)}e^{-\frac x2}x^{\frac n2 -1},&x\ge0\\ & 0 ,& x<0 \end{aligned} \right. p(x)=⎩ ⎨ ⎧22nΓ(2n)1e−2xx2n−1,0,x≥0x<0
容易得到
χ
2
\chi^2
χ2分布的期望和方差为:
E
(
X
)
=
n
,
V
a
r
(
X
)
=
2
n
E(X) = n, Var(X) = 2n
E(X)=n,Var(X)=2n
6. 随机变量函数的分布
设 y = g ( x ) y = g(x) y=g(x)是定义在 R \R R上的一个函数, X X X是一个随机变量,那么 Y = g ( X ) Y=g(X) Y=g(X)作为 X X X的函数,同样也是一个随机变量。那么如何在已知随机变量 X X X的分布下,求出另一个随机变量 Y = g ( X ) Y = g(X) Y=g(X)的分布。
6.1 离散随机变量函数的分布
设 Y = g ( X ) Y=g(X) Y=g(X),如果有 g ( X 1 ) = g ( X 2 ) g(X_1) = g(X_2) g(X1)=g(X2),就将这两个的概率合并然后相加即可。
6.2 连续随机变量函数的分布
离散随机变量的函数仍然是离散的,但连续随机变量 X X X的函数 Y = g ( X ) Y = g(X) Y=g(X)不一定为连续随机变量:
6.2.1 函数值为离散随机变量
在这种情况下,只需将
Y
Y
Y的可能取值一一列出,再将
Y
Y
Y取各种可能值的概率求出即可。例如,设
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2),
Y
=
{
0
,
X
<
μ
,
1
,
X
≥
μ
Y=\left\{ \begin{aligned} & 0 ,& X\lt \mu,\\ & 1 ,& X\ge \mu \end{aligned} \right.
Y={0,1,X<μ,X≥μ
容易计算得出
Y
Y
Y服从
p
=
0.5
p=0.5
p=0.5的0-1分布
6.2.2 函数为严格单调函数
当 g ( x ) g(x) g(x)为严格单调函数时,有以下定理:
定理6.1 随机变量函数的密度函数
设
X
X
X是连续随机变量,其密度函数为
p
X
(
x
)
p_X(x)
pX(x),
Y
=
g
(
X
)
Y= g(X)
Y=g(X)是另一个连续随机变量。若
y
=
g
(
x
)
y=g(x)
y=g(x)严格单调,其反函数
h
(
y
)
h(y)
h(y)有连续导函数,则
Y
=
g
(
x
)
Y = g(x)
Y=g(x)的密度函数为:
p
Y
(
y
)
=
{
p
X
[
h
(
y
)
]
∣
h
′
(
y
∣
)
,
a
<
y
<
b
0
,
其他
p_Y(y) =\left \{ \begin{aligned} &p_X[h(y)]|h'(y|),&a\lt y \lt b\\ & 0 , & 其他 \end{aligned} \right .
pY(y)={pX[h(y)]∣h′(y∣),0,a<y<b其他
其中
a
=
m
i
n
{
g
(
−
∞
)
,
g
(
∞
}
,
b
=
m
a
x
{
g
(
−
∞
)
,
g
(
∞
)
}
a=min\{g(-\infty),g(\infty\},b=max\{g(-\infty),g(\infty)\}
a=min{g(−∞),g(∞},b=max{g(−∞),g(∞)}
证明: p110
通过这个定理,能够得到一些有用的结论:
定理6.2 正态分布的线性变换也是正态分布
设随机变量 X X X,服从正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2),则当 a ≠ 0 a\ne 0 a=0时,有 Y = a X + b ∼ N ( a μ + b , a 2 σ 2 ) Y = aX+b \sim N(a\mu+b,a^2\sigma^2) Y=aX+b∼N(aμ+b,a2σ2)/,证明方法就是使用定理6.1
即使分布完全相同,但两个随机变量可能不相等,所以要明确,分布相同于随机变量相等是两个完全不同的概念。例如:
X
∼
N
(
0
,
2
2
)
,
Y
=
−
X
X\sim N(0,2^2),Y=-X
X∼N(0,22),Y=−X
容易证明
Y
∼
N
(
0
,
2
2
)
Y\sim N(0,2^2)
Y∼N(0,22)
定理6.3 对数正态分布
设随机变量
X
∼
N
(
μ
,
σ
2
)
X\sim N(\mu,\sigma^2)
X∼N(μ,σ2),则
Y
=
e
X
Y= e^{X}
Y=eX的概率密度函数为:
p
Y
(
y
)
=
{
1
2
π
y
σ
e
−
(
ln
y
−
μ
)
2
2
σ
2
,
y
>
0
0
,
y
≤
0
p_Y(y)=\left \{ \begin{aligned} &\frac {1}{\sqrt{2\pi}y\sigma}e^{-\cfrac{(\ln y-\mu)^2}{2\sigma^2}},&y>0\\ &0,&y\le0 \end{aligned} \right.
pY(y)=⎩
⎨
⎧2πyσ1e−2σ2(lny−μ)2,0,y>0y≤0
证明也是使用定理6.1
这个分布被称为对数正态分布,记为 L N ( μ , σ 2 ) LN(\mu,\sigma^2) LN(μ,σ2),其中 μ \mu μ称为对数均值, σ 2 \sigma ^2 σ2称为对数方差,对数正态分布是一个偏态分布,也是一个常用分布,实际中有不少随机变量服从对数正态分布,譬如:
- 绝缘材料的寿命服从对数正态分布
- 设备故障的维修时间服从对数正态分布
- 家中仅有两个小孩的年龄差页服从对数正态分布
定理 6.4 伽马分布
设随机变量 X X X服从伽马分布 G a ( α , λ ) Ga(\alpha,\lambda) Ga(α,λ),则当 k > 0 k>0 k>0时,有 Y = k X ∼ G a ( α , λ k ) Y=kX\sim Ga(\alpha,\frac{\lambda}{k}) Y=kX∼Ga(α,kλ)
一样的证明方法
定理6.5 获取任意分布的随机数
若随机变量 X X X的分布函数 F X ( x ) F_X(x) FX(x)为严格单调增的连续函数,其反函数 F − 1 ( y ) F^{-1}(y) F−1(y)存在,则 Y = F X ( X ) Y=F_X(X) Y=FX(X)服从 ( 0 , 1 ) (0,1) (0,1)上的均匀分布 U ( 0 , 1 ) U(0,1) U(0,1)
证明:p112
这一定理表明:均匀分布在连续分布类中有特殊地位,任一个连续随机变量 X X X都可以通过其分布函数 F ( x ) F(x) F(x)与均匀分布随机变量 U U U发生关系。
例如
X
X
X服从指数分布
E
x
p
(
λ
)
Exp(\lambda)
Exp(λ),其分布函数为
F
(
x
)
=
1
−
e
−
λ
x
F(x)=1-e^{-\lambda x}
F(x)=1−e−λx,当
x
x
x换成
X
X
X后,有,有
U
=
1
−
e
−
λ
X
或
X
=
1
λ
ln
1
1
−
U
U=1-e^{-\lambda X}\ \ \ 或\ \ \ X=\frac 1\lambda \ln \frac {1}{1-U}
U=1−e−λX 或 X=λ1ln1−U1
后一式表明,由均匀分布
U
(
0
,
1
)
U(0,1)
U(0,1)的随机数可以得到指数分布
E
x
p
(
λ
)
Exp(\lambda)
Exp(λ)的随机数:
x
i
=
1
λ
ln
1
1
−
u
i
,
i
=
1
,
2
,
⋯
,
n
,
⋯
x_i = \frac 1 \lambda \ln\frac {1}{1-u_i},i=1,2,\cdots,n,\cdots
xi=λ1ln1−ui1,i=1,2,⋯,n,⋯
6.3 函数为其他形式时
如果使用定理6.1寻求随机变量 Y = g ( X ) Y =g(X) Y=g(X)的分布有困难,可直接由Y的分布函数 F Y ( y ) = P ( g ( X ) ≤ y ) F_Y(y)=P(g(X)\le y) FY(y)=P(g(X)≤y)出发,按函数 g ( x ) g(x) g(x)的特点作个案处理,两个例子:
设随机变量 X X X服从伽马分布 G a ( α , λ ) Ga(\alpha,\lambda) Ga(α,λ),则当 k > 0 k>0 k>0时,有 Y = k X ∼ G a ( α , λ k ) Y=kX\sim Ga(\alpha,\frac{\lambda}{k}) Y=kX∼Ga(α,kλ)
一样的证明方法