第3章 多维随机变量及其分布
3.1 复习笔记
一、多维随机变量及其联合分布
1多维随机变量
定义:如果X1(ω),X2(ω),…,Xn(ω)是定义在同一个样本空间Ω={ω}上的n个随机变量,则称X(ω)=(X1(ω),X2(ω),…,Xn(ω))为n维(或n元)随机变量或随机向量.
2联合分布函数
(1)定义
对任意的n个实数x1,x2,…,xn,则n个事件{X1≤x1},{X2≤x2},…,{Xn≤xn}同时发生的概率F(x1,x2,…,xn)=P(X1≤x1,X2≤x2,…,Xn≤xn)称为n维随机变量(X1,X2,…,Xn)的联合分布函数.
(2)联合分布函数F(x,y)的基本性质
①单调性:F(x,y)分别对x或y是单调非减的,即当x1<x2时,有F(x1,y)≤F(x2,y),当y1<y2时,有F(x,y1)≤F(x,y2).
②有界性:对任意的x或y,有0≤F(x,y)≤1,且
③右连续性:对每个变量都是右连续的,即F(x+0,y)=F(x,y),F(x,y+0)=F(x,y).
④非负性:对任意的a<b,c<d有
P(a<X≤b,c<Y≤d)=F(b,d)-F(a,d)-F(b,c)+F(a,c)≥0
3联合分布列
(1)定义:如果二维随机变量(X,Y)只取有限个或可列个数对(xi,yj),则称(X,Y)为二维离散随机变量,称Pij=P(X=xi,Y=yj),i,j=1,2,…为(X,Y)的联合分布列,也可如下用表格形式记联合分布列
(2)联合分布列的基本性质:
①非负性:Pij≥0;
②正则性:Pij≥0,
求二维离散随机变量的联合分布列,关键是写出二维随机变量可能取的数对及其发生的概率.
4联合密度函数
(1)定义:如果存在二元非负函数P(x,y),使得二维随机变量(x,y)的分布函数F(x,y)可表示为
则称(X,Y)为二维连续随机变量,称P(u,v)为(X,Y)的联合密度函数.
若F(x,y)偏导数存在,则有联合密度函数
(2)联合密度函数的基本性质:
①非负性:p(x,y)≥0;
②正则性:
若G为平面上的一个区域,则事件{(X,Y)∈G}的概率可表示为在G上对p(x,y)的二重积分.
注:在使用上式时,关键是找出p(x,y)的非零区域与G的交集部分,确定积分区域,然后设法化成累次积分,最后计算出结果,计算中要注意如下事实,“直线的面积为零”,故积分区域的边界线是否在积分区域内不影响概率计算结果.
5常用多维分布
(1)多项分布
进行n次独立重复试验,如果每次试验有r个互不相容结果:A1,A2,…Ar,之一发生,且每次试验中Ai发生的概率为pi=P(Ai),i=1,2,…,r,且p1+p2+…+pr=1.记Xi为n次独立重复试验中Ai出现的次数,i=1,2,…,r.则(X1,X2,…,Xr)取值(n1,n2,…,nr)的概率,即A1出现n1次,A2出现n2次,……,Ar出现nr次的概率为
这个联合分布列称为r项分布,又称多项分布,记为M(n,p1,p2,…,pr).这个概率是多项式(p1+p2+pr)n展开式中的一项,故其和为1.多项分布是二项分布的推广,当r=2时,即为二项分布.
(2)多维超几何分布
若袋中有N个球,其中有Ni个i号球,i=1,2,…,r,且N=N1+N2+…+Nr,从中任意取出n个,若记Xi为取出的n个球中i号球的个数,i=1,2,…,r,则
其中n1+n2+…+nr=n
(3)多维均匀分布
设D为Rn中的一个有界区域,其度量(平面的为面积,空间的为体积等)为SD,如果多维随机变量(X1,X2,…,Xn)的联合密度函数为
则称(X1,X2,…,Xn)
服从D上的多维均匀分布,记为(X1,X2,…,Xn)~U(D).
二维均匀分布所描述的随机现象就是向平面区域D中随机投点,如果该点坐标(X,Y)落在D的子区域G中的概率只与G的面积有关,而与G的位置无关.则
(4)二元正态分布
如果二维随机变量(X,Y)的联合密度函数为
则称(X,Y)服从二元正态分布,记为(X,Y)~N(μ1,μ2,σ12,σ22,ρ).其中五个参数的取值范围分别是
-∞<μ1,μ2<∞,σ1、σ1>0,-1≤ρ≤1.
注:μ1,μ2分别是X与Y的均值,σ12,σ22分别是X与Y的方差,ρ是X与Y的相关系数.
二、边际分布与随机变量的独立性
1边际分布函数
如果在二维随机变量(X,Y)的联合分布函数F(x,y)中令y→∞,由于{Y<∞}为必然事件,故可得
这是由(X,Y)的联合分布函数F(X,Y)求得的X的分布函数,被称为X的边际分布,记为FX(X)=F(X,∞).
类似地,在F(X,Y)中令x→∞,可得Y的边际分布FY(y)=F(∞,y).
2边际分布列
在二维离散随机变量(X,Y)的联合分布列{P(X=xi,Y=yj)}中,对j求和所得的分布列
被称为X的边际分布列.
类似地,对i求和所得的分布列
称为Y的边际分布列.
3边际密度函数
如果二维连续随机变量(X,Y)的联合密度函数为p(x,y),因为
其中pX(x)和pY(y)分别为
它们恰好处于密度函数位置,故称上式给出的pX(x)为X的边际密度函数,pY(y)为Y的边际密度函数.
注意:由联合密度函数求边际密度函数时,要注意积分区域的确定.具有相同边际分布的多维联合分布可以是不同的.
4随机变量间的独立性
定义:设n维随机变量(X1,X2,…,Xn)的联合分布函数为F(x1,x2,…,xn),Fi(xi)为Xi的边际分布函数.如果对任意n个实数X1,X2,…,Xn,有
则称X1,X2,…,Xn相互独立.
对于离散随机变量,如果对其任意n个实数x1,x2,…,xn,有
则称X1,X2,…,Xn相互独立.
对于连续随机变量,如果对任意n个实数x1,x2,…,xn,有
则称X1,X2,…,Xn相互独立.
注意:证明随机变量是否独立时,常用定义来证明.
三、多维随机变量函数的分布
1多维离散随机变量函数的分布
设(X1,X2,…,Xn)为n维离散随机变量,则某一函数Y=g(X1,X2,…,Xn)是一维离散随机变量.当(X1,X2,…,Xn)所有可能取值较少时,可将Y的取值一一列出,然后再合并整理就可得出结果.
2最大值与最小值的分布
(1)最大值分布:Y=max{X1,X2,…,Xn}的分布函数为
(2)最小值分布:Y=min{X1,X2,…,Xn}的分布函数为
3连续场合的卷积公式
定理:设X与Y是两个相互独立的连续随机变量,其密度函数分别为pX(x)和pY(y),则其和Z=X+Y的密度函数为
注意:
(1)二项分布的可加性:设随机变量X~b(n,p),Y~b(m,p),且X与Y独立,则Z=X+Y~b(n+m,p).
(2)伽马分布的可加性:设随机变量X~Ga(α1,λ),Y~Ga(α2,λ),且X与Y独立,则
Z=X+Y~Ga(α1+α2,λ).
(3)m个独立同分布的指数变量之和为伽玛变量,即
(4)m个独立的χ2变量之和为χ2变量(χ2分布的可加性),即
χ2(n1)*χ2(n2)*…*χ2(nm)=χ2(n1+n2+…+nm)
4变量变换法
(1)变量变换法
设二维随机变量(X,Y)的联合密度函数为p(x,y),如果函数
有连续偏导数,且存在唯一的反函数
其变换的雅可比行列式
若
则(U,V)的联合密度函数为p(u,v)=p(x(u,v),y(u,v))|J|.
(2)增补变量法
增补变量法是变量变换法的变形,为了求出二维连续随机变量(X,Y)的函数u=g(X,Y)的密度函数,增补一个新的随机变量y=h(X,Y),一般令V=X或V=Y.先用变换法求出(U,V)的联合密度函数p(u,v),再对p(u,v)关于v积分,从而得出关于U的边际密度函数.
下面有两个使用的公式:
①积的公式:设随机变量X与Y相互独立,其密度函数分别为pX(x)和pY(y).则U=XY的密度函数为
②商的公式:设随机变量X与Y,相互独立,其密度函数分别为pX(x)和pY(y).则U=X/Y的密度函数为
四、多维随机变量的特征数
1多维随机变量函数的数学期望
定理:若二维随机变量(X,Y)的分布用联合分布列P(X=xi,Y=yj)或用联合密度函数p(x,y)表示,则Z=g(X,Y)的数学期望为
这里所涉及的数学期望都假设存在.
在连续场合(离散场合也类似)有:
(1)当g(X,Y)=X时,可得X的数学期望为
(2)当g(X,Y)=(X-E(X))2时,可得X的方差为
类似地可给出Y的数学期望与方差的公式.
注意:利用以上定理,虽然可以省略求随机变量函数的分布,但在某些场合所涉及的求和或求积难以计算,此时只能分两步进行:①先求随机变量函数Z=g(X1,X2,…,Xn)的分布;②由Z的分布去求E(Z).
2数学期望与方差的运算性质
(1)设(X,Y)是二维随机变量,则有E(X+Y)=E(X)+E(Y).简述为“和的期望等于期望的和”,推广到n维随机变量场合,即
E(X1+X2+…+Xn)=E(X1)+E(X2)+…+E(Xn)
(2)若随机变量X与Y相互独立,则有E(XY)=E(X)E(Y).简述为:在独立场合,随机变量乘积的数学期望等于数学期望的乘积,推广到n维随机变量场合,即若X1,X2,…,Xn相互独立,则有
E(X1X2…Xn)=E(X1)E(X2)…E(Xn)
(3)若随机变量X与Y相互独立,则有Var(X±Y)=Var(X)+Var(Y).表明独立变量代数和的方差等于各方差之和.
注意:此性质对标准差不成立,即σ(X+Y)≠σ(X)+σ(Y).独立变量代数和的标准差只能通过“先方差,后标准差”求得,即
(4)推广到n维随机变量场合,即若X1,X2,…,Xn相互独立,则有
Var(X1±X2±…±Xn)=Var(X1)+Var(X2)+…+Var(Xn).
这表明对独立随机变量来说,它们之间无论是相加或相减,其方差总是逐个累积起来,只会增加,不会减少.
对于n个相互独立同分布(方差为σ2)的随机变量X1,X2,…,Xn,其算术平均的方差为
3协方差
(1)定义:设(X,Y)是一个二维随机变量,若E[(X-E(X))(Y-E(Y))]存在,则称此数学期望为X与Y的协方差,或称为X与Y的相关(中心)矩,并记为
Cov(X,Y)= E[(X-E(X))(Y-E(Y))];
特别有Cov(X,X)=Var(X).
注意:协方差可正可负,也可为零.
(2)性质:Cov(X,Y)=E(XY)-E(X)E(Y).
(3)若随机变量X与Y相互独立,则Cov(X,Y)=0.反之不然.(表明“不相关”是比“独立”更弱的一个概念,因为相关性只是指一种线性关系,而独立性则是一种更广的关系,包括平方关系,对数关系).
(4)对任意二维随机变量(X,Y),有
Var(X±Y)=Var(X)+Var(Y)±2Cov(X,Y)
推广到更多个随机变量场合,即对任意n个随机变量X1,X2,…,Xn,有
(5)协方差Cov(X,Y)的计算与X,Y的次序无关,即Cov(X,Y)=Cov(Y,X).
(6)任意随机变量X与常数a的协方差为零,即Cov(X,a)=0.
(7)对任意常数a,b,有Cov(aX,bY)=abCov(X,Y).
(8)设X,Y,Z是任意三个随机变量,则Cov(X+Y,Z)=Cov(X,Z)+ Cov(Y,Z).
4相关系数
协方差是有量纲的,而相关系数是没有的.
(1)定义:设(X,Y)是一个二维随机变量,Var(X)=σX2>0,Var(Y)=σY2>0.则称
为X与Y的(线性)相关系数.
从中可以看出:相关系数Corr(X,Y)与协方差Cov(X,Y)是同符号的,即同为正,或同为负,或同为零.这说明,从相关系数的取值也可反映出X与Y的正相关、负相关和不相关.
(2)引理:二维随机变量(X,Y),若X与Y的方差都存在,且记σX2=Var(X),σY2=Var(Y),则有[Cov(X,Y)]2≤σX2σY2.
(3)性质:-1≤Corr(X,Y)≤1或|Corr(X,Y)|≤1.
这个性质表明:相关系数介于-1与1之间.
(4)性质:Corr(X,Y)=±1的充要条件是X与Y间几乎处处有线性关系,即存在a(≠0)与b,使得P(Y=aX+b)=1其中当Corr(X,Y)=1时,有a>0;当Corr(X,Y)=-1时,有a<0.
小结论:一般场合,独立必导致不相关,但不相关推不出独立.
(5)性质:在二维正态分布N(μ1,μ2,σ12,σ22,ρ)场合,不相关与独立是等价的.
5随机向量的数学期望向量与协方差矩阵
(1)定义:记n维随机向量为X=(X1,X2,…,Xn)′若其每个分量的数学期望都存在,则称E(X)=(E(X1),E(X2),…,E(Xn))′为n维随机向量X的数学期望向量,简称为X的数学期望,而称
为该随机向量的方差一协方差矩阵,简称协方差阵,记为Cov(X).
(2)定理:n维随机向量的协方差矩阵Cov(X)=(Cov(Xi,Xj))n×n是一个对称的非负定矩阵.
五、条件分布与条件期望
1条件分布
对二维随机变量(X,Y)而言,随机变量X的条件分布,就是在给定Y取某个值的条件下X的分布.
(1)离散随机变量的条件分布
定义:对一切使的yi,称
为给定Y=yj条件下X的条件分布列.
同理,对一切使的xi,称
为给定X=xi条件下Y的条件分布列.
(2)离散随机变量的条件分布函数
定义:给定Y=y条件下X的条件分布函数为
给定X=x条件下Y的条件分布函数为
2连续随机变量的条件分布
定义:对一切使PY(y)>0的y,给定Y=y条件下X的条件分布函数和条件密度函数分别为
同理对一切使PX(x)>0的x,给定X=x条件下Y的条件分布函数和条件密度函数分别为:
注意:条件分布函数F(x|y)和条件密度函数P(x|y),都还是条件Y=y的函数,不同的条件(如Y=y1和Y=y2)下,其分布函数F(x|y1)和F(x|y2)是不同的,条件密度函数p(x|y1)和p(x|y2)也是不同的.
小结:二维正态分布的边际分布和条件分布都是一维正态分布.
3连续条件下的全概率公式和贝叶斯公式
(1)全概率公式:密度函数形式:
(2)贝叶斯公式:密度函数形式:
注意:由边际分布无法得到联合分布,但由边际分布和条件分布就可以得到联合分布.另外,联合分布一样,边际分布不一定一样,反之,亦然.
4条件数学期望
条件分布的数学期望称为条件数学期望,它的定义如下: