第一章、概率论的基本概念
1. 随机事件的直观意义及运算
(1) 随机试验和随机事件
随机试验是对随机现象进行的观察和实验:
-
① 可在相同条件下重复进行 → 相对相同而非绝对
-
② 可以弄清试验的全部可能结果 → 可以扩展到不可数无穷
-
③ 试验前不能预言将出现哪一个结果
-
必然事件:随机事件中肯定发生的事件,记作 Ω。
-
不可能事件:记作 ∅。
-
随机事件:可能发生也可能不发生的事情。
(2) 基本事件:一次试验中必发生一个且仅发生一个的最简单事件。
- 不可再分解,最简单,具有相对性。
- 可组合成复合事件。
2. 随机事件的关系及其运算
样本点与样本空间对应基本事件,复合事件由基本事件构成。
若 ω∈A,则称事件 A 发生。
(1) 包含关系:∅⊂A⊂Ω
(2) 和事件:A∪B 或 ⋃i=1nAi
- ⋃i=1nAi 表示事件列 A1,A2,… 中至少有一个发生。
(3) 积事件:A∩B 或 AB
- ⋂i=1nAi
(4) 互不相容事件:AB=∅
- 事件 A,B 不可能同时发生(互斥)。
- A1,A2,…,An 两两互不相容。
(5) 对立事件 (逆事件):
- AB=∅ 且 A∪B=Ω
- A=Bˉ,B=Aˉ
(6) 差事件:
- A−B={ω∣ω∈A 且 ω∈/B}
- A−B=A−AB=(A∪B)−B=Aˉ∩B
(7) 运算律:
- 分配律:(A∩B)∪C=(A∪C)∩(B∪C)
- 分配律:(A∪B)∩C=(A∩C)∪(B∩C)
- 德·摩根律:A∪B=Aˉ∩Bˉ
- 对偶律:A∩B=Aˉ∪Bˉ
3. 概率的直观意义
概率是对随机事件发生可能性大小的度量(测度)。
4. 频率和统计概率
fn(A)=mn 为频率。
频率具有稳定性与不确定性,频率稳定于概率。
概率性质:
① 0≤P(A)≤1
② P(Ω)=1
③ 若 A1,A2,…,Am 互不相容,P(⋃i=1mAi)=∑i=1mP(Ai)
5. 古典概型
① 有且仅有有限多个基本事件
② 等可能性
古典概率 P(A)=基本事件总数A 所含基本事件个数
6. 几何概率
P(A)=μ(Ω)μ(A) (几何测度)
满足可列可加性:P(⋃i=1∞Ai)=∑i=1∞P(Ai)
7. 概率模型与公理化结构
一、可测空间
设随机试验 E 样本空间为 Ω,F 是 Ω 上的事件族满足:
① Ω∈F
② 若 A∈F,则 Aˉ∈F(逆运算封闭)
③ 若 Ai∈F,则 ⋃i=1nAi∈F(有限和封闭,F 为代数)
③’ 若 ⋃i=1∞Ai∈F,则 F 为 σ-代数(可列和封闭)
二、概率空间
设 (Ω,F) 是一可测空间,对 A∈F,定义实数集函数 P(A) 满足:
① 非负性:∀A∈F,0≤P(A)≤1
② 规范性:P(Ω)=1
③ 完全可加性:∀Ai∈F,Ai∩Aj=∅(i=j),有 P(⋃i=1∞Ai)=∑i=1∞P(Ai)
三元体 (Ω,F,P) 称为概率空间。
三、概率性质
- P(∅)=0
- 有限可加性:推论 P(A)+P(Aˉ)=1
- 若 B⊂A,则 P(A)≥P(B)
- P(A−B)=P(A)−P(B)
3. 概率的连续性
若 A1⊃A2⊃… 且 ⋂i=1∞Ai=∅,则 limn→∞P(An)=0。
4. 多除少补原理
P(⋃i=1nAi)=S1−S2+S3−S4+⋯+(−1)n+1Sn
其中 Sk 为所有 k 个事件交集的概率之和。
4. 条件概率 P(A∣B)
记 Ω1=B,F1={C∩B:C∈F} 为缩减样本空间。
PB(A)=P(B)P(AB)
则 PB 是可测空间 (Ω1,F1) 上的概率,构成概率空间 (Ω1,F1,PB)。
5. 乘法公式
P(AB)=P(B)P(A∣B)
或=P(A)P(B∣A)
P(A1A2…An)=P(A1)P(A2∣A1)…P(An∣A1…An−1)
乘积样本空间: Ω1×Ω2×⋯×Ωn={(w1,w2,…,wn)∣wi∈Ωi}
四. 条件概率
-
在 B 已发生的条件下, A 发生的概率 =P(A∣B)
-
设 (Ω,F,P) 是概率空间, A,B∈F 且 P(B)>0。
P(A∣B)=P(B)P(AB)
-
设 B∈F 且 P(B)>0, 则对 ∀A∈F 有 P(A∣B) 对应,集函数 P(⋅∣B) 满足:非负性、规范性、完全可加性。
6. 全概率公式
定理 1.4.3 (全概率公式) 设 (Ω,F,P) 为概率空间, Ai∈F (i=1,2,…,n) 为 Ω 的一个有限划分, 且 P(Ai)>0, 则对任意事件 B∈F 有:
P(B)=∑i=1nP(Ai)P(B∣Ai)
五. 贝叶斯公式
P(Aj∣B)=∑i=1nP(Ai)P(B∣Ai)P(Aj)P(B∣Aj)
六. 事件的独立性, 独立试验模型
1. 相互独立随机事件
(Ω,F,P) 为概率空间, A,B∈F。
若 P(B)>0 且 P(A∣B)=P(A), 则称 B 独立于事件 A。
若 P(A,B)=P(A)P(B), 则称 A,B 相互独立。
⇔P(A∩B)=P(A)P(B)
-
A,B 相互独立 →A,Bˉ;Aˉ,B;Aˉ,Bˉ 相互独立。
-
∀S(1≤s≤n) 及 1≤i1<i2<⋯<is≤n, 有 P(Ai1Ai2…Ais)=P(Ai1)P(Ai2)…P(Ais)。
3. 独立试验模型
① 每次试验条件相同。
② 试验结果互不影响。
4. 重贝努里概型
- 对可测空间 (Ω,F) 的理解:
- 问题1: 能否认为对任意 A∈F, A 都是可测集 (概率测度 P(A) 存在)?
可测空间 (Ω,F) 可以理解为: 可尝试定义概率测度的空间。实际中 σ-代数如何选取与实际问题需要和试验目的有关。
- 问题2: 在任意可测空间 (Ω,F) 上都能定义概率吗?
数学结论: 在任意可测空间 (Ω,F) 上至少可定义一种概率测度。
第二章: 随机变量及其分布函数
一. 随机变量
- 设 (Ω,F,P) 是概率空间, X(ω) 是定义在 Ω 上的单值实函数。若对于 ∀x∈R, 有 {ω:X(ω)≤x}∈F。
保持随机性与统计性
随机变量可以完整地描绘实验结果, 从而可用量化分析方法来研究随机现象的规律性。
注2: {ω:X(ω)≤x}={X≤x}∈F, 使 P{X≤x} 总有意义。
注3: 通常 F 是包含全体 {X≤x} 的最小 σ-代数。
由 σ-代数性质, 有:
{X<x}=⋃k=1∞{X≤x−k1}∈F
{X>x}=Ω−{X≤x}∈F
{X=x}={X≤x}−{X<x}∈F
二. 随机变量的分布函数
称函数 F(x)=P{X≤x}=P{ω:X(ω)≤x} 为随机变量 X 的分布函数 F(x) 或 FX(x)。
性质:
① 单调不降
② F(x)∈[0,1], limx→−∞F(x)=0,limx→+∞F(x)=1
③ 右连续: P{X=x}=F(x)−F(x−0)
三. 离散型随机变量
分布律满足:
① pn≥0(n=1,2,…)
② ∑n=1∞pn=1
四. 常用离散型分布
1. 两点分布
P{X=0}=1−p,P{X=1}=p
2. 二项分布
P{X=k}=Cnkpk(1−p)n−k, 记为 X∼B(n,p)。
3. 几何分布
n重贝努里试验中事件A首次发生时试验次数的分布律。
4. 泊松分布
若 Xn∼B(n,pn), 且 limn→∞npn=λ(λ>0), 则有:
limn→∞P{Xn=k}=k!λke−λ,k=0,1,2…
P{Xn=k}=k!λke−λ,k=0,1,2…
→ 泊松分布
② n 次独立重复实验,“稀有事件”出现的次数可以认为服从泊松分布。
- 超几何分布
→ 极限分布是二项分布 (N→+∞)
四. 连续型随机变量
1. 概率密度
分布函数 F(x),存在非负函数 f(x),∀x 有:
F(x)=∫−∞xf(t)dt
X 有连续型分布,f(x) 为 X 的概率密度函数,称 X 为连续型随机变量。
2. 性质
(1) f(t)≥0
(2) ∫−∞+∞f(t)dt=1
{⇔f(x) 是某个连续型随机变量的概率密度}
P{X=x0}=0⋆→ 不同的概率密度可能对应一个分布函数 F(x)。
不可能事件与 P=0 事件的区别:不可能事件的概率一定为 0,但概率为 0 的事件不一定是不可能事件。
3. 常用连续型分布
① 均匀分布: U(a,b)
f(x)={b−a1,0,a<x<b其他
→ 与有效区间长度成正比。
② 指数分布: P{X>x}=∫x+∞λe−λudu
→ 无后效性: P{X>t+s∣X>t}=P{X>s}
连续型随机变量特点:概率分布具有无后效性。
均匀分布: P{X>x}=1−P{X≤x}
指数分布: P{X>x}=e−λx
③ 正态分布 (Gauss 分布)
ϕ(x;μ,σ2)=2πσ1e−2σ2(x−μ)2/X∼N(μ,σ2)
→ 密度函数
(μ,2πσ1)→ 最高处
σ↓ ,越聚集;σ↑ ,越分散
σ→0 时趋近于 δ (冲激函数)
标准正态分布: Φ(u)=2π1∫−∞ue−2t2dt (μ=0,σ=1)
Φ(−u)=1−Φ(u)
P{x1<X<x2}=Φ(σx2−μ)−Φ(σx1−μ)
分位数: X∼N(0,1)
P{X>uα}=α,uα 称为 α 在标准正态分布下的上侧分位数。
Summary:
F(x)=Φ(x)+S(x)+R(x)
连续 + 离散 + 奇异
第三章、多维随机变量的分布
二维随机变量及其分布
联合分布函数及其性质
X,Y 同处一个可测空间,FX(x)=P{X≤x},FY(y)=P{Y≤y}
- 任意 (x,y)∈R2,称 F(x,y)=P{X≤x,Y≤y} 为随机变量 (X,Y) 的联合概率分布。
- FX(x),FY(y) 称为边缘分布函数。
由联合 → 边缘: limy→+∞F(x,y)=FX(x)
-
P{x1<X≤x2,y1<Y≤y2}=F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)
-
联合分布函数的性质
① 单调不减性: F(x,y) 分别对 x,y 单调不减。
② 有界性: limx→−∞F(x,y)=limy→−∞F(x,y)=0,且 limx→+∞,y→+∞F(x,y)=1。
③ 右连续性: limx→x0+F(x,y)=F(x0,y)。
④ 相容性: 对任意 x1<x2,y1<y2 有 F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)≥0。
二维两点分布示例:
两次抽球,放回与不放回的边缘概率相同,但联合概率不同。
→ 联合分布可推出边缘分布,反之则不行。
联合概率密度:
F(x,y)=∫−∞y∫−∞xf(u,v)dudv
(X,Y) 为连续型随机变量,性质:
- f(x,y)≥0
- ∫−∞+∞∫−∞+∞f(u,v)dudv=1
- ∂x∂y∂2F(x,y)=f(x,y) (若 F(x,y) 在 (x,y) 连续)
- G⊂R2,P{(X,Y)∈G}=∬Gf(x,y)dσ
- fX(x)=∫−∞+∞f(x,y)dy,fY(y)=∫−∞+∞f(x,y)dx
二维均匀分布: 只与区域面积大小有关,与位置无关。
→ 蒙特卡洛模拟: 以近似概率求的近似解。
④ 相容性: 对任意 x1<x2,y1<y2 有 F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)≥0
F(x,y) 满足四条性质 ⇔ 存在 (X,Y) 以 F(x,y) 为分布函数
n 维联合分布函数 → 任意 k 维边缘分布函数
P{X=xi}=Pii=∑j=1∞Pij
二维两点分布:
两次抽球,放回与不放回的边缘概率相同,但联合概率不同。
→ 联合分布可推出边缘分布,反之则不行。
联合概率密度 →
F(x,y)=∫−∞y∫−∞xf(u,v)dudv
(X,Y) 为连续型随机变量
性质:
① f(x,y)≥0
② ∫−∞+∞∫−∞+∞f(u,v)dudv=1
③ ∂x∂y∂F(x,y)=f(x,y)(若 F(x,y) 在 (x,y) 连续)
→ 不连续点只需非负即可
④ G⊂R2,P{(X,Y)∈G}=∬Gf(x,y)dσ
⑤ fX(x)=∫−∞+∞f(x,y)dy
fY(y)=∫−∞+∞f(x,y)dx
二维均匀分布: 只与大小有关,与位置无关。
→ 蒙特卡洛模拟: 以近似概率求的近似解。
0 二维随机变量的独立性
P{X≤x,Y≤y}=P{X≤x}×P{Y≤y}→X 与 Y 相互独立
否则称它们是相依的
① X,Y 相互独立 ⇔F(x,y)=FX(x)FY(y) 对 ∀(x,y) 均成立
② (离散型) X 与 Y 相互独立 ⇔P{X=xi,Y=yj}=P{X=xi}P{Y=yj} 或 pij=pi⋅p⋅j 对 ∀(xi,yj) 均成立
③ (连续型) ⇔f(x,y)=fX(x)fY(y)
0 多维独立性
F(x1,x2,…,xn)=∏i=1nFi(xi)
0 条件分布律:
P{X=xi∣Y=yj}=p⋅jpij
① P{X=xi∣Y=yj}≥0
② ∑i=1+∞P{X=xi∣Y=yj}=1
0 条件概率密度
① 条件分布函数
P{Y−ΔY<Y≤y}>0 且 ∀x∈R,limΔy→0+P{X≤x∣y−ΔY<Y≤y} 存在
此极限为在 Y=y 的条件下,X 的条件分布函数,记作 FX∣Y(x∣y)
若 (X,Y) 是连续型随机变量,f(x,y) 和 fX(x) 在 (x,y) 附近连续且 fX(x)>0
FY∣X(y∣x)=∫−∞+∞f(x,v)dv∫−∞yf(x,v)dv=fX(x)∫−∞yf(x,v)dv
★ fY∣X(y∣x)=FY∣X′(y∣x)=fX(x)f(x,y)
A. 条件概率存在 → 边缘概率密度的非零区间
B. 非零域
C. x/y 取其它值不存在
P(A∣B)=P(B)P(AB)⇒知二求一
○ 条件概率与独立性
① F(x,y)=FX(x)FY(y)(x,y)∈R2
X,Y 相互独立⇔FX∣Y(x,y)=FX(x)(x,y)∈R2
② fX∣Y(x,y)=fX(x)fY(y)
→ 除去0测集 (边缘P零区间)
③ fX(x)=fX∣Y(x,y)
④ fY(y)=fY∣X(x,y)
联合分布函数 → 边缘分布函数
联合分布律 → 边缘分布律
联合分布密度 → 边缘分布密度
条件分布
fY∣X(y∣x)=fX(x)f(x,y)
○ 随机变量函数及其分布
P{X=k}=p(k)k=0,1,…
P{Y=r}=q(r)r=0,1,…
P{X+Y=m}=∑k=0mp(k)q(m−k)→离散卷积
X1,…,Xn 相互独立,Xi∼B(1,p)
一般: 1) X1,…,Xn 相互独立;2) 具有相同类型分布
Y=∑k=1nXk
分布只有参数变化 → 具有可加性
除二项分布,泊松分布也可加。
X1+X2+⋯+Xn∼B(n,p)
反之 X∼B(n,p) 存在 Xi∼B(1,p)。
4 随机变量的函数及其分布
对于连续型随机变量的函数 Y=h(X),其累积分布函数为:
FY(y)=P{Y≤y}=P{h(X)≤y}=P{X∈h−1(−∞,y]}
对于多维随机变量的函数,其联合累积分布函数为:
FY1,…,Yk(y1,…,yk)=P{h1(X1,…,Xn)≤y1,…,hk(X1,…,Xn)≤yk}
概率密度函数为:
fY(y)=FY′(y)=∣a∣1fX(ay−b)
若 X∼N(μ,σ2),则线性函数 Y=aX+b (a=0) 服从正态分布 N(aμ+b,a2σ2)。
该分布具有线性变换不变性。若 a=σ1,b=−σμ,则变换后服从标准正态分布。
① 几种特殊的分布
1. 最大值与最小值
设 M=max(X,Y),N=min(X,Y)。
FM(z)=P{max(X,Y)≤z}=P{X≤z,Y≤z}
若 X,Y 相互独立,FM(z)=FX(z)FY(z)。
注:X,Y 相关 →X,Y 同分布;但 X,Y 同分布 ⇒X,Y 相关(如正态分布中 Y=−X)。
2. 和的分布 Z=X+Y
FZ(z)=∫−∞+∞∫−∞z−yfX,Y(x,y)dxdy=∫−∞zfZ(u)du
fZ(z)=∫−∞+∞f(z−y,y)dy
若 X,Y 相互独立:
fZ(z)=∫−∞+∞fX(z−y)fY(y)dy=∫−∞+∞fX(x)fY(z−x)dx
此即连续卷积。若 Xi 相互独立且服从正态分布,则其和仍服从正态分布。
3. 商的分布 Z=X/Y
fZ(z)=∫−∞+∞∣y∣f(zy,y)dy
随机变量的数字特征
数学期望:
若 ∫−∞+∞∣x∣dF(x)<+∞,则 E(X)=∫−∞+∞xdF(x)=∫−∞+∞xf(x)dx
- X∼P(λ)→E(X)=λ,D(X)=λ
- 两点分布:E(X)=p,D(X)=p(1−p)
- X∼N(μ,σ2)→E(X)=μ,D(X)=σ2
- X∼B(n,p)→E(X)=np,D(X)=np(1−p)
- 指数分布:E(X)=λ1,D(X)=λ21
- 均匀分布:E(X)=2a+b,D(X)=12(b−a)2
函数期望:
E(g(X))=∫−∞+∞g(x)fX(x)dx
E(g(X,Y))=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
若 X,Y 相互独立,E(XY)=E(X)E(Y)。
方差公式:D(X)=E(X2)−[E(X)]2。
若 X1,…,Xn 相互独立,D(∑Xi)=∑D(Xi),且 D(X1−X2)=D(X1)+D(X2)。
Chebyshev 不等式:
若 D(X) 存在,则 ∀ε>0:
P{∣X−E(X)∣≥ε}≤ε2D(X)
协方差与相关系数:
- Cov(X,X)=D(X)
- Cov(X,Y)=E[(X−μX)(Y−μY)]
- 相关系数 r(X,Y)=σXσYCov(X,Y)
- 对于二维正态分布 X,Y∼N(μ1,σ12;μ2,σ22,ρ),X,Y 相互独立 ⇔ρ=0。
- 许瓦兹不等式:Cov(X,Y)≤D(X)D(Y)
其他概念:
- 矩:原点矩 E(Xk),中心矩 E[(X−E(X))k]。
- R-S 积分:I=∫abf(x)dg(x),黎曼积分为其特例。
- 条件数学期望:E(Y∣X=x)=∫−∞+∞yf(Y∣X=x)dy。
- 回归函数:记 μ(X)=E(Y∣X) 和 S(Y)=E(X∣Y),它们本身是随机变量。
0 确定性关系与相关关系
若 μ(x) 存在,则 Y 与 X 存在相关关系。
y=μ(x) 称为回归方程。
0 考虑随机变量 δ(Y)=E(X∣Y)
E(X∣Y)=∫−∞+∞xf(x∣y)dx→ 关于 y 的函数
E(X∣Y)→ 关于 Y 的随机变量
- E(c∣Y)=c, 是常数
关于 E(X∣Y) 的分布 → 转化为 Y 的不等式
-
E[aX+bY∣Z]=aE(X∣Z)+bE(Y∣Z)
-
X,Y 相互独立, E(X∣Y)=E(X)
-
E(X)=E[E(X∣Y)]
-
E[g(Y)X∣Y]=g(Y)E(X∣Y)
-
E[X−E(X∣Y)]2≤E[X−g(Y)]2
D(X∣Y)=E[X−E(X∣Y=y)]2→ 条件方差
n 维正态随机变量
记 μ=E(XY)=(E(X)E(Y))=(μ1μ2)
C=(σ12ρ12σ1σ2ρ12σ1σ2σ22)
φ(x1,x2,…,xn)=(2π)2n∣C∣211exp[−21(x−μ)TC−1(x−μ)]
C=(σij) 是 n 阶正定对称矩阵, ∣C∣ 是其行列式
X=(x1,x2,…,xn)T, μ=(μ1,μ2,…,μn)T
→(X1,X2,…,Xn) 服从 n 维正态分布
- ① X1,X2,…,Xn 相互独立
- ② X1,X2,…,Xn 两两不相关
- ③ C 为对角矩阵 (C 为协方差矩阵)
- ④ 两两独立
① X∼N(μ,C),B=(bjk)m×n
Y=BX∼N(Bμ,BCBT)
Linked Notes
No outgoing note links.
Referenced By
No backlinks yet.