随机数学第五章

一、随机变量的特征函数

  1. 定义: X,YX, Y 是实随机变量, 复随机变量 Z=X+jYZ = X + jY

E(Z)=E(X)+jE(Y)E(Z) = E(X) + jE(Y)

E(ejtX)=E(costX)+jE(sintX)E(e^{jtX}) = E(\cos tX) + jE(\sin tX)

=+costxdF(x)+j+sintxdF(x)= \int_{-\infty}^{+\infty} \cos tx \, dF(x) + j \int_{-\infty}^{+\infty} \sin tx \, dF(x)

=+(costx+jsintx)dF(x)=+ejtxdF(x)={+ejtxf(x)dx(continuous)ejtxkpk(discrete)= \int_{-\infty}^{+\infty} (\cos tx + j \sin tx) \, dF(x) = \int_{-\infty}^{+\infty} e^{jtx} \, dF(x) = \begin{cases} \int_{-\infty}^{+\infty} e^{jtx} f(x) \, dx & (\text{continuous}) \\ \sum e^{jtx_k} p_k & (\text{discrete}) \end{cases}

φ(t)=E(ejtX)\varphi(t) = E(e^{jtX})XX 的特征函数,总存在,是关于 tt 的函数。

  1. 性质:

    • φ(t)φ(0)=1|\varphi(t)| \le \varphi(0) = 1 (Cauchy-Schwarz 不等式)

    • φ(t)=φ(t)\varphi(-t) = \overline{\varphi(t)} (共轭对称性)

    • XX 的特征函数为 φX(t)Y=aX+b,φY(t)=ejbtφX(at)\varphi_X(t) \rightarrow Y = aX + b, \varphi_Y(t) = e^{jbt} \cdot \varphi_X(at)

    • ④ 若 XN(0,1)X \sim N(0, 1),则 φ(t)=et22\varphi(t) = e^{-\frac{t^2}{2}}

    • φX(t)\varphi_X(t)R\mathbb{R} 上一致连续。 波赫纳-辛钦定理: φ(t)\varphi(t) 为特征函数 R\leftrightarrow \mathbb{R} 上一致连续、非负定且 φ(0)=1\varphi(0) = 1

    • ⑥ 互演公式及唯一性定理: A. F(x2)F(x1)=limT12πTTejtx2ejtx1jtφ(t)dtF(x_2) - F(x_1) = \lim_{T \to \infty} \frac{1}{2\pi} \int_{-T}^{T} \frac{e^{-jtx_2} - e^{-jtx_1}}{jt} \varphi(t) \, dt B. F1(x)F2(x)φ1(t)φ2(t)F_1(x) \equiv F_2(x) \leftrightarrow \varphi_1(t) \equiv \varphi_2(t)

    • ⑦ 随机变量 nn 阶矩存在 φ(k)(t)\Leftrightarrow \varphi^{(k)}(t) 存在, 且 E(Xk)=jkφ(k)(0),(kn)E(X^k) = j^{-k} \varphi^{(k)}(0), (k \le n)

    • nn 维随机变量 (X1,X2,,Xn)(X_1, X_2, \dots, X_n) 分布函数为 F(x1,x2,,xn)F(x_1, x_2, \dots, x_n) φ(t1,t2,,tn)=E[ej(t1X1++tnXn)]\varphi(t_1, t_2, \dots, t_n) = E[e^{j(t_1 X_1 + \dots + t_n X_n)}]

    • ⑨ 二维相关性质: A. φ(t1,t2)=++ej(t1x+t2y)f(x,y)dxdy\varphi(t_1, t_2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{j(t_1 x + t_2 y)} f(x, y) \, dx \, dy B. φ(t1,t2)φ(0,0)=1|\varphi(t_1, t_2)| \le \varphi(0, 0) = 1 C. φ(t1,t2)=φ(t1,t2)\varphi(t_1, t_2) = \overline{\varphi(-t_1, -t_2)} D. φ(t1,t2)\varphi(t_1, t_2) 在实平面一致连续 E. φ(t1,0)=φX(t1);φ(0,t2)=φY(t2)\varphi(t_1, 0) = \varphi_X(t_1); \varphi(0, t_2) = \varphi_Y(t_2) F. (a1X1+b1,a2X2+b2)ej(t1b1+t2b2)φ(a1t1,a2t2)(a_1 X_1 + b_1, a_2 X_2 + b_2) \rightarrow e^{j(t_1 b_1 + t_2 b_2)} \varphi(a_1 t_1, a_2 t_2) G. Z=aX1+bX2+cejtcφ(at,bt)Z = aX_1 + bX_2 + c \rightarrow e^{jtc} \varphi(at, bt) (降维)

    • X1,X2,,XnX_1, X_2, \dots, X_n 相互独立 φ(t1,t2,,tn)=k=1nφXk(tk)\Leftrightarrow \varphi(t_1, t_2, \dots, t_n) = \prod_{k=1}^{n} \varphi_{X_k}(t_k) Y=i=1nXiφY(t)=i=1nφXi(t)\Leftrightarrow Y = \sum_{i=1}^{n} X_i \Leftrightarrow \varphi_Y(t) = \prod_{i=1}^{n} \varphi_{X_i}(t)

  2. 常见分布的特征函数

    • ① 单点分布 P{X=c}=1P\{X=c\}=1: φ(t)=ejtc\varphi(t) = e^{jtc}
    • ② 指数分布: φ(t)=(1jtλ)1,tR\varphi(t) = (1 - \frac{jt}{\lambda})^{-1}, t \in \mathbb{R}
    • ③ 正态分布: φ(t)=ejμtσ2t22\varphi(t) = e^{j\mu t - \frac{\sigma^2 t^2}{2}}
    • ④ 泊松分布: φ(t)=eλ(ejt1)\varphi(t) = e^{\lambda(e^{jt}-1)}

二、随机变量的收敛性

1. 分布函数收敛

对于分布函数列 {Fn(x)}\{F_n(x)\},若 limnFn(x)=F(x)\lim_{n \to \infty} F_n(x) = F(x)F(x)F(x) 每一连续点都成立,则称 Fn(x)F_n(x) 弱收敛于 F(x)F(x),记为 Fn(x)WF(x)F_n(x) \xrightarrow{W} F(x)

2. 连续性定理 (列维-克拉美)

  • 正极限: Fn(x)WF(x){φn(t)}φ(t)F_n(x) \xrightarrow{W} F(x) \Rightarrow \{\varphi_n(t)\} \to \varphi(t) 一致成立。
  • 逆极限: {φn(t)}φ(t)\{\varphi_n(t)\} \to \varphi(t)φ(t)\varphi(t)t=0t=0 连续 Fn(x)WF(x)\Rightarrow F_n(x) \xrightarrow{W} F(x)

3. 依分布收敛

Fn(x)WF(x){Xn}F_n(x) \xrightarrow{W} F(x) \Rightarrow \{X_n\} 依分布收敛于 XX,记为 XnWXX_n \xrightarrow{W} X

4. 依概率收敛

ε>0,limnP{XnXε}=0\forall \varepsilon > 0, \lim_{n \to \infty} P\{|X_n - X| \ge \varepsilon\} = 0,则称 {Xn}\{X_n\} 依概率收敛于 XX,记为 XnPXX_n \xrightarrow{P} X

5. 概率为1收敛

P{limnXn=X}=1P\{\lim_{n \to \infty} X_n = X\} = 1 : {Xn}\{X_n\} 以概率1收敛于 XX / 几乎处处收敛于 XX

概率为1收敛 ?\stackrel{?}{\Leftrightarrow} 依概率收敛 \Leftrightarrow 依分布收敛

三、大数定律

1. 弱大数定律

① Chebyshev 不等式:

XXE(X)E(X)D(X)D(X) 都存在, 则 ε>0\forall \varepsilon > 0 :

P{XE(X)ε}D(X)ε2P\{|X - E(X)| \ge \varepsilon\} \le \frac{D(X)}{\varepsilon^2}

or P{XE(X)<ε}1D(X)ε2\text{or } P\{|X - E(X)| < \varepsilon\} \ge 1 - \frac{D(X)}{\varepsilon^2}

② 大数定律定义:

Xn,n=1,2,X_n, n=1, 2, \dots 是一个随机变量序列, E(Xn)E(X_n) 都存在。

Xˉn=1ni=1nXi\bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i, 若 limn[XˉnE(Xˉn)]=0\lim_{n \to \infty} [\bar{X}_n - E(\bar{X}_n)] = 0

{Xn}\Rightarrow \{X_n\} 服从 (弱) 大数定律

ε>0\forall \varepsilon > 0

limnP{1ni=1nXi1ni=1nE(Xi)<ε}=1\lim_{n \to \infty} P \left\{ \left| \frac{1}{n} \sum_{i=1}^{n} X_i - \frac{1}{n} \sum_{i=1}^{n} E(X_i) \right| < \varepsilon \right\} = 1

意义: nn \uparrow, {Xn}\{X_n\}nn 项算术平均值与其数学期望任意接近的概率足够大。

③ Chebyshev 大数定律

Xk,k=1,2,X_k, k=1, 2, \dots 是相互独立的随机变量序列, E(Xk)E(X_k)D(Xk)D(X_k) 都存在, 且 C,D(Xk)<C,k=1,2,\exists C, D(X_k) < C, k=1, 2, \dots

{Xk},k=1,2,\Rightarrow \{X_k\}, k=1, 2, \dots 服从大数定律。

④ 推论: 独立同分布大数定律

XkX_k 相互独立且同分布, E(Xk)=μ,D(Xk)=σ2E(X_k) = \mu, D(X_k) = \sigma^2

ε>0,limnP{1nk=1nXkμ<ε}=1\Rightarrow \forall \varepsilon > 0, \lim_{n \to \infty} P \left\{ \left| \frac{1}{n} \sum_{k=1}^{n} X_k - \mu \right| < \varepsilon \right\} = 1

⑤ 泊松大数定律

XkX_k 相互独立, P{Xn=1}=pn,P{Xn=0}=1pn=qnP\{X_n=1\}=p_n, P\{X_n=0\}=1-p_n=q_n

{Xk}\Rightarrow \{X_k\} 服从大数定律。

⑥ 推论: Bernoulli 大数定律

XkX_k 相互独立且同分布, P{Xn=1}=p,P{Xn=0}=1p=qP\{X_n=1\}=p, P\{X_n=0\}=1-p=q

ξn\xi_nnn 次重复独立试验中 AA 发生的次数, pp 是每次试验 AA 发生的概率。

ε>0,limnP{1nk=1nXkp<ε}=limnP{ξnnp<ε}=1\Rightarrow \forall \varepsilon > 0, \lim_{n \to \infty} P \left\{ \left| \frac{1}{n} \sum_{k=1}^{n} X_k - p \right| < \varepsilon \right\} = \lim_{n \to \infty} P \left\{ \left| \frac{\xi_n}{n} - p \right| < \varepsilon \right\} = 1

⑦ 辛钦大数定律

XkX_k 相互独立同分布, 若 E(Xk)E(X_k) 存在, 则 {Xk}\{X_k\} 服从大数定律 (不要求二阶矩存在, 但要求同分布)。

2. 强大数定律

① 定义: Xn,n=1,2,X_n, n=1, 2, \dots 是一随机变量序列, E(Xn)E(X_n) 都存在, Xˉn=1ni=1nXi\bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i

XˉnE(Xˉn)0, as n\bar{X}_n - E(\bar{X}_n) \to 0, \text{ as } n \to \infty (即 XˉnE(Xˉn)\bar{X}_n - E(\bar{X}_n) 几乎处处收敛于 0)

{Xn}\Rightarrow \{X_n\} 服从强大数定律。

② 博雷尔强大数定律:

XkX_k 相互独立同分布, P{Xn=1}=p,P{Xn=0}=1p=qP\{X_n=1\}=p, P\{X_n=0\}=1-p=q (条件与 Bernoulli 一致)

{Xk}\Rightarrow \{X_k\} 服从强大数定律。

③ 科尔莫哥洛夫判别法 (科尔莫哥洛夫定理)

XkX_k 相互独立, 若 n=1D(Xn)n2<\sum_{n=1}^{\infty} \frac{D(X_n)}{n^2} < \infty, 则 {Xn}\{X_n\} 服从强大数定律。

四、中心极限定理

1. 定义:

{Xk}\{X_k\} 相互独立, 有有限数学期望和方差。

Yn=k=1nXkk=1nE(Xk)k=1nD(Xk)Y_n = \frac{\sum_{k=1}^{n} X_k - \sum_{k=1}^{n} E(X_k)}{\sqrt{\sum_{k=1}^{n} D(X_k)}}

limnP{Yn<z}=12πze12y2dy=ϕ(z)\lim_{n \to \infty} P\{Y_n < z\} = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-\frac{1}{2}y^2} dy = \phi(z)

{Xk}\{X_k\} 服从中心极限定理。

k=1nXkk=1nE(Xk)k=1nD(Xk)N(0,1)as n\Rightarrow \frac{\sum_{k=1}^{n} X_k - \sum_{k=1}^{n} E(X_k)}{\sqrt{\sum_{k=1}^{n} D(X_k)}} \sim N(0, 1) \quad \text{as } n \to \infty

2. 林德伯格-列维独立同分布中心极限定理

{Xk}\{X_k\} 独立同分布, E(Xk)=μ,D(Xk)=σ20E(X_k) = \mu, D(X_k) = \sigma^2 \neq 0

limnP{k=1nXknμnσ<z}=ϕ(z)\lim_{n \to \infty} P\left\{ \frac{\sum_{k=1}^{n} X_k - n\mu}{\sqrt{n}\sigma} < z \right\} = \phi(z)

3. 棣莫佛-拉普拉斯定理

{Xk}B(1,p),P(Xk=1)=p,P(Xk=0)=1p=q\{X_k\} \sim B(1, p), P(X_k=1) = p, P(X_k=0) = 1-p = q

Yn=XkB(n,p)Y_n = \sum X_k \sim B(n, p), 则 E(Yn)=np,D(Yn)=np(1p)E(Y_n) = np, D(Y_n) = np(1-p)

等价形式: limnP{Ynnpnp(1p)<x}=ϕ(x)\lim_{n \to \infty} P\left\{ \frac{Y_n - np}{\sqrt{np(1-p)}} < x \right\} = \phi(x)

np5,np(1p)5np \ge 5, np(1-p) \ge 5, 有:

P{m1Ym2}ϕ(m2npnp(1p))ϕ(m1npnp(1p))P\{m_1 \le Y \le m_2\} \approx \phi\left(\frac{m_2 - np}{\sqrt{np(1-p)}}\right) - \phi\left(\frac{m_1 - np}{\sqrt{np(1-p)}}\right)

第六章 抽样分布

一、基本概念

  1. 总体与个体。
  2. 总体分布: 数量指标 XX 的分布, 总体是随机变量。
  3. 样本: 按照一定的规则从总体中抽取的一部分个体 (X1,X2,,Xn)(X_1, X_2, \dots, X_n)
  4. 简单随机样本: 样本中的 X1,X2,,XnX_1, X_2, \dots, X_n 相互独立且同分布。
  5. 统计量: X1,X2,,XnX_1, X_2, \dots, X_n 是总体 XX 的样本, T(X1,X2,,Xn)T(X_1, X_2, \dots, X_n) 是关于样本的函数 (是随机变量且不含未知参数) 称为统计量。t=T(X1,X2,,Xn)t = T(X_1, X_2, \dots, X_n) 为统计值。

6. 样本与总体均值和方差

样本均值: Xˉ=1ni=1nXi\bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i

样本方差: S2=1n1i=1n(XiXˉ)2S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2

总体期望: E(X)=ixipiE(X) = \sum_{i} x_i p_i

总体方差: D(X)=i[xiE(X)]2piD(X) = \sum_{i} [x_i - E(X)]^2 p_i

证明: 要使 E(S2)=σ2E(S^2) = \sigma^2

i=1n(XiXˉ)2=i=1n(Xiμ+μXˉ)2=i=1n(Xiμ)22(Xiμ)(μXˉ)+(μXˉ)2=i=1n(Xiμ)22n(Xˉμ)2+n(Xˉμ)2=i=1n(Xiμ)2n(Xˉμ)2\begin{aligned} \therefore \sum_{i=1}^{n} (X_i - \bar{X})^2 &= \sum_{i=1}^{n} (X_i - \mu + \mu - \bar{X})^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - 2(X_i - \mu)(\mu - \bar{X}) + (\mu - \bar{X})^2 \\ &= \sum_{i=1}^{n} (X_i - \mu)^2 - 2n(\bar{X} - \mu)^2 + n(\bar{X} - \mu)^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2 \end{aligned}

E(S2)=1n1E[i=1n(Xiμ)2n(Xˉμ)2]=1n1{i=1nE[(Xiμ)2]nE[(Xˉμ)2]}=1n1{nσ2nE[(1ni=1nXiμ)2]}=1n1{nσ2nE[(1ni=1n(Xiμ))2]}=1n1(n1)σ2=σ2无偏估计\begin{aligned} \therefore E(S^2) &= \frac{1}{n-1} E\left[\sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2\right] = \frac{1}{n-1} \left\{ \sum_{i=1}^{n} E[(X_i - \mu)^2] - nE[(\bar{X} - \mu)^2] \right\} \\ &= \frac{1}{n-1} \left\{ n\sigma^2 - nE\left[\left(\frac{1}{n} \sum_{i=1}^{n} X_i - \mu\right)^2\right] \right\} = \frac{1}{n-1} \left\{ n\sigma^2 - nE\left[\left(\frac{1}{n} \sum_{i=1}^{n} (X_i - \mu)\right)^2\right] \right\} \\ &= \frac{1}{n-1} (n-1)\sigma^2 = \sigma^2 \rightarrow \text{无偏估计} \end{aligned}

7. k 阶原点矩与中心矩

Ak=1ni=1nXikA_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k (样本)

Bk=1ni=1n(XiXˉ)kB_k = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^k

γk=E(Xk)=ixikpi\gamma_k = E(X^k) = \sum_{i} x_i^k p_i (总体)

μk=E[(XE(X))k]=i[xiE(X)]kpi\mu_k = E[(X - E(X))^k] = \sum_{i} [x_i - E(X)]^k p_i

区分样本二阶中心矩与样本方差:

M2=1ni=1n(XiXˉ)2M_2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2

S2=1n1i=1n(XiXˉ)2S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2

Xˉ=A1\bar{X} = A_1

(n1)S2=nM2(n-1)S^2 = n M_2

M2=1ni=1nXi2Xˉ2=A2A12M_2 = \frac{1}{n} \sum_{i=1}^{n} X_i^2 - \bar{X}^2 = A_2 - A_1^2

类比 D(X)=E(X2)[E(X)]2D(X) = E(X^2) - [E(X)]^2

样本矩是随机变量,总体矩是数值。

8. 最大/小项统计量与样本极差

Xn,X1,Dn=XnX1X_n^*, X_1^*, D_n^* = X_n^* - X_1^*

  1. 几个关系:

E(X)=μ,D(X)=σ2E(X) = \mu, D(X) = \sigma^2

E(Ai)=μE(A_i) = \mu

E(S2)=σ2,E(M2)=n1nσ2E(S^2) = \sigma^2, E(M_2) = \frac{n-1}{n} \sigma^2

二、抽样分布

1. 四种常用统计分布

① 标准正态分布

f(x)=12πex22f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}

上侧分位数 UαU_\alpha (0<α<10 < \alpha < 1) 满足 P(X>Uα)=Uα+f(x)dx=α=1P(XUα)=1Φ(Uα)P(X > U_\alpha) = \int_{U_\alpha}^{+\infty} f(x) dx = \alpha = 1 - P(X \le U_\alpha) = 1 - \Phi(U_\alpha)

χ2\chi^2 (卡方) 分布

f(x)={12n2Γ(n2)xn21ex2,x>00,x0f(x) = \begin{cases} \frac{1}{2^{\frac{n}{2}} \Gamma(\frac{n}{2})} x^{\frac{n}{2}-1} e^{-\frac{x}{2}}, & x > 0 \\ 0, & x \le 0 \end{cases}

Xχ2(n)X \sim \chi^2(n)XX 服从自由度为 nn 的卡方分布。

其中 Γ(α)\Gamma(\alpha) 是 Gamma 函数: Γ(z)=0+tz1etdt\Gamma(z) = \int_0^{+\infty} t^{z-1} e^{-t} dt (Γ(12)=π\Gamma(\frac{1}{2}) = \sqrt{\pi})

  • XN(0,1)X \sim N(0, 1), Y=X2Y = X^2 服从 χ2(1)\chi^2(1) 分布
  • X1N(0,1)X_1 \sim N(0, 1), X2N(0,1)X_2 \sim N(0, 1), Y=X12+X22Y = X_1^2 + X_2^2 服从 χ2(2)\chi^2(2) 分布
  • χ2=i=1nXi2χ2(n)\chi^2 = \sum_{i=1}^{n} X_i^2 \sim \chi^2(n) (XiN(0,1)X_i \sim N(0, 1))
  • XN(μ,σ2)X \sim N(\mu, \sigma^2), 则 χ2=(n1)S2σ2χ2(n1)\chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)

性质: ① E(χ2)=n,D(χ2)=2nE(\chi^2) = n, D(\chi^2) = 2nY1χ2(n1),Y2χ2(n2)    Y1+Y2χ2(n1+n2)Y_1 \sim \chi^2(n_1), Y_2 \sim \chi^2(n_2) \implies Y_1 + Y_2 \sim \chi^2(n_1 + n_2) ③ 当 nn 足够大 (n>45n > 45) 时,χ2(n)n+Uα2n\chi^2(n) \approx n + U_\alpha \sqrt{2n},其中 Φ(Uα)=1α\Phi(U_\alpha) = 1 - \alpha

③ t 分布 / 学生氏分布

fT(x)=Γ(n+12)nπΓ(n2)(1+x2n)n+12f_T(x) = \frac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi} \Gamma(\frac{n}{2})} (1 + \frac{x^2}{n})^{-\frac{n+1}{2}}

TT 服从自由度为 nnTT 分布,记 Tt(n)T \sim t(n)

  • X,YX, Y 相互独立,XN(0,1)X \sim N(0, 1), Yχ2(n)Y \sim \chi^2(n)T=XY/nt(n)T = \frac{X}{\sqrt{Y/n}} \sim t(n)
  • t 分布特点: A. 关于纵轴对称; B. limnfT(x)=ϕ(x)\lim_{n \to \infty} f_T(x) = \phi(x)

④ F 分布

f(x)={n1n12n2n22Γ(n1+n22)Γ(n12)Γ(n22)xn121(n1x+n2)n1+n22,x>00,x0f(x) = \begin{cases} \frac{n_1^{\frac{n_1}{2}} n_2^{\frac{n_2}{2}} \Gamma(\frac{n_1+n_2}{2})}{\Gamma(\frac{n_1}{2}) \Gamma(\frac{n_2}{2})} x^{\frac{n_1}{2}-1} (n_1 x + n_2)^{-\frac{n_1+n_2}{2}}, & x > 0 \\ 0, & x \le 0 \end{cases}

n1n_1: 第一自由度; n2n_2: 第二自由度,XF(n1,n2)X \sim F(n_1, n_2)

  • Xχ2(n1)X \sim \chi^2(n_1), Yχ2(n2)Y \sim \chi^2(n_2), 则 F=X/n1Y/n2F(n1,n2)F = \frac{X/n_1}{Y/n_2} \sim F(n_1, n_2)
  • FF(n1,n2)F \sim F(n_1, n_2), 则 1FF(n2,n1)\frac{1}{F} \sim F(n_2, n_1)
  • 上侧分位数 Fα(n1,n2)F_{\alpha}(n_1, n_2) 满足 Fα(n1,n2)F(1α)(n2,n1)=1F_{\alpha}(n_1, n_2) \cdot F_{(1-\alpha)}(n_2, n_1) = 1

2. 抽样分布定理

A. 设 X1,X2,,XnX_1, X_2, \dots, X_n 是正态总体 XN(μ,σ2)X \sim N(\mu, \sigma^2) 的样本,Xˉ,S2\bar{X}, S^2 是样本均值与方差: ① Xˉ\bar{X}S2S^2 相互独立 ② Xˉμσ/nN(0,1)\frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)(n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)XˉμS/nt(n1)\frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)

B. XXYY 相互独立,XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2), YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)F=S12/σ12S22/σ22F(n11,n21)F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-1)σ12=σ22\sigma_1^2 = \sigma_2^2 时, T=(XˉYˉ)(μ1μ2)Sw1n1+1n2t(n1+n22)T = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2) 其中 Sw=(n11)S12+(n21)S22n1+n22S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}}

第七章. 估计理论

参数估计 {点估计区间估计}{矩估计极大似然估计\left\{ \begin{array}{l} \text{点估计} \\ \text{区间估计} \end{array} \right\} \left\{ \begin{array}{l} \text{矩估计} \\ \text{极大似然估计} \end{array} \right.

  1. 点估计: F(x;θ)F(x; \theta), θ\theta 未知; 由样本 X1,X2,,XnX_1, X_2, \dots, X_n 建立统计量 T(X1,X2,,Xn)T(X_1, X_2, \dots, X_n), 其统计值作为 θ\theta 的估计值 θ^=T(X1,X2,,Xn)\hat{\theta} = T(X_1, X_2, \dots, X_n)θ\theta 的点估计量。

  2. 矩估计: 替换原则 (E(X)XˉE(X) \to \bar{X}; D(X)m2D(X) \to m_2)

  • 样本均值是总体均值的矩法估计量 (无偏)
  • 方差的矩法估计量是样本中心二阶矩
  1. 极大似然估计法: 按照最大可能性原则进行推断 \toθ\theta 的估计值使似然函数达到最大值 ① 似然函数: Xf(x;θ1,θ2,,θk)X \to f(x; \theta_1, \theta_2, \dots, \theta_k) X1,X2,,XnX_1, X_2, \dots, X_n 联合概率密度 L(θ1,θ2,,θk)=i=1nf(xi;θ1,θ2,,θk)L(\theta_1, \theta_2, \dots, \theta_k) = \prod_{i=1}^{n} f(x_i; \theta_1, \theta_2, \dots, \theta_k)lnL(θ1,θ2,,θk)\ln L(\theta_1, \theta_2, \dots, \theta_k) \to 对数似然函数 L(θ1,θ2,,θk)θk=0,k=1,2,\frac{\partial L(\theta_1, \theta_2, \dots, \theta_k)}{\partial \theta_k} = 0, k=1, 2, \dots \to 似然方程组

③ 步骤: A. 写出似然函数 B. 取对数 C. 求偏导 D. 解似然方程组

  1. 区间估计: θ\theta \toX1,X2,,Xnθ^1=θ1(X1,X2,,Xn),θ^2=θ2(X1,X2,,Xn)X_1, X_2, \dots, X_n \to \hat{\theta}_1 = \theta_1(X_1, X_2, \dots, X_n), \hat{\theta}_2 = \theta_2(X_1, X_2, \dots, X_n) 对于给定 α\alpha 满足 P{θ^1θθ^2}=1αP\{\hat{\theta}_1 \le \theta \le \hat{\theta}_2\} = 1-\alpha [θ^1,θ^2]\to [\hat{\theta}_1, \hat{\theta}_2]θ\theta 置信度 1α1-\alpha 的区间估计 (置信区间) α\alpha \to 显著性水平, 一般取 0.1 或 0.05 ① 确定能接受可靠程度前提下, 尽可能提高准确度 ② 枢轴变量法: A. 选取 θ\theta 的估计量 (Xˉμ,S2σ2\bar{X} \to \mu, S^2 \to \sigma^2) B. 建立枢轴变量: 构造关于 θ\theta 和样本的函数 W(X1,X2,,Xn,θ)W(X_1, X_2, \dots, X_n, \theta) C. 确定 WW 的分布 (正态, χ2\chi^2, TT, FF) D. 根据分布对 1α1-\alpha 查上侧分位数, 使 P{W1α/2WWα/2}=1αP\{W_{1-\alpha/2} \le W \le W_{\alpha/2}\} = 1-\alpha P{AθB}=1α\to P\{A \le \theta \le B\} = 1-\alpha (A, B 为不含未知参数的统计量)

第八章. 假设检验

一. 基本概念

  1. 分类
  • 关于总体参数的假设检验
  • 关于总体分布的假设检验
  • 原假设/零假设: 根据问题需要提出的假设 H0H_0
  • 备择假设: 与原假设对立的假设 H1H_1
  • 接受域: 使 H0H_0 予以接受的检验统计量的取值区域 AA
  • 拒绝域: 使 H0H_0 被拒绝的检验统计量的取值区域 RR

2. 两类错误

H0H_0H1H_1
拒绝 H0H_0弃真 (第一类错误)正确
接受 H0H_0正确纳伪 (第二类错误)
  • 不可能同时减小犯两类错误的概率,减小一类错误必然使另一类错误增大。
  • 通常做法: 先控制犯第一类错误的概率 α\alpha,然后再使犯第二类错误的概率 β(α)\beta(\alpha) 尽可能小。

3. 基本步骤:

① 提出 H0H_0H1H_1 ② 建立检验统计量: 建立一个不带任何未知参数的统计量,并在 H0H_0 成立的条件下确定 UU 的分布 ③ 确定 H0H_0 拒绝域: 选定 α\alpha ④ 对 H0H_0 作判断: 根据样本值计算检验统计量 uu,判断 uu 是否落在拒绝域

  • 确定 H0H_0 拒绝域应遵循有利准则: 将 UUH0H_0 有利的区域确定为接受域,对 H1H_1 成立有利的区域确定为拒绝域。
  • α\alpha \uparrow (显著性水平),犯第一类错误(弃真) \uparrow,拒绝域 \downarrow

二. 参数假设检验

o μ\mu 的检验

  1. μ\mu 检验法 (Z检验) \to 必须已知总体方差 σ2\sigma^2

① 单样本检验 H0:μ=μ0,H1:μμ0H_0: \mu = \mu_0, H_1: \mu \neq \mu_0 H0H_0 成立: U=Xˉμ0σ/nN(0,1)U = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1),拒绝域: u>uα2|u| > u_{\frac{\alpha}{2}}

② 双样本检验 X1,,Xn1N(μ1,σ12)X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma_1^2), Y1,,Yn2N(μ2,σ22)Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma_2^2) H0H_0 成立: U=XˉYˉσ12n1+σ22n2N(0,1)U = \frac{\bar{X} - \bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1),拒绝域: u>uα2|u| > u_{\frac{\alpha}{2}}

  1. tt 检验法 \to μ\muσ2\sigma^2 都未知,但总体服从正态分布

① 单样本检验 X1,,XnN(μ,σ2)X_1, \dots, X_n \sim N(\mu, \sigma^2) H0H_0 成立: T=Xˉμ0S/nt(n1)T = \frac{\bar{X} - \mu_0}{S/\sqrt{n}} \sim t(n-1),拒绝域: t>tα2(n1)|t| > t_{\frac{\alpha}{2}}(n-1)

② 双样本检验 X1,,Xn1N(μ1,σ2)X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma^2), Y1,,Yn2N(μ2,σ2)Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma^2) XXYY 相互独立,σ2\sigma^2 未知但 σ12=σ22=σ2\sigma_1^2 = \sigma_2^2 = \sigma^2 H0H_0 成立: T=XˉYˉSw1n1+1n2t(n1+n22)T = \frac{\bar{X} - \bar{Y}}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2) 其中 Sw=(n11)S12+(n21)S22n1+n22S_w = \sqrt{\frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}} 拒绝域: T>tα2(n1+n22)|T| > t_{\frac{\alpha}{2}}(n_1 + n_2 - 2)

o σ2\sigma^2 的检验

1. χ2\chi^2 检验法 \to 单样本

X1,,XnN(μ,σ2)X_1, \dots, X_n \sim N(\mu, \sigma^2); H0:σ2=σ02,H1:σ2σ02H_0: \sigma^2 = \sigma_0^2, H_1: \sigma^2 \neq \sigma_0^2

  1. 已知 μ\mu: χ2=i=1n(Xiμσ0)2χ2(n)\chi^2 = \sum_{i=1}^{n} \left( \frac{X_i - \mu}{\sigma_0} \right)^2 \sim \chi^2(n)
  2. 未知 μ\mu: χ2=(n1)S2σ02χ2(n1)\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1) 拒绝域: χ2>χα22\chi^2 > \chi_{\frac{\alpha}{2}}^2χ2<χ1α22\chi^2 < \chi_{1-\frac{\alpha}{2}}^2
2. F 检验法 \to 双样本

X1,,Xn1N(μ1,σ2)X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma^2), Y1,,Yn2N(μ2,σ2)Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma^2)

  1. 已知 μ1,μ2\mu_1, \mu_2: F=1n1(Xiμ1)21n2(Yjμ2)2F(n1,n2)F = \frac{\frac{1}{n_1} \sum (X_i - \mu_1)^2}{\frac{1}{n_2} \sum (Y_j - \mu_2)^2} \sim F(n_1, n_2)
  2. 未知 μ1,μ2\mu_1, \mu_2: F=S12S22F(n11,n21)F = \frac{S_1^2}{S_2^2} \sim F(n_1 - 1, n_2 - 1) 拒绝域: f>Fα2f > F_{\frac{\alpha}{2}}f<F1α2f < F_{1-\frac{\alpha}{2}}

☆ 假设检验原则:

  1. 根据后果: 后果严重者设为第一类错误并控制 α\alpha
  2. 爱保护的事物放原假设 H0H_0
  3. 新事物放备择假设 H1H_1
  4. 等号 ”=” 永远放在 H0H_0 中。

Linked Notes

No outgoing note links.

Referenced By

No backlinks yet.