随机数学第五章

一、随机变量的特征函数

定义: $X, Y$ 是实随机变量, 复随机变量 $Z = X + jY$

$E(Z) = E(X) + jE(Y)$

$E(e^{jtX}) = E(\cos tX) + jE(\sin tX)$

$= \int_{-\infty}^{+\infty} \cos tx \, dF(x) + j \int_{-\infty}^{+\infty} \sin tx \, dF(x)$

$= \int_{-\infty}^{+\infty} (\cos tx + j \sin tx) \, dF(x) = \int_{-\infty}^{+\infty} e^{jtx} \, dF(x) = \begin{cases} \int_{-\infty}^{+\infty} e^{jtx} f(x) \, dx & (\text{continuous}) \\ \sum e^{jtx_k} p_k & (\text{discrete}) \end{cases}$

$\varphi(t) = E(e^{jtX})$ 是 $X$ 的特征函数，总存在，是关于 $t$ 的函数。

性质:
- ① $|\varphi(t)| \le \varphi(0) = 1$ (Cauchy-Schwarz 不等式)
- ② $\varphi(-t) = \overline{\varphi(t)}$ (共轭对称性)
- ③ $X$ 的特征函数为 $\varphi_X(t) \rightarrow Y = aX + b, \varphi_Y(t) = e^{jbt} \cdot \varphi_X(at)$
- ④ 若 $X \sim N(0, 1)$ ，则 $\varphi(t) = e^{-\frac{t^2}{2}}$
- ⑤ $\varphi_X(t)$ 在 $\mathbb{R}$ 上一致连续。波赫纳-辛钦定理: $\varphi(t)$ 为特征函数 $\leftrightarrow \mathbb{R}$ 上一致连续、非负定且 $\varphi(0) = 1$ 。
- ⑥ 互演公式及唯一性定理: A. $F(x_2) - F(x_1) = \lim_{T \to \infty} \frac{1}{2\pi} \int_{-T}^{T} \frac{e^{-jtx_2} - e^{-jtx_1}}{jt} \varphi(t) \, dt$ B. $F_1(x) \equiv F_2(x) \leftrightarrow \varphi_1(t) \equiv \varphi_2(t)$
- ⑦ 随机变量 $n$ 阶矩存在 $\Leftrightarrow \varphi^{(k)}(t)$ 存在, 且 $E(X^k) = j^{-k} \varphi^{(k)}(0), (k \le n)$
- ⑧ $n$ 维随机变量 $(X_1, X_2, \dots, X_n)$ 分布函数为 $F(x_1, x_2, \dots, x_n)$ $\varphi(t_1, t_2, \dots, t_n) = E[e^{j(t_1 X_1 + \dots + t_n X_n)}]$
- ⑨ 二维相关性质: A. $\varphi(t_1, t_2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{j(t_1 x + t_2 y)} f(x, y) \, dx \, dy$ B. $|\varphi(t_1, t_2)| \le \varphi(0, 0) = 1$ C. $\varphi(t_1, t_2) = \overline{\varphi(-t_1, -t_2)}$ D. $\varphi(t_1, t_2)$ 在实平面一致连续 E. $\varphi(t_1, 0) = \varphi_X(t_1); \varphi(0, t_2) = \varphi_Y(t_2)$ F. $(a_1 X_1 + b_1, a_2 X_2 + b_2) \rightarrow e^{j(t_1 b_1 + t_2 b_2)} \varphi(a_1 t_1, a_2 t_2)$ G. $Z = aX_1 + bX_2 + c \rightarrow e^{jtc} \varphi(at, bt)$ (降维)
- ⑩ $X_1, X_2, \dots, X_n$ 相互独立 $\Leftrightarrow \varphi(t_1, t_2, \dots, t_n) = \prod_{k=1}^{n} \varphi_{X_k}(t_k)$ $\Leftrightarrow Y = \sum_{i=1}^{n} X_i \Leftrightarrow \varphi_Y(t) = \prod_{i=1}^{n} \varphi_{X_i}(t)$
常见分布的特征函数
- ① 单点分布 $P\{X=c\}=1$ : $\varphi(t) = e^{jtc}$
- ② 指数分布: $\varphi(t) = (1 - \frac{jt}{\lambda})^{-1}, t \in \mathbb{R}$
- ③ 正态分布: $\varphi(t) = e^{j\mu t - \frac{\sigma^2 t^2}{2}}$
- ④ 泊松分布: $\varphi(t) = e^{\lambda(e^{jt}-1)}$

二、随机变量的收敛性

1. 分布函数收敛

对于分布函数列 $\{F_n(x)\}$ ，若 $\lim_{n \to \infty} F_n(x) = F(x)$ 在 $F(x)$ 每一连续点都成立，则称 $F_n(x)$ 弱收敛于 $F(x)$ ，记为 $F_n(x) \xrightarrow{W} F(x)$ 。

2. 连续性定理 (列维-克拉美)

正极限: $F_n(x) \xrightarrow{W} F(x) \Rightarrow \{\varphi_n(t)\} \to \varphi(t)$ 一致成立。
逆极限: $\{\varphi_n(t)\} \to \varphi(t)$ 且 $\varphi(t)$ 在 $t=0$ 连续 $\Rightarrow F_n(x) \xrightarrow{W} F(x)$ 。

3. 依分布收敛

$F_n(x) \xrightarrow{W} F(x) \Rightarrow \{X_n\}$ 依分布收敛于 $X$ ，记为 $X_n \xrightarrow{W} X$ 。

4. 依概率收敛

$\forall \varepsilon > 0, \lim_{n \to \infty} P\{|X_n - X| \ge \varepsilon\} = 0$ ，则称 $\{X_n\}$ 依概率收敛于 $X$ ，记为 $X_n \xrightarrow{P} X$ 。

5. 概率为1收敛

$P\{\lim_{n \to \infty} X_n = X\} = 1$ : $\{X_n\}$ 以概率1收敛于 $X$ / 几乎处处收敛于 $X$

概率为1收敛 $\stackrel{?}{\Leftrightarrow}$ 依概率收敛 $\Leftrightarrow$ 依分布收敛

三、大数定律

1. 弱大数定律

① Chebyshev 不等式:

若 $X$ 的 $E(X)$ 与 $D(X)$ 都存在, 则 $\forall \varepsilon > 0$ :

$P\{|X - E(X)| \ge \varepsilon\} \le \frac{D(X)}{\varepsilon^2}$

$\text{or } P\{|X - E(X)| < \varepsilon\} \ge 1 - \frac{D(X)}{\varepsilon^2}$

② 大数定律定义:

$X_n, n=1, 2, \dots$ 是一个随机变量序列, $E(X_n)$ 都存在。

记 $\bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i$ , 若 $\lim_{n \to \infty} [\bar{X}_n - E(\bar{X}_n)] = 0$

$\Rightarrow \{X_n\}$ 服从 (弱) 大数定律

即 $\forall \varepsilon > 0$

$\lim_{n \to \infty} P \left\{ \left| \frac{1}{n} \sum_{i=1}^{n} X_i - \frac{1}{n} \sum_{i=1}^{n} E(X_i) \right| < \varepsilon \right\} = 1$

意义: $n \uparrow$ , $\{X_n\}$ 前 $n$ 项算术平均值与其数学期望任意接近的概率足够大。

③ Chebyshev 大数定律

$X_k, k=1, 2, \dots$ 是相互独立的随机变量序列, $E(X_k)$ 和 $D(X_k)$ 都存在, 且 $\exists C, D(X_k) < C, k=1, 2, \dots$

$\Rightarrow \{X_k\}, k=1, 2, \dots$ 服从大数定律。

④ 推论: 独立同分布大数定律

$X_k$ 相互独立且同分布, $E(X_k) = \mu, D(X_k) = \sigma^2$

$\Rightarrow \forall \varepsilon > 0, \lim_{n \to \infty} P \left\{ \left| \frac{1}{n} \sum_{k=1}^{n} X_k - \mu \right| < \varepsilon \right\} = 1$

⑤ 泊松大数定律

$X_k$ 相互独立, $P\{X_n=1\}=p_n, P\{X_n=0\}=1-p_n=q_n$

$\Rightarrow \{X_k\}$ 服从大数定律。

⑥ 推论: Bernoulli 大数定律

$X_k$ 相互独立且同分布, $P\{X_n=1\}=p, P\{X_n=0\}=1-p=q$

令 $\xi_n$ 是 $n$ 次重复独立试验中 $A$ 发生的次数, $p$ 是每次试验 $A$ 发生的概率。

$\Rightarrow \forall \varepsilon > 0, \lim_{n \to \infty} P \left\{ \left| \frac{1}{n} \sum_{k=1}^{n} X_k - p \right| < \varepsilon \right\} = \lim_{n \to \infty} P \left\{ \left| \frac{\xi_n}{n} - p \right| < \varepsilon \right\} = 1$

⑦ 辛钦大数定律

$X_k$ 相互独立同分布, 若 $E(X_k)$ 存在, 则 $\{X_k\}$ 服从大数定律 (不要求二阶矩存在, 但要求同分布)。

2. 强大数定律

① 定义: $X_n, n=1, 2, \dots$ 是一随机变量序列, $E(X_n)$ 都存在, $\bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i$

若 $\bar{X}_n - E(\bar{X}_n) \to 0, \text{ as } n \to \infty$ (即 $\bar{X}_n - E(\bar{X}_n)$ 几乎处处收敛于 0)

$\Rightarrow \{X_n\}$ 服从强大数定律。

② 博雷尔强大数定律:

$X_k$ 相互独立同分布, $P\{X_n=1\}=p, P\{X_n=0\}=1-p=q$ (条件与 Bernoulli 一致)

$\Rightarrow \{X_k\}$ 服从强大数定律。

③ 科尔莫哥洛夫判别法 (科尔莫哥洛夫定理)

$X_k$ 相互独立, 若 $\sum_{n=1}^{\infty} \frac{D(X_n)}{n^2} < \infty$ , 则 $\{X_n\}$ 服从强大数定律。

四、中心极限定理

1. 定义:

$\{X_k\}$ 相互独立, 有有限数学期望和方差。

$Y_n = \frac{\sum_{k=1}^{n} X_k - \sum_{k=1}^{n} E(X_k)}{\sqrt{\sum_{k=1}^{n} D(X_k)}}$

$\lim_{n \to \infty} P\{Y_n < z\} = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-\frac{1}{2}y^2} dy = \phi(z)$

称 $\{X_k\}$ 服从中心极限定理。

$\Rightarrow \frac{\sum_{k=1}^{n} X_k - \sum_{k=1}^{n} E(X_k)}{\sqrt{\sum_{k=1}^{n} D(X_k)}} \sim N(0, 1) \quad \text{as } n \to \infty$

2. 林德伯格-列维独立同分布中心极限定理

$\{X_k\}$ 独立同分布, $E(X_k) = \mu, D(X_k) = \sigma^2 \neq 0$

$\lim_{n \to \infty} P\left\{ \frac{\sum_{k=1}^{n} X_k - n\mu}{\sqrt{n}\sigma} < z \right\} = \phi(z)$

3. 棣莫佛-拉普拉斯定理

$\{X_k\} \sim B(1, p), P(X_k=1) = p, P(X_k=0) = 1-p = q$

令 $Y_n = \sum X_k \sim B(n, p)$ , 则 $E(Y_n) = np, D(Y_n) = np(1-p)$

等价形式: $\lim_{n \to \infty} P\left\{ \frac{Y_n - np}{\sqrt{np(1-p)}} < x \right\} = \phi(x)$

若 $np \ge 5, np(1-p) \ge 5$ , 有:

$P\{m_1 \le Y \le m_2\} \approx \phi\left(\frac{m_2 - np}{\sqrt{np(1-p)}}\right) - \phi\left(\frac{m_1 - np}{\sqrt{np(1-p)}}\right)$

第六章抽样分布

一、基本概念

总体与个体。
总体分布: 数量指标 $X$ 的分布, 总体是随机变量。
样本: 按照一定的规则从总体中抽取的一部分个体 $(X_1, X_2, \dots, X_n)$ 。
简单随机样本: 样本中的 $X_1, X_2, \dots, X_n$ 相互独立且同分布。
统计量: $X_1, X_2, \dots, X_n$ 是总体 $X$ 的样本, $T(X_1, X_2, \dots, X_n)$ 是关于样本的函数 (是随机变量且不含未知参数) 称为统计量。 $t = T(X_1, X_2, \dots, X_n)$ 为统计值。

6. 样本与总体均值和方差

样本均值: $\bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i$

样本方差: $S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2$

总体期望: $E(X) = \sum_{i} x_i p_i$

总体方差: $D(X) = \sum_{i} [x_i - E(X)]^2 p_i$

证明: 要使 $E(S^2) = \sigma^2$ 。

$\begin{aligned} \therefore \sum_{i=1}^{n} (X_i - \bar{X})^2 &= \sum_{i=1}^{n} (X_i - \mu + \mu - \bar{X})^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - 2(X_i - \mu)(\mu - \bar{X}) + (\mu - \bar{X})^2 \\ &= \sum_{i=1}^{n} (X_i - \mu)^2 - 2n(\bar{X} - \mu)^2 + n(\bar{X} - \mu)^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2 \end{aligned}$

$\begin{aligned} \therefore E(S^2) &= \frac{1}{n-1} E\left[\sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2\right] = \frac{1}{n-1} \left\{ \sum_{i=1}^{n} E[(X_i - \mu)^2] - nE[(\bar{X} - \mu)^2] \right\} \\ &= \frac{1}{n-1} \left\{ n\sigma^2 - nE\left[\left(\frac{1}{n} \sum_{i=1}^{n} X_i - \mu\right)^2\right] \right\} = \frac{1}{n-1} \left\{ n\sigma^2 - nE\left[\left(\frac{1}{n} \sum_{i=1}^{n} (X_i - \mu)\right)^2\right] \right\} \\ &= \frac{1}{n-1} (n-1)\sigma^2 = \sigma^2 \rightarrow \text{无偏估计} \end{aligned}$

7. k 阶原点矩与中心矩

$A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k$ (样本)

$B_k = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^k$

$\gamma_k = E(X^k) = \sum_{i} x_i^k p_i$ (总体)

$\mu_k = E[(X - E(X))^k] = \sum_{i} [x_i - E(X)]^k p_i$

区分样本二阶中心矩与样本方差：

$M_2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2$

$S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2$

① $\bar{X} = A_1$

② $(n-1)S^2 = n M_2$

③ $M_2 = \frac{1}{n} \sum_{i=1}^{n} X_i^2 - \bar{X}^2 = A_2 - A_1^2$

类比 $D(X) = E(X^2) - [E(X)]^2$

样本矩是随机变量，总体矩是数值。

8. 最大/小项统计量与样本极差

$X_n^*, X_1^*, D_n^* = X_n^* - X_1^*$

几个关系:

$E(X) = \mu, D(X) = \sigma^2$

$E(A_i) = \mu$

$E(S^2) = \sigma^2, E(M_2) = \frac{n-1}{n} \sigma^2$

二、抽样分布

1. 四种常用统计分布

① 标准正态分布

$f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}$

上侧分位数 $U_\alpha$ ( $0 < \alpha < 1$ ) 满足 $P(X > U_\alpha) = \int_{U_\alpha}^{+\infty} f(x) dx = \alpha = 1 - P(X \le U_\alpha) = 1 - \Phi(U_\alpha)$

② $\chi^2$ (卡方) 分布

$f(x) = \begin{cases} \frac{1}{2^{\frac{n}{2}} \Gamma(\frac{n}{2})} x^{\frac{n}{2}-1} e^{-\frac{x}{2}}, & x > 0 \\ 0, & x \le 0 \end{cases}$

$X \sim \chi^2(n)$ ， $X$ 服从自由度为 $n$ 的卡方分布。

其中 $\Gamma(\alpha)$ 是 Gamma 函数: $\Gamma(z) = \int_0^{+\infty} t^{z-1} e^{-t} dt$ ( $\Gamma(\frac{1}{2}) = \sqrt{\pi}$ )

若 $X \sim N(0, 1)$ , $Y = X^2$ 服从 $\chi^2(1)$ 分布
若 $X_1 \sim N(0, 1)$ , $X_2 \sim N(0, 1)$ , $Y = X_1^2 + X_2^2$ 服从 $\chi^2(2)$ 分布
$\chi^2 = \sum_{i=1}^{n} X_i^2 \sim \chi^2(n)$ ( $X_i \sim N(0, 1)$ )
若 $X \sim N(\mu, \sigma^2)$ , 则 $\chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$

性质: ① $E(\chi^2) = n, D(\chi^2) = 2n$ ② $Y_1 \sim \chi^2(n_1), Y_2 \sim \chi^2(n_2) \implies Y_1 + Y_2 \sim \chi^2(n_1 + n_2)$ ③ 当 $n$ 足够大 ( $n > 45$ ) 时， $\chi^2(n) \approx n + U_\alpha \sqrt{2n}$ ，其中 $\Phi(U_\alpha) = 1 - \alpha$

③ t 分布 / 学生氏分布

$f_T(x) = \frac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi} \Gamma(\frac{n}{2})} (1 + \frac{x^2}{n})^{-\frac{n+1}{2}}$

$T$ 服从自由度为 $n$ 的 $T$ 分布，记 $T \sim t(n)$ 。

若 $X, Y$ 相互独立， $X \sim N(0, 1)$ , $Y \sim \chi^2(n)$ 则 $T = \frac{X}{\sqrt{Y/n}} \sim t(n)$
t 分布特点: A. 关于纵轴对称; B. $\lim_{n \to \infty} f_T(x) = \phi(x)$

④ F 分布

$f(x) = \begin{cases} \frac{n_1^{\frac{n_1}{2}} n_2^{\frac{n_2}{2}} \Gamma(\frac{n_1+n_2}{2})}{\Gamma(\frac{n_1}{2}) \Gamma(\frac{n_2}{2})} x^{\frac{n_1}{2}-1} (n_1 x + n_2)^{-\frac{n_1+n_2}{2}}, & x > 0 \\ 0, & x \le 0 \end{cases}$

$n_1$ : 第一自由度; $n_2$ : 第二自由度， $X \sim F(n_1, n_2)$

若 $X \sim \chi^2(n_1)$ , $Y \sim \chi^2(n_2)$ , 则 $F = \frac{X/n_1}{Y/n_2} \sim F(n_1, n_2)$
若 $F \sim F(n_1, n_2)$ , 则 $\frac{1}{F} \sim F(n_2, n_1)$
上侧分位数 $F_{\alpha}(n_1, n_2)$ 满足 $F_{\alpha}(n_1, n_2) \cdot F_{(1-\alpha)}(n_2, n_1) = 1$

2. 抽样分布定理

A. 设 $X_1, X_2, \dots, X_n$ 是正态总体 $X \sim N(\mu, \sigma^2)$ 的样本， $\bar{X}, S^2$ 是样本均值与方差： ① $\bar{X}$ 与 $S^2$ 相互独立 ② $\frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)$ ③ $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ ④ $\frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$

B. $X$ 与 $Y$ 相互独立， $X \sim N(\mu_1, \sigma_1^2)$ , $Y \sim N(\mu_2, \sigma_2^2)$ ① $F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-1)$ ② $\sigma_1^2 = \sigma_2^2$ 时, $T = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)$ 其中 $S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}}$

第七章. 估计理论

参数估计 $\left\{ \begin{array}{l} \text{点估计} \\ \text{区间估计} \end{array} \right\} \left\{ \begin{array}{l} \text{矩估计} \\ \text{极大似然估计} \end{array} \right.$

点估计: $F(x; \theta)$ , $\theta$ 未知; 由样本 $X_1, X_2, \dots, X_n$ 建立统计量 $T(X_1, X_2, \dots, X_n)$ , 其统计值作为 $\theta$ 的估计值 $\hat{\theta} = T(X_1, X_2, \dots, X_n)$ 为 $\theta$ 的点估计量。
矩估计: 替换原则 ( $E(X) \to \bar{X}$ ; $D(X) \to m_2$ )

样本均值是总体均值的矩法估计量 (无偏)
方差的矩法估计量是样本中心二阶矩

极大似然估计法: 按照最大可能性原则进行推断 $\to$ 求 $\theta$ 的估计值使似然函数达到最大值 ① 似然函数: $X \to f(x; \theta_1, \theta_2, \dots, \theta_k)$ $X_1, X_2, \dots, X_n$ 联合概率密度 $L(\theta_1, \theta_2, \dots, \theta_k) = \prod_{i=1}^{n} f(x_i; \theta_1, \theta_2, \dots, \theta_k)$ ② $\ln L(\theta_1, \theta_2, \dots, \theta_k) \to$ 对数似然函数 $\frac{\partial L(\theta_1, \theta_2, \dots, \theta_k)}{\partial \theta_k} = 0, k=1, 2, \dots \to$ 似然方程组

③ 步骤: A. 写出似然函数 B. 取对数 C. 求偏导 D. 解似然方程组

区间估计: $\theta \to$ 由 $X_1, X_2, \dots, X_n \to \hat{\theta}_1 = \theta_1(X_1, X_2, \dots, X_n), \hat{\theta}_2 = \theta_2(X_1, X_2, \dots, X_n)$ 对于给定 $\alpha$ 满足 $P\{\hat{\theta}_1 \le \theta \le \hat{\theta}_2\} = 1-\alpha$ $\to [\hat{\theta}_1, \hat{\theta}_2]$ 为 $\theta$ 置信度 $1-\alpha$ 的区间估计 (置信区间) $\alpha \to$ 显著性水平, 一般取 0.1 或 0.05 ① 确定能接受可靠程度前提下, 尽可能提高准确度 ② 枢轴变量法: A. 选取 $\theta$ 的估计量 ( $\bar{X} \to \mu, S^2 \to \sigma^2$ ) B. 建立枢轴变量: 构造关于 $\theta$ 和样本的函数 $W(X_1, X_2, \dots, X_n, \theta)$ C. 确定 $W$ 的分布 (正态, $\chi^2$ , $T$ , $F$ ) D. 根据分布对 $1-\alpha$ 查上侧分位数, 使 $P\{W_{1-\alpha/2} \le W \le W_{\alpha/2}\} = 1-\alpha$ $\to P\{A \le \theta \le B\} = 1-\alpha$ (A, B 为不含未知参数的统计量)

第八章. 假设检验

一. 基本概念

分类

关于总体参数的假设检验
关于总体分布的假设检验
原假设/零假设: 根据问题需要提出的假设 $H_0$
备择假设: 与原假设对立的假设 $H_1$
接受域: 使 $H_0$ 予以接受的检验统计量的取值区域 $A$
拒绝域: 使 $H_0$ 被拒绝的检验统计量的取值区域 $R$

2. 两类错误

	$H_0$ 真	$H_1$ 真
拒绝 $H_0$	弃真 (第一类错误)	正确
接受 $H_0$	正确	纳伪 (第二类错误)

不可能同时减小犯两类错误的概率，减小一类错误必然使另一类错误增大。
通常做法: 先控制犯第一类错误的概率 $\alpha$ ，然后再使犯第二类错误的概率 $\beta(\alpha)$ 尽可能小。

3. 基本步骤:

① 提出 $H_0$ 与 $H_1$ ② 建立检验统计量: 建立一个不带任何未知参数的统计量，并在 $H_0$ 成立的条件下确定 $U$ 的分布 ③ 确定 $H_0$ 拒绝域: 选定 $\alpha$ ④ 对 $H_0$ 作判断: 根据样本值计算检验统计量 $u$ ，判断 $u$ 是否落在拒绝域

确定 $H_0$ 拒绝域应遵循有利准则: 将 $U$ 对 $H_0$ 有利的区域确定为接受域，对 $H_1$ 成立有利的区域确定为拒绝域。
$\alpha \uparrow$ (显著性水平)，犯第一类错误(弃真) $\uparrow$ ，拒绝域 $\downarrow$ 。

二. 参数假设检验

o $\mu$ 的检验

$\mu$ 检验法 (Z检验) $\to$ 必须已知总体方差 $\sigma^2$

① 单样本检验 $H_0: \mu = \mu_0, H_1: \mu \neq \mu_0$ $H_0$ 成立: $U = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$ ，拒绝域: $|u| > u_{\frac{\alpha}{2}}$

② 双样本检验 $X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma_1^2)$ , $Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma_2^2)$ $H_0$ 成立: $U = \frac{\bar{X} - \bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1)$ ，拒绝域: $|u| > u_{\frac{\alpha}{2}}$

$t$ 检验法 $\to$ $\mu$ 与 $\sigma^2$ 都未知，但总体服从正态分布

① 单样本检验 $X_1, \dots, X_n \sim N(\mu, \sigma^2)$ $H_0$ 成立: $T = \frac{\bar{X} - \mu_0}{S/\sqrt{n}} \sim t(n-1)$ ，拒绝域: $|t| > t_{\frac{\alpha}{2}}(n-1)$

② 双样本检验 $X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma^2)$ , $Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma^2)$ $X$ 与 $Y$ 相互独立， $\sigma^2$ 未知但 $\sigma_1^2 = \sigma_2^2 = \sigma^2$ $H_0$ 成立: $T = \frac{\bar{X} - \bar{Y}}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)$ 其中 $S_w = \sqrt{\frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}}$ 拒绝域: $|T| > t_{\frac{\alpha}{2}}(n_1 + n_2 - 2)$

o $\sigma^2$ 的检验

1. $\chi^2$ 检验法 $\to$ 单样本

$X_1, \dots, X_n \sim N(\mu, \sigma^2)$ ; $H_0: \sigma^2 = \sigma_0^2, H_1: \sigma^2 \neq \sigma_0^2$

已知 $\mu$ : $\chi^2 = \sum_{i=1}^{n} \left( \frac{X_i - \mu}{\sigma_0} \right)^2 \sim \chi^2(n)$
未知 $\mu$ : $\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)$ 拒绝域: $\chi^2 > \chi_{\frac{\alpha}{2}}^2$ 或 $\chi^2 < \chi_{1-\frac{\alpha}{2}}^2$

2. F 检验法 $\to$ 双样本

$X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma^2)$ , $Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma^2)$

已知 $\mu_1, \mu_2$ : $F = \frac{\frac{1}{n_1} \sum (X_i - \mu_1)^2}{\frac{1}{n_2} \sum (Y_j - \mu_2)^2} \sim F(n_1, n_2)$
未知 $\mu_1, \mu_2$ : $F = \frac{S_1^2}{S_2^2} \sim F(n_1 - 1, n_2 - 1)$ 拒绝域: $f > F_{\frac{\alpha}{2}}$ 或 $f < F_{1-\frac{\alpha}{2}}$

☆ 假设检验原则:

根据后果: 后果严重者设为第一类错误并控制 $\alpha$ 。
爱保护的事物放原假设 $H_0$ 。
新事物放备择假设 $H_1$ 。
等号 ”=” 永远放在 $H_0$ 中。

Linked Notes

No outgoing note links.

Referenced By

No backlinks yet.