随机数学第五章
一、随机变量的特征函数
定义: X , Y X, Y X , Y 是实随机变量, 复随机变量 Z = X + j Y Z = X + jY Z = X + j Y
E ( Z ) = E ( X ) + j E ( Y ) E(Z) = E(X) + jE(Y) E ( Z ) = E ( X ) + j E ( Y )
E ( e j t X ) = E ( cos t X ) + j E ( sin t X ) E(e^{jtX}) = E(\cos tX) + jE(\sin tX) E ( e j tX ) = E ( cos tX ) + j E ( sin tX )
= ∫ − ∞ + ∞ cos t x d F ( x ) + j ∫ − ∞ + ∞ sin t x d F ( x ) = \int_{-\infty}^{+\infty} \cos tx \, dF(x) + j \int_{-\infty}^{+\infty} \sin tx \, dF(x) = ∫ − ∞ + ∞ cos t x d F ( x ) + j ∫ − ∞ + ∞ sin t x d F ( x )
= ∫ − ∞ + ∞ ( cos t x + j sin t x ) d F ( x ) = ∫ − ∞ + ∞ e j t x d F ( x ) = { ∫ − ∞ + ∞ e j t x f ( x ) d x ( continuous ) ∑ e j t x k p k ( discrete ) = \int_{-\infty}^{+\infty} (\cos tx + j \sin tx) \, dF(x) = \int_{-\infty}^{+\infty} e^{jtx} \, dF(x) = \begin{cases} \int_{-\infty}^{+\infty} e^{jtx} f(x) \, dx & (\text{continuous}) \\ \sum e^{jtx_k} p_k & (\text{discrete}) \end{cases} = ∫ − ∞ + ∞ ( cos t x + j sin t x ) d F ( x ) = ∫ − ∞ + ∞ e j t x d F ( x ) = { ∫ − ∞ + ∞ e j t x f ( x ) d x ∑ e j t x k p k ( continuous ) ( discrete )
φ ( t ) = E ( e j t X ) \varphi(t) = E(e^{jtX}) φ ( t ) = E ( e j tX ) 是 X X X 的特征函数,总存在,是关于 t t t 的函数。
性质:
① ∣ φ ( t ) ∣ ≤ φ ( 0 ) = 1 |\varphi(t)| \le \varphi(0) = 1 ∣ φ ( t ) ∣ ≤ φ ( 0 ) = 1 (Cauchy-Schwarz 不等式)
② φ ( − t ) = φ ( t ) ‾ \varphi(-t) = \overline{\varphi(t)} φ ( − t ) = φ ( t ) (共轭对称性)
③ X X X 的特征函数为 φ X ( t ) → Y = a X + b , φ Y ( t ) = e j b t ⋅ φ X ( a t ) \varphi_X(t) \rightarrow Y = aX + b, \varphi_Y(t) = e^{jbt} \cdot \varphi_X(at) φ X ( t ) → Y = a X + b , φ Y ( t ) = e j b t ⋅ φ X ( a t )
④ 若 X ∼ N ( 0 , 1 ) X \sim N(0, 1) X ∼ N ( 0 , 1 ) ,则 φ ( t ) = e − t 2 2 \varphi(t) = e^{-\frac{t^2}{2}} φ ( t ) = e − 2 t 2
⑤ φ X ( t ) \varphi_X(t) φ X ( t ) 在 R \mathbb{R} R 上一致连续。
波赫纳-辛钦定理: φ ( t ) \varphi(t) φ ( t ) 为特征函数 ↔ R \leftrightarrow \mathbb{R} ↔ R 上一致连续、非负定且 φ ( 0 ) = 1 \varphi(0) = 1 φ ( 0 ) = 1 。
⑥ 互演公式及唯一性定理:
A. F ( x 2 ) − F ( x 1 ) = lim T → ∞ 1 2 π ∫ − T T e − j t x 2 − e − j t x 1 j t φ ( t ) d t F(x_2) - F(x_1) = \lim_{T \to \infty} \frac{1}{2\pi} \int_{-T}^{T} \frac{e^{-jtx_2} - e^{-jtx_1}}{jt} \varphi(t) \, dt F ( x 2 ) − F ( x 1 ) = lim T → ∞ 2 π 1 ∫ − T T j t e − j t x 2 − e − j t x 1 φ ( t ) d t
B. F 1 ( x ) ≡ F 2 ( x ) ↔ φ 1 ( t ) ≡ φ 2 ( t ) F_1(x) \equiv F_2(x) \leftrightarrow \varphi_1(t) \equiv \varphi_2(t) F 1 ( x ) ≡ F 2 ( x ) ↔ φ 1 ( t ) ≡ φ 2 ( t )
⑦ 随机变量 n n n 阶矩存在 ⇔ φ ( k ) ( t ) \Leftrightarrow \varphi^{(k)}(t) ⇔ φ ( k ) ( t ) 存在, 且 E ( X k ) = j − k φ ( k ) ( 0 ) , ( k ≤ n ) E(X^k) = j^{-k} \varphi^{(k)}(0), (k \le n) E ( X k ) = j − k φ ( k ) ( 0 ) , ( k ≤ n )
⑧ n n n 维随机变量 ( X 1 , X 2 , … , X n ) (X_1, X_2, \dots, X_n) ( X 1 , X 2 , … , X n ) 分布函数为 F ( x 1 , x 2 , … , x n ) F(x_1, x_2, \dots, x_n) F ( x 1 , x 2 , … , x n )
φ ( t 1 , t 2 , … , t n ) = E [ e j ( t 1 X 1 + ⋯ + t n X n ) ] \varphi(t_1, t_2, \dots, t_n) = E[e^{j(t_1 X_1 + \dots + t_n X_n)}] φ ( t 1 , t 2 , … , t n ) = E [ e j ( t 1 X 1 + ⋯ + t n X n ) ]
⑨ 二维相关性质:
A. φ ( t 1 , t 2 ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ e j ( t 1 x + t 2 y ) f ( x , y ) d x d y \varphi(t_1, t_2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{j(t_1 x + t_2 y)} f(x, y) \, dx \, dy φ ( t 1 , t 2 ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ e j ( t 1 x + t 2 y ) f ( x , y ) d x d y
B. ∣ φ ( t 1 , t 2 ) ∣ ≤ φ ( 0 , 0 ) = 1 |\varphi(t_1, t_2)| \le \varphi(0, 0) = 1 ∣ φ ( t 1 , t 2 ) ∣ ≤ φ ( 0 , 0 ) = 1
C. φ ( t 1 , t 2 ) = φ ( − t 1 , − t 2 ) ‾ \varphi(t_1, t_2) = \overline{\varphi(-t_1, -t_2)} φ ( t 1 , t 2 ) = φ ( − t 1 , − t 2 )
D. φ ( t 1 , t 2 ) \varphi(t_1, t_2) φ ( t 1 , t 2 ) 在实平面一致连续
E. φ ( t 1 , 0 ) = φ X ( t 1 ) ; φ ( 0 , t 2 ) = φ Y ( t 2 ) \varphi(t_1, 0) = \varphi_X(t_1); \varphi(0, t_2) = \varphi_Y(t_2) φ ( t 1 , 0 ) = φ X ( t 1 ) ; φ ( 0 , t 2 ) = φ Y ( t 2 )
F. ( a 1 X 1 + b 1 , a 2 X 2 + b 2 ) → e j ( t 1 b 1 + t 2 b 2 ) φ ( a 1 t 1 , a 2 t 2 ) (a_1 X_1 + b_1, a_2 X_2 + b_2) \rightarrow e^{j(t_1 b_1 + t_2 b_2)} \varphi(a_1 t_1, a_2 t_2) ( a 1 X 1 + b 1 , a 2 X 2 + b 2 ) → e j ( t 1 b 1 + t 2 b 2 ) φ ( a 1 t 1 , a 2 t 2 )
G. Z = a X 1 + b X 2 + c → e j t c φ ( a t , b t ) Z = aX_1 + bX_2 + c \rightarrow e^{jtc} \varphi(at, bt) Z = a X 1 + b X 2 + c → e j t c φ ( a t , b t ) (降维)
⑩ X 1 , X 2 , … , X n X_1, X_2, \dots, X_n X 1 , X 2 , … , X n 相互独立 ⇔ φ ( t 1 , t 2 , … , t n ) = ∏ k = 1 n φ X k ( t k ) \Leftrightarrow \varphi(t_1, t_2, \dots, t_n) = \prod_{k=1}^{n} \varphi_{X_k}(t_k) ⇔ φ ( t 1 , t 2 , … , t n ) = ∏ k = 1 n φ X k ( t k )
⇔ Y = ∑ i = 1 n X i ⇔ φ Y ( t ) = ∏ i = 1 n φ X i ( t ) \Leftrightarrow Y = \sum_{i=1}^{n} X_i \Leftrightarrow \varphi_Y(t) = \prod_{i=1}^{n} \varphi_{X_i}(t) ⇔ Y = ∑ i = 1 n X i ⇔ φ Y ( t ) = ∏ i = 1 n φ X i ( t )
常见分布的特征函数
① 单点分布 P { X = c } = 1 P\{X=c\}=1 P { X = c } = 1 : φ ( t ) = e j t c \varphi(t) = e^{jtc} φ ( t ) = e j t c
② 指数分布: φ ( t ) = ( 1 − j t λ ) − 1 , t ∈ R \varphi(t) = (1 - \frac{jt}{\lambda})^{-1}, t \in \mathbb{R} φ ( t ) = ( 1 − λ j t ) − 1 , t ∈ R
③ 正态分布: φ ( t ) = e j μ t − σ 2 t 2 2 \varphi(t) = e^{j\mu t - \frac{\sigma^2 t^2}{2}} φ ( t ) = e j μ t − 2 σ 2 t 2
④ 泊松分布: φ ( t ) = e λ ( e j t − 1 ) \varphi(t) = e^{\lambda(e^{jt}-1)} φ ( t ) = e λ ( e j t − 1 )
二、随机变量的收敛性
1. 分布函数收敛
对于分布函数列 { F n ( x ) } \{F_n(x)\} { F n ( x )} ,若 lim n → ∞ F n ( x ) = F ( x ) \lim_{n \to \infty} F_n(x) = F(x) lim n → ∞ F n ( x ) = F ( x ) 在 F ( x ) F(x) F ( x ) 每一连续点都成立,则称 F n ( x ) F_n(x) F n ( x ) 弱收敛于 F ( x ) F(x) F ( x ) ,记为 F n ( x ) → W F ( x ) F_n(x) \xrightarrow{W} F(x) F n ( x ) W F ( x ) 。
2. 连续性定理 (列维-克拉美)
正极限: F n ( x ) → W F ( x ) ⇒ { φ n ( t ) } → φ ( t ) F_n(x) \xrightarrow{W} F(x) \Rightarrow \{\varphi_n(t)\} \to \varphi(t) F n ( x ) W F ( x ) ⇒ { φ n ( t )} → φ ( t ) 一致成立。
逆极限: { φ n ( t ) } → φ ( t ) \{\varphi_n(t)\} \to \varphi(t) { φ n ( t )} → φ ( t ) 且 φ ( t ) \varphi(t) φ ( t ) 在 t = 0 t=0 t = 0 连续 ⇒ F n ( x ) → W F ( x ) \Rightarrow F_n(x) \xrightarrow{W} F(x) ⇒ F n ( x ) W F ( x ) 。
3. 依分布收敛
F n ( x ) → W F ( x ) ⇒ { X n } F_n(x) \xrightarrow{W} F(x) \Rightarrow \{X_n\} F n ( x ) W F ( x ) ⇒ { X n } 依分布收敛于 X X X ,记为 X n → W X X_n \xrightarrow{W} X X n W X 。
4. 依概率收敛
∀ ε > 0 , lim n → ∞ P { ∣ X n − X ∣ ≥ ε } = 0 \forall \varepsilon > 0, \lim_{n \to \infty} P\{|X_n - X| \ge \varepsilon\} = 0 ∀ ε > 0 , lim n → ∞ P { ∣ X n − X ∣ ≥ ε } = 0 ,则称 { X n } \{X_n\} { X n } 依概率收敛于 X X X ,记为 X n → P X X_n \xrightarrow{P} X X n P X 。
5. 概率为1收敛
P { lim n → ∞ X n = X } = 1 P\{\lim_{n \to \infty} X_n = X\} = 1 P { lim n → ∞ X n = X } = 1 : { X n } \{X_n\} { X n } 以概率1收敛于 X X X / 几乎处处收敛于 X X X
概率为1收敛 ⇔ ? \stackrel{?}{\Leftrightarrow} ⇔ ? 依概率收敛 ⇔ \Leftrightarrow ⇔ 依分布收敛
三、大数定律
1. 弱大数定律
① Chebyshev 不等式:
若 X X X 的 E ( X ) E(X) E ( X ) 与 D ( X ) D(X) D ( X ) 都存在, 则 ∀ ε > 0 \forall \varepsilon > 0 ∀ ε > 0 :
P { ∣ X − E ( X ) ∣ ≥ ε } ≤ D ( X ) ε 2 P\{|X - E(X)| \ge \varepsilon\} \le \frac{D(X)}{\varepsilon^2} P { ∣ X − E ( X ) ∣ ≥ ε } ≤ ε 2 D ( X )
or P { ∣ X − E ( X ) ∣ < ε } ≥ 1 − D ( X ) ε 2 \text{or } P\{|X - E(X)| < \varepsilon\} \ge 1 - \frac{D(X)}{\varepsilon^2} or P { ∣ X − E ( X ) ∣ < ε } ≥ 1 − ε 2 D ( X )
② 大数定律定义:
X n , n = 1 , 2 , … X_n, n=1, 2, \dots X n , n = 1 , 2 , … 是一个随机变量序列, E ( X n ) E(X_n) E ( X n ) 都存在。
记 X ˉ n = 1 n ∑ i = 1 n X i \bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i X ˉ n = n 1 ∑ i = 1 n X i , 若 lim n → ∞ [ X ˉ n − E ( X ˉ n ) ] = 0 \lim_{n \to \infty} [\bar{X}_n - E(\bar{X}_n)] = 0 lim n → ∞ [ X ˉ n − E ( X ˉ n )] = 0
⇒ { X n } \Rightarrow \{X_n\} ⇒ { X n } 服从 (弱) 大数定律
即 ∀ ε > 0 \forall \varepsilon > 0 ∀ ε > 0
lim n → ∞ P { ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E ( X i ) ∣ < ε } = 1 \lim_{n \to \infty} P \left\{ \left| \frac{1}{n} \sum_{i=1}^{n} X_i - \frac{1}{n} \sum_{i=1}^{n} E(X_i) \right| < \varepsilon \right\} = 1 lim n → ∞ P { n 1 ∑ i = 1 n X i − n 1 ∑ i = 1 n E ( X i ) < ε } = 1
意义: n ↑ n \uparrow n ↑ , { X n } \{X_n\} { X n } 前 n n n 项算术平均值与其数学期望任意接近的概率足够大。
③ Chebyshev 大数定律
X k , k = 1 , 2 , … X_k, k=1, 2, \dots X k , k = 1 , 2 , … 是相互独立的随机变量序列, E ( X k ) E(X_k) E ( X k ) 和 D ( X k ) D(X_k) D ( X k ) 都存在, 且 ∃ C , D ( X k ) < C , k = 1 , 2 , … \exists C, D(X_k) < C, k=1, 2, \dots ∃ C , D ( X k ) < C , k = 1 , 2 , …
⇒ { X k } , k = 1 , 2 , … \Rightarrow \{X_k\}, k=1, 2, \dots ⇒ { X k } , k = 1 , 2 , … 服从大数定律。
④ 推论: 独立同分布大数定律
X k X_k X k 相互独立且同分布, E ( X k ) = μ , D ( X k ) = σ 2 E(X_k) = \mu, D(X_k) = \sigma^2 E ( X k ) = μ , D ( X k ) = σ 2
⇒ ∀ ε > 0 , lim n → ∞ P { ∣ 1 n ∑ k = 1 n X k − μ ∣ < ε } = 1 \Rightarrow \forall \varepsilon > 0, \lim_{n \to \infty} P \left\{ \left| \frac{1}{n} \sum_{k=1}^{n} X_k - \mu \right| < \varepsilon \right\} = 1 ⇒ ∀ ε > 0 , lim n → ∞ P { n 1 ∑ k = 1 n X k − μ < ε } = 1
⑤ 泊松大数定律
X k X_k X k 相互独立, P { X n = 1 } = p n , P { X n = 0 } = 1 − p n = q n P\{X_n=1\}=p_n, P\{X_n=0\}=1-p_n=q_n P { X n = 1 } = p n , P { X n = 0 } = 1 − p n = q n
⇒ { X k } \Rightarrow \{X_k\} ⇒ { X k } 服从大数定律。
⑥ 推论: Bernoulli 大数定律
X k X_k X k 相互独立且同分布, P { X n = 1 } = p , P { X n = 0 } = 1 − p = q P\{X_n=1\}=p, P\{X_n=0\}=1-p=q P { X n = 1 } = p , P { X n = 0 } = 1 − p = q
令 ξ n \xi_n ξ n 是 n n n 次重复独立试验中 A A A 发生的次数, p p p 是每次试验 A A A 发生的概率。
⇒ ∀ ε > 0 , lim n → ∞ P { ∣ 1 n ∑ k = 1 n X k − p ∣ < ε } = lim n → ∞ P { ∣ ξ n n − p ∣ < ε } = 1 \Rightarrow \forall \varepsilon > 0, \lim_{n \to \infty} P \left\{ \left| \frac{1}{n} \sum_{k=1}^{n} X_k - p \right| < \varepsilon \right\} = \lim_{n \to \infty} P \left\{ \left| \frac{\xi_n}{n} - p \right| < \varepsilon \right\} = 1 ⇒ ∀ ε > 0 , lim n → ∞ P { n 1 ∑ k = 1 n X k − p < ε } = lim n → ∞ P { n ξ n − p < ε } = 1
⑦ 辛钦大数定律
X k X_k X k 相互独立同分布, 若 E ( X k ) E(X_k) E ( X k ) 存在, 则 { X k } \{X_k\} { X k } 服从大数定律 (不要求二阶矩存在, 但要求同分布)。
2. 强大数定律
① 定义: X n , n = 1 , 2 , … X_n, n=1, 2, \dots X n , n = 1 , 2 , … 是一随机变量序列, E ( X n ) E(X_n) E ( X n ) 都存在, X ˉ n = 1 n ∑ i = 1 n X i \bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i X ˉ n = n 1 ∑ i = 1 n X i
若 X ˉ n − E ( X ˉ n ) → 0 , as n → ∞ \bar{X}_n - E(\bar{X}_n) \to 0, \text{ as } n \to \infty X ˉ n − E ( X ˉ n ) → 0 , as n → ∞ (即 X ˉ n − E ( X ˉ n ) \bar{X}_n - E(\bar{X}_n) X ˉ n − E ( X ˉ n ) 几乎处处收敛于 0)
⇒ { X n } \Rightarrow \{X_n\} ⇒ { X n } 服从强大数定律。
② 博雷尔强大数定律:
X k X_k X k 相互独立同分布, P { X n = 1 } = p , P { X n = 0 } = 1 − p = q P\{X_n=1\}=p, P\{X_n=0\}=1-p=q P { X n = 1 } = p , P { X n = 0 } = 1 − p = q (条件与 Bernoulli 一致)
⇒ { X k } \Rightarrow \{X_k\} ⇒ { X k } 服从强大数定律。
③ 科尔莫哥洛夫判别法 (科尔莫哥洛夫定理)
X k X_k X k 相互独立, 若 ∑ n = 1 ∞ D ( X n ) n 2 < ∞ \sum_{n=1}^{\infty} \frac{D(X_n)}{n^2} < \infty ∑ n = 1 ∞ n 2 D ( X n ) < ∞ , 则 { X n } \{X_n\} { X n } 服从强大数定律。
四、中心极限定理
1. 定义:
{ X k } \{X_k\} { X k } 相互独立, 有有限数学期望和方差。
Y n = ∑ k = 1 n X k − ∑ k = 1 n E ( X k ) ∑ k = 1 n D ( X k ) Y_n = \frac{\sum_{k=1}^{n} X_k - \sum_{k=1}^{n} E(X_k)}{\sqrt{\sum_{k=1}^{n} D(X_k)}} Y n = ∑ k = 1 n D ( X k ) ∑ k = 1 n X k − ∑ k = 1 n E ( X k )
lim n → ∞ P { Y n < z } = 1 2 π ∫ − ∞ z e − 1 2 y 2 d y = ϕ ( z ) \lim_{n \to \infty} P\{Y_n < z\} = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{z} e^{-\frac{1}{2}y^2} dy = \phi(z) lim n → ∞ P { Y n < z } = 2 π 1 ∫ − ∞ z e − 2 1 y 2 d y = ϕ ( z )
称 { X k } \{X_k\} { X k } 服从中心极限定理。
⇒ ∑ k = 1 n X k − ∑ k = 1 n E ( X k ) ∑ k = 1 n D ( X k ) ∼ N ( 0 , 1 ) as n → ∞ \Rightarrow \frac{\sum_{k=1}^{n} X_k - \sum_{k=1}^{n} E(X_k)}{\sqrt{\sum_{k=1}^{n} D(X_k)}} \sim N(0, 1) \quad \text{as } n \to \infty ⇒ ∑ k = 1 n D ( X k ) ∑ k = 1 n X k − ∑ k = 1 n E ( X k ) ∼ N ( 0 , 1 ) as n → ∞
2. 林德伯格-列维独立同分布中心极限定理
{ X k } \{X_k\} { X k } 独立同分布, E ( X k ) = μ , D ( X k ) = σ 2 ≠ 0 E(X_k) = \mu, D(X_k) = \sigma^2 \neq 0 E ( X k ) = μ , D ( X k ) = σ 2 = 0
lim n → ∞ P { ∑ k = 1 n X k − n μ n σ < z } = ϕ ( z ) \lim_{n \to \infty} P\left\{ \frac{\sum_{k=1}^{n} X_k - n\mu}{\sqrt{n}\sigma} < z \right\} = \phi(z) lim n → ∞ P { n σ ∑ k = 1 n X k − n μ < z } = ϕ ( z )
3. 棣莫佛-拉普拉斯定理
{ X k } ∼ B ( 1 , p ) , P ( X k = 1 ) = p , P ( X k = 0 ) = 1 − p = q \{X_k\} \sim B(1, p), P(X_k=1) = p, P(X_k=0) = 1-p = q { X k } ∼ B ( 1 , p ) , P ( X k = 1 ) = p , P ( X k = 0 ) = 1 − p = q
令 Y n = ∑ X k ∼ B ( n , p ) Y_n = \sum X_k \sim B(n, p) Y n = ∑ X k ∼ B ( n , p ) , 则 E ( Y n ) = n p , D ( Y n ) = n p ( 1 − p ) E(Y_n) = np, D(Y_n) = np(1-p) E ( Y n ) = n p , D ( Y n ) = n p ( 1 − p )
等价形式: lim n → ∞ P { Y n − n p n p ( 1 − p ) < x } = ϕ ( x ) \lim_{n \to \infty} P\left\{ \frac{Y_n - np}{\sqrt{np(1-p)}} < x \right\} = \phi(x) lim n → ∞ P { n p ( 1 − p ) Y n − n p < x } = ϕ ( x )
若 n p ≥ 5 , n p ( 1 − p ) ≥ 5 np \ge 5, np(1-p) \ge 5 n p ≥ 5 , n p ( 1 − p ) ≥ 5 , 有:
P { m 1 ≤ Y ≤ m 2 } ≈ ϕ ( m 2 − n p n p ( 1 − p ) ) − ϕ ( m 1 − n p n p ( 1 − p ) ) P\{m_1 \le Y \le m_2\} \approx \phi\left(\frac{m_2 - np}{\sqrt{np(1-p)}}\right) - \phi\left(\frac{m_1 - np}{\sqrt{np(1-p)}}\right) P { m 1 ≤ Y ≤ m 2 } ≈ ϕ ( n p ( 1 − p ) m 2 − n p ) − ϕ ( n p ( 1 − p ) m 1 − n p )
第六章 抽样分布
一、基本概念
总体与个体。
总体分布: 数量指标 X X X 的分布, 总体是随机变量。
样本: 按照一定的规则从总体中抽取的一部分个体 ( X 1 , X 2 , … , X n ) (X_1, X_2, \dots, X_n) ( X 1 , X 2 , … , X n ) 。
简单随机样本: 样本中的 X 1 , X 2 , … , X n X_1, X_2, \dots, X_n X 1 , X 2 , … , X n 相互独立且同分布。
统计量: X 1 , X 2 , … , X n X_1, X_2, \dots, X_n X 1 , X 2 , … , X n 是总体 X X X 的样本, T ( X 1 , X 2 , … , X n ) T(X_1, X_2, \dots, X_n) T ( X 1 , X 2 , … , X n ) 是关于样本的函数 (是随机变量且不含未知参数) 称为统计量。t = T ( X 1 , X 2 , … , X n ) t = T(X_1, X_2, \dots, X_n) t = T ( X 1 , X 2 , … , X n ) 为统计值。
6. 样本与总体均值和方差
样本均值: X ˉ = 1 n ∑ i = 1 n X i \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i X ˉ = n 1 ∑ i = 1 n X i
样本方差: S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2 S 2 = n − 1 1 ∑ i = 1 n ( X i − X ˉ ) 2
总体期望: E ( X ) = ∑ i x i p i E(X) = \sum_{i} x_i p_i E ( X ) = ∑ i x i p i
总体方差: D ( X ) = ∑ i [ x i − E ( X ) ] 2 p i D(X) = \sum_{i} [x_i - E(X)]^2 p_i D ( X ) = ∑ i [ x i − E ( X ) ] 2 p i
证明: 要使 E ( S 2 ) = σ 2 E(S^2) = \sigma^2 E ( S 2 ) = σ 2 。
∴ ∑ i = 1 n ( X i − X ˉ ) 2 = ∑ i = 1 n ( X i − μ + μ − X ˉ ) 2 = ∑ i = 1 n ( X i − μ ) 2 − 2 ( X i − μ ) ( μ − X ˉ ) + ( μ − X ˉ ) 2 = ∑ i = 1 n ( X i − μ ) 2 − 2 n ( X ˉ − μ ) 2 + n ( X ˉ − μ ) 2 = ∑ i = 1 n ( X i − μ ) 2 − n ( X ˉ − μ ) 2 \begin{aligned} \therefore \sum_{i=1}^{n} (X_i - \bar{X})^2 &= \sum_{i=1}^{n} (X_i - \mu + \mu - \bar{X})^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - 2(X_i - \mu)(\mu - \bar{X}) + (\mu - \bar{X})^2 \\ &= \sum_{i=1}^{n} (X_i - \mu)^2 - 2n(\bar{X} - \mu)^2 + n(\bar{X} - \mu)^2 = \sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2 \end{aligned} ∴ i = 1 ∑ n ( X i − X ˉ ) 2 = i = 1 ∑ n ( X i − μ + μ − X ˉ ) 2 = i = 1 ∑ n ( X i − μ ) 2 − 2 ( X i − μ ) ( μ − X ˉ ) + ( μ − X ˉ ) 2 = i = 1 ∑ n ( X i − μ ) 2 − 2 n ( X ˉ − μ ) 2 + n ( X ˉ − μ ) 2 = i = 1 ∑ n ( X i − μ ) 2 − n ( X ˉ − μ ) 2
∴ E ( S 2 ) = 1 n − 1 E [ ∑ i = 1 n ( X i − μ ) 2 − n ( X ˉ − μ ) 2 ] = 1 n − 1 { ∑ i = 1 n E [ ( X i − μ ) 2 ] − n E [ ( X ˉ − μ ) 2 ] } = 1 n − 1 { n σ 2 − n E [ ( 1 n ∑ i = 1 n X i − μ ) 2 ] } = 1 n − 1 { n σ 2 − n E [ ( 1 n ∑ i = 1 n ( X i − μ ) ) 2 ] } = 1 n − 1 ( n − 1 ) σ 2 = σ 2 → 无偏估计 \begin{aligned} \therefore E(S^2) &= \frac{1}{n-1} E\left[\sum_{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2\right] = \frac{1}{n-1} \left\{ \sum_{i=1}^{n} E[(X_i - \mu)^2] - nE[(\bar{X} - \mu)^2] \right\} \\ &= \frac{1}{n-1} \left\{ n\sigma^2 - nE\left[\left(\frac{1}{n} \sum_{i=1}^{n} X_i - \mu\right)^2\right] \right\} = \frac{1}{n-1} \left\{ n\sigma^2 - nE\left[\left(\frac{1}{n} \sum_{i=1}^{n} (X_i - \mu)\right)^2\right] \right\} \\ &= \frac{1}{n-1} (n-1)\sigma^2 = \sigma^2 \rightarrow \text{无偏估计} \end{aligned} ∴ E ( S 2 ) = n − 1 1 E [ i = 1 ∑ n ( X i − μ ) 2 − n ( X ˉ − μ ) 2 ] = n − 1 1 { i = 1 ∑ n E [( X i − μ ) 2 ] − n E [( X ˉ − μ ) 2 ] } = n − 1 1 ⎩ ⎨ ⎧ n σ 2 − n E ( n 1 i = 1 ∑ n X i − μ ) 2 ⎭ ⎬ ⎫ = n − 1 1 ⎩ ⎨ ⎧ n σ 2 − n E ( n 1 i = 1 ∑ n ( X i − μ ) ) 2 ⎭ ⎬ ⎫ = n − 1 1 ( n − 1 ) σ 2 = σ 2 → 无偏估计
7. k 阶原点矩与中心矩
A k = 1 n ∑ i = 1 n X i k A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k A k = n 1 ∑ i = 1 n X i k (样本)
B k = 1 n ∑ i = 1 n ( X i − X ˉ ) k B_k = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^k B k = n 1 ∑ i = 1 n ( X i − X ˉ ) k
γ k = E ( X k ) = ∑ i x i k p i \gamma_k = E(X^k) = \sum_{i} x_i^k p_i γ k = E ( X k ) = ∑ i x i k p i (总体)
μ k = E [ ( X − E ( X ) ) k ] = ∑ i [ x i − E ( X ) ] k p i \mu_k = E[(X - E(X))^k] = \sum_{i} [x_i - E(X)]^k p_i μ k = E [( X − E ( X ) ) k ] = ∑ i [ x i − E ( X ) ] k p i
区分样本二阶中心矩与样本方差:
M 2 = 1 n ∑ i = 1 n ( X i − X ˉ ) 2 M_2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2 M 2 = n 1 ∑ i = 1 n ( X i − X ˉ ) 2
S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2 S 2 = n − 1 1 ∑ i = 1 n ( X i − X ˉ ) 2
① X ˉ = A 1 \bar{X} = A_1 X ˉ = A 1
② ( n − 1 ) S 2 = n M 2 (n-1)S^2 = n M_2 ( n − 1 ) S 2 = n M 2
③ M 2 = 1 n ∑ i = 1 n X i 2 − X ˉ 2 = A 2 − A 1 2 M_2 = \frac{1}{n} \sum_{i=1}^{n} X_i^2 - \bar{X}^2 = A_2 - A_1^2 M 2 = n 1 ∑ i = 1 n X i 2 − X ˉ 2 = A 2 − A 1 2
类比 D ( X ) = E ( X 2 ) − [ E ( X ) ] 2 D(X) = E(X^2) - [E(X)]^2 D ( X ) = E ( X 2 ) − [ E ( X ) ] 2
样本矩是随机变量,总体矩是数值。
8. 最大/小项统计量与样本极差
X n ∗ , X 1 ∗ , D n ∗ = X n ∗ − X 1 ∗ X_n^*, X_1^*, D_n^* = X_n^* - X_1^* X n ∗ , X 1 ∗ , D n ∗ = X n ∗ − X 1 ∗
几个关系:
E ( X ) = μ , D ( X ) = σ 2 E(X) = \mu, D(X) = \sigma^2 E ( X ) = μ , D ( X ) = σ 2
E ( A i ) = μ E(A_i) = \mu E ( A i ) = μ
E ( S 2 ) = σ 2 , E ( M 2 ) = n − 1 n σ 2 E(S^2) = \sigma^2, E(M_2) = \frac{n-1}{n} \sigma^2 E ( S 2 ) = σ 2 , E ( M 2 ) = n n − 1 σ 2
二、抽样分布
1. 四种常用统计分布
① 标准正态分布
f ( x ) = 1 2 π e − x 2 2 f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} f ( x ) = 2 π 1 e − 2 x 2
上侧分位数 U α U_\alpha U α (0 < α < 1 0 < \alpha < 1 0 < α < 1 ) 满足 P ( X > U α ) = ∫ U α + ∞ f ( x ) d x = α = 1 − P ( X ≤ U α ) = 1 − Φ ( U α ) P(X > U_\alpha) = \int_{U_\alpha}^{+\infty} f(x) dx = \alpha = 1 - P(X \le U_\alpha) = 1 - \Phi(U_\alpha) P ( X > U α ) = ∫ U α + ∞ f ( x ) d x = α = 1 − P ( X ≤ U α ) = 1 − Φ ( U α )
② χ 2 \chi^2 χ 2 (卡方) 分布
f ( x ) = { 1 2 n 2 Γ ( n 2 ) x n 2 − 1 e − x 2 , x > 0 0 , x ≤ 0 f(x) = \begin{cases} \frac{1}{2^{\frac{n}{2}} \Gamma(\frac{n}{2})} x^{\frac{n}{2}-1} e^{-\frac{x}{2}}, & x > 0 \\ 0, & x \le 0 \end{cases} f ( x ) = { 2 2 n Γ ( 2 n ) 1 x 2 n − 1 e − 2 x , 0 , x > 0 x ≤ 0
X ∼ χ 2 ( n ) X \sim \chi^2(n) X ∼ χ 2 ( n ) ,X X X 服从自由度为 n n n 的卡方分布。
其中 Γ ( α ) \Gamma(\alpha) Γ ( α ) 是 Gamma 函数: Γ ( z ) = ∫ 0 + ∞ t z − 1 e − t d t \Gamma(z) = \int_0^{+\infty} t^{z-1} e^{-t} dt Γ ( z ) = ∫ 0 + ∞ t z − 1 e − t d t (Γ ( 1 2 ) = π \Gamma(\frac{1}{2}) = \sqrt{\pi} Γ ( 2 1 ) = π )
若 X ∼ N ( 0 , 1 ) X \sim N(0, 1) X ∼ N ( 0 , 1 ) , Y = X 2 Y = X^2 Y = X 2 服从 χ 2 ( 1 ) \chi^2(1) χ 2 ( 1 ) 分布
若 X 1 ∼ N ( 0 , 1 ) X_1 \sim N(0, 1) X 1 ∼ N ( 0 , 1 ) , X 2 ∼ N ( 0 , 1 ) X_2 \sim N(0, 1) X 2 ∼ N ( 0 , 1 ) , Y = X 1 2 + X 2 2 Y = X_1^2 + X_2^2 Y = X 1 2 + X 2 2 服从 χ 2 ( 2 ) \chi^2(2) χ 2 ( 2 ) 分布
χ 2 = ∑ i = 1 n X i 2 ∼ χ 2 ( n ) \chi^2 = \sum_{i=1}^{n} X_i^2 \sim \chi^2(n) χ 2 = ∑ i = 1 n X i 2 ∼ χ 2 ( n ) (X i ∼ N ( 0 , 1 ) X_i \sim N(0, 1) X i ∼ N ( 0 , 1 ) )
若 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X ∼ N ( μ , σ 2 ) , 则 χ 2 = ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) χ 2 = σ 2 ( n − 1 ) S 2 ∼ χ 2 ( n − 1 )
性质:
① E ( χ 2 ) = n , D ( χ 2 ) = 2 n E(\chi^2) = n, D(\chi^2) = 2n E ( χ 2 ) = n , D ( χ 2 ) = 2 n
② Y 1 ∼ χ 2 ( n 1 ) , Y 2 ∼ χ 2 ( n 2 ) ⟹ Y 1 + Y 2 ∼ χ 2 ( n 1 + n 2 ) Y_1 \sim \chi^2(n_1), Y_2 \sim \chi^2(n_2) \implies Y_1 + Y_2 \sim \chi^2(n_1 + n_2) Y 1 ∼ χ 2 ( n 1 ) , Y 2 ∼ χ 2 ( n 2 ) ⟹ Y 1 + Y 2 ∼ χ 2 ( n 1 + n 2 )
③ 当 n n n 足够大 (n > 45 n > 45 n > 45 ) 时,χ 2 ( n ) ≈ n + U α 2 n \chi^2(n) \approx n + U_\alpha \sqrt{2n} χ 2 ( n ) ≈ n + U α 2 n ,其中 Φ ( U α ) = 1 − α \Phi(U_\alpha) = 1 - \alpha Φ ( U α ) = 1 − α
③ t 分布 / 学生氏分布
f T ( x ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) − n + 1 2 f_T(x) = \frac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi} \Gamma(\frac{n}{2})} (1 + \frac{x^2}{n})^{-\frac{n+1}{2}} f T ( x ) = nπ Γ ( 2 n ) Γ ( 2 n + 1 ) ( 1 + n x 2 ) − 2 n + 1
T T T 服从自由度为 n n n 的 T T T 分布,记 T ∼ t ( n ) T \sim t(n) T ∼ t ( n ) 。
若 X , Y X, Y X , Y 相互独立,X ∼ N ( 0 , 1 ) X \sim N(0, 1) X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) Y \sim \chi^2(n) Y ∼ χ 2 ( n ) 则 T = X Y / n ∼ t ( n ) T = \frac{X}{\sqrt{Y/n}} \sim t(n) T = Y / n X ∼ t ( n )
t 分布特点: A. 关于纵轴对称; B. lim n → ∞ f T ( x ) = ϕ ( x ) \lim_{n \to \infty} f_T(x) = \phi(x) lim n → ∞ f T ( x ) = ϕ ( x )
④ F 分布
f ( x ) = { n 1 n 1 2 n 2 n 2 2 Γ ( n 1 + n 2 2 ) Γ ( n 1 2 ) Γ ( n 2 2 ) x n 1 2 − 1 ( n 1 x + n 2 ) − n 1 + n 2 2 , x > 0 0 , x ≤ 0 f(x) = \begin{cases} \frac{n_1^{\frac{n_1}{2}} n_2^{\frac{n_2}{2}} \Gamma(\frac{n_1+n_2}{2})}{\Gamma(\frac{n_1}{2}) \Gamma(\frac{n_2}{2})} x^{\frac{n_1}{2}-1} (n_1 x + n_2)^{-\frac{n_1+n_2}{2}}, & x > 0 \\ 0, & x \le 0 \end{cases} f ( x ) = ⎩ ⎨ ⎧ Γ ( 2 n 1 ) Γ ( 2 n 2 ) n 1 2 n 1 n 2 2 n 2 Γ ( 2 n 1 + n 2 ) x 2 n 1 − 1 ( n 1 x + n 2 ) − 2 n 1 + n 2 , 0 , x > 0 x ≤ 0
n 1 n_1 n 1 : 第一自由度; n 2 n_2 n 2 : 第二自由度,X ∼ F ( n 1 , n 2 ) X \sim F(n_1, n_2) X ∼ F ( n 1 , n 2 )
若 X ∼ χ 2 ( n 1 ) X \sim \chi^2(n_1) X ∼ χ 2 ( n 1 ) , Y ∼ χ 2 ( n 2 ) Y \sim \chi^2(n_2) Y ∼ χ 2 ( n 2 ) , 则 F = X / n 1 Y / n 2 ∼ F ( n 1 , n 2 ) F = \frac{X/n_1}{Y/n_2} \sim F(n_1, n_2) F = Y / n 2 X / n 1 ∼ F ( n 1 , n 2 )
若 F ∼ F ( n 1 , n 2 ) F \sim F(n_1, n_2) F ∼ F ( n 1 , n 2 ) , 则 1 F ∼ F ( n 2 , n 1 ) \frac{1}{F} \sim F(n_2, n_1) F 1 ∼ F ( n 2 , n 1 )
上侧分位数 F α ( n 1 , n 2 ) F_{\alpha}(n_1, n_2) F α ( n 1 , n 2 ) 满足 F α ( n 1 , n 2 ) ⋅ F ( 1 − α ) ( n 2 , n 1 ) = 1 F_{\alpha}(n_1, n_2) \cdot F_{(1-\alpha)}(n_2, n_1) = 1 F α ( n 1 , n 2 ) ⋅ F ( 1 − α ) ( n 2 , n 1 ) = 1
2. 抽样分布定理
A. 设 X 1 , X 2 , … , X n X_1, X_2, \dots, X_n X 1 , X 2 , … , X n 是正态总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X ∼ N ( μ , σ 2 ) 的样本,X ˉ , S 2 \bar{X}, S^2 X ˉ , S 2 是样本均值与方差:
① X ˉ \bar{X} X ˉ 与 S 2 S^2 S 2 相互独立
② X ˉ − μ σ / n ∼ N ( 0 , 1 ) \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1) σ / n X ˉ − μ ∼ N ( 0 , 1 )
③ ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ 2 ( n − 1 ) S 2 ∼ χ 2 ( n − 1 )
④ X ˉ − μ S / n ∼ t ( n − 1 ) \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1) S / n X ˉ − μ ∼ t ( n − 1 )
B. X X X 与 Y Y Y 相互独立,X ∼ N ( μ 1 , σ 1 2 ) X \sim N(\mu_1, \sigma_1^2) X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) Y \sim N(\mu_2, \sigma_2^2) Y ∼ N ( μ 2 , σ 2 2 )
① F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-1) F = S 2 2 / σ 2 2 S 1 2 / σ 1 2 ∼ F ( n 1 − 1 , n 2 − 1 )
② σ 1 2 = σ 2 2 \sigma_1^2 = \sigma_2^2 σ 1 2 = σ 2 2 时, T = ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2) T = S w n 1 1 + n 2 1 ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) ∼ t ( n 1 + n 2 − 2 )
其中 S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}} S w = n 1 + n 2 − 2 ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2
第七章. 估计理论
参数估计 { 点估计 区间估计 } { 矩估计 极大似然估计 \left\{ \begin{array}{l} \text{点估计} \\ \text{区间估计} \end{array} \right\} \left\{ \begin{array}{l} \text{矩估计} \\ \text{极大似然估计} \end{array} \right. { 点估计 区间估计 } { 矩估计 极大似然估计
点估计: F ( x ; θ ) F(x; \theta) F ( x ; θ ) , θ \theta θ 未知; 由样本 X 1 , X 2 , … , X n X_1, X_2, \dots, X_n X 1 , X 2 , … , X n 建立统计量 T ( X 1 , X 2 , … , X n ) T(X_1, X_2, \dots, X_n) T ( X 1 , X 2 , … , X n ) , 其统计值作为 θ \theta θ 的估计值 θ ^ = T ( X 1 , X 2 , … , X n ) \hat{\theta} = T(X_1, X_2, \dots, X_n) θ ^ = T ( X 1 , X 2 , … , X n ) 为 θ \theta θ 的点估计量。
矩估计: 替换原则 (E ( X ) → X ˉ E(X) \to \bar{X} E ( X ) → X ˉ ; D ( X ) → m 2 D(X) \to m_2 D ( X ) → m 2 )
样本均值是总体均值的矩法估计量 (无偏)
方差的矩法估计量是样本中心二阶矩
极大似然估计法: 按照最大可能性原则进行推断 → \to → 求 θ \theta θ 的估计值使似然函数达到最大值
① 似然函数: X → f ( x ; θ 1 , θ 2 , … , θ k ) X \to f(x; \theta_1, \theta_2, \dots, \theta_k) X → f ( x ; θ 1 , θ 2 , … , θ k )
X 1 , X 2 , … , X n X_1, X_2, \dots, X_n X 1 , X 2 , … , X n 联合概率密度 L ( θ 1 , θ 2 , … , θ k ) = ∏ i = 1 n f ( x i ; θ 1 , θ 2 , … , θ k ) L(\theta_1, \theta_2, \dots, \theta_k) = \prod_{i=1}^{n} f(x_i; \theta_1, \theta_2, \dots, \theta_k) L ( θ 1 , θ 2 , … , θ k ) = ∏ i = 1 n f ( x i ; θ 1 , θ 2 , … , θ k )
② ln L ( θ 1 , θ 2 , … , θ k ) → \ln L(\theta_1, \theta_2, \dots, \theta_k) \to ln L ( θ 1 , θ 2 , … , θ k ) → 对数似然函数
∂ L ( θ 1 , θ 2 , … , θ k ) ∂ θ k = 0 , k = 1 , 2 , ⋯ → \frac{\partial L(\theta_1, \theta_2, \dots, \theta_k)}{\partial \theta_k} = 0, k=1, 2, \dots \to ∂ θ k ∂ L ( θ 1 , θ 2 , … , θ k ) = 0 , k = 1 , 2 , ⋯ → 似然方程组
③ 步骤:
A. 写出似然函数
B. 取对数
C. 求偏导
D. 解似然方程组
区间估计: θ → \theta \to θ → 由 X 1 , X 2 , … , X n → θ ^ 1 = θ 1 ( X 1 , X 2 , … , X n ) , θ ^ 2 = θ 2 ( X 1 , X 2 , … , X n ) X_1, X_2, \dots, X_n \to \hat{\theta}_1 = \theta_1(X_1, X_2, \dots, X_n), \hat{\theta}_2 = \theta_2(X_1, X_2, \dots, X_n) X 1 , X 2 , … , X n → θ ^ 1 = θ 1 ( X 1 , X 2 , … , X n ) , θ ^ 2 = θ 2 ( X 1 , X 2 , … , X n )
对于给定 α \alpha α 满足 P { θ ^ 1 ≤ θ ≤ θ ^ 2 } = 1 − α P\{\hat{\theta}_1 \le \theta \le \hat{\theta}_2\} = 1-\alpha P { θ ^ 1 ≤ θ ≤ θ ^ 2 } = 1 − α
→ [ θ ^ 1 , θ ^ 2 ] \to [\hat{\theta}_1, \hat{\theta}_2] → [ θ ^ 1 , θ ^ 2 ] 为 θ \theta θ 置信度 1 − α 1-\alpha 1 − α 的区间估计 (置信区间)
α → \alpha \to α → 显著性水平, 一般取 0.1 或 0.05
① 确定能接受可靠程度前提下, 尽可能提高准确度
② 枢轴变量法:
A. 选取 θ \theta θ 的估计量 (X ˉ → μ , S 2 → σ 2 \bar{X} \to \mu, S^2 \to \sigma^2 X ˉ → μ , S 2 → σ 2 )
B. 建立枢轴变量: 构造关于 θ \theta θ 和样本的函数 W ( X 1 , X 2 , … , X n , θ ) W(X_1, X_2, \dots, X_n, \theta) W ( X 1 , X 2 , … , X n , θ )
C. 确定 W W W 的分布 (正态, χ 2 \chi^2 χ 2 , T T T , F F F )
D. 根据分布对 1 − α 1-\alpha 1 − α 查上侧分位数, 使 P { W 1 − α / 2 ≤ W ≤ W α / 2 } = 1 − α P\{W_{1-\alpha/2} \le W \le W_{\alpha/2}\} = 1-\alpha P { W 1 − α /2 ≤ W ≤ W α /2 } = 1 − α
→ P { A ≤ θ ≤ B } = 1 − α \to P\{A \le \theta \le B\} = 1-\alpha → P { A ≤ θ ≤ B } = 1 − α (A, B 为不含未知参数的统计量)
第八章. 假设检验
一. 基本概念
分类
关于总体参数的假设检验
关于总体分布的假设检验
原假设/零假设: 根据问题需要提出的假设 H 0 H_0 H 0
备择假设: 与原假设对立的假设 H 1 H_1 H 1
接受域: 使 H 0 H_0 H 0 予以接受的检验统计量的取值区域 A A A
拒绝域: 使 H 0 H_0 H 0 被拒绝的检验统计量的取值区域 R R R
2. 两类错误
H 0 H_0 H 0 真H 1 H_1 H 1 真拒绝 H 0 H_0 H 0 弃真 (第一类错误) 正确 接受 H 0 H_0 H 0 正确 纳伪 (第二类错误)
不可能同时减小犯两类错误的概率,减小一类错误必然使另一类错误增大。
通常做法: 先控制犯第一类错误的概率 α \alpha α ,然后再使犯第二类错误的概率 β ( α ) \beta(\alpha) β ( α ) 尽可能小。
3. 基本步骤:
① 提出 H 0 H_0 H 0 与 H 1 H_1 H 1
② 建立检验统计量: 建立一个不带任何未知参数的统计量,并在 H 0 H_0 H 0 成立的条件下确定 U U U 的分布
③ 确定 H 0 H_0 H 0 拒绝域: 选定 α \alpha α
④ 对 H 0 H_0 H 0 作判断: 根据样本值计算检验统计量 u u u ,判断 u u u 是否落在拒绝域
确定 H 0 H_0 H 0 拒绝域应遵循有利准则: 将 U U U 对 H 0 H_0 H 0 有利的区域确定为接受域,对 H 1 H_1 H 1 成立有利的区域确定为拒绝域。
α ↑ \alpha \uparrow α ↑ (显著性水平),犯第一类错误(弃真) ↑ \uparrow ↑ ,拒绝域 ↓ \downarrow ↓ 。
二. 参数假设检验
o μ \mu μ 的检验
μ \mu μ 检验法 (Z检验) → \to → 必须已知总体方差 σ 2 \sigma^2 σ 2
① 单样本检验
H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 H_0: \mu = \mu_0, H_1: \mu \neq \mu_0 H 0 : μ = μ 0 , H 1 : μ = μ 0
H 0 H_0 H 0 成立: U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1) U = σ / n X ˉ − μ 0 ∼ N ( 0 , 1 ) ,拒绝域: ∣ u ∣ > u α 2 |u| > u_{\frac{\alpha}{2}} ∣ u ∣ > u 2 α
② 双样本检验
X 1 , … , X n 1 ∼ N ( μ 1 , σ 1 2 ) X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma_1^2) X 1 , … , X n 1 ∼ N ( μ 1 , σ 1 2 ) , Y 1 , … , Y n 2 ∼ N ( μ 2 , σ 2 2 ) Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma_2^2) Y 1 , … , Y n 2 ∼ N ( μ 2 , σ 2 2 )
H 0 H_0 H 0 成立: U = X ˉ − Y ˉ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U = \frac{\bar{X} - \bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1) U = n 1 σ 1 2 + n 2 σ 2 2 X ˉ − Y ˉ ∼ N ( 0 , 1 ) ,拒绝域: ∣ u ∣ > u α 2 |u| > u_{\frac{\alpha}{2}} ∣ u ∣ > u 2 α
t t t 检验法 → \to → μ \mu μ 与 σ 2 \sigma^2 σ 2 都未知,但总体服从正态分布
① 单样本检验
X 1 , … , X n ∼ N ( μ , σ 2 ) X_1, \dots, X_n \sim N(\mu, \sigma^2) X 1 , … , X n ∼ N ( μ , σ 2 )
H 0 H_0 H 0 成立: T = X ˉ − μ 0 S / n ∼ t ( n − 1 ) T = \frac{\bar{X} - \mu_0}{S/\sqrt{n}} \sim t(n-1) T = S / n X ˉ − μ 0 ∼ t ( n − 1 ) ,拒绝域: ∣ t ∣ > t α 2 ( n − 1 ) |t| > t_{\frac{\alpha}{2}}(n-1) ∣ t ∣ > t 2 α ( n − 1 )
② 双样本检验
X 1 , … , X n 1 ∼ N ( μ 1 , σ 2 ) X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma^2) X 1 , … , X n 1 ∼ N ( μ 1 , σ 2 ) , Y 1 , … , Y n 2 ∼ N ( μ 2 , σ 2 ) Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma^2) Y 1 , … , Y n 2 ∼ N ( μ 2 , σ 2 )
X X X 与 Y Y Y 相互独立,σ 2 \sigma^2 σ 2 未知但 σ 1 2 = σ 2 2 = σ 2 \sigma_1^2 = \sigma_2^2 = \sigma^2 σ 1 2 = σ 2 2 = σ 2
H 0 H_0 H 0 成立: T = X ˉ − Y ˉ S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T = \frac{\bar{X} - \bar{Y}}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2) T = S w n 1 1 + n 2 1 X ˉ − Y ˉ ∼ t ( n 1 + n 2 − 2 )
其中 S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w = \sqrt{\frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}} S w = n 1 + n 2 − 2 ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2
拒绝域: ∣ T ∣ > t α 2 ( n 1 + n 2 − 2 ) |T| > t_{\frac{\alpha}{2}}(n_1 + n_2 - 2) ∣ T ∣ > t 2 α ( n 1 + n 2 − 2 )
o σ 2 \sigma^2 σ 2 的检验
1. χ 2 \chi^2 χ 2 检验法 → \to → 单样本
X 1 , … , X n ∼ N ( μ , σ 2 ) X_1, \dots, X_n \sim N(\mu, \sigma^2) X 1 , … , X n ∼ N ( μ , σ 2 ) ; H 0 : σ 2 = σ 0 2 , H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2 = \sigma_0^2, H_1: \sigma^2 \neq \sigma_0^2 H 0 : σ 2 = σ 0 2 , H 1 : σ 2 = σ 0 2
已知 μ \mu μ : χ 2 = ∑ i = 1 n ( X i − μ σ 0 ) 2 ∼ χ 2 ( n ) \chi^2 = \sum_{i=1}^{n} \left( \frac{X_i - \mu}{\sigma_0} \right)^2 \sim \chi^2(n) χ 2 = ∑ i = 1 n ( σ 0 X i − μ ) 2 ∼ χ 2 ( n )
未知 μ \mu μ : χ 2 = ( n − 1 ) S 2 σ 0 2 ∼ χ 2 ( n − 1 ) \chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1) χ 2 = σ 0 2 ( n − 1 ) S 2 ∼ χ 2 ( n − 1 )
拒绝域: χ 2 > χ α 2 2 \chi^2 > \chi_{\frac{\alpha}{2}}^2 χ 2 > χ 2 α 2 或 χ 2 < χ 1 − α 2 2 \chi^2 < \chi_{1-\frac{\alpha}{2}}^2 χ 2 < χ 1 − 2 α 2
2. F 检验法 → \to → 双样本
X 1 , … , X n 1 ∼ N ( μ 1 , σ 2 ) X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma^2) X 1 , … , X n 1 ∼ N ( μ 1 , σ 2 ) , Y 1 , … , Y n 2 ∼ N ( μ 2 , σ 2 ) Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma^2) Y 1 , … , Y n 2 ∼ N ( μ 2 , σ 2 )
已知 μ 1 , μ 2 \mu_1, \mu_2 μ 1 , μ 2 : F = 1 n 1 ∑ ( X i − μ 1 ) 2 1 n 2 ∑ ( Y j − μ 2 ) 2 ∼ F ( n 1 , n 2 ) F = \frac{\frac{1}{n_1} \sum (X_i - \mu_1)^2}{\frac{1}{n_2} \sum (Y_j - \mu_2)^2} \sim F(n_1, n_2) F = n 2 1 ∑ ( Y j − μ 2 ) 2 n 1 1 ∑ ( X i − μ 1 ) 2 ∼ F ( n 1 , n 2 )
未知 μ 1 , μ 2 \mu_1, \mu_2 μ 1 , μ 2 : F = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F = \frac{S_1^2}{S_2^2} \sim F(n_1 - 1, n_2 - 1) F = S 2 2 S 1 2 ∼ F ( n 1 − 1 , n 2 − 1 )
拒绝域: f > F α 2 f > F_{\frac{\alpha}{2}} f > F 2 α 或 f < F 1 − α 2 f < F_{1-\frac{\alpha}{2}} f < F 1 − 2 α
☆ 假设检验原则:
根据后果: 后果严重者设为第一类错误并控制 α \alpha α 。
爱保护的事物放原假设 H 0 H_0 H 0 。
新事物放备择假设 H 1 H_1 H 1 。
等号 ”=” 永远放在 H 0 H_0 H 0 中。
Linked Notes No outgoing note links.
Referenced By No backlinks yet.