数理统计：统计量及其分布

迁移来源

旧站标题：统计量及其分布

新站标题：数理统计：统计量及其分布

旧站路径：/math/课程/数理统计/chapters/统计量及其分布/统计量及其分布/

旧页面 ID：513

统计量及其分布 #

统计量与抽样分布 #

definition

设 $x_1,x_2,\cdots,x_n$ 为一个样本, 若样本函数 $T=T(x_1,x_2,\cdots,x_n)$ 中不含有任何未知参数 (即可以由样本算出的量), 则称 $T$ 为统计量. 统计量的分布称为抽样分布.

info

(1) 统计量是样本的函数, 故其也有二重性.
(2) 尽管统计量不依赖于未知参数, 但是它的分布是依赖于未知参数的.
(3) 掌握: 总体分布 $\Rightarrow$ 样本的联合概率函数 $\Rightarrow$ 统计量的概率函数.

样本均值及其抽样分布 #

definition

设 $x_1,x_2,\ldots,x_n$ 为一个样本, 其算数平均值称为样本均值, 反映的是样本的中心位置. 一般用 $\overline{x}$ 表示, 有时也用 $\overline{X}$ 表示, 即

\begin{equation} \overline{x} = \dfrac{x_1+x_2+\cdots+x_n}{n} = \dfrac{1}{n}\sum\limits_{i=1}^n x_i. \end{equation}

在分组样本场合, 样本均值的近似公式为

tip

设总体 $X$ 的均值 $E(X)=\mu$ , 方差 $\var(X)=\sigma^2 < +\infty$ , 令 $X_1,\ldots,X_n$ 是来自总体 $X$ 的随机样本, 样本均值为

\overline{X}_n=\dfrac{1}{n}\sum\limits_{i=1}^n X_i,

则

E(\overline{X}_n)=\mu,\quad \var(\overline{X_n})=\dfrac{\sigma^2}{n}.

note

\begin{aligned} E(\overline{X}_n) &= E(\dfrac{1}{n}\sum\limits_{i=1}^n x_i)\\ &= \dfrac{1}{n}E(\sum\limits_{i=1}^n X_i)\\ &=\dfrac{1}{n}\sum\limits_{i=1}^n E(X_i)\\ &=\dfrac{1}{n}\sum\limits_{i=1}^n E(X)\\ &=E(x)=\mu. \end{aligned}\quad \begin{aligned} \var(\overline{X}_n) &= \var(\dfrac{1}{n}\sum\limits_{i=1}^n x_i)\\ &= \dfrac{1}{n^2}\var(\sum\limits_{i=1}^n X_i)\\ &=\dfrac{1}{n^2}\sum\limits_{i=1}^n \var(X_i)\\ &=\dfrac{1}{n^2}\sum\limits_{i=1}^n \var(X)\\ &=\dfrac{\var(X)}{n}=\dfrac{\sigma^2}{n}. \end{aligned}

利用切比雪夫不等式

P(|X-\mu|<\varepsilon)\geqslant 1-\dfrac{\var(X)}{\varepsilon^2}

估计满足精度要求的样本数量. {{< admonition example “例” true >}} 假设某一分布的均值未知, 方差 $\sigma^2=1$ , 用样本均值估计总体期望, 要求有 $0.95$ 的概率误差在 $0.5$ 以内. 即要求 $P(|\overline{X}_n-\mu|<0.5)\geqslant 0.95$ .

利用切比雪夫不等式 $P(|\overline{X}_n-\mu|<0.5)\geqslant 1-\dfrac{\var(\overline{X}_n)}{\varepsilon^2}=1-\dfrac{\sigma^2}{\varepsilon n}\geqslant0.95$

即 $1-\dfrac{1}{n\times \frac{1}{4}}\geqslant 0.95\Rightarrow n\geqslant 80$ .

在确定总体分布下的样本均值分布

即求 $X_1,\ldots,X_n$ 是来自下列确定分布的随机样本, 求 $\overline{X}_n$ 的精确分布.

(1) 伯努利分布 $X\sim B(n,p)$ .
(2) Poisson 分布 $P(\lambda)$ , 其中 $\lambda>0$ . $P\left(\overline{X}_n=\dfrac{k}{n}\right)= e^{-\lambda n}\dfrac{(n \lambda)^k}{k!}$ .
(3) 指数分布 $\t{Exp}(\theta)$ .
(4) 柯西分布 $X\sim \text{Cauchy}(a,b):f(x)=\dfrac{1}{\pi b\{1+[(x-a)/p]^2\}}$ . $X$ 的特征函数为

E(e^{\text{i} tX})=e^{\text{i} ta-b|t|},

可推出

E(e^{\text{i} t\overline{X}_n})=[E(e^{\text{i} \frac t n} X)]^n=e^{\text{i} ta-b|t|},

从而 $\overline{X}_n\sim\text{Cauchy}(a,b)$ .

(5) 正态分布 $N(\mu,\sigma^2)$ .
(6) 渐进分布

abstract

样本均值 $\overline{X}_n$ 的特征函数与总体的特征函数满足:

E(e^{\text{i} t\overline{X}_n})=[E(e^{\text{i} \frac t n} X)]^n.

统计量及其分布 #

统计量与抽样分布 #

样本均值及其抽样分布 #

评论