数学 旧 .com 迁移

数理统计:统计量及其分布

从旧 .com 全量搬运的历史内容,来源路径:/math/课程/数理统计/chapters/统计量及其分布/统计量及其分布/

迁移来源

统计量及其分布 #

统计量与抽样分布 #

definition

x1,x2,,xnx_1,x_2,\cdots,x_n 为一个样本, 若样本函数 T=T(x1,x2,,xn)T=T(x_1,x_2,\cdots,x_n) 中不含有任何未知参数 (即可以由样本算出的量), 则称 TT统计量. 统计量的分布称为抽样分布.

info
  • (1) 统计量是样本的函数, 故其也有二重性.
  • (2) 尽管统计量不依赖于未知参数, 但是它的分布是依赖于未知参数的.
  • (3) 掌握: 总体分布 \Rightarrow 样本的联合概率函数 \Rightarrow 统计量的概率函数.

样本均值及其抽样分布 #

definition

x1,x2,,xnx_1,x_2,\ldots,x_n 为一个样本, 其算数平均值称为样本均值, 反映的是样本的中心位置. 一般用 x\overline{x} 表示, 有时也用 X\overline{X} 表示, 即

x=x1+x2++xnn=1ni=1nxi.\begin{equation} \overline{x} = \dfrac{x_1+x_2+\cdots+x_n}{n} = \dfrac{1}{n}\sum\limits_{i=1}^n x_i. \end{equation}

在分组样本场合, 样本均值的近似公式为

tip

设总体 XX 的均值 E(X)=μE(X)=\mu, 方差 \var(X)=σ2<+\var(X)=\sigma^2 < +\infty, 令 X1,,XnX_1,\ldots,X_n 是来自总体 XX 的随机样本, 样本均值为

Xn=1ni=1nXi,\overline{X}_n=\dfrac{1}{n}\sum\limits_{i=1}^n X_i,

E(Xn)=μ,\var(Xn)=σ2n.E(\overline{X}_n)=\mu,\quad \var(\overline{X_n})=\dfrac{\sigma^2}{n}.
note
E(Xn)=E(1ni=1nxi)=1nE(i=1nXi)=1ni=1nE(Xi)=1ni=1nE(X)=E(x)=μ.\var(Xn)=\var(1ni=1nxi)=1n2\var(i=1nXi)=1n2i=1n\var(Xi)=1n2i=1n\var(X)=\var(X)n=σ2n.\begin{aligned} E(\overline{X}_n) &= E(\dfrac{1}{n}\sum\limits_{i=1}^n x_i)\\ &= \dfrac{1}{n}E(\sum\limits_{i=1}^n X_i)\\ &=\dfrac{1}{n}\sum\limits_{i=1}^n E(X_i)\\ &=\dfrac{1}{n}\sum\limits_{i=1}^n E(X)\\ &=E(x)=\mu. \end{aligned}\quad \begin{aligned} \var(\overline{X}_n) &= \var(\dfrac{1}{n}\sum\limits_{i=1}^n x_i)\\ &= \dfrac{1}{n^2}\var(\sum\limits_{i=1}^n X_i)\\ &=\dfrac{1}{n^2}\sum\limits_{i=1}^n \var(X_i)\\ &=\dfrac{1}{n^2}\sum\limits_{i=1}^n \var(X)\\ &=\dfrac{\var(X)}{n}=\dfrac{\sigma^2}{n}. \end{aligned}

利用切比雪夫不等式

P(Xμ<ε)1\var(X)ε2P(|X-\mu|<\varepsilon)\geqslant 1-\dfrac{\var(X)}{\varepsilon^2}

估计满足精度要求的样本数量. {{< admonition example “例” true >}} 假设某一分布的均值未知, 方差 σ2=1\sigma^2=1, 用样本均值估计总体期望, 要求有 0.950.95 的概率误差在 0.50.5 以内. 即要求 P(Xnμ<0.5)0.95P(|\overline{X}_n-\mu|<0.5)\geqslant 0.95.

利用切比雪夫不等式 P(Xnμ<0.5)1\var(Xn)ε2=1σ2εn0.95P(|\overline{X}_n-\mu|<0.5)\geqslant 1-\dfrac{\var(\overline{X}_n)}{\varepsilon^2}=1-\dfrac{\sigma^2}{\varepsilon n}\geqslant0.95

11n×140.95n801-\dfrac{1}{n\times \frac{1}{4}}\geqslant 0.95\Rightarrow n\geqslant 80.

在确定总体分布下的样本均值分布

即求 X1,,XnX_1,\ldots,X_n 是来自下列确定分布的随机样本, 求 Xn\overline{X}_n 的精确分布.

  • (1) 伯努利分布 XB(n,p)X\sim B(n,p).
  • (2) Poisson 分布 P(λ)P(\lambda), 其中 λ>0\lambda>0. P(Xn=kn)=eλn(nλ)kk!P\left(\overline{X}_n=\dfrac{k}{n}\right)= e^{-\lambda n}\dfrac{(n \lambda)^k}{k!}.
  • (3) 指数分布 Exp(θ)\t{Exp}(\theta).
  • (4) 柯西分布 XCauchy(a,b):f(x)=1πb{1+[(xa)/p]2}X\sim \text{Cauchy}(a,b):f(x)=\dfrac{1}{\pi b\{1+[(x-a)/p]^2\}}. XX 的特征函数为
E(eitX)=eitabt,E(e^{\text{i} tX})=e^{\text{i} ta-b|t|},

可推出

E(eitXn)=[E(eitnX)]n=eitabt,E(e^{\text{i} t\overline{X}_n})=[E(e^{\text{i} \frac t n} X)]^n=e^{\text{i} ta-b|t|},

从而 XnCauchy(a,b)\overline{X}_n\sim\text{Cauchy}(a,b).

  • (5) 正态分布 N(μ,σ2)N(\mu,\sigma^2).
  • (6) 渐进分布
abstract

样本均值 Xn\overline{X}_n 的特征函数与总体的特征函数满足:

E(eitXn)=[E(eitnX)]n.E(e^{\text{i} t\overline{X}_n})=[E(e^{\text{i} \frac t n} X)]^n.

讨论

评论

正在加载评论...