0%

重要的连续分布

重要的连续分布

各分布简介

分布类型 简介
均匀分布 古典派中的几何概型
正态分布 二项分布的另一种极限
指数分布 泊松分布的间隔, 连续的几何分布

均匀分布

均匀分布的定义

如果连续随机变量X的概率密度函数为:

\[ p(x)= \begin{cases} \frac{1}{b-a}, &a < x < b\\ 0, & 其它 \end{cases} \]

则称X服从区间(a,b)上的均匀分布,记作 \(X\sim U(a,b)\) ,其累积分布函数为:

\[ F(x)=\begin{cases} 0,&x < a\\ \frac{x-a}{b-a},&a\le x \le b\\ 1,&x > b \end{cases} \]

期望和方差分别为:

\[ E(X)=\frac{a+b}{2},\quad Var(X)=\frac{(b-a)^2}{12} \]

正态分布

二项分布原是一个离散分布模型。 但是, 当伯努利实验次数较多的时候, 二项分布的计算较为困难(没有计算机的时候), 所以, 就有了逼近二项分布, 在当n比较大的时候用于逼近二项分布。

逼近二项分布的定义

X服从于二项分布

\[ X \sim b(n, p) \]

那么它的期望和方差为

\[ \begin{split} \mu & = np \\ \sigma^2 & = np(1-p) \end{split} \]

则可以使用以下公式逼近二项分布

\[ p(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad -\infty < x < +\infty \]

这个逼近的分布方式, 就是 正态分布 (normal distribution), 也叫做 高斯分布 (Gaussian distribution)

累积分布函数为:

\[ F(x)=\frac{1}{\sigma\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}\mathrm{d}t \]

正态分布的重要性质

线性

若有随机变量X符合正态分布

\[ X\sim N(\mu, \sigma^2) \]

那么则有

\[ aX+b \sim N(a\mu + b, a^2\sigma^2) \]

这条重要的性质可以使得任意的正态分布转换为标准正态分布

即:

若有

\[ \text{若有} X \sim N(\mu, \sigma^2) \]

则有

\[ \ Z = \frac{X-\mu}{\sigma} \sim N(0, 1) \]

上α分位点

如果有 \(Z\sim N(0,1)\) ,如果 \(z_\alpha\) 满足:

\[ P(Z > z_\alpha) = \alpha,\quad 0 < \alpha < 1 \]

那么称点 \(z_\alpha\) 为标准正态分布的 上α分位点

六西格玛

对于随机变量 \(X\sim N(\mu, \sigma^2)\)

不论 \(\mu , \sigma\) 的取值是什么, 其中, 关于 \(\mu\) 对称的面积都是确定的

\[ \begin{split} P(\mu-\sigma\le X\le \mu+\sigma)\approx 68.26\% \\ P(\mu-3\sigma\le X\le \mu+3\sigma)\approx 99.72\% \end{split} \]

指数分布

指数分布的定义

若随机变量X的概率密度函数为:

\[ p(x)=\begin{cases} \lambda e^{-\lambda x}, & x \ge 0\\ 0,& x < 0 \end{cases} \]

其中 \(\lambda > 0\) ,称X服从指数分布,也可以记为:

\[ X \sim Exp(\lambda) \]

累积分布函数为:

\[ F(x)=\begin{cases} 1-e^{-\lambda x}, & x \ge 0\\ 0,& x < 0 \end{cases} \]

指数分布 \(X\sim Exp(\lambda)\) 的期望和方差为:

\[ E(X)=\frac{1}{\lambda},\quad Var(X)=\frac{1}{\lambda^2} \]

指数分布的性质

无记忆性