重要的连续分布
各分布简介
分布类型 | 简介 |
---|---|
均匀分布 | 古典派中的几何概型 |
正态分布 | 二项分布的另一种极限 |
指数分布 | 泊松分布的间隔, 连续的几何分布 |
均匀分布
均匀分布的定义
如果连续随机变量X的概率密度函数为:
\[ p(x)= \begin{cases} \frac{1}{b-a}, &a < x < b\\ 0, & 其它 \end{cases} \]
则称X服从区间(a,b)上的均匀分布,记作 \(X\sim U(a,b)\) ,其累积分布函数为:
\[ F(x)=\begin{cases} 0,&x < a\\ \frac{x-a}{b-a},&a\le x \le b\\ 1,&x > b \end{cases} \]
期望和方差分别为:
\[ E(X)=\frac{a+b}{2},\quad Var(X)=\frac{(b-a)^2}{12} \]
正态分布
二项分布原是一个离散分布模型。 但是, 当伯努利实验次数较多的时候, 二项分布的计算较为困难(没有计算机的时候), 所以, 就有了逼近二项分布, 在当n比较大的时候用于逼近二项分布。
逼近二项分布的定义
X服从于二项分布
\[ X \sim b(n, p) \]
那么它的期望和方差为
\[ \begin{split} \mu & = np \\ \sigma^2 & = np(1-p) \end{split} \]
则可以使用以下公式逼近二项分布
\[ p(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad -\infty < x < +\infty \]
这个逼近的分布方式, 就是 正态分布 (normal distribution), 也叫做 高斯分布 (Gaussian distribution)
其累积分布函数为:
\[ F(x)=\frac{1}{\sigma\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}\mathrm{d}t \]
正态分布的重要性质
线性
若有随机变量X符合正态分布
\[ X\sim N(\mu, \sigma^2) \]
那么则有
\[ aX+b \sim N(a\mu + b, a^2\sigma^2) \]
这条重要的性质可以使得任意的正态分布转换为标准正态分布。
即:
若有
\[ \text{若有} X \sim N(\mu, \sigma^2) \]
则有
\[ \ Z = \frac{X-\mu}{\sigma} \sim N(0, 1) \]
上α分位点
如果有 \(Z\sim N(0,1)\) ,如果 \(z_\alpha\) 满足:
\[ P(Z > z_\alpha) = \alpha,\quad 0 < \alpha < 1 \]
那么称点 \(z_\alpha\) 为标准正态分布的 上α分位点。
六西格玛
对于随机变量 \(X\sim N(\mu, \sigma^2)\)
不论 \(\mu , \sigma\) 的取值是什么, 其中, 关于 \(\mu\) 对称的面积都是确定的
\[ \begin{split} P(\mu-\sigma\le X\le \mu+\sigma)\approx 68.26\% \\ P(\mu-3\sigma\le X\le \mu+3\sigma)\approx 99.72\% \end{split} \]
指数分布
指数分布的定义
若随机变量X的概率密度函数为:
\[ p(x)=\begin{cases} \lambda e^{-\lambda x}, & x \ge 0\\ 0,& x < 0 \end{cases} \]
其中 \(\lambda > 0\) ,称X服从指数分布,也可以记为:
\[ X \sim Exp(\lambda) \]
累积分布函数为:
\[ F(x)=\begin{cases} 1-e^{-\lambda x}, & x \ge 0\\ 0,& x < 0 \end{cases} \]
指数分布 \(X\sim Exp(\lambda)\) 的期望和方差为:
\[ E(X)=\frac{1}{\lambda},\quad Var(X)=\frac{1}{\lambda^2} \]