Alex_McAvoy

想要成为渔夫的猎手

常见概率分布

Reference

【离散分布】

伯努利试验

满足以下描述的试验,被称为伯努利试验(Bernoulli experiment)

  1. 试验只能有互斥的两种结果,发生或不发生,成功或失败
  2. 每次试验中,某种结果发生的概率是 $p$,另一种结果发生的概率是 $1-p$
  3. 试验是互相独立的,且可重复进行 $n$ 次

伯努利试验,对应的现实场景是有放回抽样

伯努利分布

伯努利分布(Bernoulli Distribution)又称 0-1 分布、两点分布,用于描述一次伯努利试验中是否成功

记 $X$ 为一次伯努利试验中事件 $A$ 成功的次数,则 $X=0,1$,假设事件 $A$ 发生的概率为 $p$,那么称 $X$ 服从参数为 $1,p$ 的伯努利分布,记作 $X\sim B(1,p)$

$X$ 的概率分布为:

即:


伯努利分布的数学期望和方差分别为:

  • $EX=p$
  • $DX=p(1-p)$

伯努利分布的特征函数为:

二项分布

二项分布(Binomial Distribution)又称 $n$ 重伯努利分布,用于描述 $n$ 次伯努利试验中成功的次数

记 $X$ 为 $n$ 重伯努利试验中事件 $A$ 成功的次数,则 $X=0,1,2,\cdots,n$,假设事件 $A$ 发生的概率为 $p$,那么称 $X$ 服从参数为 $n,p$ 的伯努利分布,记作 $X\sim B(n,p)$

$X$ 的概率分布为:

在独立条件下,二项分布对于其中的参数 $n$ 具有可加性,即:$X_1\sim B(n_1,p)$,$X_2\sim B(n_2,p)$,且 $X_1,X_2$ 独立,有 $X_1+X_2\sim B(n_1+n_2,p)$

进一步,服从 $B(n,p)$ 的随机变量可以看作是 $n$ 个相互独立的服从伯努利分布 $B(1,p)$ 的随机变量之和


二项分布的数学期望和方差分别为:

  • $EX=np$
  • $DX=np(1-p)$

二项分布的特征函数为:

几何分布

几何分布(Geometric Distribution)用于描述伯努利试验序列中,事件 $A$ 首次出现的试验次数

重复进行伯努利试验,直到事件 $A$ 发生为止才停下,记 $X$ 为若干次伯努利试验中事件 $A$ 进行的次数,则 $X=1,2,\cdots$,假设事件 $A$ 发生的概率为 $p$,那么称 $X$ 服从参数为 $p$ 的几何分布,记作 $X\sim G(p)$

$X$ 的概率分布为:

几何分布具有无记忆性:若 $X\sim G(p)$,对 $\forall n,m\in Z^+$,有

该性质表明,在前 $m$ 次试验中 $A$ 没有出现的条件下,则在接下去的 $n$ 次试验中 $A$ 仍未出现的概率只与 $n$ 有关,而与以前的 $m$ 次试验无关,似乎忘记了前 $m$ 次试验结果


几何分布的数学期望和方差分别为:

  • $EX=\frac{1}{p}$
  • $DX=\frac{1-p}{p^2}$

几何分布的特征函数为:

负二项分布与帕斯卡分布

负二项分布(Negative Binomial Distribution)用于描述伯努利试验序列中,事件 $A$ 第 $r$ 次出现时的试验次数

重复进行伯努利试验,直到事件 $A$ 发生第 $r$ 次时才停下,记 $X$ 为若干次伯努利试验中事件 $A$ 进行的次数,则 $X=r,r+1,\cdots$,假设事件 $A$ 发生的概率为 $p$,那么称 $X$ 服从参数为 $r,p$ 的负二项分布,记作 $X\sim NB(r,p)$

$X$ 的概率分布为:

当 $r$ 为整数时,称 $X$ 服从参数为 $r,p$ 的帕斯卡分布(Pascal Distribution),记作 $X\sim Pas(r,p)$

需要注意的是,尽管很难想象一个非整数的失败次数,但这个分布是通过概率密度函数在形式上严格定义的

可以发现,当 $r=1$ 时,帕斯卡分布即几何分布,即:$Pas(1,p)=G(p)$

与二项分布类似,帕斯卡分布对于其中的参数 $r$ 具有可加性,即:$X_1\sim Pas(r_1,p)$,$X_2\sim Pas(r_2,p)$,且 $X_1,X_2$ 独立,有 $X_1+X_2\sim Pas(r_1+r_2,p)$

进一步,服从帕斯卡分布 $Pas(r,p)$ 的随机变量可以看作是 $r$ 个相互独立的服从几何分布 $G(p)$ 的随机变量之和


负二项分布的数学期望和方差分别为:

  • $EX=\frac{r}{p}$
  • $DX=\frac{r(1-p)}{p^2}$

负二项分布的特征函数为:

泊松分布

泊松分布(Poisson Distribution)常与单位时间、单位面积、单位体积上的计数过程相联系

记 $X$ 为某个随机事件 $A$ 发生的次数,则 $X=0,1,2,\cdots,n$,假设每次事件 $A$ 是否发生相互独立,且事件 $A$ 平均发生 $\lambda$ 次,那么 $X$ 服从参数为 $\lambda$ 的泊松分布,记为 $X\sim P(\lambda)$

$X$ 的概率分布为:

与二项分布类似,泊松分布在独立条件下对于参数 $\lambda$ 具有可加性,即:$X_1\sim P(\lambda_1)$,$X_2\sim P(\lambda_2)$,且 $X_1,X_2$ 独立,有 $X_1+X_2\sim P(\lambda_1+\lambda_2)$

事实上,泊松分布本质上是 $n\rightarrow \infty$ 时的二项分布,即若 $\lim\limits_{n\rightarrow \infty} np_n=\lambda,0<p_n<1$,则有:

也就是说,当 $n$ 足够大,且此时平均发生的事件数趋于常数 $\lambda$ 时,二项分布 $B(n,p_n)$ 实质上就是泊松分布 $P(\lambda)$


泊松分布的数学期望和方差分别为:

  • $EX=\lambda$
  • $DX=\lambda$

泊松分布的特征函数为:

超几何分布

超几何分布(Hypergeometric Distribution)用于描述 $N$ 个产品中不放回的随机抽取 $n$ 个的次品数

设有 $N$ 个产品,其中有 $M(M\leq N)$ 个次品,从中不放回的随机抽取 $n(n\leq N)$ 个,记 $X$ 为这 $n$ 个中的次品数,则 $X=0,1,\cdots,\min\{M,n\}$,称 $X$ 服从参数为 $n,N,M$ 的超几何分布,记作 $X\sim H(n,M,N)$

$X$ 的概率分布为:

当次品数 $M$ 只与产品数 $N$ 相关时,且 $\lim\limits_{N\rightarrow\infty}\frac{M}{N}=p\in(0,1)$,则有:

也就是说,当总量 $N$ 足够大时,若次品率 $\frac{M}{N}$ 趋于一个常数 $p$,那么进行无放回抽取(超几何分布)可以近似为有放回抽取(二项分布)


超几何分布的数学期望和方差分别为:

  • $EX=\frac{nM}{N}$
  • $DX=\frac{nM(N-m)(N-n)}{N^2(N-1)}$

超几何分布的特征函数为:

【连续分布】

正态分布

若随机变量 $X$ 的概率密度函数为:

则称 $X$ 服从参数为 $\mu,\sigma^2$ 的正态分布,记作 $X\sim N(\mu,\sigma^2)$,其中 $\mu$ 为位置参数,用于控制曲线在 $x$ 上的位置,$\sigma$ 为尺度参数,用于控制曲线的形状

容易看出,其具备如下性质:

  • $f(x)$ 关于 $x=\mu$ 对称
  • $f(\mu)$ 为最大值
  • $x=\mu\pm\sigma$ 为拐点

其分布函数为:

当 $\mu=0,\sigma^2=1$ 时,有 $X\sim N(0,1)$,此时称正态分布为标准正态分布,此时概率密度函数和分布函数分别为:

故有:若 $X~\sim N(\mu,\sigma^2)$,则

  • $P(X\leq a) = \Phi(\frac{a-\mu}{\sigma})$
  • $P(a\leq X \leq b)=\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})$

任何一个正态变量均可通过标准化转换为标准正态分布,即若 $X\sim N(\mu,\sigma^2)$,有:

故有:若 $X\sim N(0,1)$,则

  • $\Phi(-a)=1-\Phi(a)$
  • $P(X>a)=1-\Phi(a)$
  • $P(a<X<b)=\Phi(b)-\Phi(a)$
  • $P(|X|<c)=2\Phi(c)-1$

正态分布的数学期望和方差分别为:

  • $EX=\mu$
  • $DX=\sigma^2$

正态分布的特征函数为:

均匀分布

若随机变量 $X$ 的概率密度函数为:

则称 $X$ 服从区间 $(a,b)$ 上的均匀分布,记作 $X\sim U(a,b)$

其分布函数为:


均匀分布的数学期望和方差分别为:

  • $EX=\frac{a+b}{2}$
  • $DX=\frac{(b-a)^2}{12}$

均匀分布的特征函数为:

指数分布

指数分布是一种偏态分布,随机变量只可能取非负实数,常被用作各种寿命分布,譬如电子元器件的寿命、动物的寿命、电话的通话时间、随机服务系统中的服务时间等,其在可靠性与排队论中有着广泛的应用

若随机变量 $X$ 的概率密度函数为:

则称 $X$ 服从参数为 $\lambda$ 的指数分布,记作 $X\sim E(\lambda)$

其分布函数为:

与几何分布类似,指数分布具有无记忆性:若 $X\sim E(\lambda)$,对 $\forall t,s>0$,有


指数分布的数学期望和方差分别为:

  • $EX=\frac{1}{\lambda}$
  • $DX=\frac{1}{\lambda^2}$

指数分布的特征函数为:

伽马分布

首先引入伽马函数:

其具有如下性质:

  • $\Gamma(1)=1,\Gamma(\frac{1}{2})=\sqrt{\pi}$
  • $\Gamma(\alpha+1)=\alpha\Gamma(\alpha)$
  • $\Gamma(n+1)=n\Gamma(n)=n!$,其中 $n$ 为自然数

若随机变量 $X$ 的概率密度函数为:

则称 $X$ 服从参数为 $\alpha,\lambda$ 的伽马分布,记作 $X\sim \Gamma(\alpha,\lambda)$,其中 $\alpha>0$ 为形状参数,$\lambda>0$ 为尺度参数

可以发现,当 $\alpha=1$ 时,伽马分布即指数分布,即 $\Gamma(1,\lambda)=E(\lambda)$

与二项分布类似,伽马分布对于其中的参数 $\alpha$ 具有可加性,即:$X_1\sim \Gamma(\alpha_1,\lambda)$,$X_2\sim \Gamma(\alpha_2,\lambda)$,且 $X_1,X_2$ 独立,有 $X_1+X_2\sim \Gamma(\alpha_1+\alpha_2,\lambda)$

进一步,服从伽马分布 $\Gamma(\alpha,\lambda)$ 的随机变量可以看作是 $\alpha$ 个相互独立的服从指数分布 $E(p)$ 的随机变量之和

此外,当 $\alpha=\frac{n}{2},\lambda=\frac{1}{2}$ 时,伽马分布 $\Gamma(\frac{n}{2},\frac{1}{2})$ 为自由度为 $n$ 的卡方分布,记作 $\chi^2(n)$


伽马分布的数学期望和方差分别为:

  • $EX=\frac{\alpha}{\lambda}$
  • $DX=\frac{\alpha}{\lambda^2}$

伽马分布的特征函数为:

贝塔分布

首先引入贝塔函数:

其具有如下性质:

  • $B(a,b)=B(b,a)$
  • $B(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}$

若随机变量 $X$ 的概率密度函数为:

则称 $X$ 服从参数为 $a,b$ 的贝塔分布,记作 $X\sim Be(a,b)$,其中 $a,b>0$ 均为形状参数


贝塔分布的数学期望和方差分别为:

  • $EX=\frac{a}{a+b}$
  • $DX=\frac{ab}{(a+b)^2(a+b+1)}$

【随机向量的分布】

多项分布

多项分布(Multinomial Distribution)是二项分布的推广

独立进行 $N$ 次伯努利试验,设 $A_1,A_2,\cdots,A_n$ 为完备事件组,用 $X_i$ 表示事件 $A_i$ 发生的次数,若事件 $A_i$ 发生的概率为 $p_i$,那么称 $\mathbf{X}=(X_1,X_2,\cdots,X_n)$ 服从多项分布,记作 $\mathbf{X} \sim PN(N,p_1,p_2,\cdots,p_r)$

$\mathbf{X}$ 的概率分布为:

其中,$k_i\geq0$,且 $k_1+\cdots+k_n=N$

二维正态分布

若随机变量 $(X,Y)$ 的联合概率密度为:

其中,$\sigma_1,\sigma_2 >0,-1<\rho<1$

则称 $(X,Y)$ 服从参数为 $\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho$ 的二维正态分布,记作 $(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$

$X,Y$ 的边缘密度均为正态分布,且参数分别来自二维正态分布中的 $\sigma_1,\sigma_2,\mu_1,\mu_2$ ,与 $\rho$ 无关,即:

故有: $X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)$

进一步可得,$X,Y$ 独立的充要条件为:$\rho=0$

二维均匀分布

二维均匀分布是均匀分布的推广

设 $D\in \mathbb{R}^2$,$m(D)$ 为其面积,若 $(X,Y)$ 有联合概率密度:

则称 $(X,Y)$ 服从 $D$ 上的均匀分布

感谢您对我的支持,让我继续努力分享有用的技术与知识点!