「概率基础」常见概率分布
本文主要总结一些基础的概率分布,便于遗忘时查阅。
从最基础的抛硬币开始吧~
大家都知道一枚硬币只有正面和反面两种可能情况,用随机变量$X$来表示抛硬币的结果,那么$X$的可能情况为$X=1$(表示正面)或$X=0$(表示反面),伯努利试验也就指抛一次硬币的结果,即
$$ P(X=k) = p^k(1-p)^{1-k}, k=0,1 $$ 其中$p$代表的就是硬币为正面的概率。我们也称$X$满足参数为$p$的伯努利分布,$X\sim Ber(p)$
到这里我们只抛了一次硬币,那么如果多抛几次呢,那就是二项分布,即独立重复$n$次抛硬币(伯努利试验)。而原来的随机变量$X$表示的就是$n$次试验中正面朝上的次数,因此$X$的可能取值也就是$0,1,…,n$,出现$k$次正面的概率为
$$ P(X=k)=C_n^k p^k(1-p)^{n-k} $$ 其中$C_n^k=\frac{n!}{k!(n-k)!}$为二项系数。 我们也称$X$满足参数为$(n,p)$的二项分布$X\sim B(n,p)$, 二项分布具有期望$E[X]=np$和方差$Var[X]=np(1-p)$。
有人会觉得抛硬币不过瘾,结果就两种情况,想要探索更多的情况我们进入到掷骰子,而且是一个不均匀的筛子,也就是不用面发生的可能性是不一样的,假设各个面发生的概率为$p=[p_1,…,p_6],\sum p_i=1$,并且引入$X=[X_1,…,X_6]$来表示各个面的情况,也就是说$X_i$里只有一个是$1$其他都是$0$,比如你筛子是3朝上,那么$X_3=1$,$X_1,X_2,X_4,X_5,X_6$均为$0$。这时候我们就可以表示$X$这个随机向量的概率了:
$$ P(X|p)=\prod_{i=1}^{6}p_i^{X_i} $$
那如果掷骰子$n$次呢,$X=[X_1,…,X_6]$这时候表示的就是$n$次试验中某个面向上的次数。 我们记第$i$面朝上的次数为$m_i$且满足$\sum m_i=n$,那么这时候$X$满足的就是多项分布:
记做$X\sim Multi(n,p)$一句话概括多项分布就是一个多种可能情况的事件独立发生$n$次,各种可能情况发生次数的联合分布。
多项分布的统计量满足$E[X_i]=Np_i$,$Var[X_i]=Np_i(1-p_i)$,$Cov(X_i,X_j)=-Np_ip_j$