多项分布概率公式的理解

多项分布是二项分布的推广。二项分布(也叫伯努利分布)的典型例子是扔硬币,硬币正面朝上概率为\(p\), 重复扔\(n\)次硬币,\(k\)次为正面的概率即为一个二项分布概率。而多项分布就像扔骰子,有6个面对应6个不同的点数。二项分布时事件\(X\)只有2种取值,而多项分布的\(X\)有多种取值,多项分布的概率公式为  \[P(X_{1}=x_1,\cdots ,X_{k}=x_{k})= \begin{cases}&\frac{n!}{x_{1}!,\cdots,x_{k}!}p^{x_{1}}\cdots p^{x_{k}}\quad \textrm{when}\sum^{k}_{i=1}{x_{i}=n}\\&0 \qquad\qquad\qquad\qquad\qquad\;\textrm{otherwise.} \end{cases}\]  这个公式看上去像是莫名其妙地冒出来的,想要了解它首先必须要知道组合数学中的多项式定理。

多项式定理:\(n\)是一个正整数时,我们有   \[(x_{1}+x_{2}+\ldots+x_{k})^n=\sum{\frac{n!}{r_1!r_2!\cdots r_k!}x_1^{r_1}\ldots x_k^{r_k}}\]   其中\(r_1+ \ldots + r_k=n,r_i \geq 0\)

这个多项式定理的推导如下,将式子左边展开  

\[ (x_{1}+x_{2}+\ldots+x_{k})^n=(x_{1}+x_{2}+\ldots+x_{k})\cdots(x_{1}+x_{2}+\cdots+x_{k}) \]

这样的话,我们可以把问题看成在\(n\)个式子里,先选取\(r_1\)\(x_1\),然后选取\(r_2\)\(x_2\),最后选取\(r_k\)\(x_k\),然后求有多少种方法。类似把\(n\)个球放到\(k\)个不同的盒子里的方法有多少种,我们得到  \[C_{n}^{r_1,r_2,\ldots r_k}=C_{n}^{r_1}C_{n-r_1}^{r_2} \ldots C_{n-r_1\ldots-r_{k-1}}^{r_k}=\frac{n!}{r_1!r_2!\ldots r_k!}\]    所以\(x_1^{r_1}x_2^{r_2}\ldots x_k^{r_k}\)的系数为\(C_{n}^{r_1,r_2,\ldots r_k}\),这样,我们就能得到展开式的通式。举个例子,当\(k=2\)时,我们就得到了常见的二项式公式: \[(a+b)^n=\sum_{i=0}^{n}{C_{n}^{i}a^{i}b^{n-i}}\]

再来看之前的多项分布的概率公式,假设\(X_1,X_2,\ldots,X_k\)发生的概率为\(p_1,p_2,\ldots,p_k\),由于事件之间是相互独立的,可得\(p_1+p_2+\ldots+p_k=1\)。 我们将\(p_1+p_2+\ldots+p_k=1\)式子的左边看做一次抽样各种事件发生的概率和,那么\((p_1+p_2+\ldots+p_k)^n=1^n=1\)则是进行了\(n\)次抽样所有事件相互组合的对应概率和。把这个多项式展开,它的每一项都对应着一个特殊事件的出现概率。我们把展开式的通项作为\(X_1\)出现\(x_1\)次,\(X_2\)出现\(x_2\)次,…,\(X_k\)出现\(x_k\)次的这种事件的出现概率,这样就得到了多项分布的概率公式。