概率论笔记2

02 Jul 2013 by LelouchHe

样本空间与事件

样本空间和事件都是现代的集合概念,二者的试验本质是相同的,唯一不同的地方是二者覆盖的范畴不同

样本空间S: 试验所有可能的结果的集合.也就是说,试验的结果在试验之前无法准确了解(废话,否则要概率作甚),但是结果的诸多中可能是知道的.比如上一篇中讨论过的组合问题(从n个元素中随机取r个),虽然不知道每次会取出r个什么样的元素,但是不同的取法数量是知道的($\binom{n}{r}$),而这就是样本空间的大小,样本空间就是这$\binom {n} {r}$种r个元素的组合
事件E: 样本空间的子集.一开始我也有些诧异,最初理解的事件是”需要关心的试验结果的集合”,但转念一想,事件是独立于操作者(即我本人)的,”关心”这个太过于主观,而且就结果而言,$E \subset S$.更进一步讲,样本空间中的任意子集,都可以作为事件来进行处理判断,这个不是主观来确定的.当E中的任一结果发生时,E事件发生

既然样本空间S和事件E都是集合,那么集合满足的性质,二者都满足(交换/结合/分配/DeMorgon等不一而足),此处不赘述

S/E提供了进行概率处理的”舞台场景”:S是舞台,所有的结果都在S中;E是演员,处理中主要的操作对象.

概率公理

常识意义下的概率,是指事件的频率.比如在S下进行了N次试验,其中E发生了n次,那么E发生的频率为$F(E) = \frac {n} {N}$,所以$P(E) = \lim _ {n \to \infty} F(E)$

但是这个结果非常不可靠,因为无法证明不同的N次试验极限收敛到唯一确定值.因此,现代的观点是从概率公理出发(S下的E):

公理1: $0 \leq P(E) \leq 1$
公理2: $P(S) = 1$
公理3: 对于互不相容事件$E _ 1, E _ 2, \dots$,即若$i \neq j, E _ i E _ j = \emptyset$,有$P(\bigcup _ {i = 1} ^ {\infty} E _ i) = \sum _ {i = 1} ^ {\infty} P(E _ i)$

这三条公理都比较直观,公理1明确的概率范围,公理2其实就是样本空间的另一种定义(试验结果肯定在样本空间内),公理3表示不相同事件交的概率为概率的和

和频率的联系

假设样本空间S有N个元素(即N种不同试验结果),$E _ i$是单元素集,即只包含了试验结果i,那么对于$i \neq j, E _ i E _ j = \emptyset$(显然,每次试验只可能有一个结果).又由于所有的试验结果组成了样本空间S ,所以根据公理2和3,有

\[P(\bigcup _ {i = 1} ^ {N} E _ i) = \sum _ {i = 1} ^ {N} P(E _ i) = 1\]

如果简单的假设所有试验结果发生的概率是相同的(即$P(E _ i) = P(E _ j)$),那么就有:

\[\sum _ {i = 1} ^ {N} P(E _ i) = N P (E) = 1, P(E) = 1 / N\]

如果所有试验结果发生的概率是相同的,自然,每个结果发生的平均频率就是$1 / N$,就是此处的概率

再看,现在假设G是多元素集,即包含了n个试验结果,G中的n个试验结果同样是互不相容的,再根据公理3和刚才的结论有:

\[P(G) = \sum _ {i = 1} ^ {n} P(E _ i) = n P (E) = n / N\]

这也就是G发生的平均频率

等可能样本空间

上面的论述很自然的使用了等可能样本空间,即该样本空间内某试验结果发生的概率是等可能的(发生概率相同),只有利用这一点,才能在上面的推理中,把单次事件$E _i$的概率计算出来,进而计算多元素集合Ｇ的概率

可以看到,等可能样本空间是一个通用的模型,首先定义了单位值(所有结果互不相容且概率相同),然后通过单位值的组合,获取事件概率(试验结果之和).这样有两个关键点:

单位值要足够单.单的意思是足够基本,互不相容.很多情况下,单位值是很容易看出来的,比如n个元素取r个,那么单位值就是n个元素取1个,这些结果是互不相容的(显然).
单位值组合成复杂事件.这里又有两层意思,一是Ｅ不能脱离Ｓ,比如Ｅ中不能包含Ｓ中没有的结果.虽然这个看着很显然,但有的时候处理问题忽略了Ｓ的存在,会导致严重的错误;二是Ｅ包含必需的单位值(试验结果),即要认清Ｅ包含的试验结果是否真正是Ｅ的,有时会被题目迷惑

单位值的概率没有提到,是因为这个是和处理问题的粒度相关的.比如考察从黑球白球混合的集合中抽取.如果把抽出任一球当作单位值,那么单位值的概率是相同的,但如果把抽出黑球/白球当作单位值,那么这个单位值其实就是刚才那个角度的组合了(概率可能就不一样了).当然,不是每个问题都要变换粒度,这里只是提醒一下,不要陷入死胡同而已

从这个侧面也能看到,具体概率的运算处理,更倾向于事件之间的相对结果,而非相对于样本空间的绝对结果.就抽取球而言,不同试验概率相同,如果按照黑球/白球粒度来看,相对概率就是黑球/白球数量之比.虽然最后肯定是能得到绝对结果,但开始处是从相对来说的

其实,这也是概率公理为什么不提概率值是多少的原因.概率的具体值,并不是本质,本质是看作单位值的事件之间的相对概率.公理既没有谈等可能,也没有谈粒度问题,因为这都是单位值选取的问题,和概率无关,就好像不论使用公制还是英制,测量的结果都是一致的.