我们把对随机现象的实现和对它的观察称为 随机试验,简称 试验,常用字母 E 表示.我们感兴趣的是具有以下特点的随机试验:
- 试验可以在相同条件下重复进行;
- 试验的所有可能结果是明确可知的,并且不止一个;
- 每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.
我们把随机试验 E 的每个可能的基本结果称为 样本点,全体样本点的集合称为试验 E 的 样本空间.一般地,我们用 Ω 表示样本空间,用 ω 表示样本点.在高中,我们只讨论 Ω 为有限集的情况.如果一个随机试验有 n 个可能结果 ω1,ω2,…,ωn,则称样本空间 Ω={ω1,ω2,…,ωn} 为一个 有限样本空间.有了样本点和样本空间的概念,我们就可以用数学方法描述和研究随机现象了.
例如,抛掷一枚硬币,如果用 h 表示「正面朝上」的样本点,用 t 表示「反面朝上」的样本点,则样本空间 Ω={h,t}.抛掷两枚硬币,试验的样本点可用一个有序对表示,则样本空间 Ω={(h,h),(h,t),(t,h),(t,t)}.
对于上面连续抛两枚硬币的例子,我们设事件 A 表示「一枚硬币正面朝上,另一枚硬币反面朝上」,那么事件 A 发生当且仅当样本点属于集合 {(h,t),(t,h)}.这启发我们用样本空间 Ω 的子集来表示一个事件.
一般地,我们将样本空间 Ω 的子集称为 随机事件,简称 事件,并把只包含一个样本点的事件称为 基本事件. 随机事件一般用大写字母 A,B,C,… 表示.在每次试验中,称 事件 A 发生,当且仅当 A 中某个样本点出现.随机试验中的每个随机事件都可以用这个试验的样本空间的子集来表示.事件 A 的样本点个数用 n(A) 表示.
Ω 作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以 Ω 总会发生,我们称 Ω 为 必然事件.而空集 ∅ 不包含任何样本点,在每次试验中都不会发生,我们称 ∅ 为 不可能事件.虽然必然事件与不可能事件不具有随机性,但为了方便,将必然事件和不可能事件作为随机事件的两个极端情形.这样,每个事件都是样本空间 Ω 的一个子集.
一般来说,我们希望从简单事件的概率推算出复杂事件的概率,因此需要研究事件之间的关系和运算.由于事件是利用样本空间的子集定义的,我们可以利用集合的知识(见 集合 一节)来研究随机事件.
一般地,若事件 A 发生时,事件 B 一定发生,则称事件 B 包含 事件 A(或事件 A 包含于 事件 B),记作 A⊆B(或 B⊇A).
特别地,如果事件 B 包含事件 A,事件 A 也包含事件 B,则称事件 A 与事件 B 相等,记作 A=B,即
A⊆B∧B⊆A⟺A=B.
一般地,事件 A 与事件 B 至少有一个发生,这样得到的一个事件中的样本点或者在事件 A 中,或者在事件 B 中,称这个事件为事件 A 与事件 B 的 并事件(或 和事件),记作 A∪B(或 A+B).
一般地,事件 A 与事件 B 同时发生,这样得到的一个事件中的样本点既在事件 A 中,也在事件 B 中,称这样的一个事件为事件 A 与事件 B 的 交事件(或 积事件),记作 A∩B(或 AB).
一般地,如果事件 A 与事件 B 不能同时发生,也就是说 A∩B 是一个不可能事件,即 A∩B=∅,则称事件 A 与事件 B 互斥(或互不相容).
一般地,如果事件 A 和事件 B 在任何一次试验中有且仅有一个发生,即 A∪B=Ω 且 A∩B=∅,则称事件 A 与事件 B 互为对立.事件 A 的对立事件记为 A.
事件的基本关系和运算总结如下表.
事件的关系或运算 | 含义 | 符号 |
---|
包含 | A 发生必有 B 发生 | A⊆B |
并事件(和事件) | A 和 B 至少有一个发生 | A∪B 或 A+B |
交事件(积事件) | A 和 B 同时发生 | A∩B 或 AB |
互斥(互不相容) | A 和 B 不能同时发生 | A∩B=∅ |
互为对立 | A 和 B 有且仅有一个发生 | A∩B=∅∧A∪B=Ω |
由定义可知,若 A,B 互为对立,则 A,B 互斥;但若 A,B 互斥,A,B 不一定对立.
对于事件 A,B,一般有 A=AB∪AB,且 AB 与 AB 互斥.
类似地,可以定义多个事件的和事件以及积事件.
研究随机现象,最重要的是知道随机事件发生的可能性大小.对随机事件发生可能性大小的度量(数值)称为事件的概率,事件 A 的概率用 P(A) 表示.
我们先从最简单的一类随机事件开始研究,如抛一枚质地均匀的硬币或骰子.这类事件具有如下共同特征:
- 有限性:样本空间的样本点只有有限个;
- 等可能性:每个样本点发生的可能性相等.
我们将具有以上两个特征的试验的数学模型称为 古典概率模型,简称 古典概型,符合古典概型的试验称为古典概型试验.
一般地,设试验 E 是古典概型试验,样本空间包含 n 个样本点,事件 A 包含其中的 k 个样本点,则定义事件 A 的 概率
P(A)=nk=n(Ω)n(A).
抛掷两枚质地均匀的骰子(标记为 1 号和 2 号),观察两枚骰子分别可能出现的基本结果.
(1)写出这个试验的样本空间,并判断这个试验是否为古典概型;
(2)求下列事件的概率:
- A= “两个点数之和是 5”;
- B= “两个点数相等”;
- C= “1 号骰子的点数大于 2 号骰子的点数”.
(1)设 m,n 分别表示抛掷 1 号骰子和 2 号骰子出现的点数,则样本空间
Ω={(m,n)∣m,n∈{1,2,3,4,5,6}},其中共有 6×6=36 个样本点.由于骰子质地均匀,各个样本点出现的可能性大小相等,因此这个实验属于古典概型.
(2)A={(1,4),(2,3),(3,2),(4,1)},因此
P(A)=n(Ω)n(A)=364=91;B={(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)},因此
P(B)=n(Ω)n(B)=366=61;C={(m,n)∣m>n,m,n∈{1,2,3,4,5,6}},因此
P(C)=n(Ω)n(C)=365+4+3+2+1=125.
如果不给骰子标序号,也就是说我们不关心抛出的数字顺序,那么 (1,2) 和 (2,1) 就是同一个样本点.我们不妨让小数在前,大数在后,则样本空间
Ω={(m,n)∣m≤n,m,n∈{1,2,3,4,5,6}},此时 n(Ω)=6+5+4+3+2+1=21.如果当做古典概型计算,那么上面的事件 A={(1,4),(2,3)},则 P(A)=212,这与我们刚才计算出的结果不符.
事实上,如果给骰子标上序号,则 36 个结果都是等可能的,此时可以按照古典概型计算;如果不标序号,则 21 个结果的可能性不都相等,如掷出 (1,1) 只有一种情况,但掷出 (1,2) 有两种情况,它们发生的可能性不等,因此不能当做古典概型计算.
性质 1 对任意的事件 A,都有 P(A)≥0.
性质 2 必然事件的概率为 1,不可能事件的概率为 0,即 P(Ω)=1,P(∅)=0.
性质 3 如果事件 A 与事件 B 互斥,那么 P(A∪B)=P(A)+P(B).可推广到多个事件的情况.
性质 4 如果事件 A 与事件 B 互为对立事件,那么 P(B)=1−P(A),P(A)=1−P(B).
性质 5 如果 A⊆B,那么 P(A)≤P(B).
性质 6 设 A,B 是一个随机试验中的两个事件,有容斥原理
P(A∪B)=P(A)+P(B)−P(A∩B).
显然,性质 3 是性质 6 的特殊情况.
对任意两个事件 A,B,称事件 A 与事件 B 相互独立,当且仅当
P(AB)=P(A)P(B).
由两个事 件相互独立的定义,容易验证必然事件、不可能事件都与任意事件相互独立.这是因为必然事件 Ω 总会发生,不会受任何事件是否发生的影响;同样,不可能事件 ∅ 总不会发生,也不受任何事件是否发生的影响.当然,它们也不影响其他事件是否发生.
如果事件 A,B 相互独立,那么 A,B,A,B 相互独立.以 A 与 B 为例证明:
证 由于
P(A)=P(AB∪AB)=P(AB)+P(AB)=P(A)P(B)+P(AB),
所以
P(AB)=P(A)−P(A)P(B)=P(A)(1−P(B))=P(A)P(B),
即 A 与 B 相互独立.
大量试验表明,在任何确定次数的随机试验中,一个随机事件 A 发生的频率具有随机性.一般地,随着试验次数的增大,频率偏离概率的幅度会缩小,即事件 A 发生的频率 fn(A) 会逐渐稳定于事件 A 发生的概率 P(A).我们称频率的这个性质为 频率的稳定性.因此,我们可以用频率 f(A) 估计概率 P(A).
我们称利用随机模拟解决问题的方法为蒙特卡洛(Monte Carlo)方法.