RESUMEN. Definimos los conceptos de probabilidad y espacio probabilístico.
- Definición. Sea $E$ el espacio muestral asociado a un experimento aleatorio y $\mathcal{M}$ una $\sigma-$álgebra de sucesos en $E.$ Una medida de probabilidad o probabilidad es una función $p:\mathcal{M}\to \mathbb{R}$ tal que:
$1)$ $0\le p(A)\le 1$ para todo $A\in \mathcal{M}.$
$2)$ Si $A_1,A_2,\ldots$ son elementos de $\mathcal{M}$ disjuntos dos a dos, entonces $$p\left(\bigcup_{n=1}^\infty A_n\right)=\sum_{n=1}^\infty p(A_n).$$ $3)$ $p(E)=1.$
A la terna $(E,\mathcal{M}, p)$ se la llama espacio de probabilidad. - Teorema. (Propiedades que se deducen de los axiomas de probabilidad).
$1)$ $p(A^c)=1-p(A)$ para todo $A\in\mathcal{M}.$
$2)$ $p(\emptyset)=0.$
$3)$ $A\subset B\Rightarrow p(A)\le p(B)$ para todo par $A,B\in\mathcal{M}.$
$4)$ $p\left(A_1\cup A_2\right)=p\left(A_1\right)+p\left(A_2\right)-p\left(A_1\cap A_2\right)$ para todo par $A_1,A_2\in\mathcal{M}.$
Demostración.
$1)$ Tenemos $$p(A\cup A^c)=P(E)=1\Rightarrow p(A)+p(A^c)=1\Rightarrow P(A^c)=1-p(A).$$ $2)$ $p(\emptyset)=p(E^c)=1-p(E)=1-1=0.$
$3)$ Tenemos $B=A\cup (B-A)$ con lo cual $p(B)=p(A)+p(B-A)$ y al ser $p(B-A)\ge 0$ se concluye que $p(A)\le p(B).$
$4)$ Tenemos $$A_1=A_1\cap E= A_1\cap\left(A_2\cup A_2^c\right)= \left(A_1\cap A_2\right)\cup \left(A_1\cap A_2^c\right),$$ $$A_2=A_2\cap E= A_2\cap\left(A_1\cup A_1^c\right)= \left(A_1\cap A_2\right)\cup \left(A_2\cap A_1^c\right).$$ Además, $A_1$ está expresado como uniónn de los sucesos incompatibles $A_1\cap A_2$ y $A_1\cap A_2^c$ y por tanto, $$p\left(A_1\right)=p\left(A_1\cap A_2\right)+p\left(A_1\cap A_2^c\right).\qquad [1]$$ De la misma manera, $$p\left(A_2\right)=p\left(A_1\cap A_2\right)+p\left(A_2\cap A_1^c\right).\qquad [2]$$ Por otra parte, $$A_1\cup A_2=\left(A_1\cap A_2\right)\cup \left(A_1\cap A_2^c\right)\cup \left(A_2 \cap A_1^c\right)$$ está expresado como unión de tres sucesos incompatibles y por tanto, $$p\left(A_1\cup A_2\right)=p\left(A_1\cap A_2\right)+p\left(A_1\cap A_2^c\right)+p\left(A_2\cap A_1^c\right).\qquad [3]$$ Sumando miembro a miembro $[1]$ y $[2]$ y pasando un $p\left(A_1\cap A_2\right)$ al primer miembro $$p\left(A_1\right)+p\left(A_2\right)-p\left(A_1\cap A_2\right)=p\left(A_1\cap A_2\right)+p\left(A_1\cap A_2^c\right)+p\left(A_2\cap A_1^c\right),$$ y usando la igualdad $[3]$ queda $$p\left(A_1\cup A_2\right)=p\left(A_1\right)+p\left(A_2\right)-p\left(A_1\cap A_2\right).$$ - Teorema. Sea $(E,\mathcal{M},p)$ un espacio de probabilidad, entonces $$p\left(A_1\cup \ldots \cup A_n\right)=\sum_{i=1}
^np\left(A_i\right)-\sum_{i,j=1,\;i < j}
^np\left(A_i\cap A_j\right)+$$ $$
\sum_{i,j,k=1,\;i < j < k}
^np\left(A_i\cap A_j\cap A_k\right)+\ldots +(-1)^{n+1}p\left(A_1\cap A_2\cap \ldots \cap A_n\right),$$ para $A_1,\ldots,A_n\in\mathcal{M}$.
Demostración. Ver Probabilidad de la unión de $n$ sucesos.