Si el único propósito del investigador es describir los resultados de un experimento concreto, los métodos analizados en los capítulos anteriores pueden considerarse suficientes. No obstante, si lo que se pretende es utilizar la información obtenida para extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido estudiados, entonces estos métodos constituyen sólo el principio del análisis, y debe recurrirse a métodos de inferencia estadística, los cuales implican el uso inteligente de la teoría de la probabilidad.

Comenzamos este bloque interpretando la noción de probabilidad y la terminología subyacente a esta área de las matemáticas, ya que la probabilidad constituye por sí misma un concepto básico que refleja su relación con la faceta del mundo exterior que pretende estudiar: los fenómenos aleatorios, los cuales obedecen unas ciertas reglas de comportamiento. De alguna manera, el concepto de probabilidad, se relaciona o nos recuerda las propiedades de la frecuencia relativa.

A partir de ella, y junto con las definiciones de probabilidad condicionada y la de sucesos independientes, se deducen los teoremas fundamentales del Cálculo de Probabilidades.

Nos centraremos posteriormente en el eslabón que une la teoría de la probabilidad y la estadística aplicada: la noción de variable aleatoria, mostrando de esta manera, como puede emplearse la teoría de la probabilidad para sacar conclusiones precisas acerca de una población en base a una muestra extraída de ella, y que muchos de los estudios estadísticos son de hecho, estudio de las propiedades de una o más variables aleatorias.

Tal como hemos citado anteriormente, en las aplicaciones prácticas es importante poder describir los rasgos principales de una distribución, es decir, caracterizar los resultados del experimento aleatorio mediante unos parámetros. Llegamos así al estudio de las características asociadas a una variable aleatoria introduciendo los conceptos de esperanza y varianza matemática, relacionándolos con los conceptos de media y varianza de una variable estadística.

El cálculo de probabilidades nos suministra las reglas para el estudio de los experimentos aleatorios o de azar, constituyendo la base para la estadística inductiva o inferencial.

Para trabajar con el cálculo de probabilidades es necesario fijar previamente cierta terminología. Vamos a introducir parte de ella en las próximas líneas.

Experimentos y sucesos aleatorios

Diremos que un experimento es aleatorio si se verifican las siguientes condiciones:

1.

Se puede repetir indefinidamente, siempre en las mismas condiciones;

2.

Antes de realizarlo, no se puede predecir el resultado que se va a obtener;

3.

El resultado que se obtenga, e, pertenece a un conjunto conocido previamente de resultados posibles. A este conjunto, de resultados posibles, lo denominaremos espacio muestral y lo denotaremos normalmente mediante la letra E. Los elementos del espacio muestral se denominan sucesos elementales.

$\begin{displaymath}e_1,e_2\in E \qquad\Longrightarrow \qquad e_1,e_2 \mbox{ son sucesos elementales.} \end{displaymath}$

Cualquier subconjunto de E será denominado suceso aleatorio, y se denotará normalmente con las letras A, B,...

$\begin{displaymath}A,B\subset E \qquad\Longrightarrow \qquad A,B \mbox{ son sucesos aleatorios.} \end{displaymath}$

Obsérvese que los sucesos elementales son sucesos aleatorios compuestos por un sólo elemento. Por supuesto los sucesos aleatorios son más generales que los elementales, ya que son conjuntos que pueden contener no a uno sólo, sino a una infinidad de sucesos elementales --y también no contener ninguno.-- Sucesos aleatorios que aparecen con gran frecuencia en el cálculo de probabilidades son los siguientes:

4.4.0.0.0.1 Suceso seguro:

Es aquel que siempre se verifica después del experimento aleatorio, es decir, el mismo E

$\begin{displaymath}E\subset E \qquad\Longrightarrow \qquad E \mbox{ es el suceso seguro.} \end{displaymath}$

4.4.0.0.0.2 Suceso imposible:

Es aquel que nunca se verifica como resultado del experimento aleatorio. Como debe ser un subconjunto de E, la única posibilidad es que el suceso imposible sea el conjunto vacío

$\begin{displaymath}\emptyset \subset E \qquad\Longrightarrow \qquad \emptyset \mbox{ es el suceso imposible.} \end{displaymath}$

4.4.0.0.0.3 Suceso contrario a un suceso A:

También se denomina complementario de A y es el suceso que se verifica si, como resultado del experimento aleatorio, no se verifica A. Se acostumbra a denotar con el símbolo $\overline{A}$

$\begin{displaymath}A \subset E \qquad\Longrightarrow \qquad \underbrace{\overline{A}=\{e\in E\;:\; e\notin A\} }_{\mbox{suceso contrario de } A} \end{displaymath}$

**Figura:** Representación gráfica de un suceso aleatorio $A\subset E$ , y de su suceso contrario
$\includegraphics[angle=0, width=1\textwidth]{fig04-01.eps}$

4.4.0.1 Ejemplo

Si realizamos el experimento aleatorio de lanzar un dado al aire, tenemos:

$\begin{eqnarray}\html{eqn0}\mbox{Sucesos elementales } &\rightarrow& 1,2,3,4,5,6... ...= \overline{\{1,2,3\}} \\ \; \dots \end{array}\right. \nonumber \end{eqnarray}$

Operaciones básicas con sucesos aleatorios

Al ser los sucesos aleatorios nada más que subconjuntos de un conjunto E --espacio muestral--, podemos aplicarles las conocidas operaciones con conjuntos, como son la unión, intersección y diferencia:

4.6.0.0.0.1 Unión:

Dados dos sucesos aleatorios $A,B\subset E$ , se denomina suceso unión de A y B al conjunto formado por todos los sucesos elementales que pertenecen a A o bien que pertenecen a B (incluyendo los que están en ambos simultáneamente), es decir

$\begin{displaymath}A{\cup}B =\{e\in E\;:\; e\in A \;\mbox{ ó } \; e\in B\} \end{displaymath}$

Como ejemplo, tenemos que la unión de un suceso cualquiera con su complementario es el suceso seguro:

$\begin{eqnarray}\html{eqn7}A{\cup}\overline{A} &=&\{e\in E\;:\; e\in A \;\mbox{ ... ... A \;\mbox{ ó } \; e\notin {A}\} \nonumber \\ & =& E \nonumber \end{eqnarray}$

Volviendo al ejemplo del lanzamiento de un dado, si $A=\{1,2,3\}$ y $B=\{3,4\}$ , el suceso unión de A y B es:

$\begin{displaymath}\left. \begin{array}{c} A=\{1,2,3\} \\ \\ B=\{3,4\} \... ...\right\} \quad \Longrightarrow \quad A {\cup}B = \{1,2,3,4\} \end{displaymath}$

4.6.0.0.0.2 Intersección:

Dados dos sucesos aleatorios $A,B\subset E$ , se denomina suceso intersección de A y B al conjunto formado por todos los sucesos elementales que pertenecen a A y B a la vez, es decir,

$\begin{displaymath}A{\cap}B =\{e\in E\;:\; e\in A \;\mbox{ y además } \; e\in B\} \end{displaymath}$

A veces por comodidad se omite el símbolo ${\cap}$ para denotar la intersección de conjuntos, sobre todo cuando el número de conjuntos que intervienen en la expresión es grande. En particular podremos usar la siguiente notación como equivalente a la intersección:

$\begin{displaymath}A_1{\cap}A_2{\cap}A_3{\cap}\cdots {\cap}A_{n-1}{\cap}A_n\stackrel{def}{\equiv} A_1A_2A_3\cdots A_{n-1}A_n \end{displaymath}$

Un ejemplo de intersección es la de un suceso aleatorio cualquiera, $A\subset E$ , con su complementario, $\overline{A}\subset E$ , que es el suceso imposible:

$\begin{eqnarray}\html{eqn9}A{\cap}\overline{A} &=& \{e\in E\;:\; e\in A \;\mbox... ...demás } \; e\notin {A}\} \nonumber \\ & =& \emptyset \nonumber \end{eqnarray}$

Volviendo al ejemplo del dado,

$\begin{displaymath}\left. \begin{array}{c} A=\{1,2,3\} \\ \\ B=\{3,4\} \... ...rray} \right\} \quad \Longrightarrow \quad A {\cap}B = \{3\} \end{displaymath}$

4.6.0.0.0.3 Diferencia:

Dados dos sucesos aleatorios $A,B\subset E$ , se llama suceso diferencia de A y B, y se representa mediante $A{\setminus}B$ , o bien A-B, al suceso aleatorio formado por todos los sucesos elementales que pertenecen a A, pero no a B:

$\begin{displaymath}A{\setminus}B \equiv A - B =\{e\in E\;:\; e\in A \;\mbox{ y además } \; e\notin B\} = A{\cap}\overline{B} \end{displaymath}$

$\begin{displaymath}\left. \begin{array}{c} A=\{1,2,3\} \\ \\ B=\{3,4\} \... ...egin{array}{c}A - B = \{1,2\} \\ \\ B-A=\{4\} \end{array}\end{displaymath}$

Obsérvese que el suceso contrario de un suceso A, puede escribirse como la diferencia del suceso seguro menos éste, o sea,

$\begin{eqnarray}\html{eqn11}\overline{A}&=& \{e\in E\;:\; e\notin A\} \nonumber \\ &=& E {\setminus}A \nonumber \end{eqnarray}$

4.6.0.0.0.4 Diferencia simétrica:

Si $A,B\subset E$ , se denomina suceso diferencia simétrica de A y B, y se representa mediante $A\triangle B$ , al suceso aleatorio formado por todos los sucesos elementales que pertenecen a A y no a B, y los que están en By no en A:

$\begin{displaymath}A\triangle B = (A{\setminus}B){\cup}(B{\setminus}A) = (A{\cup}B){\setminus}(A{\cap}B) \end{displaymath}$

Así:

$\begin{displaymath}\left. \begin{array}{c} A=\{1,2,3\} \\ \\ B=\{3,4\} \... ...Longrightarrow \quad A \triangle B = \{1,2,4\} = B\triangle A \end{displaymath}$

**Figura:** Dados dos sucesos aleatorios $A,B\subset E$ se representa: en (a) $A {\cup }B$ ; en (b) $A{\cap }B$ ; en (c) A-B; en (d) $A\triangle B$ .
$\includegraphics[angle=0, width=0.8\textwidth]{fig04-02.eps}$

Hay ciertas propiedades que relacionan la unión, intersección y suceso contrario, que son conocidas bajo el nombre de Leyes de Morgan:

$\begin{displaymath}{ \mbox{\fbox{$\displaystyle \mbox{Leyes de Morgan} \quad \r... ...{A{\cap}B} = \overline{A}{\cup}\overline{B} \end{array}$ } } } \end{displaymath}$

Experimentos aleatorios y probabilidad

Se denominan experimentos deterministas aquellos que realizados de una misma forma y con las mismas condiciones iniciales, ofrecen siempre el mismo resultado. Como ejemplo, tenemos que un objeto de cualquier masa partiendo de un estado inicial de reposo, y dejado caer al vacío desde una torre, llega siempre al suelo con la misma velocidad: $v=\sqrt{2\,g\,h}$ ^4.1

Cuando en un experimento no se puede predecir el resultado final, hablamos de experimento aleatorio. Este es el caso cuando lanzamos un dado y observamos su resultado.

En los experimentos aleatorios se observa que cuando el número de experimentos aumenta, las frecuencias relativas con las que ocurre cierto suceso e, f_n(e),

$\begin{displaymath}f_n(e) = \frac{\mbox{número de ocurrencias de }e}{n} \end{displaymath}$

tiende a converger hacia cierta cantidad que denominamos probabilidad de e.

$\begin{displaymath}{{\cal P}_{rob}}[e] = \lim_{n\rightarrow \infty} f_n(e) \end{displaymath}$

4.8.0.1 Ejemplo

En la Figura 4.3 se presenta la evolución de la frecuencia relativa del número de caras obtenido en el lanzamiento de una moneda en 100 ocasiones (simulado por un ordenador). En principio la evolución de las frecuencias relativas es errática, pero a medida que el número de tiradas aumenta, tiende a lo que entendemos por probabilidad de cara.

**Figura:** Convergencia a 1/2 de la frecuencia relativa del número de caras obtenido en lanzamientos sucesivos de una moneda (simulación en ordenador).
$\includegraphics[angle=0, width=1\textwidth]{fig04-03.eps}$

Esta es la noción frecuentista de probabilidad. Sin embargo esta definición no se puede utilizar en la práctica pues:

se requiere realizar un número infinito de veces un experimento para calcular una probabilidad. Por ejemplo, lanzar infinitas veces un dado para ver que las frecuencias relativas de la aparición de cada cara convergen a 1/6. Esto puede suplirse en la práctica realizando el experimento un número suficientemente elevado de veces, hasta que tengamos la precisión que requieran nuestros cálculos. Sin embargo,
los experimentos aleatorios a veces no pueden ser realizados, como es el caso de calcular la probabilidad de morir jugando a la ruleta rusa con un revolver: no es posible (o no se debe) calcular esta probabilidad repitiendo el experimento un número indefinidamente alto de veces para aproximarla mediante la frecuencia relativa). Para ello existen métodos mucho más seguros, como los que mencionaremos a continuación.

Probabilidad de Laplace

Si un experimento cualquiera puede dar lugar a un número finito de resultados posibles, y no existe ninguna razón que privilegie unos resultados en contra de otros, se calcula la probabilidad de un suceso aleatorio A, según la regla de Laplace como el cociente entre el número de casos favorables a A, y el de todos los posibles resultados del experimento:

$\begin{displaymath}{{\cal P}}[A] = \frac{\mbox{número de casos favorables a $A$ }}{ \mbox{número de casos posibles}} \end{displaymath}$

4.8.2.1 Ejemplo

Calcular la probabilidad de que al lanzar un dado se obtenga un número impar.

Solución:

El espacio muestral es $E=\{1,2,3,4,5,6\}$ . Vamos a llamar A, al suceso consistente en que el resultado es impar, $A=\{1,3,5\}$ . Como no suponemos que ninguna de las caras ofrece una probabilidad de ocurrencia diferente a las demás, podemos aplicar la regla de Laplace para obtener que

$\begin{eqnarray}\html{eqn15}{{\cal P}}[A]&=&\frac{\mbox{número de casos favorabl... ...r \\ & & \nonumber \\ &=& \frac{3}{6} = \frac{1}{2} \nonumber \end{eqnarray}$

Definición axiomática de probabilidad

Para hacer una definición rigurosa de la probabilidad, necesitamos precisar ciertas leyes o axiomas que deba cumplir una función de probabilidad. Intuitivamente estos axiomas deberían implicar, entre otras, las siguientes cuestiones, que nos parecen lógicas en términos de lo que se puede esperar de una función de probabilidad:

La probabilidad sólo puede tomar valores comprendidos entre 0 y 1(no puede haber sucesos cuya probabilidad de ocurrir sea del $200\%$ ni del $-5\%$ ;
La probabilidad del suceso seguro es 1, es decir, el $100\%$ ;
La probabilidad del suceso imposible debe ser 0.
La probabilidad de la intersección de dos sucesos debe ser menor o igual que la probabilidad de cada uno de los sucesos por separado, es decir,

$\begin{displaymath}{{\cal P}_{rob}}[A{\cap}B]\leq {{\cal P}_{rob}}[A] \end{displaymath}$

$\begin{displaymath}{{\cal P}_{rob}}[A{\cap}B]\leq {{\cal P}_{rob}}[B] \end{displaymath}$
La probabilidad de la unión de sucesos debe ser mayor que la de cada uno de los sucesos por separado:

$\begin{displaymath}{{\cal P}_{rob}}[A{\cup}B]\geq {{\cal P}_{rob}}[A] \end{displaymath}$

$\begin{displaymath}{{\cal P}_{rob}}[A{\cup}B]\geq {{\cal P}_{rob}}[B] \end{displaymath}$

Más aún, si los sucesos son disjuntos (incompatibles) debe ocurrir que

$\begin{displaymath}A{\cap}B=\emptyset \qquad\Longrightarrow\qquad {{\cal P}_{rob}}[A{\cup}B] ={{\cal P}_{rob}}[A]+{{\cal P}_{rob}}[B] \end{displaymath}$
La probabilidad del suceso contrario de A, debe valer ${{\cal P}_{rob}}[\overline{A}]=1-{{\cal P}_{rob}}[A]$ . Esto en realidad puede deducirse del siguiente razonamiento:

$\begin{displaymath}A{\cap}\overline{A} = \emptyset \;\Rightarrow\; 1={{\cal P}_... ...tarrow \; {{\cal P}_{rob}}[\overline{A}]=1-{{\cal P}_{rob}}[A] \end{displaymath}$

En las últimas líneas hemos esbozado ciertas propiedades que debería cumplir una función que queramos llamar probabilidad. Hemos de tener en cuenta entonces que siguiendo esos puntos:

1.: La función de probabilidad debe calcularse sobre subconjuntos de E. No es estrictamente necesario que sean todos, pero si es necesario que si se puede calcular sobre un conjunto, lo pueda ser también sobre su complementario, y que si se puede calcular sobre dos conjuntos A y B, que también se pueda calcular sobre su unión y su intersección. Para ello introduciremos el concepto de $\sigma$ -álgebra de sucesos, que será una clase de subconjuntos de Esobre los que podamos aplicar las reglas de la probabilidad.
2.: Entre las leyes que debe cumplir una función de probabilidad y que hemos escrito antes, hemos observado que algunas son redundantes, ya que se pueden deducir de las demás. Con la definición axiomática de la probabilidad pretendemos dar el menor conjunto posible de estas reglas, para que las demás se deduzcan como una simple consecuencia de ellas.

Precisemos entonces los conceptos de $\sigma$ -álgebra de sucesos y de probabilidad.

4.8.4.1 Concepto de $\sigma$ -álgebra de sucesos

Sea $\cal A$ una clase no vacía formada por ciertos subconjuntos del espacio muestral E. Diremos que esta clase es un $\sigma$ -álgebra de sucesos si los sucesos complementarios de aquellos que están en $\cal A$ también están en $\cal A$ , así como sus uniones numerables (sean finitas o infinitas). Esto se puede enunciar como:

4.8.4.2 Concepto axiomático de probabilidad

Dado un espacio muestral E, y un $\sigma$ -álgebra de sucesos $\cal A$ sobre él, diremos que ${{\cal P}}$ es una probabilidad sobre $\cal A$ si las siguientes propiedades (axiomas) son verificadas:

Ax-1.

La probabilidad es una función definida sobre $\cal A$ y que sólo toma valores positivos comprendidos entre 0 y 1

$\begin{displaymath}\begin{array}{rcl} {{\cal P}}\;:\;{\cal A} & \longrightarrow ... ...n {\cal A} & \longmapsto & 0\leq{{\cal P}}[A]\leq 1 \end{array}\end{displaymath}$

Ax-2.

La probabilidad del suceso seguro es 1

$\begin{displaymath}{{\cal P}}[E]=1 \end{displaymath}$

Ax-3.

La probabilidad de la unión numerable de sucesos disjuntos es la suma de sus probabilidades (figura 4.4):

$\begin{displaymath}A_1,A_2,\dots, A_n,\dots\: \in {\cal A} \Longrightarrow {{\c... ...i=1}^{\infty} A_i\right] = \sum_{i=1}^{\infty} {{\cal P}}[A_i] \end{displaymath}$

**Figura:** El tercer axioma de probabilidad indica que si $A=A_1{\cup}A_2{\cup}\cdots$ con $A_i{\cap }A_j=\emptyset$ , entonces ${{\cal P}}[A]={{\cal P}}[A_1]+{{\cal P}}[A_2]+\cdots$
$\includegraphics[angle=0, width=0.5\textwidth]{fig04-04.eps}$

4.8.4.3 Observación

La introducción de la definición de $\sigma$ -álgebra puede parecer innecesaria a primera vista, ya que es una clase formada por subconjuntos de Eque verifican ciertas propiedades relativas a la complementariedad y a las uniones finitas que ya verifica de antemano el conjunto denominado partes de E, P(E), formado por todos los subconjuntos de E. Cuando el conjunto E de los posibles resultados de un experimento aleatorio sea finito, normalmente consideraremos como $\sigma$ -álgebra de sucesos al conjunto P(E). Esto ocurre cuando por ejemplo realizamos el experimento aleatorio de lanzar un dado:

$\begin{displaymath}E=\{1,2,3,4,5,6\} \end{displaymath}$

$\begin{displaymath}{\cal A} = {P}(E) = \{ \emptyset, E, \{1\}, \{2\},\dots, \{1,2\}, \{1,3\},\dots,\{1,2,3\},\dots\} \end{displaymath}$

Cuando E es infinito no numerable, la estructura del conjunto P(E) puede presentar propiedades extremadamente engorrosas. Entonces es más conveniente utilizar como $\sigma$ -álgebra un subconjunto más pequeño suyo, pero no tanto que no nos permita realizar las operaciones de complementariedad o de uniones finitas que se precisan en la definición de un $\sigma$ -álgebra. Por ejemplo, si realizamos el experimento aleatorio de esperar el tiempo que hace falta para que un átomo de carbono catorce, C¹⁴, se desintegre de modo natural, se tiene que

$\begin{displaymath}E=I\!\!R^+, \end{displaymath}$

sin embargo, el $\sigma$ -álgebra de sucesos que consideramos no es $P(I\!\!R^+)$ , que es una clase demasiado compleja para definir sobre sus elementos una medida de probabilidad. En su lugar consideramos el $\sigma$ -álgebra formada por todos los intervalos, abiertos o cerrados, y sus uniones finitas

$\begin{displaymath}{\cal A} = \{ \emptyset,I\!\!R^+,\,(2,3)\, ,\, (4,5]{\cup}[8,+\infty)\,,\dots\} \end{displaymath}$

lo que por supuesto incluye a los puntos de $I\!\!R^+$ , ya que por ejemplo

$\begin{displaymath}\{2\}=[2,2]. \end{displaymath}$

Este tipo de conjuntos (los intervalos) son los que nos interesan en la práctica, v.g. calcular la probabilidad de que el peso en kilogramos de un niño al nacer esté en el intervalo [2,4]. De esto modo vamos a realizar el siguiente convenio a lo largo del libro:

No haremos en general referencia al $\sigma$ -álgebra de sucesos más que cuando sea estrictamente necesario. De este modo cuando a partir de ahora se diga `` $A\subset E$ '', nos referiremos implícitamente a que $A\in {\cal{A}}$ , donde $\cal A$ es un $\sigma$ -álgebra de sucesos asociado a E y sobre el que se ha definido la función de probabilidad.
Si el espacio muestral es finito o infinito numerable, entenderemos que el $\sigma$ -álgebra de sucesos es por defecto P(E).
Si E es un conjunto infinito no numerable como $I\!\!R$ , $I\!\!R^+$ , o subconjuntos suyos en forma de intervalos, entenderemos que el $\sigma$ -álgebra asociada es la mencionada en el ejemplo anterior, es decir, la formada por todos los intervalos abiertos, cerrados o semi-abiertos (lo que incluye en particular a los puntos), y sus uniones finitas. De este modo podremos calcular probabilidades como las siguientes:

$\begin{displaymath}{{\cal P}}[(2,3)]\;,\; {{\cal P}}[(2,5]{\cup}[4,7)]\;,\;{{\cal P}}[\{3\}]\;,\dots \end{displaymath}$
Probabilidad condicionada e independencia de sucesos

Sea $B\subset E$ un suceso aleatorio de probabilidad no nula, 0$" align="middle" border="0" width="67" height="31">. Para cualquier otro suceso $A\subset E$ , llamamos probabilidad condicionada de A a B a la cantidad que representamos mediante ${{\cal P}}[A_{\mid B}]$ o bien ${{\cal P}}_B[A]$ y que se calcula como:

$\begin{displaymath}{ \mbox{\fbox{$\displaystyle {{\cal P}}[A_{\mid B}] = \frac{{{\cal P}}[A{\cap}B]}{{{\cal P}}[B]} $ } } } \end{displaymath}$

4.10.0.1 Ejemplo
Se lanza un dado al aire ¿Cuál es la probabilidad de que salga el número 4? Si sabemos que el resultado ha sido un número par, ¿se ha modificado esta probabilidad?

Solución:
El espacio muestral que corresponde a este experimento es

$\begin{displaymath}E=\{1,2,3,4,5,6\} \end{displaymath}$

y se ha de calcular la probabilidad del suceso $A=\{4\}$ . Si el dado no está trucado, todos los números tienen la misma probabilidad de salir, y siguiendo la definición de probabilidad de Laplace,

$\begin{eqnarray}\html{eqn15}{{\cal P}}[A]&=&\frac{\mbox{ casos favorables }}{\mb... ...de elementos en } \{1,2,3,4,5,6\} } \nonumber \\ &=& \frac{1}{6} \end{eqnarray}$

Obsérvese que para calcular la probabilidad de A según la definición de Laplace hemos tenido que suponer previamente que todos los elementos del espacio muestral tienen la misma probabilidad de salir, es decir:

$\begin{displaymath}{{\cal P}}[1]={{\cal P}}[2]={{\cal P}}[3]={{\cal P}}[4]={{\cal P}}[5]={{\cal P}}[6] \end{displaymath}$

Por otro lado, si ha salido un número par, de nuevo por la definición de probabilidad de Laplace tendríamos

$\begin{eqnarray}\html{eqn16}{{\cal P}}_{\mbox{par}}[4] &=&\frac{\mbox{ casos fav... ...elementos en }\{2,4,6\} } \nonumber \\ &=& \frac{1}{3} \nonumber \end{eqnarray}$

Esta misma probabilidad se podría haber calculado siguiendo la definición de la probabilidad condicionada, ya que si escribimos

$\begin{eqnarray}\html{eqn16}A=\{4\} \qquad&\Rightarrow&\qquad {{\cal P}}[A]=\fra... ...4\} \qquad&\Rightarrow&\qquad {{\cal P}}[A{\cap}B] = \frac{1}{6} \end{eqnarray}$

y entonces

$\begin{displaymath}{{\cal P}}_{\mbox{par}}[4] = {{\cal P}}_B[A] = {{\cal P}}[A_{... ...al P}}[A{\cap}B]}{{{\cal P}}[B]} =\frac{1/6}{1/2}= \frac{1}{3} \end{displaymath}$

que por supuesto coincide con el mismo valor que calculamos usando la definición de probabilidad de Laplace.

4.10.0.2 Observación
Obsérvese que según la definición de probabilidad condicionada, se puede escribir la probabilidad de la intersección de dos sucesos de probabilidad no nula como

$\begin{displaymath}{{\cal P}}[A{\cap}B] = \left\{ \begin{array}{l} {{\cal P}}[A... ... {{\cal P}}[B]\cdot {{\cal P}}[A_{\mid B}] \end{array}\right. \end{displaymath}$

O sea, la probabilidad de la intersección de dos sucesos, es la probabilidad de uno cualquiera de ellos, multiplicada por la probabilidad del segundo sabiendo que ha ocurrido el primero.
Si entre dos sucesos no existe ninguna relación cabe esperar que la expresión ``sabiendo que'' no aporte ninguna información. De este modo introducimos el concepto de independencia de dos sucesos A y B como:

$\begin{displaymath}{ \mbox{\fbox{$\displaystyle A \mbox { es independiente de B... ...{\cal P}}[A{\cap}B] = {{\cal P}}[A]\cdot {{\cal P}}[B] $ } } } \end{displaymath}$

Esta relación puede ser escrita de modo equivalente, cuando dos sucesos son de probabilidad no nula como

$\begin{displaymath}{ \mbox{\fbox{$\displaystyle A \mbox { es independiente de B... ...cal P}}[B] = {{\cal P}}[B_{\mid A}] \end{array}\right. $ } } } \end{displaymath}$

Ciertos teoremas fundamentales del cálculo de probabilidades

Hay algunos resultados importantes del cálculo de probabilidades que son conocidos bajo los nombres de teorema de la probabilidad compuesta, teorema de la probabilidad total y teorema de Bayes. Veamos cuales son estos teoremas, pero previamente vamos a enunciar a modo de recopilación, una serie de resultados elementales cuya demostración se deja como ejercicio para el lector (algunos ya han sido demostrados anteriormente):

4.12.0.1 Proposición
Sean $A,B\subset E$ no necesariamente disjuntos. Se verifican entonces las siguientes propiedades:

1.
Probabilidad de la unión de sucesos:
$\begin{displaymath}{ \mbox{\fbox{$\displaystyle {{\cal P}}[A{\cup}B] = {{\cal P}}[A] +{{\cal P}}[B] -{{\cal P}}[A{\cap}B] $ } } } \end{displaymath}$

2.
Probabilidad de la intersección de sucesos:
$\begin{displaymath}{ \mbox{\fbox{$\displaystyle {{\cal P}}[A{\cap}B] = \left\{... ... P}}[B]\cdot {{\cal P}}[A_{\mid B}] \end{array}\right. $ } } } \end{displaymath}$

3.
Probabilidad del suceso contrario:
$\begin{displaymath}{ \mbox{\fbox{$\displaystyle {{\cal P}}[\overline{A}] = 1-{{\cal P}}[A] $ } } } \end{displaymath}$

4.
Probabilidad condicionada del suceso contrario:
$\begin{displaymath}{ \mbox{\fbox{$\displaystyle {{\cal P}}[\overline{A}_{\mid B}] = 1-{{\cal P}}[A_{\mid B}] $ } } } \end{displaymath}$

4.12.0.2 Ejemplo

En una universidad el 50% de los alumnos habla inglés, el 20% francés y el 5% los dos idiomas ¿Cuál es la probabilidad de encontrar alumnos que hablen alguna lengua extranjera?

Solución:
Sea A el suceso hablar inglés: ${{\cal P}}[A]=0,5$ .
Sea B el suceso hablar francés: ${{\cal P}}[B]=0,2$ .
El suceso hablar francés e inglés es $A{\cap }B$ : ${{\cal P}}[A{\cap}B] =0,05$ .
Así:

$\begin{displaymath}{{\cal P}}[A{\cup}B] = {{\cal P}}[A] + {{\cal P}}[B] - {{\cal P}}[A{\cap}B] = 0,5 + 0,2 - 0,05 = 0,65 \end{displaymath}$

4.12.0.3 Ejemplo
En una estación de esquí, para navidad-es, la experiencia indica que hay un tiempo soleado sólo el $15\%$ de los días. Por otro lado, se ha calculado que cuando un día es soleado, hay una probabilidad del 20% de que el día posterior también lo sea. Calcular la probabilidad de que, en navidades, un fin de semana completo sea soleado.

Solución: Llamemos S al suceso sábado soleado y D al suceso domingo soleado. La única manera en que un fin de semana completo sea soleado es que lo sea en primer lugar el sábado, y que el domingo posterior también. Es decir:

$\begin{displaymath}{{\cal P}}[S{\cap}D] = {{\cal P}}[S]\cdot {{\cal P}}[D_{\mid S}] = 0,15\times 0,2 = 0,03 \end{displaymath}$

Luego sólo el $3\%$ de los fines de semana son soleados.

El primero de los teoremas que vamos a enunciar es una generalización de la probabilidad de la intersección de dos sucesos, a la de un número cualquiera pero finito de ellos:

4.12.0.4 Teorema (Probabilidad compuesta)
Sea $A_1,A_2,\dots,A_n\subset E$ una colección de sucesos aleatorios. Entonces:

$\begin{displaymath}{{\cal P}}[A_1 A_2 \cdots A_n] = {{\cal P}}[A_1]\cdot {{\cal... ... A_1 A_2}]\cdots {{\cal P}}[{A_n}{\mid A_1 A_2\cdots A_{n-1}}] \end{displaymath}$

Demostración

$\begin{eqnarray}\html{eqn25}{{\cal P}}[A_1 A_2 \cdots A_n] &=& {{\cal P}}[ (A_1A... ...}]\cdots {{\cal P}}[{A_n}{\mid A_1 A_2\cdots A_{n-1}}] \nonumber \end{eqnarray}$

Los teoremas que restan nos dicen como calcular las probabilidades de sucesos cuando tenemos que el suceso seguro está descompuesto en una serie de sucesos incompatibles de los que conocemos su probabilidad. Para ello necesitamos introducir un nuevo concepto: Se dice que la colección $A_1,A_2,\dots,A_n\subset E$ es un sistema exhaustivo y excluyente de sucesos si se verifican las relaciones (véase la figura 4.5):

Figura: A₁,A₂,A₃,A₄ forman un sistema exhaustivo y excluyente se sucesos.

$\includegraphics[angle=-90, width=0.5\textwidth]{fig04-05.eps}$

$\begin{displaymath}\bigcup_{i=1}^n \, A_i = E \end{displaymath}$

$\begin{displaymath}A_i {\cap}A_j= \emptyset \qquad \forall\, i\neq j \end{displaymath}$

4.12.0.5 Teorema (Probabilidad total)
Sea $A_1,A_2,\dots,A_n\subset E$ un sistema exhaustivo y excluyente de sucesos. Entonces
$\begin{displaymath}{ \mbox{\fbox{$\displaystyle \forall \, B\subset E,\;\Righta... ...{i=1}^n \,{{\cal P}}[B_{\mid A_i}]\cdot{{\cal P}}[A_i] $ } } } \end{displaymath}$

Demostración

Obsérvese la Figura 4.6. De ahí realizamos las siguientes operaciones:

Figura: Si A₁,A₂,A₃,A₄ forma un sistema exhaustivo y excluyente se sucesos, podemos calcular la probabilidad de B a partir de las cantidades ${{\cal P}}[B{\cap }A_i]$ , o lo que es lo mismo, ${{\cal P}}[B_{\mid A_i}]\cdot {{\cal P}}[A_i]$

$\includegraphics[angle=0, width=0.5\textwidth]{fig04-06.eps}$

$\begin{eqnarray}\html{eqn27}{{\cal P}}[B] &=& {{\cal P}}[B{\cap}E] \nonumber \\ ... ...{i=1}^n \,{{\cal P}}[B_{\mid A_i}]\cdot{{\cal P}}[A_i] \nonumber \end{eqnarray}$

4.12.0.6 Ejemplo
Se tienen dos urnas, y cada una de ellas contiene un número diferente de bolas blancas y rojas:

Primera urna, U₁: 3 bolas blancas y 2 rojas;

Segunda urna, U₂: 4 bolas blancas y 2 rojas.

Se realiza el siguiente experimento aleatorio:

Se tira una moneda al aire y si sale cara se elige una bola de la primera urna, y si sale cruz de la segunda.

¿Cuál es la probabilidad de que salga una bola blanca?

Solución: La situación que tenemos puede ser esquematizada como

$3 \; B$

$2\; R$

U₁

${{\cal P}}[U_1] = 1/2$

${{\cal P}}[B_{\mid U_1}] = 3/5$

$4 \; B$

$2\; R$

U₂

${{\cal P}}[U_2] = 1/2$

${{\cal P}}[B_{\mid U_2}] = 4/6$

Como U₁ y U₂ forman un sistema incompatible y excluyente de sucesos (la bola resultado debe provenir de una de esas dos urnas y de una sólo de ellas), el teorema de la probabilidad total nos permite afirmar entonces que

$\begin{displaymath}{{\cal P}}[B]= {{\cal P}}[B_{\mid U_1}]\cdot {{\cal P}}[U_1] ... ...ot \frac{1}{2} + \frac{4}{6}\cdot\frac {1}{2} = \frac{19}{30} \end{displaymath}$

4.12.0.7 Teorema (Bayes)
Sea $A_1,A_2,\dots,A_n\subset E$ un sistema exhaustivo y excluyente de sucesos. Sea $B\subset E$ un suceso del que conocemos todas las cantidades ${{\cal P}}[B_{\mid A_i}]$ , $i=1, \dots,n$ , a las que denominamos verosimilitudes. entonces se verifica:
$\begin{displaymath}{ \mbox{\fbox{$\displaystyle \forall\, j=1,\dots,n,\qquad {{... ...i=1}^n {{\cal P}}[B_{\mid A_i}]\cdot {{\cal P}}[A_i] } $ } } } \end{displaymath}$

Demostración
Es una consecuencia de la definición de probabilidad condicionada en términos de la intersección, y del teorema de la probabilidad total:
$\begin{eqnarray}\html{eqn29}{{\cal P}}[{A_j}_{\mid B}] &=& \frac{{{\cal P}}[A_j ... ...i=1}^n {{\cal P}}[B_{\mid A_i}]\cdot {{\cal P}}[A_i] } \nonumber \end{eqnarray}$

4.12.0.8 Ejemplo
Se tienen tres urnas. Cada una de ellas contiene un número diferente de bolas blancas y rojas:
Primera urna, U₁: 3 bolas blancas y 2 rojas;
Segunda urna, U₂: 4 bolas blancas y 2 rojas;
Tercera urna, U₃: 3 bolas rojas.
Se realiza el siguiente experimento aleatorio:

Alguien elije al azar y con la misma probabilidad una de las tres urnas, y saca una bola.

Si el resultado del experimento es que ha salido una bola blanca, ¿cuál es la probabilidad de que provenga de la primera urna? Calcular lo mismo para las otras dos urnas.

Solución:
Vamos a representar en un esquema los datos de que disponemos:

$3 \; B$

$2\; R$

U₁

${{\cal P}}[U_1] = 1/3$

${{\cal P}}[B_{\mid U_1}] = 3/5$

$4 \; B$

$2\; R$

U₂

${{\cal P}}[U_2] = 1/3$

${{\cal P}}[B_{\mid U_2}] = 4/6$

$0 \; B$

$3\; R$

U₃

${{\cal P}}[U_3] = 1/3$

${{\cal P}}[B_{\mid U_3}] = 0$

En este caso U₁, U₂ y U₃ forman un sistema incompatible y excluyente de sucesos (la bola resultado debe provenir de una de esas tres urnas y de una sólo de ellas), por tanto es posible aplicar el teorema de Bayes:
$\begin{eqnarray}\html{eqn29}{{\cal P}}[{U_1}_{\mid B}] &=& \frac{ \displaystyle ... ...}{3}} \nonumber \\ & & \nonumber \\ &=& \frac{9}{19} \nonumber \end{eqnarray}$

Con respecto a las demás urnas hacemos lo mismo:
$\begin{eqnarray}\html{eqn29}{{\cal P}}[{U_2}_{\mid B}] &=& \frac{ \displaystyle ... ...{3}} \nonumber \\ & & \nonumber \\ &=& \frac{10}{19} \nonumber \end{eqnarray}$

$\begin{eqnarray}\html{eqn29}{{\cal P}}[{U_3}_{\mid B}] &=& \frac{ \displaystyle ... ...dot \frac{1}{3}} \nonumber \\ & & \nonumber \\ &=& 0 \nonumber \end{eqnarray}$

4.12.0.9 Observación
Obsérvese que en el ejemplo anterior, antes de realizar el experimento aleatorio de extraer una bola para ver su resultado, teníamos que la probabilidad de elegir una urna i cualquiera es ${{\cal P}}[U_i]$ . Estas probabilidades se denominan probabilidades a priori. Sin embargo, después de realizar el experimento, y observar que el resultado del mismo ha sido la extracción de una bola blanca, las probabilidades de cada urna han cambiado a ${{\cal P}}[{U_i}_{\mid B}]$ . Estas cantidades se denominan probabilidades a posteriori. Vamos a representar en una tabla la diferencia entre ambas:

a priori a posteriori

${{\cal P}}[U_1] = 1/3$ ${{\cal P}}[{U_1}_{\mid B}]=9/19$

${{\cal P}}[U_2] = 1/3$ ${{\cal P}}[{U_2}_{\mid B}]=10/19$

${{\cal P}}[U_3] = 1/3$ ${{\cal P}}[{U_3}_{\mid B}]=0$

1 1

$\;\; \Longrightarrow \;\;$

Las probabilidades a priori cambian de tal modo de las a posteriori que una vez observado el resultado del experimento aleatorio, se puede afirmar con certeza que no fue elegida la tercera urna.

Esta fenómeno tiene aplicaciones fundamentales en Ciencia: Cuando se tienen dos teorías científicas diferentes, T₁ y T₂, que pretenden explicar cierto fenómeno, y a las que asociamos unas probabilidades a priori de ser ciertas,

$\begin{displaymath}{{\cal P}}[T_1]\;,\;{{\cal P}}[T_2] \end{displaymath}$

podemos llevar a cabo la experimentación que se considere más conveniente, para una vez obtenido el cuerpo de evidencia, B, calcular como se modifican las probabilidades de verosimilitud de cada teoría mediante el teorema de Bayes:

$\begin{displaymath}{{\cal P}}[{T_1}_{\mid B}]\;,\;{{\cal P}}[{T_2}_{\mid B}] \end{displaymath}$

Así la experimentación puede hacer que una teoría sea descartada si ${{\cal P}}[{T_i}_{\mid B}]\approx 0$ o reforzada si ${{\cal P}}[{T_i}_{\mid B}]\approx 1$ . Una aplicación básica de esta técnica la tenemos en Medicina para decidir si un paciente padece cierta enfermedad o no, en función de los resultados de un test diagnóstico.

probabilidad y estadistica

martes, 14 de octubre de 2008

VIDEOS UNIDAD 2

UNIDAD 2 PROBABILIDAD

Experimentos y sucesos aleatorios

4.4.0.0.0.1 Suceso seguro:

4.4.0.0.0.2 Suceso imposible:

4.4.0.0.0.3 Suceso contrario a un suceso A:

4.4.0.1 Ejemplo

Operaciones básicas con sucesos aleatorios

4.6.0.0.0.1 Unión:

4.6.0.0.0.2 Intersección:

4.6.0.0.0.3 Diferencia:

4.6.0.0.0.4 Diferencia simétrica:

Experimentos aleatorios y probabilidad

4.8.0.1 Ejemplo

Probabilidad de Laplace

4.8.2.1 Ejemplo

Definición axiomática de probabilidad

4.8.4.1 Concepto de $\sigma$ -álgebra de sucesos

4.8.4.2 Concepto axiomático de probabilidad

4.8.4.3 Observación

Probabilidad condicionada e independencia de sucesos

4.10.0.1 Ejemplo

4.10.0.2 Observación

Ciertos teoremas fundamentales del cálculo de probabilidades

4.12.0.1 Proposición

4.12.0.2 Ejemplo

4.12.0.3 Ejemplo

4.12.0.4 Teorema (Probabilidad compuesta)

4.12.0.5 Teorema (Probabilidad total)

4.12.0.6 Ejemplo

4.12.0.7 Teorema (Bayes)

4.12.0.8 Ejemplo

4.12.0.9 Observación

Archivo del blog

Datos personales

a priori	a posteriori
${{\cal P}}[U_1] = 1/3$	${{\cal P}}[{U_1}_{\mid B}]=9/19$
${{\cal P}}[U_2] = 1/3$	${{\cal P}}[{U_2}_{\mid B}]=10/19$
${{\cal P}}[U_3] = 1/3$	${{\cal P}}[{U_3}_{\mid B}]=0$
1	1