VIDEO2
VIDEO 3
VIDEO 4
VIDEO 5
Si el único propósito del investigador es describir los resultados de un experimento concreto, los métodos analizados en los capítulos anteriores pueden considerarse suficientes. No obstante, si lo que se pretende es utilizar la información obtenida para extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido estudiados, entonces estos métodos constituyen sólo el principio del análisis, y debe recurrirse a métodos de inferencia estadística, los cuales implican el uso inteligente de la teoría de la probabilidad.
Comenzamos este bloque interpretando la noción de probabilidad y la terminología subyacente a esta área de las matemáticas, ya que la probabilidad constituye por sí misma un concepto básico que refleja su relación con la faceta del mundo exterior que pretende estudiar: los fenómenos aleatorios, los cuales obedecen unas ciertas reglas de comportamiento. De alguna manera, el concepto de probabilidad, se relaciona o nos recuerda las propiedades de la frecuencia relativa.
A partir de ella, y junto con las definiciones de probabilidad condicionada y la de sucesos independientes, se deducen los teoremas fundamentales del Cálculo de Probabilidades.
Nos centraremos posteriormente en el eslabón que une la teoría de la probabilidad y la estadística aplicada: la noción de variable aleatoria, mostrando de esta manera, como puede emplearse la teoría de la probabilidad para sacar conclusiones precisas acerca de una población en base a una muestra extraída de ella, y que muchos de los estudios estadísticos son de hecho, estudio de las propiedades de una o más variables aleatorias.
Tal como hemos citado anteriormente, en las aplicaciones prácticas es importante poder describir los rasgos principales de una distribución, es decir, caracterizar los resultados del experimento aleatorio mediante unos parámetros. Llegamos así al estudio de las características asociadas a una variable aleatoria introduciendo los conceptos de esperanza y varianza matemática, relacionándolos con los conceptos de media y varianza de una variable estadística.
Para trabajar con el cálculo de probabilidades es necesario fijar previamente cierta terminología. Vamos a introducir parte de ella en las próximas líneas.
Diremos que un experimento es aleatorio si se verifican las siguientes condiciones:
Cualquier subconjunto de E será denominado suceso aleatorio, y se denotará normalmente con las letras A, B,...
Obsérvese que los sucesos elementales son sucesos aleatorios compuestos por un sólo elemento. Por supuesto los sucesos aleatorios son más generales que los elementales, ya que son conjuntos que pueden contener no a uno sólo, sino a una infinidad de sucesos elementales --y también no contener ninguno.-- Sucesos aleatorios que aparecen con gran frecuencia en el cálculo de probabilidades son los siguientes:
Al ser los sucesos aleatorios nada más que subconjuntos de un conjunto E --espacio muestral--, podemos aplicarles las conocidas operaciones con conjuntos, como son la unión, intersección y diferencia:
Como ejemplo, tenemos que la unión de un suceso cualquiera con su complementario es el suceso seguro:
Volviendo al ejemplo del lanzamiento de un dado, si y
, el suceso unión de A y B es:
A veces por comodidad se omite el símbolo para denotar la intersección de conjuntos, sobre todo cuando el número de conjuntos que intervienen en la expresión es grande. En particular podremos usar la siguiente notación como equivalente a la intersección:
Un ejemplo de intersección es la de un suceso aleatorio cualquiera, , con su complementario,
, que es el suceso imposible:
Volviendo al ejemplo del dado,
Obsérvese que el suceso contrario de un suceso A, puede escribirse como la diferencia del suceso seguro menos éste, o sea,
Así:
Hay ciertas propiedades que relacionan la unión, intersección y suceso contrario, que son conocidas bajo el nombre de Leyes de Morgan:
Se denominan experimentos deterministas aquellos que realizados de una misma forma y con las mismas condiciones iniciales, ofrecen siempre el mismo resultado. Como ejemplo, tenemos que un objeto de cualquier masa partiendo de un estado inicial de reposo, y dejado caer al vacío desde una torre, llega siempre al suelo con la misma velocidad: 4.1
Cuando en un experimento no se puede predecir el resultado final, hablamos de experimento aleatorio. Este es el caso cuando lanzamos un dado y observamos su resultado.
En los experimentos aleatorios se observa que cuando el número de experimentos aumenta, las frecuencias relativas con las que ocurre cierto suceso e, fn(e),
tiende a converger hacia cierta cantidad que denominamos probabilidad de e.
| |
Esta es la noción frecuentista de probabilidad. Sin embargo esta definición no se puede utilizar en la práctica pues:
Si un experimento cualquiera puede dar lugar a un número finito de resultados posibles, y no existe ninguna razón que privilegie unos resultados en contra de otros, se calcula la probabilidad de un suceso aleatorio A, según la regla de Laplace como el cociente entre el número de casos favorables a A, y el de todos los posibles resultados del experimento:
Solución:
El espacio muestral es . Vamos a llamar A, al suceso consistente en que el resultado es impar,
. Como no suponemos que ninguna de las caras ofrece una probabilidad de ocurrencia diferente a las demás, podemos aplicar la regla de Laplace para obtener que
Para hacer una definición rigurosa de la probabilidad, necesitamos precisar ciertas leyes o axiomas que deba cumplir una función de probabilidad. Intuitivamente estos axiomas deberían implicar, entre otras, las siguientes cuestiones, que nos parecen lógicas en términos de lo que se puede esperar de una función de probabilidad:
Más aún, si los sucesos son disjuntos (incompatibles) debe ocurrir que
En las últimas líneas hemos esbozado ciertas propiedades que debería cumplir una función que queramos llamar probabilidad. Hemos de tener en cuenta entonces que siguiendo esos puntos:
Dado un espacio muestral E, y un -álgebra de sucesos
sobre él, diremos que
es una probabilidad sobre
si las siguientes propiedades (axiomas) son verificadas:
Cuando E es infinito no numerable, la estructura del conjunto P(E) puede presentar propiedades extremadamente engorrosas. Entonces es más conveniente utilizar como -álgebra un subconjunto más pequeño suyo, pero no tanto que no nos permita realizar las operaciones de complementariedad o de uniones finitas que se precisan en la definición de un
-álgebra. Por ejemplo, si realizamos el experimento aleatorio de esperar el tiempo que hace falta para que un átomo de carbono catorce, C14, se desintegre de modo natural, se tiene que
sin embargo, el -álgebra de sucesos que consideramos no es
, que es una clase demasiado compleja para definir sobre sus elementos una medida de probabilidad. En su lugar consideramos el
-álgebra formada por todos los intervalos, abiertos o cerrados, y sus uniones finitas
lo que por supuesto incluye a los puntos de , ya que por ejemplo
Este tipo de conjuntos (los intervalos) son los que nos interesan en la práctica, v.g. calcular la probabilidad de que el peso en kilogramos de un niño al nacer esté en el intervalo [2,4]. De esto modo vamos a realizar el siguiente convenio a lo largo del libro:
No haremos en general referencia al-álgebra de sucesos más que cuando sea estrictamente necesario. De este modo cuando a partir de ahora se diga ``
'', nos referiremos implícitamente a que
, donde
es un
-álgebra de sucesos asociado a E y sobre el que se ha definido la función de probabilidad.
Si el espacio muestral es finito o infinito numerable, entenderemos que el
-álgebra de sucesos es por defecto P(E).
Si E es un conjunto infinito no numerable como
,
, o subconjuntos suyos en forma de intervalos, entenderemos que el
-álgebra asociada es la mencionada en el ejemplo anterior, es decir, la formada por todos los intervalos abiertos, cerrados o semi-abiertos (lo que incluye en particular a los puntos), y sus uniones finitas. De este modo podremos calcular probabilidades como las siguientes:
![]()
Probabilidad condicionada e independencia de sucesos
Sea
un suceso aleatorio de probabilidad no nula,
0$" align="middle" border="0" width="67" height="31">. Para cualquier otro suceso
, llamamos probabilidad condicionada de A a B a la cantidad que representamos mediante
o bien
y que se calcula como:
![]()
4.10.0.1 Ejemplo
Se lanza un dado al aire ¿Cuál es la probabilidad de que salga el número 4? Si sabemos que el resultado ha sido un número par, ¿se ha modificado esta probabilidad?
Solución:
El espacio muestral que corresponde a este experimento es
![]()
y se ha de calcular la probabilidad del suceso
. Si el dado no está trucado, todos los números tienen la misma probabilidad de salir, y siguiendo la definición de probabilidad de Laplace,
Obsérvese que para calcular la probabilidad de A según la definición de Laplace hemos tenido que suponer previamente que todos los elementos del espacio muestral tienen la misma probabilidad de salir, es decir:
![]()
Por otro lado, si ha salido un número par, de nuevo por la definición de probabilidad de Laplace tendríamos
Esta misma probabilidad se podría haber calculado siguiendo la definición de la probabilidad condicionada, ya que si escribimos
y entonces
![]()
que por supuesto coincide con el mismo valor que calculamos usando la definición de probabilidad de Laplace.
4.10.0.2 Observación
Obsérvese que según la definición de probabilidad condicionada, se puede escribir la probabilidad de la intersección de dos sucesos de probabilidad no nula como
![]()
O sea, la probabilidad de la intersección de dos sucesos, es la probabilidad de uno cualquiera de ellos, multiplicada por la probabilidad del segundo sabiendo que ha ocurrido el primero.
Si entre dos sucesos no existe ninguna relación cabe esperar que la expresión ``sabiendo que'' no aporte ninguna información. De este modo introducimos el concepto de independencia de dos sucesos A y B como:
![]()
Esta relación puede ser escrita de modo equivalente, cuando dos sucesos son de probabilidad no nula como
![]()
Ciertos teoremas fundamentales del cálculo de probabilidades
Hay algunos resultados importantes del cálculo de probabilidades que son conocidos bajo los nombres de teorema de la probabilidad compuesta, teorema de la probabilidad total y teorema de Bayes. Veamos cuales son estos teoremas, pero previamente vamos a enunciar a modo de recopilación, una serie de resultados elementales cuya demostración se deja como ejercicio para el lector (algunos ya han sido demostrados anteriormente):
4.12.0.1 Proposición
Seanno necesariamente disjuntos. Se verifican entonces las siguientes propiedades:
- 1.
- Probabilidad de la unión de sucesos:
![]()
- 2.
- Probabilidad de la intersección de sucesos:
![]()
- 3.
- Probabilidad del suceso contrario:
![]()
- 4.
- Probabilidad condicionada del suceso contrario:
![]()
4.12.0.2 Ejemplo
En una universidad el 50% de los alumnos habla inglés, el 20% francés y el 5% los dos idiomas ¿Cuál es la probabilidad de encontrar alumnos que hablen alguna lengua extranjera?
Solución:
Sea A el suceso hablar inglés:
.
Sea B el suceso hablar francés:
.
El suceso hablar francés e inglés es
:
.
Así:
![]()
4.12.0.3 Ejemplo
En una estación de esquí, para navidad-es, la experiencia indica que hay un tiempo soleado sólo elde los días. Por otro lado, se ha calculado que cuando un día es soleado, hay una probabilidad del 20% de que el día posterior también lo sea. Calcular la probabilidad de que, en navidades, un fin de semana completo sea soleado.
Solución: Llamemos S al suceso sábado soleado y D al suceso domingo soleado. La única manera en que un fin de semana completo sea soleado es que lo sea en primer lugar el sábado, y que el domingo posterior también. Es decir:
![]()
Luego sólo el
de los fines de semana son soleados.
El primero de los teoremas que vamos a enunciar es una generalización de la probabilidad de la intersección de dos sucesos, a la de un número cualquiera pero finito de ellos:
4.12.0.4 Teorema (Probabilidad compuesta)
Seauna colección de sucesos aleatorios. Entonces:
![]()
Demostración
Los teoremas que restan nos dicen como calcular las probabilidades de sucesos cuando tenemos que el suceso seguro está descompuesto en una serie de sucesos incompatibles de los que conocemos su probabilidad. Para ello necesitamos introducir un nuevo concepto: Se dice que la colección
es un sistema exhaustivo y excluyente de sucesos si se verifican las relaciones (véase la figura 4.5):
![]()
![]()
4.12.0.5 Teorema (Probabilidad total)
Seaun sistema exhaustivo y excluyente de sucesos. Entonces
![]()
DemostraciónObsérvese la Figura 4.6. De ahí realizamos las siguientes operaciones:
Figura: Si A1,A2,A3,A4 forma un sistema exhaustivo y excluyente se sucesos, podemos calcular la probabilidad de B a partir de las cantidades , o lo que es lo mismo,
![]()
4.12.0.6 Ejemplo
Se tienen dos urnas, y cada una de ellas contiene un número diferente de bolas blancas y rojas:
- Primera urna, U1: 3 bolas blancas y 2 rojas;
- Segunda urna, U2: 4 bolas blancas y 2 rojas.
Se realiza el siguiente experimento aleatorio:
Se tira una moneda al aire y si sale cara se elige una bola de la primera urna, y si sale cruz de la segunda.¿Cuál es la probabilidad de que salga una bola blanca?
Solución: La situación que tenemos puede ser esquematizada como
U1
U2
Como U1 y U2 forman un sistema incompatible y excluyente de sucesos (la bola resultado debe provenir de una de esas dos urnas y de una sólo de ellas), el teorema de la probabilidad total nos permite afirmar entonces que
![]()
4.12.0.7 Teorema (Bayes)
Seaun sistema exhaustivo y excluyente de sucesos. Sea
un suceso del que conocemos todas las cantidades
,
, a las que denominamos verosimilitudes. entonces se verifica:
![]()
DemostraciónEs una consecuencia de la definición de probabilidad condicionada en términos de la intersección, y del teorema de la probabilidad total:
4.12.0.8 Ejemplo
Se tienen tres urnas. Cada una de ellas contiene un número diferente de bolas blancas y rojas:Se realiza el siguiente experimento aleatorio:
- Primera urna, U1: 3 bolas blancas y 2 rojas;
- Segunda urna, U2: 4 bolas blancas y 2 rojas;
- Tercera urna, U3: 3 bolas rojas.
Alguien elije al azar y con la misma probabilidad una de las tres urnas, y saca una bola.Si el resultado del experimento es que ha salido una bola blanca, ¿cuál es la probabilidad de que provenga de la primera urna? Calcular lo mismo para las otras dos urnas.
Solución:
Vamos a representar en un esquema los datos de que disponemos:
U1
U2
U3
En este caso U1, U2 y U3 forman un sistema incompatible y excluyente de sucesos (la bola resultado debe provenir de una de esas tres urnas y de una sólo de ellas), por tanto es posible aplicar el teorema de Bayes:
Con respecto a las demás urnas hacemos lo mismo:
4.12.0.9 Observación
Obsérvese que en el ejemplo anterior, antes de realizar el experimento aleatorio de extraer una bola para ver su resultado, teníamos que la probabilidad de elegir una urna i cualquiera es. Estas probabilidades se denominan probabilidades a priori. Sin embargo, después de realizar el experimento, y observar que el resultado del mismo ha sido la extracción de una bola blanca, las probabilidades de cada urna han cambiado a
. Estas cantidades se denominan probabilidades a posteriori. Vamos a representar en una tabla la diferencia entre ambas:
a priori a posteriori 1 1
Las probabilidades a priori cambian de tal modo de las a posteriori que una vez observado el resultado del experimento aleatorio, se puede afirmar con certeza que no fue elegida la tercera urna.
Esta fenómeno tiene aplicaciones fundamentales en Ciencia: Cuando se tienen dos teorías científicas diferentes, T1 y T2, que pretenden explicar cierto fenómeno, y a las que asociamos unas probabilidades a priori de ser ciertas,
![]()
podemos llevar a cabo la experimentación que se considere más conveniente, para una vez obtenido el cuerpo de evidencia, B, calcular como se modifican las probabilidades de verosimilitud de cada teoría mediante el teorema de Bayes:
![]()
Así la experimentación puede hacer que una teoría sea descartada si
o reforzada si
. Una aplicación básica de esta técnica la tenemos en Medicina para decidir si un paciente padece cierta enfermedad o no, en función de los resultados de un test diagnóstico.