jueves, 4 de diciembre de 2008

unidad III

3. Funciones de Distribución de Variables.
3.1 Variables aleatorias y su clasificación


Si en un experimento aleatorio a cada suceso aleatorio elemental le asignamos un valor numérico obtenemos una variable aleatoria. Es decir, una variable que lleva asociada una probabilidad. La probabilidad de un valor concreto de la variable es la probabilidad que corresponde a los sucesos aleatorios elementales a los que hemos asignado ese valor numérico.

Por ejemplo : En el experimento aleatorio "lanzar un dado" asignamos a cada cara del dado su valor numérico (esta asignación aparece de forma natural). Así generamos una variable aleatoria que toma seis valores, del 1 al 6 con igual probabilidad (1/6) cada uno de ellos. Pero, con este mismo experimento, podemos generar otras variables aleatorias (no tan naturales) como puede ser : asignar el valor 1 a las caras que son múltiplos de tres y el valor 0 a las que no lo son, apareciendo una variable aleatoria que tiene dos valores, el 1 con probabilidad 1/3 y el 0 con probabilidad 2/3.

Crear una variable aleatoria no tiene mucho sentido sino la vamos a utilizar en un determinado contexto, por ejemplo, podemos utilizar la segunda variable aleatoria que hemos creado para apostar si sale o no múltiplo de tres.

Resumiendo, una variable aleatoria se construye al atribuir un número (positivo, negativo o cero) a cada uno de los sucesos aleatorios que forman el espacio muestral de un experimento aleatorio. La probabilidad de cada valor de la variable es la probabilidad conjunta de los sucesos que dan lugar a ese valor. Es decir, definimos una variable aleatoria como una aplicación del espacio muestral W sobre el conjunto de los números reales R.

Según la amplitud del campo de variación de la función podemos distinguir : variables aleatorias discretas y variables aleatorias continuas. De la misma forma que en estadística descriptiva, una variable aleatoria es discreta si toma valores en un conjunto finito o infinito numerable. Y una variable aleatoria es continua si puede tomar valores en un conjunto infinito no numerable. Como ejemplo típico de variable aleatoria discreta tenemos la distribución binomial, y como ejemplo típico de variable aleatoria continua vamos a ver ahora la distribución normal.

Como hemos visto hay variables aleatorias que pueden tomar cualquier valor de un intervalo real de la forma (a, b), (a, +¥), (-¥, b), (-¥, +¥) o uniones de ellos. A las variables de este tipo se las denomina variables aleatorias continuas.

Por ejemplo : Supongamos que vamos a realizar un experimento aleatorio que consiste en seleccionar una persona y apuntar su peso. Podemos crear una variable aleatoria cuyos valores sean el número de kilogramos que pesa la persona observada. En este caso, el rango de valores posibles se extiende entre los límites naturales, pero la continuidad de esta variable aleatoria radica en el carácter continuo de lo que medimos, el peso, es decir, en el hecho de que entre dos valores posibles se podrían obtener infinitos valores intermedios, también posibles si utilizáramos aparatos con suficiente precisión. Estos "infinitos" en el interior del rango de la variable es lo que diferencia a las variables continuas de las discretas.

Sin entrar en profundidades, consideramos que una distribución de probabilidad es cualquier mecanismo que nos ayuda a obtener las probabilidades de los valores de una variable si es discreta, o las probabilidades de intervalos de la variable si es continua. Si la variable aleatoria es discreta es posible asignar probabilidades a cada uno de los valores puntuales de la variable. En contra, cuando es continua cada uno de los infinitos valores posibles tendrá probabilidad cero y sólo podremos hablar de probabilidad dentro de intervalos.

3.2 Distribuciones de probabilidad discretas

3.2.2 Distribución Binomial
Supongamos que un experimento aleatorio tiene las siguientes características:

* En cada prueba del experimento sólo son posibles dos resultados: el suceso A (éxito) y su contrario`A (fracaso).
* El resultado obtenido en cada prueba es independiente de los resultados obtenidos anteriormente.
* La probabilidad del suceso A es constante, la representamos por p, y no varía de una prueba a otra. La probabilidad de `A es 1- p y la representamos por q .
* El experimento consta de un número n de pruebas.

Todo experimento que tenga estas características diremos que sigue el modelo de la distribución Binomial. A la variable X que expresa el número de éxitos obtenidos en cada prueba del experimento, la llamaremos variable aleatoria binomial.

La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas. Como hay que considerar todas las maneras posibles de obtener k-éxitos y (n-k) fracasos debemos calcular éstas por combinaciones (número combinatorio n sobre k).

La distribución Binomial se suele representar por B(n,p) siendo n y p los parámetros de dicha distribución.

Función de Probabilidad de la v.a. Binomial

Función de probabilidad de la distribución Binomial o también denominada función de la distribución de Bernoulli (para n=1). Verificándose: 0 £ p £ 1

Como el cálculo de estas probabilidades puede resultar algo tedioso se han construido tablas para algunos valores de n y p que nos facilitan el trabajo.

Parámetros de la Distribución Binomial

Función de Distribución de la v.a. Binomial

siendo k el mayor número entero menor o igual a xi.

Esta función de distribución proporciona, para cada número real xi, la probabilidad de que la variable X tome valores menores o iguales que xi.

3.3 Esperanza matemática
En estadística la esperanza matemática (o simplemente esperanza) o valor esperado de una variable aleatoria es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Por ejemplo, en un juego de azar el valor esperado es el beneficio medio.

Si todos los sucesos son de igual probabilidad la esperanza es la media aritmética.
Para una variable aleatoria discreta con valores posibles x_1, x_2 \ldots x_n \,\! y sus probabilidades representadas por la función de masa p(xi) la esperanza se calcula como:

Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los valores y la función de densidad f(x) \,\!:


La esperanza también se suele simbolizar con \mu = E[X] \,\!

Las esperanzas E[X^k] para k=0,1,2... se llaman momentos de orden k . Más importantes son los momentos centrados E[(X-E[X])^k] .

No todas las variables aleatorias tienen un valor esperado. Por ejemplo, la distribución de Cauchy no lo tiene.

Propiedades
La esperanza es un operador lineal, ya que:


3.5 Distribución t
Se sabe que se distribuye normalmente con una media m y una varianza s²/n, o la variable se distribuye normalmente con media cero y varianza unitaria. Sin embargo, para calcular Z se requiere que s sea conocido. Por lo tanto, se requiere una distribución para el caso en que s sea desconocido y se pueda reemplazar por un estimativo, tal como S. Tal distribución es la distribución t.

Teorema. Sean Y y Z dos variables aleatorias independientes, Y con una distribución Chi cuadrado con n grados de libertad, y Z con una distribución normal estándar (0,1), entonces la distribución de la variable


está dado por:

y se denomina "distribución t ó distribución de Student, con n grados de libertad.

Origen: WS Gosset publicó inicialmente la distribución bajo el seudónimo de "Student".

Propiedades generales

a) El valor esperado es cero Þ E(T)= 0
b) Distribución simétrica con respecto a cero.
c) La varianza de T está dada por
d) La varianza de T es ligeramente mayor de 1.0, es decir, es ligeramente mayor que la de la distribución normal estandarizada.
e) Para n ³ 30 la distribución t tiende hacia la distribución normal.

Tabulación. La función de distribución no puede calcularse en forma analítica; sin embargo, ha sido tabulada para diferentes valores de la probabilidad acumulada, y para varios grados de libertad. Como la distribución es simétrica, solamente se presentan probabilidades acumuladas para valores positivos de t (t³0). Los valores que se presentan en los encabezamientos de las columnas de la tabla corresponden a las probabilidades de exceder los respectivos valores de t, es decir, presentan las colas a la derecha de los valores respectivos de t. Para encontrar probabilidades correspondientes a valores negativos de t hay que hacer uso de la propiedad de simetría de la distribución t que nos dice que F(-t) = 1 - F(t).

Notación. Usaremos la notación para denotar el valor de la distribución t con n grados de libertad y una probabilidad acumulada de P hacia la derecha (o una probabilidad de 1-P hacia la izquierda).

La aplicación fundamental para la cual se usa esta distribución se presenta en el siguiente teorema.

Teorema. Si y S² son la media y la varianza de una muestra aleatoria de tamaño n tomada de una población normal con media m y varianza s², entonces la variabletiene la distribución t con n-1 grados de libertad.

3.6 Distribución Chi-cuadrada
En estadística, la distribución ji-cuadrado, también denominada ji-cuadrado de Pearson, es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria:

donde Zi son variables de distribución normal, de media cero y varianza uno.

Esta distribución se expresa habitualmente c X\sim\chi^2_k

Donde el subíndice k de \chi^2_k , es le número de sumandos, se denomina grados de libertad de la distribución.

Se suele usar la denominada prueba ji-cuadrado como test de independencia y como test de bondad de ajuste.

Distribución χ² (ji-cuadrado)
Función de densidad de probabilidad



3.7 Distribución F
Usada en teoría de probabilidad y estadística, la distribución F es una distribución de probabilidad continua. También se la conoce como distribución F de Snedecor o como distribución F de Fisher-Snedecor.

Una variable aleatoria de distribución F se construye como el siguiente cociente:

donde

* U1 y U2 siguen una distribución ji-cuadrada con d1 y d2 grados de libertad respectivamente, y

* U1 y U2 son estadísticamente independientes.

La distribución F aparece frecuentemente como la distribución nula de una prueba estadística, especialmente en el análisis de varianza. Véase el test F.

La función de densidad de una F(d1, d2) viene dada por
donde

* U1 y U2 siguen una distribución ji-cuadrada con d1 y d2 grados de libertad respectivamente, y

* U1 y U2 son estadísticamente independientes.

La distribución F aparece frecuentemente como la distribución nula de una prueba estadística, especialmente en el análisis de varianza. Véase el test F.

La función de densidad de una F(d1, d2) viene dada por

para todo número real x ≥ 0, donde d1 y d2 son enteros positivos, y B es la distribución beta.

La función de distribución es

donde I es la función beta incompleta regularizada.

No hay comentarios: