Distribución Normal

DISTRIBUCIÓN NORMAL
Esta distribución resulta útil no sólo porque un gran número de distribuciones de frecuencias presentan formas aproximadamente normales, sino también por su gran significado teórico en el campo de la estadística inferencial. 
En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal como por ejemplo:
  • Caracteres morfológicos de individuos: talla, peso,..
  • Caracteres sociológicos: consumo de un cierto producto por un grupo de individuos, puntuaciones de examen…
  • Caracteres psicológicos: cociente intelectual, grado de adaptación a un medio
  • Valores estadísticos muestrales: la media.
  • Otras distribuciones como la Binomial o la de Poisson son aproximaciones normales.

No obstante, hay que tener cuidado al suponer que un determinado conjunto de observaciones se puede aproximar por una distribución normal.



La distribución normal la obtuvo inicialmente De Moivre en 1733 como límite o aproximación de la distribución B (n,p) cuando n   . Posteriormente Gauss en 1809 y Laplace en 1812 llegaron a obtenerla empíricamente al estudiar la distribución de errores accidentales en Astronomía y Geodesia.


Una justificación de la frecuente aparición de la distribución normal es el teorema central del limite, que veremos más tarde, que establece que cuando los resultados de un experimento son debidos a un conjunto muy grande de causas independientes, que actúan sumando sus efectos, siendo cada efecto individual de poca importancia respecto al conjunto, es esperable que los resultados sigan una distribución normal.


La curva normal responde al tipo de curva perfectamente simétrica, y unimodal basada en un número infinito de casos, por lo que sólo puede ser tratada de forma aproximada cuando se opera con datos reales. Por tratarse de una curva simétrica coinciden la media, la moda y la mediana.

Diremos que la variable aleatoria, de tipo continuo, sigue una distribución Normal de parámetros (µσ) si su función de densidad es:   



donde  µ, σ ϵ R y tales que  -< µ < +   y σ>0

La función de densidad depende de dos parámetros: media y varianza de la distribución, y puede verse por la definición que no hay una única distribución normal sino una familia completa de  distribuciones.   


Abreviadamente esta distribución la indicaremos por:  → (µ,σ) 

Se observa que tiene forma de campana, de aquí que frecuentemente se le llame curva o campana de Gauss.    


Los parámetros:


  • µ, es el centro de la distribución y también se corresponde con el punto máximo de la distribución.
  • σ, nos da una idea del grado de apertura de la distribución.


d normal 4 Distribución Normal
 Veamos los siguientes ejemplos:
  • En este caso tenemos 2 curvas normales N  (µ1,σ)  y N(µ2,σ) que tienen distintas medidas, pero tienen la misma desviación típica, por lo tanto sus centros están en diferentes lugares pero el grado de apertura de ambas distribuciones es el mismo.
  • En este segundo caso tenemos 2 curvas normales  N  (µ1,σ)  y N(µ2,σ) que tienen distintas desviaciones típicas pero tienen la misma media. Ahora las curvas están centradas en el mismo punto m pero su grado de apertura es distinto. Como d 1<d 2 la curva de mayor desviación típica, en este caso d 2 tendrá una mayor dispersión.
Características de esta distribución:
Función de distribución:

La integral correspondiente a esta función de distribución solo puede calcularse mediante métodos numéricos aproximados. Una manera de simplificar estos cálculos es mediante el proceso de tipificación de una variable aleatoria normal, que nos permite pasar de una N→(µ,σ) a una N(0,1).

La variable normal con media 0 y desviación típica la unidad se denomina normal estándar N(0,1); su función de distribución ésta tabulada. Para calcular probabilidades en el caso general, transformaremos la variable aleatoria x en la variable normal estándar z, mediante:

Si aplicamos el cambio de variable tenemos como función de densidad:

y su funcion de densidad es:

Las características que presenta la normal tipificada son:
  • No depende de ningún parámetro.
  • La curva f(z) es simétrica respecto al eje Y.
  • Para realizar la representación gráfica de la función de densidad f (z) correspondiente a la normal N(0,1) procederíamos de forma análoga a como se hizo para la distribución N→(µ,σ)
Ejemplo:

Las calificaciones de los 500 aspirantes presentados a un examen para contratación laboral, se distribuye normalmente con media 6.5 y varianza 4.

a) Calcule la probabilidad de que un aspirante obtenga más de 8 puntos.
b) Determine la proporción de aspirantes con calificaciones inferiores a 5 puntos.
c) ¿ Cuántos aspirantes obtuvieron calificaciones comprendidas entre 5 y 7.5 puntos ?.

 (6.5, 4)= N(6.5,2)
Nos encontramos ante una distribución normal

a)

Tipificamos el valor 8 :

       La probabilidad pedida es el área a la derecha de z = 0.75.
                                           Consultando las tablas obtenemos : 0.22663
                                      


b)

 
                                              Tipificamos el valor 5 :



                                       Calculemos el área (probabilidad) a la izquierda de z = -0.75.
                                       Consultando las tablas obtenemos : 0.22663
                                       En términos de porcentajes será 0'22663 x 100 : el 22.663 %

c)





                                            El área comprendida entre ambos es , consultando las tablas :
                                            Pr(5 < X < 7.5) = Pr(-0.75 < z < 0.5) = 0.46483
                                            Multiplicando la probabilidad por el total de aspirantes,
                                            obtenemos el número de ellos que tienen calificaciones
                                            comprendidas entre 5 y 7.5 puntos :
                                            0.46483 x 500 = 232.415 232 aspirantes



                                             Tipificamos los valores 5 y 7.5 :