lunes, 25 de febrero de 2013

distribucion normal de probabilidad





Contenido: 

  • Que es distribucion normal
  • Distribucion normal de probabilidad
  • Probabilidad
  • Equivalencia entre probabilidad y conjunto  









           






 Distribucion normal:


En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico de una función gaussiana.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.
De hecho, la estadística es un modelo matemático que sólo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido como método correlacional.
La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:
La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo, la distribución muestral de las medias muestrales es aproximadamente normal, cuando la distribución de la población de la cual se extrae la muestra no es normal.1 Además, la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. La distribución normal es la más extendida en estadística y muchos tests estadísticos están basados en una supuesta "normalidad".



 Definición formal

Hay varios modos de definir formalmente una distribución de probabilidad. La forma más visual es mediante su función de densidad. De forma equivalente, también pueden darse para su definición la función de distribución, los momentos, la función característica y la función generatriz de momentos, entre otros.

Función de densidad

Gráfica de la distribución normal de media 0 y desviación típica 1
Se dice que una variable aleatoria continua X sigue una distribución normal de parámetros μ y σ y se denota X~N(μ, σ) si su función de densidad está dada por:
f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}, \, \quad x\in\mathbb{R},
donde μ (mu) es la media y σ (sigma) es la desviación estándar (σ2 es la varianza).5
Se llama distribución normal "estándar" a aquélla en la que sus parámetros toman los valores μ = 0 y σ = 1. En este caso la función de densidad tiene la siguiente expresión:
f(x)=f_{0,1}(x)=\frac{e^\frac{-x^2}{2}}{\sqrt{2\pi\,}}, \,\quad x\in\mathbb{R}.
Su gráfica se muestra a la derecha y con frecuencia se usan tablas para el cálculo de los valores de su distribución.

Función de distribución

Función de distribución para la distribución normal
La función de distribución de la distribución normal está definida como sigue:
 \begin{align}
\Phi_{\mu,\sigma^2}(x)
&{}=\int_{-\infty}^x\varphi_{\mu,\sigma^2}(u)\,du\\
&{}=\frac{1}{\sigma\sqrt{2\pi}}
\int_{-\infty}^x
e^{-\frac{(u - \mu)^2}{2\sigma^2}}\, du ,\quad x\in\mathbb{R}\\
\end{align}
Por tanto, la función de distribución de la normal estándar es:

\Phi(x) = \Phi_{0,1}(x)
= \frac{1}{\sqrt{2\pi}}
\int_{-\infty}^x
e^{-\frac{u^2}{2}}
\, du, \quad x\in\mathbb{R}.
Esta función de distribución puede expresarse en términos de una función especial llamada función error de la siguiente forma:

\Phi(x)
=\frac{1}{2} \Bigl[ 1 + \operatorname{erf} \Bigl( \frac{x}{\sqrt{2}} \Bigr) \Bigr],
\quad x\in\mathbb{R},
y la propia función de distribución puede, por consiguiente, expresarse así:

\Phi_{\mu,\sigma^2}(x)
=\frac{1}{2} \Bigl[ 1 + \operatorname{erf} \Bigl( \frac{x-\mu}{\sigma\sqrt{2}} \Bigr) \Bigr],
\quad x\in\mathbb{R}.
El complemento de la función de distribución de la normal estándar, 1 - \Phi(x), se denota con frecuencia Q(x), y es referida, a veces, como simplemente función Q, especialmente en textos de ingeniería.6 7 Esto representa la cola de probabilidad de la distribución gaussiana. También se usan ocasionalmente otras definiciones de la función Q, las cuales son todas ellas transformaciones simples de \Phi.8
La inversa de la función de distribución de la normal estándar (función cuantil) puede expresarse en términos de la inversa de la función de error:

\Phi^{-1}(p)
= \sqrt2
\;\operatorname{erf}^{-1} (2p - 1),
\quad p\in(0,1),
y la inversa de la función de distribución puede, por consiguiente, expresarse como:

\Phi_{\mu,\sigma^2}^{-1}(p)
= \mu + \sigma\Phi^{-1}(p)
= \mu + \sigma\sqrt2
\; \operatorname{erf}^{-1}(2p - 1),
\quad p\in(0,1).
Esta función cuantil se llama a veces la función probit. No hay una primitiva elemental para la función probit. Esto no quiere decir meramente que no se conoce, sino que se ha probado la inexistencia de tal función. Existen varios métodos exactos para aproximar la función cuantil mediante la distribución normal (véase función cuantil).
Los valores Φ(x) pueden aproximarse con mucha precisión por distintos métodos, tales como integración numérica, series de Taylor, series asintóticas y fracciones continuas.

Límite inferior y superior estrictos para la función de distribución

Para grandes valores de x la función de distribución de la normal estándar \scriptstyle\Phi(x) es muy próxima a 1 y \scriptstyle\Phi(-x)\,{=}\,1\,{-}\,\Phi(x) está muy cerca de 0. Los límites elementales

\frac{x}{1+x^2}\varphi(x)<1-\Phi(x)<\frac{\varphi(x)}{x}, \qquad x>0,
en términos de la densidad \scriptstyle\varphi son útiles.
Usando el cambio de variable v = u²/2, el límite superior se obtiene como sigue:

\begin{align}
1-\Phi(x)
&=\int_x^\infty\varphi(u)\,du\\
&<\int_x^\infty\frac ux\varphi(u)\,du
=\int_{x^2/2}^\infty\frac{e^{-v}}{x\sqrt{2\pi}}\,dv
=-\biggl.\frac{e^{-v}}{x\sqrt{2\pi}}\biggr|_{x^2/2}^\infty
=\frac{\varphi(x)}{x}.
\end{align}
De forma similar, usando \scriptstyle\varphi'(u)\,{=}\,-u\,\varphi(u) y la regla del cociente,

\begin{align}
\Bigl(1+\frac1{x^2}\Bigr)(1-\Phi(x))&=\Bigl(1+\frac1{x^2}\Bigr)\int_x^\infty\varphi(u)\,du\\
&=\int_x^\infty \Bigl(1+\frac1{x^2}\Bigr)\varphi(u)\,du\\
&>\int_x^\infty \Bigl(1+\frac1{u^2}\Bigr)\varphi(u)\,du
=-\biggl.\frac{\varphi(u)}u\biggr|_x^\infty
=\frac{\varphi(x)}x.
\end{align}
Resolviendo para \scriptstyle 1\,{-}\,\Phi(x)\, proporciona el límite inferior.




Propiedades

Algunas propiedades de la distribución normal son:
  1. Es simétrica respecto de su media, μ;
    Distribución de probabilidad alrededor de la media en una distribución N(μ, σ).
  2. La moda y la mediana son ambas iguales a la media, μ;
  3. Los puntos de inflexión de la curva se dan para x = μ − σ y x = μ + σ.
  4. Distribución de probabilidad en un entorno de la media:
    1. en el intervalo [μ - σ, μ + σ] se encuentra comprendida, aproximadamente, el 68,26% de la distribución;
    2. en el intervalo [μ - 2σ, μ + 2σ] se encuentra, aproximadamente, el 95,44% de la distribución;
    3. por su parte, en el intervalo [μ -3σ, μ + 3σ] se encuentra comprendida, aproximadamente, el 99,74% de la distribución. Estas propiedades son de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que prácticamente la totalidad de la distribución se encuentre a tres desviaciones típicas de la media justifica los límites de las tablas empleadas habitualmente en la normal estándar.
  5. Si X ~ N(μ, σ2) y a y b son números reales, entonces (aX + b) ~ N(+b, a2σ2).
  6. Si X ~ N(μx, σx2) e Y ~ N(μy, σy2) son variables aleatorias normales independientes, entonces:
    • Su suma está normalmente distribuida con U = X + Y ~ N(μx + μy, σx2 + σy2) (demostración). Recíprocamente, si dos variables aleatorias independientes tienen una suma normalmente distribuida, deben ser normales (Teorema de Crámer).
    • Su diferencia está normalmente distribuida con V = X - Y \sim N(\mu_X - \mu_Y, \sigma^2_X + \sigma^2_Y).
    • Si las varianzas de X e Y son iguales, entonces U y V son independientes entre sí.
    • La divergencia de Kullback-Leibler, D {\rm KL}( X \| Y ) =
{ 1 \over 2 } \left( \log \left( { \sigma^2_Y \over \sigma^2_X } \right) + \frac{\sigma^2_X}{\sigma^2_Y} +
\frac{\left(\mu_Y - \mu_X\right)^2}{\sigma^2_Y} - 1\right).
  7. Si X \sim N(0, \sigma^2_X) e Y \sim N(0, \sigma^2_Y) son variables aleatorias independientes normalmente distribuidas, entonces:
  8. Si X_1, \dots, X_n son variables normales estándar independientes, entonces X_1^2 + \cdots + X_n^2 sigue una distribución χ² con n grados de libertad.
  9. Si X_1,\dots,X_n son variables normales estándar independientes, entonces la media muestral \bar{X}=(X_1+\cdots+X_n)/n y la varianza muestral S^2=((X_1-\bar{X})^2+\cdots+(X_n-\bar{X})^2)/(n-1) son independientes. Esta propiedad caracteriza a las distribuciones normales y contribuye a explicar por qué el test-F no es robusto respecto a la no-normalidad).




Distribución normal compleja

Considérese la variable aleatoria compleja gaussiana

Z=X+iY\,
donde X e Y son variables gaussianas reales e independientes con igual varianza \sigma_r^2. La función de distribución de la variable conjunta es entonces

\frac{1}{2\,\pi\,\sigma_r^2} e^{-(x^2+y^2)/(2 \sigma_r ^2)}.
Como \sigma_Z =\sqrt{2}\sigma_r, la función de distribución resultante para la variable gaussiana compleja Z es

\frac{1}{\pi\,\sigma_Z^2} e^{-|Z|^2\!/\sigma_Z^2}.

Distribuciones relacionadas

  • Distribución normal truncada. si X \sim N(\mu, \sigma^2),\! entonces truncando X por debajo de A y por encima de B dará lugar a una variable aleatoria de media E(X)=\mu + \frac{\sigma(\varphi_1-\varphi_2)}{T},\! donde T=\Phi\left(\frac{B-\mu}{\sigma}\right)-\Phi\left(\frac{A-\mu}{\sigma}\right), \; \varphi_1 = \varphi\left(\frac{A-\mu}{\sigma}\right), \; \varphi_2 = \varphi\left(\frac{B-\mu}{\sigma}\right) y \varphi\, es la función de densidad de una variable normal estándar.



1. Probabilidad.
La probabilidad p de un suceso está comprendida entre 0 y 1 (0 <= p <= 1), en donde:
p = 0 es la probabilidad del suceso imposible.
p = 1 es la probabilidad del suceso seguro.

2. La distribución normal de probabilidad.
La distribución normal de probabilidad, distribución de Gauss o campana de Gauss es una distribución estadística continua de probabilidad. Se sabe que las características físicas, psicológicas y sociales de una población, además de otros fenómenos, (inteligencia, peso, belleza, longevidad, borreguismo, etc.), siguen más o menos la distribución normal de probabilidad.
Por ejemplo, si la estatura se representa en el eje X, entonces se ve que la mayoría de la gente tiene una estatura normal, situada en el centro de la gráfica, mientras que una minoría de gente es muy alta y otra minoría muy baja, saliéndose de lo normal, según lo mostrado en la gráfica en los extremos izquierdo y derecho. Otro ejemplo es la inteligencia: La mayoría de la gente es de inteligencia normal, mientras que una minoría es muy inteligente y otra es muy poco inteligente. O la longevidad: La mayoría de la gente tiene una esperanza de vida normal, mientras que unos pocos mueren demasiado pronto o llegan a centenarios.

En el eje X se representa una variable estadística y en el eje Y la probabilidad para cada valor de X. Algunas características:
  • La media, la mediana y la moda son el valor central en donde la distribución alcanza su valor máximo, siendo una distribución simétrica respecto de este valor. Para valores alejados de la media, decrece exponencialmente.
  • El área total bajo la curva del gráfico es 1. Esto es, la integral de la gráfica es 1. O dicho de otra forma, la suma total de todas las probabilidades es 1.
  • El gráfico de arriba muestra las principales subáreas del gráfico.
  • La probabilidad de que x sea cualquier valor <= x1 (donde x1 es un valor cualquiera de X), es la integral de la curva hasta x1, o sea, el área bajo la curva hasta x1, o lo que es lo mismo, la suma de todas las probabilidades hasta x1:



3. Equivalencia entre probabilidades y conjuntos.
Hay una equivalencia en operar con probabilidades y operar con conjuntos, debido a que ambas cosas siguen el álgebra de Boole.


a) Operar con conjuntos.
El conjunto total es el conjunto formado por todos los elementos, del que se obtienen subconjuntos. El conjunto vacío es el conjunto sin ningún elemento.
Si tenemos por ejemplo un conjunto formado por las mujeres muy inteligentes y otro formado por las mujeres muy atractivas, (ambos conjuntos pequeños, tal y como sugieren las respectivas distribuciones normales de probabilidad), entonces el subconjunto formado por las mujeres muy inteligentes que son además muy atractivas será la intersección de ambos conjuntos, y este subconjunto intersección será de un tamaño menor o como mucho igual que los conjuntos de mujeres atractivas y de mujeres inteligentes por separado, pues es obvio que si es difícil encontrar a una atractiva, más difícil es encontrar a una que sea además inteligente.
Por el contrario, si se quiere encontrar a una que sea inteligente o que sea atractiva (no necesariamente las dos cosas, sino solamente una de ellas), será la unión de los dos conjuntos, resultando en un conjunto mayor.
Por último, el conjunto complemento de un subconjunto A es el conjunto que no contiene ningún elemento de A: Conjunto total – A.


b) Operar numéricamente con probabilidades.
La probabilidad del suceso seguro es 1 y es equivalente al conjunto total. La del suceso imposible es 0 y es equivalente al conjunto vacío.
Esta operación de intersección de conjuntos se expresa numéricamente en términos de probabilidades como el producto de las probabilidades. Como la probabilidad de un suceso es un número menor o igual que 1, el producto de dos probabilidades “p”, “q”, va a ser menor o igual que 1 también, y menor o igual que “p” y que “q”.
En el ejemplo anterior, supongamos que la probabilidad de encontrar a una mujer atractiva es p=0’20 y la de encontrar a una inteligente es q=0’25. Entonces, la probabilidad de encontrar a una que sea inteligente y atractiva es p·q = 0’20 x 0’25 = 0’05, mucho más pequeña que la de encontrar a una que sólo sea atractiva/inteligente:
p·q <= p
p·q <= q

Por el contrario, la probabilidad de encontrar una mujer que sea o inteligente o atractiva será la suma de probabilidades p+q = 0’45:
p+q >= p
p+q >= q

Por último, la probabilidad del complemento de p (el conjunto que no tiene elementos en p) es 1-p: restar la probabilidad de p a la probabilidad del suceso seguro que es 1.
Resumiendo las operaciones del álgebra de Boole con sus equivalentes numéricos de probabilidad y de conjuntos:
  • Producto lógico = Intersección de conjuntos = producto de probabilidades.
  • Suma lógica = Unión de conjuntos = suma de probabilidades.
  • Complemento = Conjunto total – subconjunto = 1 – p