¿Qué es la distribución gaussiana?

¿Qué es la distribución gaussiana?

En estadística, la distribución gaussiana o normal se utiliza para caracterizar sistemas complejos con muchos factores. como se describe en la historia de las estadísticas de stephen stigler, abraham de moivre inventó la distribución que lleva el nombre de karl fredrick gauss. La contribución de gauss radica en su aplicación de la distribución al enfoque de mínimos cuadrados para minimizar el error en el ajuste de datos con una línea de mejor ajuste. Así lo hizo la distribución de errores más importante en las estadísticas.

motivación

¿Cuál es la distribución de una muestra de datos? ¿Qué pasa si no conoce la distribución subyacente de los datos? ¿Hay alguna forma de probar hipótesis sobre los datos sin conocer la distribución subyacente? Gracias al teorema del límite central, la respuesta es sí.

declaración del teorema

indica que una media muestral de una población infinita es aproximadamente normal, o gaussiana, con una media igual a la población subyacente, y una varianza igual a la varianza poblacional dividida por el tamaño de la muestra. la aproximación mejora a medida que aumenta el tamaño de la muestra.

la declaración de aproximación a veces se presenta erróneamente como una conclusión acerca de la convergencia a una distribución normal. dado que la distribución normal aproximada cambia a medida que aumenta el tamaño de la muestra, tal declaración es engañosa.

el teorema fue desarrollado por pierre simon laplace.

por qué está en todas partes

Las distribuciones normales son omnipresentes. La razón viene del teorema del límite central. muchas veces, cuando se mide un valor, es el efecto de suma de muchas variables independientes. por lo tanto, el valor que se mide en sí mismo tiene una calidad media de la muestra. por ejemplo, una distribución del rendimiento de los atletas puede tener forma de campana, como resultado de las diferencias en la dieta, el entrenamiento, la genética, el entrenamiento y la psicología. Incluso las alturas de los hombres tienen una distribución normal, siendo una función de muchos factores biológicos.

cópulas gaussianas

Lo que se llama una "función de cópula" con una distribución gaussiana apareció en las noticias en 2009 debido a su uso en la evaluación del riesgo de invertir en bonos garantizados. El mal uso de la función fue instrumental en la crisis financiera de 2008-2009. Aunque hubo muchas causas de la crisis, en retrospectiva, las distribuciones gaussianas probablemente no deberían haberse utilizado. una función con una cola más gruesa habría asignado mayor probabilidad a los eventos adversos.

derivación

el teorema del límite central se puede probar en muchas líneas al analizar la función de generación de momento (mgf) de (media muestral media) /? (varianza de la población / tamaño muestral) en función del mgf de la población subyacente. La parte aproximada del teorema se introduce al expandir el MGF de la población subyacente como una serie de potencias, y luego muestra que la mayoría de los términos son insignificantes a medida que el tamaño de la muestra se hace grande.

se puede probar en muchas menos líneas al usar una expansión taylor en la ecuación característica de la misma función y hacer que el tamaño de la muestra sea grande.

conveniencia computacional

Algunos modelos estadísticos suponen que los errores son gaussianos. esto permite que las distribuciones de funciones de las variables normales, como la distribución de chi-cuadrado y f, sean utilizadas en la prueba de hipótesis. específicamente, en la prueba f, el estadístico f se compone de una relación de distribuciones chi-cuadradas, que a su vez son funciones de un parámetro de varianza normal. la relación de los dos hace que la varianza se cancele, lo que permite realizar pruebas de hipótesis sin conocer las varianzas, aparte de su normalidad y constancia.



Continuar Leyendo >

Articulos relacionados a la energia