cuando los científicos, economistas o estadísticos hacen predicciones basadas en la teoría y luego recopilan datos reales, necesitan una forma de medir la variación entre los valores predichos y los medidos. por lo general, dependen del error cuadrático medio (mse), que es la suma de las variaciones de los puntos de datos individuales al cuadrado y dividida por el número de puntos de datos menos 2. cuando los datos se muestran en un gráfico, usted determina el mse por Sumando las variaciones en los puntos de datos del eje vertical. en una gráfica xy, esos serían los valores de y.
¿Por qué cuadrar las variaciones?
Multiplicar la variación entre los valores pronosticados y observados tiene dos efectos deseables. El primero es asegurar que todos los valores sean positivos. si uno o más valores fueran negativos, la suma de todos los valores podría ser poco realista y una representación pobre de la variación real entre los valores pronosticados y observados. La segunda ventaja de la cuadratura es dar más peso a las diferencias más grandes, lo que garantiza que un gran valor para mse signifique grandes variaciones de datos.
algoritmo de cálculo de muestra de la muestra
Supongamos que tiene un algoritmo que predice los precios de una acción en particular diariamente. el lunes, predice que el precio de las acciones será de $ 5.50, el martes a $ 6.00, el miércoles de $ 6.00, el jueves $ 7.50 y el viernes $ 8.00. considerando el lunes como el día 1, tiene un conjunto de puntos de datos que aparecen así: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) y (5, 8.00). Los precios reales son los siguientes: lunes $ 4.75 (1, 4.75); martes $ 5.35 (2, 5.35); miércoles $ 6.25 (3, 6.25); jueves $ 7.25 (4, 7.25); y viernes: $ 8.50 (5, 8.50).
las variaciones entre los valores y de estos puntos son 0.75, 0.65, -0.25, 0.25 y -0.50 respectivamente, donde el signo negativo indica un valor predicho más pequeño que el observado. para calcular mse, primero se ajusta cada valor de variación, lo que elimina los signos negativos y produce 0.5625, 0.4225, 0.0625, 0.0625 y 0.25. sumar estos valores da 1.36 y dividir por el número de mediciones menos 2, que es 3, produce el mse, que resulta ser 0.45.
mse y rmse
los valores más pequeños para mse indican una mayor concordancia entre los resultados pronosticados y observados, y una mse de 0.0 indica una concordancia perfecta. es importante recordar, sin embargo, que los valores de variación son cuadrados. cuando se requiere una medición de error que esté en las mismas unidades que los puntos de datos, los estadísticos toman el error cuadrático medio (rmse). obtienen esto tomando la raíz cuadrada del error cuadrático medio. para el ejemplo anterior, el rsme sería 0.671 o aproximadamente 67 centavos.