al ajustar una línea recta a un conjunto de datos, es posible que le interese determinar qué tan bien se ajusta la línea resultante a los datos. una forma de hacer esto es calcular la suma de los errores de cuadrados (sse). este valor proporciona una medida de qué tan bien la línea de mejor ajuste se aproxima al conjunto de datos. El sse es importante para el análisis de datos experimentales y se determina a través de unos pocos pasos cortos.
Encuentre una línea de mejor ajuste para modelar los datos usando regresión. La línea de mejor ajuste tiene la forma y = ax + b, donde a y b son los parámetros que debe determinar. Puede encontrar estos parámetros utilizando un análisis de regresión lineal simple. por ejemplo, suponga que la línea de mejor ajuste tiene la forma y = 0.8x + 7.
use la ecuación para determinar el valor de cada valor y pronosticado por la línea de mejor ajuste. puedes hacer esto sustituyendo cada valor x en la ecuación de la línea. por ejemplo, si x es igual a 1, sustituyéndolo en la ecuación y = 0.8x + 7 se obtiene 7.8 para el valor de y.
determine la media de los valores pronosticados a partir de la línea de ecuación de mejor ajuste. puede hacer esto sumando todos los valores y pronosticados a partir de las ecuaciones y dividiendo el número resultante por el número de valores. por ejemplo, si los valores son 7.8, 8.6 y 9.4, sumando estos valores da 25.8, y dividiendo este número por el número de valores, 3 en este caso, da 8.6.
reste cada uno de los valores individuales de la media y cuadre el número resultante. en nuestro ejemplo, si restamos el valor 7.8 de la media 8.6, el número resultante es 0.8. al cuadrar este valor se obtiene 0.64.
sume todos los valores al cuadrado del paso 4. si aplica las instrucciones del paso 4 a los tres valores de nuestro ejemplo, encontrará valores de 0.64, 0 y 0.64. Sumando estos valores se obtiene 1.28. Esta es la suma del error de cuadrados.
advertencia
los números de los datos solo se utilizan para determinar la ecuación de la línea de mejor ajuste. use los valores de la línea de mejor ajuste al calcular el error de la suma de cuadrados.