Experimentos de prueba de predicciones. estas predicciones son a menudo numéricas, lo que significa que, a medida que los científicos recopilan datos, esperan que los números se descompongan de cierta manera. los datos del mundo real rara vez coinciden exactamente con las predicciones que hacen los científicos, por lo que los científicos necesitan una prueba para decirles si la diferencia entre los números observados y los esperados se debe al azar o a algún factor imprevisto que obligará al científico a ajustar la teoría subyacente . Una prueba de chi-cuadrado es una herramienta estadística que los científicos usan para este propósito.
el tipo de datos requeridos
necesita datos categóricos para usar una prueba de chi-cuadrado. un ejemplo de datos categóricos es el número de personas que respondieron una pregunta "sí" frente al número de personas que respondieron la pregunta "no" (dos categorías), o el número de ranas en una población que es verde, amarilla o gris ( tres categorías). no puede utilizar una prueba de chi-cuadrado en datos continuos, como los que se pueden recopilar de una encuesta para preguntar a las personas qué tan alto son. de tal encuesta, obtendría una amplia gama de alturas. sin embargo, si dividió las alturas en categorías tales como "de menos de 6 pies de altura" y "de 6 pies de altura y más", entonces podría usar una prueba de chi-cuadrado en los datos.
la prueba de bondad de ajuste
una prueba de bondad de ajuste es una prueba común, y quizás la más sencilla, realizada con la estadística de chi-cuadrado. en una prueba de bondad de ajuste, el científico hace una predicción específica sobre los números que espera ver en cada categoría de sus datos. luego recopila datos del mundo real, llamados datos observados, y utiliza la prueba de chi-cuadrado para ver si los datos observados coinciden con sus expectativas.
por ejemplo, imagine que un biólogo está estudiando los patrones de herencia en una especie de rana. entre los 100 descendientes de un grupo de padres de ranas, el modelo genético de la bióloga la lleva a esperar 25 descendientes amarillos, 50 descendientes verdes y 25 descendientes grises. lo que realmente observa es de 20 descendientes amarillos, 52 descendientes verdes y 28 descendientes grises. ¿Se apoya su predicción o su modelo genético es incorrecto? Ella puede usar una prueba de chi-cuadrado para averiguarlo.
calculando la estadística de chi-cuadrado
comience a calcular la estadística de chi-cuadrado restando cada valor esperado de su valor observado correspondiente y cuadrando cada resultado. el cálculo para el ejemplo de la descendencia de la rana se vería así:
amarillo = (20 - 25) ^ 2 = 25 verde = (52 - 50) ^ 2 = 4 gris = (28 - 25) ^ 2 = 9
ahora divide cada resultado por su valor esperado correspondiente.
amarillo = 25 ÷ 25 = 1 verde = 4 ÷ 50 = 0.08 gris = 9 ÷ 25 = 0.36
Finalmente, sume las respuestas del paso anterior.
chi-cuadrado = 1 + 0.08 + 0.36 = 1.44
interpretando el estadístico chi-cuadrado
la estadística de chi-cuadrado le indica qué tan diferentes fueron sus valores observados de sus valores predichos. cuanto mayor sea el número, mayor será la diferencia. puede determinar si su valor de chi-cuadrado es demasiado alto o lo suficientemente bajo para respaldar su predicción al ver si está por debajo de cierto valor crítico en una tabla de distribución de chi-cuadrado. esta tabla hace coincidir los valores de chi-cuadrado con las probabilidades, llamados valores de p . específicamente, la tabla le indica la probabilidad de que las diferencias entre sus valores observados y esperados se deban simplemente a la posibilidad aleatoria o si existe algún otro factor. para una prueba de bondad de ajuste, si el valor de p es 0.05 o menos, entonces debe rechazar su predicción.
debe determinar los grados de libertad (df) en sus datos antes de poder buscar el valor crítico de chi-cuadrado en una tabla de distribución. los grados de libertad se calculan restando 1 del número de categorías en sus datos. Hay tres categorías en este ejemplo, entonces hay 2 grados de libertad. Un vistazo a esta tabla de distribución de chi-cuadrado le indica que, para 2 grados de libertad, el valor crítico para una probabilidad de 0.05 es 5.99. esto significa que mientras su valor chi-cuadrado calculado sea menor que 5.99, sus valores esperados y, por lo tanto, la teoría subyacente, son válidos y están respaldados. dado que la estadística de ji cuadrado para los datos de descendientes de ranas fue de 1.44, la bióloga puede aceptar su modelo genético.