Cálculo más preciso del valor de una proporción de población desconocida
En las estadísticas inferenciales , los intervalos de confianza para las proporciones de la población dependen de la distribución normal estándar para determinar parámetros desconocidos de una población dada, dada una muestra estadística de la población. Una razón para esto es que para tamaños de muestra adecuados, la distribución normal estándar hace un excelente trabajo al estimar una distribución binomial . Esto es notable porque aunque la primera distribución es continua, la segunda es discreta.
Hay una serie de problemas que deben abordarse al construir intervalos de confianza para las proporciones. uno de estos se refiere a lo que se conoce como un intervalo de confianza "más cuatro", lo que da como resultado un estimador sesgado . sin embargo, este estimador de una proporción de población desconocida se desempeña mejor en algunas situaciones que los estimadores imparciales, especialmente aquellas situaciones donde no hay éxitos o fracasos en los datos.
En la mayoría de los casos, el mejor intento para estimar una proporción de la población es utilizar una proporción de muestra correspondiente. suponemos que hay una población con una proporción desconocida p de sus individuos que contiene un determinado rasgo, entonces formamos una muestra aleatoria simple de tamaño n de esta población. de estos n individuos, contamos el número de ellos y que poseen el rasgo que nos interesa. ahora estimamos p usando nuestra muestra. la proporción muestral y / n es un estimador imparcial de p.
cuándo usar el intervalo de confianza más cuatro
cuando usamos un intervalo más cuatro, modificamos el estimador de p . hacemos esto agregando cuatro al número total de observaciones, explicando así la frase "más cuatro". Luego dividimos estas cuatro observaciones entre dos éxitos hipotéticos y dos fracasos, lo que significa que sumamos dos al número total de éxitos. El resultado final es que reemplazamos cada instancia de y / n con ( y + 2) / ( n + 4), y a veces esta fracción se denota por p con una tilde por encima.
la proporción muestral típicamente funciona muy bien para estimar una proporción poblacional. Sin embargo, hay algunas situaciones en las que necesitamos modificar ligeramente nuestro estimador. La práctica estadística y la teoría matemática muestran que la modificación del intervalo más cuatro es apropiada para lograr este objetivo.
Una situación que debería hacernos considerar un intervalo más cuatro es una muestra asimétrica. muchas veces, debido a que la proporción de la población es tan pequeña o tan grande, la proporción de la muestra también es muy cercana a 0 o muy cercana a 1. En este tipo de situación, deberíamos considerar un intervalo más cuatro.
Otra razón para usar un intervalo más cuatro es si tenemos un tamaño de muestra pequeño. un intervalo más cuatro en esta situación proporciona una mejor estimación para una proporción de la población que el uso del intervalo de confianza típico para una proporción.
reglas para usar el intervalo de confianza más cuatro
el intervalo de confianza más cuatro es una forma casi mágica de calcular estadísticas inferenciales con mayor precisión, ya que simplemente agregando cuatro observaciones imaginarias a cualquier conjunto de datos dado, dos éxitos y dos fallas, es capaz de predecir con mayor precisión la proporción de un conjunto de datos que Se ajusta a los parámetros.
sin embargo, el intervalo de confianza más cuatro no siempre es aplicable a todos los problemas. solo se puede usar cuando el intervalo de confianza de un conjunto de datos es superior al 90% y el tamaño de la muestra de la población es de al menos 10. sin embargo, el conjunto de datos puede contener cualquier número de éxitos y fracasos, aunque funciona mejor cuando existe no hay éxitos o fracasos en los datos de una población determinada.
tenga en cuenta que, a diferencia de los cálculos de las estadísticas regulares, los cálculos de las estadísticas inferenciales se basan en una muestra de datos para determinar los resultados más probables dentro de una población. aunque el intervalo de confianza más cuatro corrige un margen de error mayor , este margen aún debe tenerse en cuenta para proporcionar la observación estadística más precisa.