Los intervalos de confianza se pueden utilizar para estimar varios parámetros de la población . Un tipo de parámetro que puede estimarse utilizando estadísticas inferenciales es una proporción de la población. Por ejemplo, es posible que queramos saber el porcentaje de la población estadounidense que apoya una legislación en particular. Para este tipo de pregunta, necesitamos encontrar un intervalo de confianza.
En este artículo, veremos cómo construir un intervalo de confianza para una proporción de la población, y examinaremos algunas de las teorías detrás de esto.
marco general
comenzamos mirando el panorama general antes de entrar en los detalles. El tipo de intervalo de confianza que consideraremos es de la siguiente forma:
estimar +/- margen de error
Esto significa que hay dos números que tendremos que determinar. Estos valores son una estimación del parámetro deseado, junto con el margen de error.
condiciones
Antes de realizar cualquier prueba o procedimiento estadístico, es importante asegurarse de que se cumplan todas las condiciones. para un intervalo de confianza para una proporción de la población, debemos asegurarnos de que se cumpla lo siguiente:
- tenemos una muestra aleatoria simple de tamaño n de una gran población
- nuestros individuos han sido elegidos independientemente uno del otro.
- Hay al menos 15 éxitos y 15 fracasos en nuestra muestra.
Si el último elemento no está satisfecho, entonces es posible ajustar ligeramente nuestra muestra y usar un intervalo de confianza más cuatro . En lo que sigue, asumiremos que se han cumplido todas las condiciones anteriores.
proporciones de muestra y población
comenzamos con la estimación de nuestra proporción poblacional. así como usamos una media muestral para estimar una media poblacional, usamos una proporción muestral para estimar una proporción poblacional. La proporción de la población es un parámetro desconocido. La proporción muestral es una estadística. Esta estadística se encuentra contando el número de éxitos en nuestra muestra y luego dividiendo por el número total de individuos en la muestra.
la proporción de la población se denota por p y se explica por sí misma. La notación para la proporción muestral es un poco más complicada. denotamos una proporción de muestra como p̂, y leemos este símbolo como "p-hat" porque se parece a la letra p con un sombrero en la parte superior.
Esto se convierte en la primera parte de nuestro intervalo de confianza. la estimación de p es p̂.
distribución muestral de proporción muestral
Para determinar la fórmula del margen de error, debemos pensar en la distribución muestral de p̂. necesitaremos saber la media, la desviación estándar y la distribución particular con la que estamos trabajando.
la distribución muestral de p̂ es una distribución binomial con probabilidad de éxito p y n ensayos. Este tipo de variable aleatoria tiene una media de p y una desviación estándar de ( p (1 - p ) / n ) 0.5 . Hay dos problemas con esto.
El primer problema es que una distribución binomial puede ser muy difícil de manejar. La presencia de factoriales puede conducir a algunos números muy grandes. Aquí es donde las condiciones nos ayudan. Mientras se cumplan nuestras condiciones, podemos estimar la distribución binomial con la distribución normal estándar.
El segundo problema es que la desviación estándar de p̂ usa p en su definición. El parámetro de población desconocido debe estimarse utilizando ese mismo parámetro como margen de error. Este razonamiento circular es un problema que debe corregirse.
la salida de este enigma es reemplazar la desviación estándar con su error estándar. Los errores estándar se basan en estadísticas, no en parámetros. Se utiliza un error estándar para estimar una desviación estándar. lo que hace que esta estrategia valga la pena es que ya no necesitamos saber el valor del parámetro p.
fórmula
Para utilizar el error estándar, reemplazamos el parámetro desconocido p con la estadística p̂. El resultado es la siguiente fórmula para un intervalo de confianza para una proporción de la población:
p̂ +/- z * (p̂ (1 - p̂) / n ) 0.5 .
aquí el valor de z * está determinado por nuestro nivel de confianza c. para la distribución normal estándar, exactamente c por ciento de la distribución normal estándar está entre -z * y z *. Los valores comunes para z * incluyen 1.645 para 90% de confianza y 1.96 para 95% de confianza.
ejemplo
Veamos cómo funciona este método con un ejemplo. supongamos que deseamos saber con un 95% de confianza el porcentaje del electorado en un condado que se identifica como democrático. Realizamos una muestra aleatoria simple de 100 personas en este condado y descubrimos que 64 de ellos se identifican como demócratas.
vemos que se cumplen todas las condiciones. la estimación de nuestra proporción poblacional es 64/100 = 0.64. Este es el valor de la proporción muestral p̂, y es el centro de nuestro intervalo de confianza.
El margen de error se compone de dos piezas. el primero es z *. como dijimos, para un 95% de confianza, el valor de z * = 1.96.
La otra parte del margen de error viene dada por la fórmula (p̂ (1 - p̂) / n ) 0.5 . establecemos p̂ = 0.64 y calculamos = el error estándar para ser (0.64 (0.36) / 100) 0.5 = 0.048.
Multiplicamos estos dos números y obtenemos un margen de error de 0.09408. El resultado final es:
0.64 +/- 0.09408,
o podemos reescribir esto como 54.592% a 73.408%. por lo tanto, estamos 95% seguros de que la verdadera proporción de la población de demócratas está en algún lugar dentro del rango de estos porcentajes. Esto significa que a la larga, nuestra técnica y fórmula capturarán la proporción de la población del 95% del tiempo.
ideas relacionadas
Existen varias ideas y temas relacionados con este tipo de intervalo de confianza. por ejemplo, podríamos realizar una prueba de hipótesis relacionada con el valor de la proporción de la población. También podríamos comparar dos proporciones de dos poblaciones diferentes.