el cálculo de una proporción muestral en las estadísticas de probabilidad es sencillo. Este cálculo no solo es una herramienta útil en sí mismo, sino que también es una forma útil de ilustrar cómo los tamaños de muestra en distribuciones normales afectan las desviaciones estándar de esas muestras.
diga que un jugador de béisbol está bateando .300 en una carrera que incluye muchos miles de apariciones en el plato, lo que significa que la probabilidad de que obtenga un hit de base cada vez que se enfrente a un lanzador es de 0,3. a partir de esto, es posible determinar qué tan cerca de .300 golpeará en un número menor de apariciones en el plato.
definiciones y parámetros
para estos problemas, es importante que los tamaños de muestra sean lo suficientemente grandes para producir resultados significativos. el producto del tamaño de la muestra n y la probabilidad p del evento en cuestión que ocurra deben ser mayores o iguales a 10, y de manera similar, el producto del tamaño de la muestra y uno menos la probabilidad de que ocurra el evento también deben ser mayores que o igual a 10. en lenguaje matemático, esto significa que np ≥ 10 y n (1 - p) ≥ 10.
la proporción muestral p̂ es simplemente el número de eventos observados x dividido por el tamaño muestral n, o p̂ = (x / n).
Media y desviación estándar de la variable.
la media de x es simplemente np, el número de elementos en la muestra multiplicado por la probabilidad de que ocurra el evento. la desviación estándar de x es √np (1 - p).
volviendo al ejemplo del jugador de béisbol, asuma que tiene 100 apariciones en el plato en sus primeros 25 juegos. ¿Cuáles son la media y la desviación estándar de la cantidad de golpes que se espera que reciba?
np = (100) (0.3) = 30 y √np (1 - p) = √ (100) (0.3) (0.7) = 10 √0.21 = 4.58.
esto significa que el jugador que recibe tan solo 25 hits en sus 100 apariciones en el plato o hasta 35 no sería considerado estadísticamente anómalo.
Media y desviación estándar de la proporción muestral.
la media de cualquier proporción de muestra p̂ es solo p. la desviación estándar de p̂ es √p (1 - p) / √n.
para el jugador de béisbol, con 100 intentos en el plato, la media es simplemente de 0,3 y la desviación estándar es: √ (0,3) (0,7) / √100, o (√0.21) / 10, o 0.0458.
tenga en cuenta que la desviación estándar de p̂ es mucho más pequeña que la desviación estándar de x.