Las actividades empresariales, gubernamentales y académicas casi siempre requieren la recopilación y análisis de datos. Una de las formas de representar datos numéricos es a través de gráficos, histogramas y tablas. Estas técnicas de visualización permiten a las personas obtener una mejor comprensión de los problemas y diseñar soluciones. las brechas, los grupos y los valores atípicos son características de conjuntos de datos que influyen en el análisis matemático y son fácilmente visibles en las representaciones visuales.
agujeros en los datos
las brechas se refieren a las áreas que faltan en un conjunto de datos. por ejemplo, si un experimento científico recopila datos de temperatura en el rango de 50 grados Fahrenheit a 100 grados Fahrenheit, pero nada entre 70 y 80 grados, eso representaría una brecha en el conjunto de datos. una gráfica de líneas de este conjunto de datos tendría marcas "x" para temperaturas entre 50 y 70 y nuevamente entre 80 y 100, pero no habría nada entre 70 y 80. los investigadores pueden profundizar y explorar por qué ciertos puntos de datos no aparecen en una muestra recogida.
grupos aislados
Los clusters son grupos aislados de puntos de datos. los gráficos de líneas, que son una de las formas de representar conjuntos de datos, son líneas con marcas "x" colocadas sobre números específicos para representar su frecuencia de ocurrencia en el conjunto de datos. un grupo se representa como una colección de estas marcas "x" en un pequeño intervalo o subconjunto de datos. por ejemplo, si los resultados de los exámenes para una clase de 10 estudiantes son 74, 75, 80, 72, 74, 75, 76, 86, 88 y 73, la mayoría de las marcas "x" en un trazado de líneas se encontrarán en el 72- intervalo de puntuación de -76. esto representaría un cluster de datos. note que la frecuencia para 74 y 75 es dos, pero para todas las otras puntuaciones, es una.
en los extremos
los valores atípicos son valores extremos: puntos de datos que se encuentran significativamente fuera de otros valores en un conjunto de datos. un valor atípico debe ser significativamente menor o mayor que la mayoría de los números en un conjunto de datos. La definición de "extremo" depende de las circunstancias y del consenso de los analistas involucrados en la investigación. los valores atípicos pueden ser malos puntos de datos, también conocidos como ruido, o pueden contener información valiosa sobre el fenómeno que se está investigando y la metodología de recolección de datos en sí. por ejemplo, si los puntajes de clase están en su mayoría en el rango de 70 a 80, pero un par de puntajes están en los 50 bajos, esos podrían representar valores atípicos.
poniendolo todo junto
las brechas, los valores atípicos y los grupos en los conjuntos de datos pueden afectar los resultados del análisis matemático. las brechas y los clusters pueden representar errores en la metodología de recolección de datos. por ejemplo, si una encuesta telefónica solo encuesta ciertos códigos de área, como complejos de viviendas de bajos ingresos o áreas residenciales suburbanas de alto nivel, y no una amplia muestra de la población, es probable que existan brechas y grupos en los datos . los valores atípicos pueden sesgar la media o el valor promedio de un conjunto de datos. por ejemplo, la media o el valor promedio de un conjunto de datos que consta de cuatro números (50, 55, 65 y 90) es 65. Sin el valor atípico 90, sin embargo, la media es aproximadamente 57.