DISTRIBUCIÓN DE FRECUENCIAS Y SUS GRÁFICAS
Una vez que se ha realizado el proceso de recolección de
datos, especialmente cuando se trabaja con conjuntos grandes, es
extremadamente difícil determinar el verdadero significado de la información que se ha registrado en papel. Para determinar su significancia,
los datos se organizan de manera que, con un simple vistazo, se pueda tener una
comprensión total de la información que contienen.
Entre
las herramientas estadísticas que resultan de particular utilidad para
organizar y resumir los datos se incluyen las distribuciones de frecuencias,
que colocan los datos en clases específicas, y sus gráficas, que proporcionan
una representación visual de los datos.
Distribución de Frecuencias
Una
distribución de frecuencias (o tabla
de frecuencias) organiza los datos en clases (o categorías) y registra el número de
observaciones en cada clase; es decir, es una tabla que muestra el número de
observaciones del conjunto de datos que caen dentro de cada una de las clases.
A los datos organizados y reunidos en clases se les llama datos agrupados. Aunque el proceso de agrupamiento generalmente quita detalles originales de los datos, es muy ventajosa pues proporciona una visión amplia y clara, además de que se obtienen relaciones evidentes.
Muchas herramientas tecnológicas permiten obtener de manera automática las distribuciones de frecuencias, sin necesidad de construirlas manualmente. No obstante, en el siguiente enlace se expone el procedimiento básico para la construcción de una distribución de frecuencias, junto con algunas definiciones de interés.
En el Ejemplo 01, a partir de un conjunto de datos recolectados al azar, se construye una tabla de distribución de frecuencias completa; es decir, además de las clases, las marcas de clase y las frecuencias absolutas, se incluyen las frecuencias relativas y las frecuencias acumuladas definidas en el enlace anterior.
Gráficas de las Distribuciones de Frecuencias
Los
gráficos también son métodos útiles para describir conjuntos de datos. Estos
permiten poner en relieve las tendencias de los datos, estimar valores y
verificar la veracidad de nuestras conclusiones. A continuación se definen las gráficas más comúnmente empleadas para el análisis de las distribuciones de
frecuencias.
En el Ejemplo 02, se presenta el histograma de frecuencias absolutas, el polígono de frecuencias y la ojiva correspondientes a la distribución de frecuencias construida en el Ejemplo 01; adicionalmente, se incluyen algunos comentarios y aspectos relevantes sobre su elaboración.
Ejemplo 02
Una representación de distribuciones de frecuencia relativas se puede obtener, a partir del histograma o del polígono de frecuencias, con solo cambiar la escala vertical de frecuencias absolutas a frecuencias relativas y manteniendo exactamente el mismo diagrama. Las gráficas resultantes se denominan histogramas de frecuencias relativas y polígonos de frecuencias relativas.
En el caso de las distribuciones de frecuencia acumuladas, una representación gráfica adicional a la ojiva es el histograma de frecuencias acumuladas, que se obtiene al cambiar las frecuencias absolutas del histograma por las frecuencias acumuladas.
Interpretación de los gráficos: recuerde que el objetivo no es la simple construcción de las gráficas, sino aprender algo acerca de los datos, como: los valores centrales, la variación, la forma de la distribución y la existencia o ausencia de datos distantes (valores que se encuentran lejos de los demás). Por ejemplo, al examinar el histograma del Ejemplo 02 se observa que la mayor parte de la muestra tuvo entre 72 y 84 pulsaciones por minuto, que lo menos frecuente fue encontrar individuos con pulsaciones por debajo de 68 o por encima de 90 y que la distribución está más cargada en el centro.