MEDIDAS DE ASIMETRÍA
Las curvas que representan las observaciones de datos en el conjunto pueden ser simétricas o asimétricas. Una distribución de datos es simétrica si la mitad izquierda de la curva es una imagen en espejo de su mitad derecha. Las distribuciones simétricas que solo contienen una moda siempre tienen el mismo valor para la media, la mediana y la moda, como se observa a continuación:
La asimetría es el sesgo o la distorsión de la simetría de una distribución. Si la curva que representa la distribución de los datos tiene una cola más larga hacia la derecha del máximo central, que hacia la izquierda, se dice que está sesgada hacia la derecha o que es positivamente asimétrica. Si sucede lo contrario, se considera que está sesgada hacia la izquierda o que es negativamente asimétrica. En las distribuciones asimétricas los valores de la media, la mediana y la moda son diferentes, como se observa a continuación:
Un ejemplo de una curva sesgada a la derecha puede ser la distribución de frecuencias de las edades de los asistentes a un concierto de KPOP, pues muchos valores estarían situados en el extremo inferior y pocos en el extremo superior, ya que la mayoría de los asistentes serian personas jóvenes. De manera análoga, una curva sesgada a la izquierda podría representar la frecuencia del número de días que un corredor de bienes raíces necesita para vender una casa, pues como las casas no se venden inmediatamente muchos valores estarían situados en el extremo superior y pocos en el extremo inferior.
A continuación, se introducen las dos medidas de asimetría más comúnmente empleadas para el análisis de datos, estas son los coeficientes de asimetría de Pearson y de Bowley.
Coeficiente de Asimetría de Pearson
Este estadístico utiliza las medidas de tendencia central (media y mediana) para determinar la asimetría de la distribución y viene dado por:
Coeficiente de Asimetría de Bowley
Esta medida usa los cuartiles para determinar si la distribución es simétrica o no y viene dada por:
En el Ejemplo 06 se puede visualizar el procedimiento el cálculo de las medidas de asimetría, empleando la información del Caso A (datos sin agrupar) y el Caso B (datos agrupados en una distribución de frecuencias) que se desarrollaron en los ejemplos 03, 04 y 05 (para más detalles consulte las secciones medidas de tendencia central, medidas de posición y medidas de dispersión).
Ejemplo 06
Construir un histograma de frecuencias para los Casos A y B podría proporcionar una idea directa e intuitiva acerca de la forma de la distribución de dichas variables. No obstante, a pesar de que el histograma representa una excelente opción para la visualización de la simetría, el cálculo de los coeficientes proporciona información más precisa y relevante a la hora de describir la forma de una variable.
El análisis de la asimetría de las distribuciones resulta útil en muchos campos. Muchos modelos simplistas asumen una distribución normal (distribución simétrica) para la realización de análisis estadísticos, pero en realidad los valores nunca son perfectamente simétricos y el estudio de la asimetría proporciona una idea general sobre el sesgo de la distribución.