MEDIDAS DE TENDENCIA CENTRAL
Estas medidas indican el punto medio o típico de datos que cabe esperar; en otras palabras, aportan información acerca de lo que ocurre en el centro o a la mitad del conjunto de datos. En este curso se estudiaran tres medidas de tendencia central: la media aritmética, la mediana y la moda.
Media Aritmética
Es lo que usualmente denominamos como el promedio de un conjunto de datos, es decir, es la suma de todos los valores de un grupo
dividida entre el número de ellos. En lo sucesivo nos referiremos a esta medida de tendencia central simplemente como la media.
A continuación se presenta la ecuación para el cálculo de la media para datos sin agrupar y, adicionalmente, se introduce la ecuación que permite estimar la media cuando los datos están agrupados en una distribución de frecuencias.
Observe que la ecuación de la media para datos agrupados considera que todos los valores que caen dentro de un intervalo de clase dado son iguales a la marca de clase, o punto medio del intervalo. Esto significa que la distribución de frecuencias produce una aproximación de la media, ya que no se basa en los valores individuales de cada observación.
La media es la medida más común de tendencia central. Sin embargo, aunque la media es confiable en cuanto a que toma en cuenta a todos los valores del conjunto de datos, una desventaja es su sensibilidad a los valores extremos, o valores atípicos, los cuales pueden afectarla de manera drástica. La mediana resuelve, en gran parte, esa desventaja.
Mediana
Es
el valor que divide un conjunto de datos ordenados en dos partes iguales. En
otras palabras, es el elemento más central en el conjunto de números. Es así
como la mediana también representa una medida de posición, ya que señala un
lugar en la información.
Puesto que la mediana no es sensible a los valores extremos, con frecuencia se usa para conjuntos de datos que tienen un numero relativamente pequeño de datos distantes.
Moda
Es el valor
que más se repite
dentro de un conjunto de datos. A diferencia de la media y la mediana pueden
existir varias modas en una distribución o, cuando ningún valor se repite,
puede no haber moda.
Cuando los datos se encuentran agrupados en una
distribución de frecuencias, la clase con el mayor número de datos observados
se llamará clase modal y la moda se podrá
estimar a partir de la siguiente ecuación:
La moda tampoco se ve afectada por unas pocas observaciones atípicas. Sin embargo, si no hay moda, o si el conjunto de datos es bimodal su uso puede ser confuso.
Otra ventaja de la moda es que, entre las distintas medidas de tendencia central consideradas, es la única que puede utilizarse con datos de nivel nominal de medición (una
medición es nominal cuando los datos
se distribuyen en categorías que difieren entre sí cualitativamente). No es posible calcular la media o la mediana para datos como éstos, a nivel nominal.
En el Ejemplo 03 podrá ver una explicación detallada del procedimiento de cálculo de las medidas de tendencia central. Específicamente se presentan dos casos de estudio, en el Caso A se calculan los estadísticos para datos sin agrupar y en el Caso B se explica el procedimiento de calculo considerando que los datos están agrupados en una distribución de frecuencias y se desconocen los valores individuales de cada observación.
Ejemplo 03
Cuando se trabaja con problemas de estadística, es necesario decidir si se utilizará la media, la mediana o la moda como medida de tendencia central. En una distribución que está muy sesgada, por ejemplo, la mediana se considera la mejor medida de tendencia central, debido a que siempre esta entre la moda y la media (para más detalles consulte la sección medidas de asimetría).
En cualquier otro caso, ninguna medida de tendencia central es necesariamente mejor que las otras. Todas las medidas consideradas ofrecen ventajas y desventajas, su selección deberá considerarse de manera independiente y dependerá de la naturaleza o de la forma como se utilicen los datos.