Logo de Psikipedia

De la tendencia central de la distribución, nos interesa calcular un valor central que actúe como resumen numérico para representar al conjunto de datos. Estos valores son las medidas o índices de tendencia central. Los índices de tendencia central permiten representar la distribución con un único valor y facilitan la comparación de otros conjuntos de puntuaciones de una variable.

Las medidas más utilizadas en el análisis de datos son: la media aritmética, la mediana y la moda.

La media aritmética

También se llama promedio o media, es la medida de tendencia central más conocida y usada en la práctica, por su sencillez de cálculo y es el fundamento de un gran número de técnicas estadísticas. Indica la tendencia general de una distribución de frecuencias de una variable y es el valor central de las observaciones “centro de gravedad”. Sin embargo se limita para calcular variables cuantitativas. La media aritmética de una variable X, denotada por X, se define:

X =∑Xi /n

donde:
  • Xi es el valor que toma la variable u observación del sujeto i.

  • n es el número total de observaciones.

Cuando el número de observaciones es elevado, los datos se presentan en tablas de distribución de frecuencias, agrupados o no, en intervalos; en este caso se puede calcular a partir de las frecuencias absolutas (ni) o de las frecuencias relativas o proporciones (pi):

1. Media aritmética a partir de una distribución de frecuencias absolutas:

X= ∑ni Xi / n

donde:

n es el número total de observaciones.

Xi es el valor i en la variable X i o el punto medio del intervalo.

ni es la frecuencia absoluta del valor o intervalo i.

2. Media aritmética a partir de una distribución de frecuencias relativas:

X = ∑pi Xi

donde:

pi es la frecuencia relativa o proporción de observaciones del valor o del intervalo i.

La media aritmética aprovecha toda la información disponible en los datos, pues requiere de todas las puntuaciones de los sujetos. Así, la media aritmética presenta las siguientes propiedades:

En una distribución, la suma de las desviaciones de cada valor con respecto a su media es igual a cero.

i=1n(Xi – X) = 0

Si a los valores de la variable X les aplicamos la siguiente transformación lineal Y = bX + a, la media de los nuevos valores Y será Y = bX + a.

A la hora de utilizar la media aritmética conviene tener en cuenta las siguientes limitaciones:

  • Cuando los datos están agrupados en intervalos, la media no se puede calcular si el intervalo máximo no tiene límite superior y/o el mínimo no lo tiene inferior.

  • En distribuciones asimétricas no es recomendable su uso debido a que afecta a su representatividad como valor central de la distribución. Estos valores extremos pueden ser producto de errores en la recogida o grabación de datos, o valores que aportan información relevante de la variable. En el primer caso se eliminan estas observaciones, volviendo la distribución más simétrica. Y en el caso dos, se recomienda aplicar otros índices de tendencia central menos sensibles a los valores extremos como la mediana.

La mediana

Es el índice empleado cuando la distribución es asimétrica y no es posible aplicar la media aritmética. La mediana no se ve afectada por los valores extremos que en su cálculo ocupan las posiciones centrales. Por lo tanto, la mediana es un valor apropiado para representar la tendencia central de la distribución y se puede obtener todo tipo de variables excepto en variables cualitativas.

La mediana de una variable X, representada por Md, se define como el valor de la variable que divide la distribución de frecuencias en dos partes iguales, conteniendo cada una el 50% de las observaciones.

Para el cálculo de la mediana con pocos casos se procede de la siguiente manera:

  1. Se ordenan las n puntuaciones de menor a mayor.

  2. Se observa si el número de observaciones n es impar o par. Si es impar, el valor de la mediana es el de la observación que ocupa la posición central, dentro de ese conjunto de observaciones ya ordenadas. Si es par, la mediana es la media aritmética de los dos valores centrales de la distribución.

Lo normal es que el número n de observaciones no sea pequeño; incluso aparecerán repetidos y, por ello, los datos se presentarán en tablas de distribución de frecuencias agrupados o no en intervalos.

Cuando los datos están en intervalos se denomina intervalo crítico y se corresponde con el que la frecuencia absoluta acumulada na es igual o superior a n/2.

Cuando los datos no están agrupados en intervalos, el cálculo es un caso particular de la fórmula anterior en la que la amplitud de los intervalos es igual a uno (I = 1).

La mediana se puede calcular en cualquier distribución excepto cuando los datos están agrupados y existe uno abierto en el que se encuentra la mediana.

La moda

La moda es otro índice de tendencia central que se puede obtener tanto en variables cualitativas como en cuantitativas. Se representa por Mo, y se define como el valor o categoría de la variable con mayor frecuencia absoluta.

Si se da en una variable cuantitativa con los datos no agrupados en intervalos, la moda es el valor con la mayor frecuencia absoluta.

Si se da en una distribución de una variable cuantitativa en intervalos, se localiza el intervalo modal que es el intervalo con la frecuencia máxima y la moda es el medio de dicho intervalo.

Una frecuencia es unimodal cuando existe un único valor con la frecuencia máxima. Si presenta varios valores con la frecuencia más alta, ésta será bimodal, trimodal, ...

Sus principales características son:

  • es un índice de cálculo sencillo y de fácil interpretación.

  • Es el único que, además de aplicarse a variables cuantitativas, se puede calcular en variables cualitativas.

  • Sólo se excluye su cálculo en el supuesto de que coincida con el intervalo abierto.

La elección de una medida de tendencia central

Para seleccionar un valor que resuma adecuadamente la tendencia central de la distribución de frecuencias,se recomienda como primera opción la media aritmética, por que en ella basan su importancia muchos estadísticos. Únicamente se desaconseja su uso con pocos valores extremos, cuando el nivel de medida de la variable es nominal u ordinal y/o en datos agrupados en los que existen intervalos abiertos en los extremos de la distribución.

Cuando la media no es aplicable, se recomienda la mediana. Y por último, si ésta no es posible, se aconseja tomar la moda. Resaltar que si una variable cuantitativa es simétrica y unimodal, coinciden todos los valores de la media, mediana y moda.

Compartir

 

Contenido relacionado