Una distribución de frecuencias es una representación de la relación entre un conjunto de medidas exhaustivas y mutuamente influyentes y la frecuencia de cada una de ellas.
Funciones:
-
Ofrecer la información necesaria para realizar representaciones gráficas
-
Facilitar los datos para obtener los estadísticos muestrales
Conceptos:
-
Frecuencia absoluta (ni): Número de veces que se repite cada uno de los valores de una variable. La suma de todas las frecuencias absolutas representa el total de la muestra (n)
-
Proporción o frecuencia relativa (pi): Cociente entre la frecuencia absoluta de cada valor de la variable (ni) y el número total de observaciones (n). pi = ni / n
-
Porcentaje (Pi): Valor de la frecuencia relativa (pi) multiplicado por cien: Pi = pi x 100
-
Frecuencia absoluta acumulada (na): Número de veces que se repita cada modalidad o cualquiera de las modalidades inferiores.
-
Proporción acumulada o frecuencia relativa acumulada (pa): Cociente entre la frecuencia absoluta acumulada de cada clase y el total de observaciones. pa = na / n
-
Porcentaje acumulado (Pa): Valor de la frecuencia relativa acumulada multiplicado por cien. Pa= pa x 100
Si la variable cuantitativa es reducida (número de hijos) no hay problema, la utilizamos tal cual. Pero si ocurre que es muy amplia (edad) debemos recurrir a la agrupación en intervalos.
La amplitud de los Intervalos representa al número de unidades que tenemos dentro de cada intervalo. (No es lo mismo tener una amplitud de intervalos de 10 en 10 (11-20) (21- 30) (31-40) que de 5 en 5 (15-19) (20-24) (25-29)).
Al establecer intervalos siempre se pierde información, por lo tanto, hay que buscar el equilibrio entre la precisión que buscamos y lo cómodo que sea trabajar con esos datos (si no estableciésemos intervalos podríamos encontrarnos con tablas de 100 filas).
Aunque tengamos un intervalo de edad (25-35) (36-45) no significa que no pueda haber personas con 35,5 años. Por lo tanto los intervalos (25-35) y (36-45) reciben el nombre de limites informados o aparentes (aparentan ser lo que no son) ya que en realidad los límites verdaderos son (25,5-35,5) y (35,5-45,5). El límite superior exacto del primer intervalo (35,5) coincide con el límite inferior exacto del siguiente (35,5).
Otros conceptos:
-
Intervalo: sinónimo del concepto de modalidad, es cada uno de los grupos de valores que ocupan una fila en una distribución de frecuencias.
-
Límites aparentes, virtuales o informados: son los valores mayor y menor de cada intervalo, teniendo en cuenta el nivel de precisión del instrumento de medida.
-
Límites reales o exactos: son los valores máximo y mínimo que tendría cada intervalo si el instrumento de medida tuviera una precisión perfecta.
-
Punto medio del intervalo: es la semisuma de los límites exactos o de los límites aparentes.
-
Amplitud del intervalo: es la diferencia entre el límite exacto superior y el límite exacto inferior.
Distribución de frecuencias con los datos agrupados en intervalos de la variable edad:
Cálculo de límites exactos: Límite exacto = Valor informado (el que nos han dado) +- 0,5 x I
siendo I la unidad de medida del instrumento de medida (en el caso de las edades I = 1).
Punto Medio se haya sumando los dos valores del intervalo y dividiendo el resultado entre 2. (Ej: Tomemos el intervalo (26-35) = 26 + 35 = 61/2 = 35,5).
Intervalo abierto: Son los intervalos finales que se utilizan para no tener frecuencia nula. (Ej de edad: 76 años o más).