Si queremos estudiar dos índices, relacionados entre sí, que permiten cuantificar la relación lineal que pueda haber entre dos variables cuantitativas, la covarianza nos permitirá estudiar esa posible relación. La covarianza hace referencia a la variación conjunta de dos variables y nos permite estudiar la posible relación entre X e Y. Se designa por Cov (X,Y), o por Sxy.
El signo positivo o negativo indica si la relación lineal entre ambas es directa o inversa.
La relación lineal directa es la que asume que a mayores valores de una variable, mayores de la otra, y los valores menores se corresponden con los menores en la otra variable.
La relación lineal inversa es la que asume que a mayores valores de una variable, menores de la otra y viceversa.
La covarianza presenta un grave problema, desconocemos el rango de la covarianza. Para evitar este problema disponemos del Coeficiente de Correlación de Pearson, rxy.
Propiedades de la correlación de Pearson:
-
Toma valores comprendidos entre –1 y 1.
-
Vale 0 cuando no existe relación lineal entre ambas variables
-
rxy = ± 1 si una variable es la transformación lineal de la otra.
Para interpretar los resultados hay que tener en cuenta en primer lugar el valor absoluto, cuanto mayor es nos indica que la relación lineal es más fuerte. En segundo lugar, el signo: si es positivo es relación directa, si es negativo, inversa.
El coeficiente de correlación lineal sólo detecta relaciones lineales entre dos variables.
Por tanto, un coeficiente de correlación lineal cercano a cero, indica que no existe relación lineal entre las variables, pero no excluye la posibilidad de que las variables tengan otras relaciones entre sí de carácter no lineal.
Cuando tenemos un valor intermedio como por ejemplo 0,55 es difícil afirmar si la correlación es alta o baja. Un número grande de sujetos en la muestra pueden tender a bajar el valor de los coeficientes que se obtienen. El coeficiente de correlación evaluado por nosotros será bajo, si los coeficientes de correlación que obtienen otros investigadores en circunstancias similares, son mucho más altos.
Cuando existe un Coeficiente de correlación elevado entre dos variables, no se puede afirmar que una de las variables es causa de la otra. Hay que ser muy cuidadoso en este aspecto.