En relación con los tests, el término "validez" hace referencia al grado en que el test mide aquello que pretende medir.
De lo anterior se deduce que hace referencia al grado de relación entre el test y el constructo que se quiere medir, cuanto más estrecha sea la relación más válido será el test.
Hasta los años 50 del pasado siglo, los tests se valoraban por su utilidad práctica en la selección de personal. Los tests tuvieron gran éxito en la selección y clasificación de los reclutas en el ejército de EEUU durante la primera Guerra Mundial. La validez se entendía como la capacidad del test para predecir un criterio externo. La forma de operativizar la relación entre el test y el criterio era mediante un coeficiente de correlación. Así, un test era válido en la medida en que existiera correlación entre las puntuaciones obtenidas por los sujetos en el test y las obtenidas en el criterio externo seleccionado. A la validez así entendida se le denominó validez predictiva de los tests.
La publicación de los Estándares para Tests Educativos y Psicológicos (APA, 1966) estableció los objetivos de la validez:
-
Determinar el rendimiento o actuación de un sujeto en un universo de situaciones (contenido).
-
Inferir el grado en el que un sujeto posee algún rasgo o atributo (constructo) que se supone vendrá reflejado por su ejecución en el test.
-
Predecir el rendimiento o comportamiento futuro (predictiva) o estimar su rendimiento actual sobre una variable externa al test (concurrente).
La edición de 1974 supuso un avance en la definición del concepto de validez ya que, por primera vez, se afirma que la validez se refiere a la adecuación de las inferencias que se realizan a partir de las puntuaciones de los tests u otras formas de medida; se mantiene la distinción entre los tres tipos de validez (validez de contenido, validez relativa al criterio y validez de constructo) y se consideran formas independientes de interpretar las inferencias realizadas. La validez no es una propiedad implícita a los tests ya que lo que se pretende validar no es el test en sí mismo sino las inferencias que se hagan a partir de las puntuaciones obtenidas por los sujetos.
En la edición de 1999 se defiende una concepción unitaria de validez como el grado en que la evidencia empírica obtenida y los conocimientos aportados por las teorías apoyan las inferencias que se hagan a partir de las puntuaciones obtenidas en el test cuando éste se utiliza para un objetivo concreto.
Parece haber acuerdo en el ámbito científico en que la única validez que se debe considerar es la validez de constructo y que las otras dos quedarían incluidas en ésta y serían consideradas estrategias de validación para comprender mejor lo que mide un test.
Así, ya no se habla de distintos tipos de validez, la validación de los tests es un proceso continuo que permite obtener distintos tipos de evidencia empírica, y un proceso de validación ideal debe incluir los tipos de evidencia implicados en los tres tipos tradicionales de validez: la de contenido, la de constructo, y la relativa al criterio. Aunque siempre que se aplique un test psicológico es necesario llevar a cabo un estudio de validación de constructo, este tipo de validación no es siempre suficiente. Según sea la interpretación que se vaya a hacer de las puntuaciones obtenidas y el objetivo que se pretenda alcanzar al aplicar el test, será necesario obtener otros tipos de evidencia; así, por ejemplo, cuando se utilizan los tests en selección de personal, si el que una persona sea seleccionada depende de la predicción que se haga acerca de su rendimiento futuro en el trabajo, será necesario llevar a cabo un estudio de validación predictiva, y en los tests de conocimientos la estrategia fundamental sería la validación de contenido (Hambleton y Rogers, 1991).