Validez de una prueba: 6 tipos

Los siguientes seis tipos de validez se utilizan popularmente, a saber: Validez aparente, Validez de contenido, Validez predictiva, Concurrente, Constructo y Validez factorial. De estos, el contenido, la predicción, la validez concurrente y la validez de constructo son los importantes que se utilizan en el campo de la psicología y la educación.

Estos se discuten a continuación:

Tipo # 1. Validez de la cara:

Validez de la cara en la medida en que la prueba parece medir lo que se va a medir.

La validez facial se refiere a si una prueba parece ser válida o no, es decir, desde la apariencia externa, si los elementos parecen medir el aspecto requerido o no. Si una prueba mide lo que el autor de la prueba desea medir, decimos que la prueba tiene validez nominal. Por lo tanto, la validez aparente no se refiere a lo que mide la prueba, sino a lo que "parece medir" la prueba. El contenido de la prueba, obviamente, no debe parecer inapropiado, irrelevante.

Por ejemplo, una prueba para medir "Habilidad adicional" debe contener solo elementos adicionales. Cuando uno revisa los elementos y siente que todos los elementos parecen medir la habilidad además, se puede decir que la prueba se valida por la cara.

Aunque no es un método eficiente para evaluar la validez de una prueba y como tal, por lo general no se usa todavía, se puede usar como un primer paso para validar la prueba. Una vez que la prueba se valida en la cara, podemos proceder a calcular el coeficiente de validez.

Además, este método ayuda a un fabricante de pruebas a revisar los elementos de prueba para adaptarlos al propósito. Cuando una prueba debe construirse rápidamente o cuando hay una necesidad urgente de una prueba y no hay tiempo o alcance para determinar la validez por otros métodos eficientes, se puede determinar la validez aparente.

Este tipo de validez no es adecuado, ya que opera a nivel facial y, por lo tanto, puede usarse como último recurso.

Tipo # 2. Validez del contenido:

Validez del contenido: un proceso de hacer coincidir los elementos de la prueba con los objetivos de instrucción.

La validez del contenido es el criterio más importante para la utilidad de una prueba, especialmente de una prueba de rendimiento. También se conoce como Validez Racional o Validez Lógica o Validez Curricular o Validez Interna o Validez Intrínseca.

La validez de contenido se refiere al grado o extensión en que una prueba consiste en elementos que representan los comportamientos que el fabricante de la prueba desea medir. La medida en que los elementos de una prueba son verdaderos representativos de todo el contenido y los objetivos de la enseñanza se denomina validez de contenido de la prueba.

La validez del contenido se estima al evaluar la relevancia de los elementos de prueba; es decir, los elementos de la prueba deben cubrir debidamente todo el contenido y las áreas de comportamiento del rasgo que se va a medir. Da idea del tema o cambio de comportamiento.

De esta manera, la validez de contenido se refiere a la medida en que una prueba contiene elementos que representan el comportamiento que vamos a medir. Los elementos de la prueba deben incluir todas las características relevantes del área de contenido y los objetivos en la proporción correcta.

Antes de construir la prueba, el fabricante de la prueba prepara una tabla de contenido y objetivos de dos vías, conocida popularmente como "Tabla de especificaciones".

Supongamos que se prepara una prueba de rendimiento en Matemáticas. Debe contener elementos de Álgebra, Aritmética, Geometría, Medición y Trigonometría y, además, los elementos deben medir los diferentes objetivos de comportamiento, como conocimiento, comprensión, habilidad, aplicación, etc. Por lo tanto, es imperativo que se asignen las debidas ponderaciones a los diferentes contenidos y objetivos.

En la siguiente tabla se muestra un ejemplo de "tabla de especificaciones" en Matemáticas:

La tabla refleja la muestra de tareas de aprendizaje a medir. Cuanto más cerca estén los elementos de prueba de la muestra especificada, mayor será la posibilidad de tener una validez de contenido satisfactoria. Por lo tanto, es deseable que los elementos de una prueba sean examinados por un equipo de expertos. Deben verificar si la ubicación de los diversos elementos en las celdas de la Tabla es apropiada y si todas las celdas de la Tabla tienen un número adecuado de elementos.

La adecuación se debe juzgar en términos de la ponderación asignada a las diferentes tablas de contenido por objetivo de acuerdo con el equipo de expertos que han diseñado el plan de estudios.

A continuación se presentan algunos puntos generales para garantizar la validez del contenido:

1. La prueba debe servir al nivel requerido de estudiantes, ni por encima ni por debajo de su nivel.

2. El lenguaje debe estar al nivel de los estudiantes.

3. Cualquier cosa que no esté en el currículo no debe incluirse en los ítems de la prueba.

4. Cada parte del currículo debe tener el peso necesario. Se deben seleccionar más elementos de partes más importantes del plan de estudios.

Limitaciones:

1. La ponderación que se debe dar a las diferentes partes del contenido es subjetiva.

2. Es difícil construir la prueba objetiva perfecta.

3. La validez del contenido no es suficiente o adecuada para las pruebas de Inteligencia, Logro, Actitud y, en cierta medida, las pruebas de Personalidad.

4. La ponderación dada en el cambio de comportamiento diferente no es objetiva.

Tipo # 3. Validez predictiva:

Validez predictiva la medida en que la prueba predice el rendimiento futuro de los estudiantes.

La validez predictiva se refiere a la capacidad predictiva de una prueba. Indica la efectividad de una prueba para pronosticar o predecir resultados futuros en un área específica. El usuario de prueba desea pronosticar el rendimiento futuro de un individuo. Los puntajes de las pruebas se pueden usar para predecir el comportamiento o el desempeño futuro y, por lo tanto, se pueden llamar como validez predictiva.

Con el fin de encontrar la validez predictiva, el evaluador correlaciona los puntajes de la prueba con el desempeño posterior del alumno, técnicamente conocido como "Criterio". El criterio es una medida independiente, externa y directa de lo que la prueba está diseñada para predecir o medir. Por lo tanto, también se conoce como "Criterio relacionado con la validez".

La validez predictiva o empírica ha sido definida por Cureton (1965) como una estimación del coeficiente de correlación entre los puntajes de las pruebas y el verdadero criterio.

Un ejemplo puede aclarar mejor el concepto.

Ejemplo:

La prueba de ingreso médico se construye y se administra para seleccionar al candidato para ingresar a los cursos de MBBS. Basándonos en los puntajes obtenidos por los candidatos en esta prueba, admitimos a los candidatos.

Una vez finalizado el curso, aparecen en el examen final de MBBS. El puntaje del examen final de MBBS es el criterio. Las puntuaciones de examen de ingreso y examen final (criterio) están correlacionadas. Alta correlación implica alta validez predictiva.

Aquí se pueden citar ejemplos similares, como otras pruebas de reclutamiento o pruebas de ingreso en agricultura, ingeniería, banca, ferrocarriles, etc., que deben tener una alta validez predictiva.

Es decir, las pruebas utilizadas para el reclutamiento, la clasificación y el examen de ingreso deben tener una alta validez predictiva. Este tipo de validez a veces se denomina "validez empírica" ​​o "validez estadística", ya que nuestra evaluación es principalmente empírica y estadística.

Limitación:

Si obtenemos una medida de criterio adecuada con la cual nuestros resultados de prueba deben estar correlacionados, podemos determinar la validez predictiva de una prueba. Pero es muy difícil conseguir un buen criterio. Además, es posible que no obtengamos medidas de criterio para todos los tipos de pruebas psicológicas.

Tipo # 4. Validez concurrente:

Validez concurrente que correlaciona las puntuaciones de los exámenes con otro conjunto de puntuaciones de criterios.

La validez concurrente se refiere a la medida en que los puntajes de las pruebas corresponden a un rendimiento ya establecido o aceptado, conocido como criterio. Para conocer la validez de una prueba recién construida, se correlaciona o se compara con alguna información disponible.

Por lo tanto, una prueba se valida contra alguna información disponible al mismo tiempo. Las puntuaciones obtenidas de una prueba recién construida se correlacionan con el rendimiento de la prueba preestablecida. Supongamos que hemos preparado una prueba de inteligencia.

Lo administramos a grupo de alumnos. La prueba de Stanford-Binet también se administra al mismo grupo. Ahora se correlacionan los puntajes de las pruebas hechas en nuestra prueba de nueva construcción y los puntajes de las pruebas hechas por los alumnos en la Prueba de Inteligencia Stanford-Binet. Si el coeficiente de correlación es alto, se dice que nuestra prueba de inteligencia tiene una alta validez concurrente.

El significado del diccionario del término 'concurrente' es 'existente' o 'hecho al mismo tiempo'. Por lo tanto, el término "validez concurrente" se usa para indicar el proceso de validación de una nueva prueba al correlacionar sus puntuaciones con alguna fuente de información existente o disponible (criterio) que podría haberse obtenido poco antes o poco después de que se proporcione la nueva prueba.

Para determinar la validez concurrente de una prueba de rendimiento construida recientemente, sus puntajes se correlacionan con los puntajes obtenidos por esos mismos estudiantes en su reciente examen de primer terminal o terminal. Por lo tanto, una prueba se valida contra alguna información disponible al mismo tiempo. Para obtener una medida de criterio, no estamos obligados a esperar mucho tiempo.

La validez predictiva difiere de la validez concurrente en el sentido de que en la validez anterior esperamos el futuro para obtener la medida de criterio. Pero en la facilidad de la validez concurrente, no tenemos que esperar mayores brechas.

El término 'concurrente' aquí implica las siguientes características:

1. Se supone que las dos pruebas, la cuya validez se está examinando y la que tiene validez probada, cubren la misma área de contenido en un nivel dado y el mismo objetivo;

2. La población para ambas pruebas sigue siendo la misma y las dos pruebas se administran en entornos casi similares; y

3. Los datos de rendimiento en ambas pruebas se pueden obtener casi simultáneamente.

Este tipo de validez también se conoce como "Validez externa" o "Validez funcional". La validez concurrente es relevante para las pruebas empleadas para el diagnóstico y no para la predicción del éxito futuro.

Tipo # 5. Validez de construcción:

Validez de construcción la extensión es la medida en que se puede decir que la prueba mide una construcción teórica o variable psicológica.

Un constructo es principalmente psicológico. Normalmente se refiere a un rasgo o proceso mental. La validación de constructo es el proceso de determinar en qué medida una prueba en particular mide las construcciones psicológicas que el fabricante de la prueba pretende medir.

Indica la medida en que una prueba mide los atributos abstractos o cualidades que no están definidas operativamente.

Gronlund y Linn afirman que "la validación de constructo puede definirse como el proceso de determinar el grado en que el rendimiento de la prueba puede interpretarse en términos de uno o más constructos psicológicos".

Ebel y Frisbie describen: "La validación de constructo es el proceso de recopilación de evidencia para respaldar la afirmación de que una prueba dada de hecho mide la construcción psicológica que los fabricantes de pruebas intentaron medir".

La validez de construcción también se conoce como "Validez psicológica" o "Validez del rasgo" o "Validez lógica". La validez de construcción significa que los puntajes de las pruebas se examinan en términos de una construcción. Se estudia el constructo o atributos psicológicos que una prueba mide.

La medida en que la prueba mide los rasgos de personalidad o los procesos mentales definidos por el creador de la prueba se conoce como la validez de construcción de la prueba.

Mientras construimos pruebas de inteligencia, actitud, aptitud matemática, pensamiento crítico, habilidades de estudio, ansiedad, razonamiento lógico, comprensión de lectura, etc., tenemos que apostar por la validez de constructo. Tomemos, por ejemplo, 'una prueba de sinceridad'.

Antes de construir este tipo de pruebas, el creador de pruebas se enfrenta a las preguntas:

1. ¿Cuál debería ser la definición del término sinceridad?

2. ¿Qué tipo de comportamiento se espera de una persona que es sincera?

3. ¿Qué tipo de comportamiento distingue entre sinceridad e insinceridad?

Cada construcción tiene una teoría subyacente que se puede aplicar para describir y predecir el comportamiento de un alumno.

Gronlund (1981) sugiere los siguientes tres pasos para determinar la validez del constructo:

(i) Identifique las construcciones que se presume tienen en cuenta el rendimiento de la prueba.

(ii) Derive las hipótesis con respecto al rendimiento de la prueba a partir de la teoría subyacente de cada construcción.

(iii) Verificar las hipótesis por medios lógicos y empíricos.

Cabe señalar que la validez de constructo es inferencial. Se utiliza principalmente cuando otros tipos de validez son insuficientes para indicar la validez de la prueba. La validez de construcción generalmente está involucrada en los hábitos de estudio, apreciación, honestidad, estabilidad emocional, simpatía, etc.

Tipo # 6. Validez factorial:

Validez factorial la extensión de la correlación de los diferentes factores con toda la prueba.

La validez factorial está determinada por una técnica estadística conocida como análisis factorial. Utiliza métodos de explicación de inter-correlaciones para identificar factores (que pueden verbalizarse como habilidades) que constituyen la prueba.

En otras palabras, los métodos de correlación y otros métodos estadísticos se utilizan para estimar la validez factorial. La correlación de la prueba con cada factor se calcula para determinar el peso contribuido por cada uno de estos factores al rendimiento total de la prueba.

Esto nos dice acerca de las cargas factoriales. Esta relación de los diferentes factores con toda la prueba se denomina validez factorial. Guilford (1950) sugirió que la validez factorial es la descripción más clara de lo que mide una prueba y, por todos los medios, debe darse preferencia sobre otros tipos de validez.