Pruebas psicológicas en industrias: características, tipos y normas.

El simple hecho de reunir un lote de preguntas no produce una prueba psicológica. Una prueba puede definirse mejor como la medición de una muestra estandarizada del comportamiento humano. Como tal, debe cumplir ciertos requisitos básicos. Primero, la muestra de comportamiento debe ser lo suficientemente grande y lo suficientemente representativa de la clase de comportamiento que estamos midiendo para permitirnos generalizar y predecir a partir de los resultados de las pruebas.

En segundo lugar, al exigir que la prueba esté estandarizada, queremos decir que la serie de preguntas o tareas debe administrarse de manera uniforme cada vez que se administra la prueba a los sujetos. Finalmente, todas las pruebas psicológicas deben tener los requisitos previos de validez, fiabilidad y normas.

Reunir una serie de preguntas independientemente de si se trata de temas psicológicos no los eleva al nivel de las pruebas psicológicas. Por ejemplo, muchas columnas de periódicos y libros populares de la variedad de juegos de salón 88 presentan una serie de preguntas; la persona califica las respuestas y se califica de "excelente", "buena", "mala" o "horrible". Estas no son pruebas psicológicas; son simplemente un montón de preguntas.

Por supuesto, una persona a menudo tiene una curiosidad abrumadora por descubrir algo en secreto, por lo que el plan de autoevaluación es muy popular. El tema de estas pruebas generalmente tiene un gran atractivo. Por ejemplo, una columna puede pedirle que determine si usted es un esposo sobresaliente al responder algunas preguntas. Una persona puede tener una sabiduría inescrutable, pero la única forma en que puede desarrollar una prueba para medir tales cualidades es tener una serie de preguntas que hayan sido contestadas de una manera por esposos exitosos (quienes sean) y de una manera significativamente diferente por fallidos. maridos

Normas de prueba:

El tema de las normas de prueba es de una importancia considerable y necesita una aclaración adicional. Las normas deben desarrollarse como una fuente de referencia en todas las pruebas utilizadas en la selección. Una norma es un estándar de referencia; permite comprender el significado de un puntaje de prueba. Dependiendo de la prueba, se puede informar una puntuación bruta de varias maneras: el tiempo total para completar la prueba, la cantidad de elementos correctos o la cantidad de elementos intentados son algunas de las puntuaciones brutas obtenidas en las pruebas.

En realidad, el puntaje bruto en sí mismo en una prueba psicológica suele ser una figura sin sentido. Por ejemplo, en una prueba una puntuación de 240 segundos puede ser baja, mientras que en otra prueba una puntuación de 75 segundos puede ser excepcional. El problema se complica aún más cuando se debe comparar una puntuación de 180 segundos con una puntuación de 95 ítems correcta. Sin el uso de una norma, tales comparaciones serían imposibles; en el mejor de los casos, se parecerían a un intento de comparar manzanas y melocotones.

Los dos sistemas de normas más utilizados son los percentiles y las puntuaciones estándar. Ambas medidas proporcionan información indirecta sobre el rendimiento de la prueba de los individuos en relación con una población conocida. También muestran la posición relativa de una persona en el grupo al grupo en su conjunto.

En una prueba para medir la capacidad estenográfica, el puntaje bruto de un individuo puede ser de 105 palabras por minuto con un error en la transcripción. A menos que tuviéramos información sobre el rango de velocidad basado en muchas personas, no podríamos saber si esta velocidad era buena o mala. Sin embargo, si esta prueba se ha administrado a 155 taquígrafos con un empleo remunerado y el puntaje de esta persona la ubicó en el percentil 90, estaríamos en condiciones de estimar su habilidad para tomar taquigrafía como "excepcional" porque supera 9 de cada 10 niñas en velocidad taquigráfica.

Si este mismo individuo escribe a una velocidad de 45 palabras por minuto, y si esta puntuación "es equivalente al percentil 20, podríamos concluir que 8 de cada 10 taquígrafos empleados son tipógrafos más rápidos. En realidad, entonces, la velocidad abreviada y la velocidad de escritura se pueden comparar. Sobre la base de las normas disponibles, podemos hacer una comparación directa del desempeño de esta niña en estas dos pruebas, y nuestra conclusión de que ella es muy buena para tomar dictados, pero pobre en la escritura está justificada. Si es contratada depende de las necesidades del trabajo; es muy probable que tenga que mejorar su velocidad de escritura antes de que sea posible la colocación laboral.

Para algunos trabajos de oficina, la velocidad es de gran importancia, pero en otros la precisión es más importante. Por ejemplo, se puede buscar velocidad en lugar de precisión para direccionar circulares. Por otro lado, sería necesaria una precisión extrema para presentar documentos importantes. A veces son necesarias normas separadas sobre velocidad y precisión, así como normas basadas en una combinación de las dos medidas.

En el establecimiento de normas, la información específica debe estar disponible no solo sobre el tamaño del grupo medido, sino también sobre hechos como el nivel de edad, si el grupo tiene un empleo remunerado, si se trata de una población universitaria y si se trata de un Muestreo normal no seleccionado.

Por ejemplo, se puede considerar que una persona que realiza pruebas en el percentil 70 de una población normal en una prueba de inteligencia tiene una inteligencia por encima del promedio. Sin embargo, su probable éxito en un grado en una universidad o escuela de posgrado sería cuestionable. En otras palabras, una norma es significativa solo cuando se conocen las características de la población sobre la cual se basa.

Tipos de Pruebas:

Las pruebas psicológicas se pueden clasificar en varios grupos dependiendo del propósito particular del sistema de clasificación. Antes de seguir adelante, podría ser valioso considerar algunos de estos sistemas de clasificación.

Tipo de comportamiento medido:

Probablemente el sistema de clasificación más utilizado se basa en el tipo de comportamiento que las pruebas pretenden medir. Por lo tanto, encontramos pruebas designadas como pruebas de inteligencia, pruebas de personalidad, pruebas de interés, pruebas de visión, pruebas de música, pruebas de arte, pruebas mecánicas, pruebas verbales, etc., donde cada grupo es bastante específico del comportamiento.

Pruebas de Logro y Aptitud:

Muy frecuentemente los autores distinguirán entre pruebas de aptitud y pruebas de logro. El primero es supuestamente una medida del potencial de una persona en un área determinada, mientras que el segundo es una medida de la habilidad o habilidad actual de una persona en el momento de la prueba. Dado que la misma prueba a menudo se puede considerar tanto una prueba de rendimiento como una prueba de aptitud dependiendo del uso, este sistema de clasificación suele ser difuso.

Así, con muchas pruebas uno puede:

(1) Medir la cantidad de habilidad presente, y

(2) Utilice la puntuación actual para predecir el rendimiento futuro.

Pruebas de papel y lápiz y pruebas de rendimiento:

Muchas pruebas son de la variedad de papel y lápiz:

El examinado simplemente recibe un papel de prueba o un folleto impreso que contiene las preguntas de la prueba, y registra sus respuestas de alguna manera escrita en la hoja de respuestas que se proporciona generalmente. Sin embargo, muchas otras pruebas no requieren una respuesta por escrito, sino que implican algún tipo de actividad de manipulación, como el manejo de clavijas o bloques, o el montaje de objetos mecánicos. Estas últimas pruebas se conocen como pruebas de rendimiento.

Pruebas de velocidad y potencia:

Algunas pruebas se construyen para que cada elemento sea muy fácil: la tarea es completar tantos elementos como sea posible en poco tiempo. Cuando el rendimiento de la prueba se basa principalmente en la velocidad con la que se trabaja, la prueba se denomina prueba de velocidad. El otro extremo sería una prueba en la que los elementos eran difíciles y se daba a la persona todo el tiempo necesario para completar los elementos. En dichas pruebas, el puntaje de una persona se basa exclusivamente en su capacidad para responder a las preguntas correctamente, sin importar cuánto tiempo (dentro de lo razonable, por supuesto). Este tipo de prueba se llama prueba de potencia.

Pruebas individuales y grupales:

Hay una serie de pruebas que están diseñadas para ser administradas individualmente; es decir, no pueden ser administrados simultáneamente a dos o más personas por un solo examinador. Un ejemplo sería la Escala de Inteligencia Stanford-Binet. Muy a menudo se utilizan pruebas individuales para la evaluación clínica. Las pruebas de grupo son aquellas que pueden ser tomadas por muchas personas al mismo tiempo. Para pruebas industriales, generalmente se prefieren las pruebas grupales porque son más económicas de administrar.

Pruebas de lengua y no lengua:

A veces es importante distinguir entre las pruebas que requieren un conocimiento de un idioma en particular (como el inglés) para comprender las instrucciones de la prueba o los elementos de la prueba en sí. Todas estas pruebas se denominan pruebas de lenguaje porque el rendimiento en ellas depende parcialmente de la capacidad de lenguaje del examinado, independientemente del tipo de habilidad que la prueba esté diseñada para medir.

En algunos casos es deseable o necesario evitar el sesgo de lenguaje de una prueba. Por ejemplo, probar la capacidad mecánica de las personas que son analfabetas utilizando una prueba que tiene instrucciones escritas implicadas sería bastante inadecuado. Para resolver este problema, se han construido pruebas en ciertas áreas que son pruebas sin lenguaje. No requieren ninguna habilidad de lenguaje por parte del alumno. Estos se conocen como pruebas no lingüísticas.

Pruebas versus otros dispositivos de selección:

En este artículo nuestra atención está dedicada exclusivamente a examinar las pruebas psicológicas. Sin embargo, las pruebas no son de ninguna manera la única herramienta predictiva empleada por el psicólogo en una situación de selección. Otras ayudas de selección estándar son las cartas de recomendación, los espacios en blanco de las solicitudes y las entrevistas. Los programas integrales de selección los utilizarán además de las pruebas como parte del proceso de selección total.

Un estudio en controversia:

Quizás ninguna prueba individual ilustra mejor los problemas controvertidos involucrados en las pruebas industriales que el Análisis de vectores de actividad. Una breve revisión de la controversia que rodea este dispositivo de evaluación debería servir para ilustrar algunas de estas dificultades. Locke y Hulin (1962) hicieron una revisión exhaustiva del uso de esta prueba como un dispositivo de selección industrial. Revisaron un total de 18 estudios, 17 de los cuales eran relevantes para el valor de AVA en la industria. Sin embargo, la mayoría de estos estudios fueron del tipo de validez concurrente en el que se otorgó el AVA a los empleados actuales.

Locke y Hulin informaron que había evidencia de que podía diferenciar entre:

1. Gerentes y trabajadores de producción.

2. Ejecutivos y un grupo mixto de trabajadores.

3. Siete diferentes grupos ocupacionales que van desde operadores de máquinas hasta presidentes de compañías.

4. Empleados buenos y pobres en diferentes ocupaciones.

Sin embargo, en todos los estudios de empleados actuales, se obtuvieron validez desarrollando una clave basada en esa muestra y luego aplicando la clave nuevamente a la muestra en la que se desarrolló la clave, un procedimiento conocido como validación de "repliegue". En raras ocasiones se realizó un intento de llevar a cabo el proceso necesario de validación cruzada en un grupo diferente de empleados actuales. Locke y Hulin creen que, con demasiada frecuencia, los autores de los estudios de AVA excedieron los límites aceptados al analizar el valor de sus hallazgos, dejando a menudo al lector con la impresión de que su validez era indicativa del poder predictivo de la prueba.

Solo un estudio, en opinión de Locke y Hulin, utilizó un verdadero procedimiento de validez predictiva en el que se proporcionó una clave de puntuación desarrollada previamente antes del empleo y luego se verificó su validez. En este caso no se obtuvo validez.

Parecería que la decisión de que la AVA tiene valor predictivo debe posponerse, al menos, hasta que haya más evidencia sustancial disponible. Sin embargo, lo que se discute aquí no es solo el valor real de la prueba, sino también la discrepancia entre las afirmaciones hechas por su valor y los hallazgos empíricos reales. Locke y Hulin no están solos en tomar la AVA en función de la tergiversación de los resultados de la investigación. Dunnette y Kirchner (1962) han protestado enérgicamente por Meranda y Clarke (1959) en el informe de "color" de los datos AVA.

Bennett, en su reseña del AVA para el Quinto Anuario de Medición Mental (1959) de Euros, también es bastante poco complementario, declarando: "El mumbo-jumbo de procedimientos estadísticos supuestamente sofisticados no sustituye la validez demostrada". El lector interesado puede disfrutar del El artículo de Dunnette y Kirchner (1962) y la respuesta correspondiente de Meranda y Clarke en el mismo número del Journal of Applied Psychology.

Visión general de las pruebas de personalidad en la industria:

Ghiselli y Barthol (1953) revisaron 113 estudios sobre la validez de los inventarios de personalidad en la selección de empleados. Sus resultados se resumen en la tabla 4.3. Llegan a la conclusión de que, en determinadas circunstancias, los puntajes en los inventarios de personalidad se correlacionan mejor con la competencia en una variedad más amplia de trabajos de lo que se podría haber esperado. Los autores reconocen tanto el valor potencial de las pruebas de personalidad en la industria como la necesidad de un gran aumento y mejora en la investigación y el desarrollo.