Problemas y procedimientos involucrados en la selección de trabajo

Antes de proceder a un examen de los modelos de selección básicos que están disponibles para el psicólogo, es necesario que nos ocupemos de una breve mirada al modelo general de predicción múltiple. Este modelo suele denominarse modelo de regresión múltiple. En el paradigma de predicción general, desarrollamos una línea de regresión para ajustar el conjunto de puntos de datos definidos por las puntuaciones de las personas en un predictor (el eje x o abscisa) y en el criterio (el eje y u ordenada).

La figura 3.1 muestra tal situación. La línea de regresión en la Figura 3.1 es una línea recta y se ubica de manera que la suma de las distancias cuadradas de cada punto a la línea (paralela al eje y) sea lo más pequeña posible. Utilizamos una línea recta de mejor ajuste ya que hemos asumido una relación lineal entre x e y.

La fórmula básica para una línea recta es

y = a + bx

Donde y = puntaje predicho en el criterio

a = una constante que indica el punto en el que la línea de regresión cruza el eje y

b = pendiente de la línea, representada por ∆y / ∆x, o el cambio en y observado para un cambio correspondiente en x

x = puntuación observada en el predictor

Por lo tanto, el modelo de línea de regresión básica aparece como se muestra en la Figura 3.2.

Tenga en cuenta que en la Figura 3.2 la línea de regresión cruza el eje y en un valor de 2. Por lo tanto, a = 2. También tenga en cuenta que por cada aumento de 2 unidades en x hay un aumento correspondiente de 1 unidad en y. Por lo tanto, ∆y / ∆x = 1/2 = 0.5 = b. La ecuación de regresión entonces se convierte en

y = 2 + 0.5x

Dado cualquier valor de x, tenemos una línea de regresión que nos permite predecir un puntaje correspondiente. Por ejemplo, si x fuera 8, entonces

y = 2 + 0.5 (8)

= 2 + 4

= 6

Para resumir: en el caso del predictor único, se calcula una línea recta que se ajusta mejor a los puntos observados, donde el término "mejor ajuste" significa que la suma de las desviaciones al cuadrado de los valores observados alrededor de la línea será un mínimo.

Las fórmulas necesarias para calcular las constantes a y b que definen esta línea de mejor ajuste se denominan fórmulas de "mínimos cuadrados" y son las siguientes:

La fórmula para b es una relación de la covarianza entre el predictor y el criterio y la variación total en el predictor. Cuando la varianza del criterio y la varianza del predictor son iguales, entonces b = r, o la pendiente de la línea de regresión es igual al coeficiente de correlación.

Dos predictores:

Es lógico suponer que si el predictor X 1 puede contribuir a la predicción exitosa de las puntuaciones de los criterios, y si el predictor X 2 también puede contribuir a la predicción exitosa de las puntuaciones de los criterios, entonces el uso de ambos predictores juntos permitirá una mejor predicción general que el uso de ambos. predictor individual. Sin embargo, el grado en que los dos predictores (cuando se combinan) mejorarán la previsibilidad depende de varios factores, el más importante de los cuales es la correlación entre los dos predictores.

Considere, por ejemplo, la situación en la que dos predictores se correlacionan sustancialmente con un criterio, pero no se correlacionan entre sí, de la siguiente manera:

Claramente, se puede explicar una gran cantidad de varianza de criterio adicional utilizando el predictor 2 junto con el predictor 1. La relación combinada entre dos o más predictores y un criterio se denomina correlación múltiple y tiene el símbolo R. Como fue el caso con r 2, el valor de R ”representa la cantidad total de la varianza de criterio que se puede explicar mediante el uso de varios predictores. Cuando los predictores 1 y 2 no están correlacionados entre sí, se puede demostrar que el coeficiente de correlación múltiple al cuadrado es una función aditiva de los coeficientes de correlación al cuadrado individual, o

R 2 c . 12 = r 2 1c + r 2 2c (3.1)

Por lo tanto, cuando (la correlación de los predictores) es cero, entonces la validez múltiple al cuadrado es la suma de las validaciones individuales al cuadrado.

Cuando dos predictores se correlacionan entre sí, las cosas se vuelven algo más complejas. Considere una situación (como en el siguiente diagrama) donde cada predictor tiene una validez individual sustancial pero donde r 12 también es bastante grande.

Debido a la correlación entre estos predictores, el diagrama muestra que la cantidad de superposición entre el predictor 2 y el criterio se puede dividir en dos partes: esa área exclusiva del predictor 2 y esa área compartida con el predictor 1. Por lo tanto, el uso de un segundo predictor en esta situación nos permite explicar una varianza de criterio mayor que la que se podría hacer usando el predictor 1 solo, pero toda la varianza de criterio predicha por 2 no es una varianza nueva. Por lo tanto, se puede establecer una regla general concerniente a múltiples predictores.

En igualdad de condiciones, cuanto más alta sea la correlación entre los predictores, menos se mejorará la predicción global utilizando ambos predictores juntos. El caso extremo, por supuesto, sería la situación en la que los predictores estaban perfectamente correlacionados y no tendríamos una variación de criterio adicional explicada por la adición del predictor 2 a nuestra batería de selección.

En el caso de dos predictores que están correlacionados entre sí, podemos expresar R 2 como una función de las valididades separadas y el tamaño de la correlación entre los predictores con la fórmula 2

R 2 c . 12 = r 2 1c + r 2 2c - 2r 12 r 1c r 2c / 1 - r 2 12 (3.2)

tenga en cuenta que si r 12 = 0, entonces la fórmula 3.2 se reduce a

R 2 c . 12 = r 2 1c + r 2 2c

que es la fórmula 3.1.

Una ilustración más explícita de la influencia de la correlación del predictor sobre el tamaño de los coeficientes de correlación múltiple se puede obtener a partir de la Tabla 3.1, donde se dan ejemplos de valores de R y R 2 para pares de predictores que tienen una validez de 0.30, 0.50 y 0.70 bajo condiciones hipotéticas de 0.00, 0.30 y 0. 60 correlación. La Figura 3.3 muestra la tendencia general utilizando los datos que se dan en la Tabla 3.1. La moraleja para el psicólogo es bastante evidente: evite usar predictores que puedan estar altamente relacionados entre sí.

Ecuaciones de predicción:

La ecuación de predicción en una situación de dos predictores es una extensión del modelo de un predictor. La forma general de la ecuación es

y = a + b 1 x 1 + b 2 x 2 (3.3)

Esta es la ecuación para un plano en lugar de una línea recta. Para el lector familiarizado con la geometría, la Figura 3.4 presenta un dibujo tridimensional de las relaciones entre las variables x 1, x 2 y y correspondientes a la ecuación 3.3. Hay fórmulas disponibles que permiten calcular las constantes a, b, y que resultarán en el mejor plano de regresión. Una vez que se han determinado estas constantes, la ecuación resultante se puede usar para hacer predicciones de desempeño de criterio de los nuevos solicitantes de empleo, dados sus puntajes en los predictores separados.

Para ilustrar, supongamos que los datos están disponibles en 100 hombres contratados para el trabajo X durante un mes en particular, lo que incluye puntajes en dos pruebas, así como datos de criterios después de un período de seis meses. Estos datos pueden analizarse para determinar los valores para a, b 1 y bi que mejor describen las relaciones entre las variables.

Supongamos que la siguiente ecuación fue el resultado final:

y = 2 + 0.5x 1 + 0.9x 2 (3.4)

Esta ecuación dice que el puntaje de criterio más probable para cualquier nueva contratación será igual a la mitad de su puntaje en la prueba 1 más nueve décimas de su puntaje en la prueba 2 más dos. Por lo tanto, si un nuevo solicitante obtiene un puntaje de 20 en la prueba 1 y 30 en la prueba 2, su rendimiento de criterio previsto al final de los seis meses posteriores al momento de la contratación sería

= 2 + 0.5 (20) + 0.9 (30)

= 2 -t-10 + 27

= 39

La extensión del modelo de predictor doble a un modelo de predictor k, donde k es un gran número de predicciones potenciales para el éxito del trabajo, no es demasiado difícil conceptualmente. Nuestro modelo se expande a la forma.

y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 +… + b k x k (3.5)

Sin embargo, los procedimientos computacionales para resolver los valores de mínimos cuadrados de todas las constantes en una ecuación de este tipo se vuelven bastante complejos a menos que uno tenga instalaciones informáticas disponibles. También se advierte al lector que recuerde que en toda la discusión anterior se ha supuesto el supuesto de un mundo lineal, es decir, todas las relaciones entre pares de variables son lineales. Es posible modificar el modelo de regresión múltiple para evitar este supuesto, pero eso está fuera del alcance de este libro.

Moderadores:

Uno de los conceptos más importantes en la selección y la teoría de la colocación es el concepto de la variable moderadora. Algunas veces, referida como una variable de control de población, una variable moderadora puede verse como cualquier variable que, cuando se varía sistemáticamente, tiene un efecto sobre la magnitud de la relación entre dos o más variables.

Quizás un ejemplo hipotético (Figura 3.15) de cómo podría funcionar un moderador sirva para ilustrar su influencia en el proceso de selección. El diagrama de dispersión superior ilustra una validez general de 0.50 entre el predictor y un criterio. Sin embargo, la "población" representada en el diagrama de dispersión es una que incluye ambos sexos, es decir, hombres y mujeres se agrupan para determinar la validez. Incluso una inspección casual del diagrama de dispersión superior indica (si los hombres y las mujeres están codificados de manera diferente como se ha hecho aquí) que el patrón de puntajes observados para los hombres difiere del observado para las mujeres.

Para obtener una imagen más clara de cómo difieren exactamente, las dos gráficas de dispersión inferiores en la Figura 3.15 muestran las relaciones predictor-criterio por separado para hombres y para mujeres. Ahora la diferencia es sorprendente. Para los hombres observamos una alta relación positiva, una que produce una validez de 0, 80. Para las mujeres, por otro lado, vemos que prácticamente no hay relación entre el predictor y el criterio. La validez para las mujeres es de 0.05.

La variable moderadora en el ejemplo anterior es, por supuesto, la variable de sexo. La relación entre el predictor y el criterio se ve afectada drásticamente al variar el moderador. La pregunta "¿cuál es la validez de mi predictor?" Se vuelve más compleja. Lo que inicialmente parecía ser una validez moderadamente respetable ahora se ha convertido en dos validezes bastante distintas y separadas: una muy alta y otra muy baja.

Un nombre para estas últimas validaciones podría ser validaciones condicionales, es decir, la validez del predictor dado que la población está compuesta por mujeres o dado que la población está compuesta por hombres. Una característica interesante de las variables moderadoras es que un moderador no necesita tener ninguna relación directa con el predictor o con la variable de criterio (es decir, r ym y r im = 0).

Ejemplos de moderadores:

Se han encontrado ejemplos reales de moderadores en una serie de investigaciones. Vroom (1960), por ejemplo, encontró efectos moderadores bastante marcados utilizando el grado de motivación de los gerentes y supervisores de primera línea como la variable moderadora. Todos los hombres estudiados eran empleados en la planta de Chicago o en Nueva York de una empresa nacional de servicios de entrega que se especializaba en entregar paquetes pequeños y paquetes de departamentos y otras tiendas minoristas a residencias privadas. Los datos del estudio que mejor ilustran el concepto de moderador se dan en la Tabla 3.4.

Todos los supervisores se dividieron en tres grupos según su grado de motivación evaluado utilizando un compuesto de varios índices de motivación obtenidos en la investigación. Las validaciones para una prueba de capacidad de razonamiento no verbal se obtuvieron para cada uno de los cuatro tipos diferentes de calificaciones de supervisión de estos hombres.

Esto se hizo por separado en cada nivel de motivación. Como muestra la Tabla 3.4, la prueba fue aparentemente un predictor bastante válido de qué tan alto un hombre sería calificado por su supervisor si solo los hombres con alta motivación fueran considerados. Si variamos la motivación sistemáticamente al pasar a grupos con niveles de motivación moderados o bajos, vemos un cambio sistemático correspondiente en la relación entre la prueba y el criterio. Cuanto menor es la motivación del empleado, menor es la validez del predictor, de hecho, las validaciones incluso se vuelven negativas para los grupos de baja motivación.

Otros ejemplos de moderadores se pueden encontrar en estudios de Dunnette y Kirchner (1960) y Ghiselli y sus colaboradores (1956, I960). El trabajo de Dunnette y Kirchner se ha dirigido principalmente a identificar moderadores relacionados con el trabajo que agrupan a las personas en trabajos similares en cuanto a sus responsabilidades para obtener la máxima predicción dentro de cada grupo de trabajo.

El método de Ghiselli podría denominarse un sistema moderador "libre de variables". Las personas se agrupan simplemente en función de qué tan bien se puede predecir su éxito sin una referencia directa a ninguna variable externa. Fredericksen y Gilbert (I960) también han realizado investigaciones sobre moderadores para determinar el grado en que es probable que el efecto de un moderador sea consistente a lo largo del tiempo. Encontraron que un moderador identificado en un estudio de 1954 (Fredericksen y Melville, 1954) todavía estaba operando en un seguimiento de I960.

Teoría de la selección moderna versus tradicional:

El concepto de la variable moderadora quizás ilustra mejor la tendencia moderna en el énfasis de selección y ubicación. Tradicionalmente, la selección y la validación han sido problemas que se vieron que se resolvían mejor simplemente estableciendo un criterio que parecía ser confiable y un predictor que podría predecir mejor ese criterio.

El énfasis estuvo casi completamente en el establecimiento de una alta validez con poco o ningún pensamiento hacia la exploración de las muchas variables adicionales que, cuando son variadas, podrían sumarse o restarse de la correlación obtenida. El lema general que a menudo parecía tipificar la metodología de selección era el eslogan "Si funciona, ¡úselo!"

Sin lugar a dudas, esta política fue responsable de desarrollos bastante diferentes en la psicología industrial. Primero, probablemente contribuyó al grado en que los psicólogos fueron aceptados en la industria. La administración generalmente está orientada hacia resultados positivos, como lo representa una selección mejorada, y no está demasiado preocupada por cómo se logra.

Desafortunadamente, sin embargo, esta orientación también es probablemente la causa del hecho de que las validaciones en la predicción no se han incrementado sustancialmente (en todo caso) durante los últimos 50 años, un comentario bastante perturbador sobre los esfuerzos de los psicólogos involucrados en este tipo de trabajo.

En una revisión de 1955 de un gran número de estudios de validez, Ghiselli (1955) indicó que, efectivamente, es un evento inusual obtener un coeficiente de validez de 0, 50 o superior. La Figura 3.16 presenta las distribuciones de frecuencia presentadas por Ghiselli de coeficientes de validez de diferentes magnitudes para diferentes tipos de trabajos. Tenga en cuenta que solo en la distribución de validez para trabajadores de oficina que utilizan pruebas de inteligencia como predictores y medidas de competencia como criterios hay un gran número de validez por encima de 0.50.

El interés actual en los moderadores es representativo de un enfoque más amplio y algo más sofisticado hacia la selección. Se puede rastrear hasta cuando Toops (1948) hizo un llamado a los psicólogos para que consideren la posibilidad de que al estratificar a las personas (por ejemplo, los trabajadores) de manera sistemática según las variables personales, uno debería poder mejorar la predicción. Su método de clasificación, que él denominó el procedimiento de adición, es el precursor de los moderadores.

El modelo de selección de Dunnette:

Quizás la visión actual hacia la metodología de selección puede representarse mejor mediante el modelo de selección propuesto por Dunnette (1963). Este modelo se muestra en el diagrama presentado en la Figura 3.17 y está diseñado para señalar el laberinto de complejidades e interrelaciones que existen en la situación de selección. El modelo puede ser visto como algo más que un intento de señalar simplemente la naturaleza dinámica de la selección; también representa un motivo para que los psicólogos aprovechen estas dinámicas y las utilicen para obtener las mejores ventajas con el fin de mejorar la previsibilidad.

Probablemente uno pueda entender el punto de vista representado por el modelo en términos de la descripción exacta utilizada por Dunnette (1963, p. 318):

Tenga en cuenta que el modelo de predicción modificado tiene en cuenta las interacciones complejas que pueden ocurrir entre los predictores y varias combinaciones de predictores, diferentes grupos (o tipos) de individuos, diferentes comportamientos en el trabajo y las consecuencias de estos comportamientos en relación con los objetivos de la organización. . El modelo permite la posibilidad de que los predictores sean útiles de manera diferencial para predecir los comportamientos de diferentes subconjuntos de individuos.

Además, muestra que comportamientos similares en el trabajo pueden ser predecibles por patrones de interacción bastante diferentes entre grupos de predictores e individuos o incluso que el mismo nivel de desempeño en los predictores puede conducir a patrones de comportamiento en el trabajo sustancialmente diferentes para diferentes individuos. Finalmente, el modelo reconoce la molesta realidad de que los mismos comportamientos laborales o similares pueden, después de pasar por el filtro de situación, llevar a consecuencias organizacionales muy diferentes.

La tendencia actual en la selección representada por el conocimiento de los moderadores y por el modelo de selección de Dunnette debería dar como resultado un progreso tanto en el aumento de la eficiencia de la selección como en el grado de comprensión de la dinámica de la predicción precisa.

Variables supresoras:

Ninguna discusión sobre la selección estaría completa sin alguna mención de las variables supresoras. En un sentido, una variable supresora es similar a una variable moderadora en el sentido de que se define como "una variable que puede tener un efecto sobre la magnitud de una relación predictor-criterio dada, aunque tenga poca o ninguna relación con la variable criterio en sí misma. ”

La dinámica de una variable supresora en la predicción puede entenderse mejor revisando nuevamente el concepto de correlación parcial y su medida relacionada, la correlación semi-parcial. Si uno tenía dos predictores y un criterio que estaba correlacionado como se muestra aquí, entonces Correlación parcial entre el criterio y el predictor x, que es r 1c. 2, se definió como la correlación entre x 1 y C después de que los efectos de x 2 se hayan resaltado de ambos, por lo que

Supongamos que solo queremos eliminar los efectos de X2 del criterio antes de calcular la correlación. Dicha correlación se denomina correlación parcial o parcial. Por ejemplo, podríamos estar interesados ​​en la correlación entre los puntajes de las pruebas de inteligencia (nuestro predictor x 1 ) y el nivel de habilidad final al final de un programa de capacitación en mecanografía (el criterio) x 2 podría representar el nivel de habilidad inicial de todos los empleados en términos de su velocidad de escritura antes de tomar el curso de formación. Por lo tanto, queremos eliminar los efectos del nivel de habilidad inicial en el desempeño final antes de calcular la validez de nuestra prueba de inteligencia.

Nuestra correlación semi-parcial ahora se convierte en:

El mecanismo de una variable supresora es idéntico al mostrado anteriormente, excepto que (1) en general, la variable x 2 tiene solo una relación leve (si existe) con el criterio y (2) uno está interesado en eliminar sus efectos del predictor x 1 .

La situación general puede por lo tanto ser diagramada como:

No se puede predecir con certeza si las correlaciones parciales o parciales serán mayores o menores que la correlación simple existente entre las variables, ya que el proceso de parcialización afecta el tamaño del numerador y del denominador. La única vez que esto no es así es cuando la variable que está siendo parcializada solo está relacionada con una de las otras dos variables, como en el caso del supresor. En tal situación, solo el denominador se ve afectado posteriormente (la varianza se elimina) y la correlación parcial parcial resultante es mayor que la correlación simple no parcializada entre variables.

Validación cruzada:

Una de las características de la mayoría de los sistemas de selección de predicción múltiple es que, en su desarrollo, uno tiende a capitalizar la variación aleatoria que existe en la muestra de empleados que se utilizan para fines de validación. Esto es particularmente cierto con el modelo de regresión múltiple, pero también se aplica al procedimiento de corte múltiple. Debido a que el modelo de regresión múltiple tiene propiedades de mínimos cuadrados, es decir, minimizamos deliberadamente los errores al predecir nuestra muestra en particular, es probable que si ahora aplicamos nuestra ecuación a una nueva muestra (de la misma población) no encontremos nuestra predicción tan eficiente como antes

Por lo tanto, nuestro R 2 computado es una sobreestimación de lo que es probable que sea la validez futura de nuestro sistema de predicción, ya que usar nuestra ecuación para propósitos de predicción automáticamente implica aplicarla a nuevas muestras de trabajadores. Esta caída esperada en R 2 se conoce en las estadísticas como el problema de la contracción y puede ilustrarse mejor examinando la Figura 3.18.

En la figura 3.18 tenemos dos muestras de individuos. Cada uno representa una muestra aleatoria extraída de o perteneciente a la misma población. Por ejemplo, la muestra A podría representar a todos los solicitantes de empleo para el trabajo X durante los meses impares, y la muestra B podría representar a todos los solicitantes de empleo durante los meses pares para un año en particular.

Sería muy inusual, incluso con un gran número de solicitantes en cada muestra, que las dos muestras sean idénticas en términos de sus diagramas de dispersión. Dado que se puede esperar que sus diagramas de dispersión varíen debido al error de muestreo, también se puede esperar que la correlación entre el predictor y el criterio (validez) varíe un poco, al igual que la ecuación de regresión calculada en cada muestra.

Supongamos que tomamos la ecuación de regresión calculada en la muestra A y la usamos para predecir los puntajes de la muestra B. Obviamente, no pudimos hacer un buen trabajo al minimizar la línea A con la muestra B como podríamos usar la línea de regresión B, después de todo, la línea B por definición minimiza Σd 2 para esa muestra. Por lo tanto, cualquier otra línea tendrá un error mayor asociado con ella. Por lo tanto, R 2 debe reducirse correspondientemente.

Hay fórmulas disponibles para estimar la cantidad de contracción que se puede esperar cuando se usa esta ecuación en una nueva muestra. Una de estas fórmulas es

R 2 8 = 1 - [(1 - R2) n-1 / n - k - 1]

Dónde

R 2 = correlación múltiple encogida al cuadrado

R 2 = cuadrado de correlación múltiple obtenido de la muestra de validación

n = número de personas en la muestra de validación

k = número de predictores en la ecuación de regresión

Sin embargo, es mejor validar la ecuación de forma cruzada obteniendo una segunda muestra y probándola para ver qué tan bien predice. Si parece que hay una caída muy grande, uno puede querer revisar la ecuación (quizás combinando ambas muestras en un grupo). La contracción grande se encuentra con mayor frecuencia cuando los tamaños de muestra son pequeños y / o el número de predictores es grande en relación con el tamaño de la muestra.

Mosier (1951) ha discutido una serie de tipos de validación cruzada que pueden llevarse a cabo dependiendo del diseño del estudio y si a uno le preocupa generalizar solo una nueva muestra o si se desean generalizaciones más amplias sobre la ecuación de predicción del dado (por ejemplo, , a diferentes sexos, diferentes criterios, etc.). El primero se llama caso de generalización de validez; Este último es un caso de extensión de validez. Por supuesto, se esperaría una mayor contracción en este último caso, y la fórmula 3.9 en% se aplica a los casos de generalización de validez.