Un enfoque de la teoría de la decisión sobre el predictor y el criterio de las industrias

El problema de la selección se puede ver desde una perspectiva algo diferente a la utilizada. Este segundo enfoque resulta interesante porque encontraremos que la validez del predictor puede no ser una variable tan importante en la selección como lo hace ver el punto de vista tradicional. Nuestra nueva perspectiva es una basada en un modelo de teoría de la decisión. Deberíamos comenzar por replantear el objetivo en una situación de selección típica. En muchas situaciones de selección deseamos establecer un puntaje de corte en nuestro predictor, lo que resultará en minimizar nuestros errores de decisión.

Implícito en este tipo de situación es la suposición de que la proporción de selección puede manipularse a voluntad; es decir, no es "fijo" en algún valor. También está implícita la noción de que nuestra variable de criterio se puede separar de manera significativa en dos o más agrupaciones distintas como "exitosa" y "no exitosa". Nuestro objetivo es manipular la puntuación de corte (que es lo mismo que manipular la proporción de selección) en orden para minimizar la cantidad de errores cometidos en nuestro proceso de decidir si una persona debe ser contratada o rechazada.

Anteriormente señalamos que había dos tipos distintos de errores de decisión en el paradigma de selección, falsos positivos y falsos negativos, como se muestra a continuación:

Nuestro objetivo es encontrar el punto de corte que dará como resultado el número más pequeño de errores totales. Para fines de conveniencia, comenzaremos suponiendo que ambos tipos de error se consideran igualmente costosos. Es decir, no tenemos ninguna razón para preferir cometer un error falso positivo sobre un error falso negativo, o viceversa. Al hacer este supuesto, es posible plantear el problema directamente en términos de minimizar el número total de ambos tipos de errores en lugar de tener que sopesar los dos tipos de errores por su respectivo "costo".

Ubicación del punto de corte:

Para ilustrar cómo se puede abordar el problema de encontrar una ubicación óptima para nuestro puntaje de corte, considere el caso en el que tenemos una validez específica (por ejemplo, aproximadamente 0, 70) y un porcentaje especificado de empleados actuales considerado exitoso (a menudo denominado en este contexto como la "tasa base").

Esto se puede diagramar de la siguiente manera:

El siguiente paso es presentar los mismos datos en una forma ligeramente diferente. Primero, sabemos que se supone que nuestro grupo total de empleados tiene una distribución normal en términos de sus puntajes de predictor. Segundo, e igualmente importante, se supone que ambos subgrupos (exitosos y no exitosos) tienen distribuciones normales. Al observar el ejemplo anterior, es fácil deducir que la puntuación promedio del predictor del grupo exitoso será más alta que la del grupo que no tuvo éxito.

Podríamos diagramar esto como:

Ambas distribuciones tendrán el mismo tamaño ya que se basan en el mismo número de personas (es decir, 50 por ciento en cada grupo). Existe una relación algebraica entre la diferencia entre las medias de los dos subgrupos según se ve de esta manera y el tamaño del coeficiente de correlación. Si las medias del grupo son significativamente diferentes entre sí (por ejemplo, a un nivel de significancia de 0.05), el coeficiente de correlación también será significativo al mismo nivel.

Llevando nuestro diagrama un paso más allá, podemos colocar las dos distribuciones de frecuencia de los subgrupos lado a lado en la misma línea de base, como se muestra a continuación.

Después de hacer esto, ahora podemos volver a nuestra pregunta original: ¿dónde ubicamos un límite en el predictor para que el número total de errores se minimice? Resulta que la solución matemática a este problema da como resultado una respuesta muy simple: el punto de corte que minimiza el error total es el punto en el que las dos distribuciones se intersecan entre sí.

Esto se puede demostrar fácilmente a nivel conceptual observando los tres casos ilustrados a continuación. La misma diferencia entre los medios (es decir, la misma correlación) se usa en cada caso, todo lo que se ha cambiado es la ubicación del punto de corte en el predictor.

En la ilustración (a), la cantidad de falsos positivos (fallos que están por encima del límite) viene dada por el área B. La cantidad de falsos negativos (éxitos que están por debajo del límite) viene dada por el área A.,

Error total = A + B

Para la ilustración (b), el número de falsos positivos viene dado por B y el número de falsos negativos es dado por A + C. Por lo tanto,

Error total = A + B + C

Para la ilustración (c), el número de falsos positivos está dado por B + C y el número de falsos negativos está dado por A. Por lo tanto,

Error total = A + B + C

Dado que la inspección de las tres ilustraciones confirma rápidamente que el área A + B es la misma para los tres casos, entonces es obvio que el error aumenta en cierta cantidad C cada vez que el corte se aleja (en cualquier dirección) del punto en la cual las dos distribuciones se intersecan.

Algunas ramificaciones inusuales:

Ahora tenemos un principio general para ubicar un puntaje de corte que minimizará el número total de errores en una situación de toma de decisiones de selección, es decir, en el punto de intersección.

Resulta que, siempre que ambos tipos de errores se consideren igualmente costosos, esta es una regla muy general y no se ve afectada por:

(1) Los tamaños relativos de los dos grupos (es decir, el porcentaje considerado exitoso), o

(2) Las respectivas variaciones o dispersiones de las dos distribuciones.

Esto conduce a algunos aspectos interesantes y muy importantes del problema de predicción general sobre la relación entre la validez de la prueba y la utilidad de la prueba. Rorer, Hoffman, LA Forge y Hsieh (1966) han señalado tres casos tan interesantes.

Caso 1:

Tanto las medias como las varianzas de los dos grupos difieren entre sí. Supongamos que nuestro grupo exitoso es del mismo tamaño que el grupo no exitoso y tiene una media significativamente mayor en el predictor, pero su varianza es mucho menor.

Un diagrama de tal situación es el siguiente:

Nuestro principio de establecer puntos de corte dice que debemos colocarlos donde se crucen las dos distribuciones. Tenga en cuenta que esto sucede dos veces en este caso particular. Por lo tanto, tenemos un corte superior y un corte inferior. Deberíamos seleccionar solo aquellas personas que se encuentran dentro del intervalo entre valores de corte en términos de su puntaje de prueba. Cualquier otro punto de corte dará como resultado un error total mayor que el que se obtendría con los ubicados en los puntos de intersección.

Caso 2:

Los grupos tienen medias iguales pero varianzas diferentes. En este caso muy interesante, los dos grupos no difieren en términos de su puntaje promedio de predicción, es decir, en promedio, los empleados que no triunfan se desempeñan tan bien en la prueba como los empleados exitosos. Esto implica que el coeficiente de correlación es cero entre el predictor y el criterio. Sin embargo, hemos declarado además que los dos grupos difieren en términos de su variabilidad.

Si asumimos que el grupo exitoso es el grupo con la variabilidad más pequeña para propósitos de exposición, podemos expresarlo de la siguiente manera:

A pesar de que los dos grupos tienen el mismo puntaje de criterio promedio, es posible desarrollar puntos de corte que mejorarán la predicción sobre la que se disfruta actualmente a través de los métodos actuales, ya que las dos distribuciones se intersecan en dos puntos debido a su variabilidad desigual. Por lo tanto, tenemos la situación única en la que no habría una validez aparente (medida por un coeficiente de correlación), pero donde la predicción se puede mejorar mucho mediante el uso de valores de corte adecuados.

Caso 3:

Las medias grupales son considerablemente diferentes, pero el tamaño del grupo también es muy diferente. Supongamos que estamos ante una situación en la que la tasa base de empleados sin éxito es muy pequeña, es decir, alrededor del 90 por ciento de nuestros empleados actuales se consideran exitosos. Tal situación se muestra en el siguiente diagrama.

Aquí tenemos otra situación única. Aunque los medios del grupo pueden ser sustancialmente diferentes, lo que da una correlación sustancial entre el criterio y el predictor, no será posible establecer ningún corte que resulte en una reducción del error sobre lo que se obtiene actualmente con los métodos actuales. Debido a la marcada diferencia de tamaño entre los dos grupos, vemos que las dos distribuciones no se intersecan en ningún punto.

Bajo nuestro sistema de selección actual solo estamos cometiendo errores el 10 por ciento del tiempo. Si movemos nuestro límite de izquierda a derecha en el caso 3 (para empezar, se encuentra en el extremo izquierdo, ya que actualmente estamos seleccionando a todas estas personas), por supuesto, comenzaremos a eliminar algunas de las personas que no tienen éxito. Empleado bajo el sistema actual.

Sin embargo, al mismo tiempo, vamos a comenzar a rechazar a los empleados que resulten exitosos. Mirar el diagrama rápidamente nos dice que este aumento en falsos negativos sería mayor que la disminución correspondiente en falsos positivos, sin importar dónde pongamos nuestro límite. Por lo tanto, cualquier corte basado en pruebas resultará en más errores de los que tenemos sin la prueba, aunque la prueba sea altamente válida.