Predicción del éxito del trabajo (con diagrama y estadísticas)

La predicción del éxito en el trabajo implica determinar hasta qué punto el predictor está relacionado con el criterio. Por ejemplo, supongamos que uno estuviera interesado en configurar un programa de selección para contratar nuevos empleados de archivos. Supongamos además que se había decidido utilizar una prueba de papel y lápiz de la aptitud administrativa como potencial predictor de la eficiencia del empleado de archivo, y que la eficiencia se determinaría por las calificaciones de los supervisores. La Tabla 2.3 muestra algunos datos hipotéticos para esta situación asumida, dando puntajes a doce empleados de archivo tanto en la prueba de oficina como en la medida del criterio de eficiencia. La Figura 2.5 muestra un gráfico de los datos en la Tabla 2.3.

Note que parece haber una tendencia sistemática. En general, cuanto más alta fue la puntuación de una persona en la prueba clerical, mayor fue su puntaje en la medida de la competencia laboral. Por lo tanto, podemos deducir que existe una relación definida entre el desempeño de la prueba (el predictor) y la competencia en el trabajo (el criterio). También podemos deducir que si seleccionamos a aquellas personas que obtienen mejores calificaciones en la prueba, estamos más dispuestos a contratar a personas que serán más competentes que si contratáramos a personas independientemente de la calificación de las pruebas.

Estableciendo el Grado de Relación:

El grado de relación entre cualquiera de las dos variables puede definirse como la medida en que estas dos variables varían juntas de manera sistemática. El término más técnico para esto es el grado de covarianza existente entre las variables. Un estadístico conocido como coeficiente de correlación proporciona una medida formal del grado de covarianza entre dos conjuntos de puntajes cualquiera de los dos. Cuando dos conjuntos de puntajes están altamente relacionados, decimos que están altamente correlacionados. La medida más común de correlación es el Coeficiente de Correlación de Momento del Producto de Pearson, que se designa con el símbolo r.

Como medida de relación, r varía entre + 1.00 y -1.00. Cuando r es + 1.00, los dos conjuntos de puntajes están relacionados entre sí de manera positiva y perfecta. Cuando r es -1.00, los dos conjuntos de puntuaciones están relacionados de manera negativa y perfecta entre sí. Cuando r = 0.00, los dos conjuntos de puntuaciones no tienen ninguna relación entre sí. La figura 2.6 muestra gráficas de diferentes magnitudes de r.

Al predecir el éxito en el trabajo, el signo del coeficiente de correlación no es importante, pero la magnitud sí lo es. Cuanto mayor sea el tamaño absoluto de r, mejor será la predicción de las puntuaciones de criterio sobre la base de la información obtenida del predictor.

Para comprender la razón de ser de la correlación, puede ser útil considerar una representación pictórica de la covarianza y su relación con r. Cualquier conjunto de puntajes tendrá cierta cantidad de variación; de hecho, como ya hemos visto, los puntajes de las personas en muchos rasgos siguen una distribución normal con un pequeño número de puntajes muy altos, un pequeño número de puntajes muy bajos y la mayoría de las puntuaciones que se producen en la mitad de la distribución.

Supongamos que representamos esta varianza en un conjunto de puntajes de criterio como se muestra arriba, donde el área total se define como 1.00. Podemos hacer esto ya que es posible transformar cualquier conjunto de puntajes brutos para que su varianza sea igual a 1.00 usando lo que se conoce como transformación de puntaje az.

De manera similar, supongamos que tenemos un conjunto de puntajes de predictor que también varían y se distribuyen normalmente, y nuevamente el área se define como igual a la cantidad 1.00. Ahora podemos representar r geométricamente como relacionado con la cantidad de superposición (covarianza) de los dos conjuntos de puntuaciones.

Una definición más precisa de r como estadística es que es la relación de la cantidad de covarianza entre dos variables y la raíz cuadrada del producto de las respectivas varianzas (a veces llamada media geométrica) que puede diagramarse como se muestra a continuación:

Volviendo a los datos dados en la Tabla 2.3, es posible calcular la correlación entre estos dos conjuntos de puntajes utilizando la fórmula

Se advierte al lector que r no se puede interpretar como un porcentaje. Si r = 0.50, esto no implica que el 50 por ciento de la varianza en el criterio sea predecible a partir de la variable de selección. El cuadrado de r, sin embargo, puede ser interpretado así. Una correlación de 0.50, cuando se ajusta al cuadrado, da r 2 = 0.25, que puede interpretarse como el porcentaje de varianza en el criterio predicho por la variable de selección.

La estadística r 2 a veces se denomina coeficiente de determinación porque representa la cantidad de varianza en una variable que se puede "determinar" al conocer las puntuaciones en una segunda variable. La figura 2.7 muestra la relación entre r (la medida de la relación) y r 2 . Tenga en cuenta que es posible obtener r 's de un tamaño bastante sustancial y aún así solo representa una pequeña proporción de la varianza del criterio.

Regresión:

Como hemos visto, el coeficiente de correlación r mide el grado de relación entre dos variables. Por sí solo, sin embargo, no nos proporciona un procedimiento mediante el cual podamos predecir un conjunto de puntuaciones de otro conjunto. La técnica por la cual se hace esto se llama análisis de regresión. Puede pensarse que la regresión está relacionada con la correlación de la siguiente manera: la correlación mide la magnitud o el grado de relación entre dos variables, mientras que la regresión proporciona una descripción del tipo de relación entre las variables que, a su vez, se puede usar para hacer predicciones.

Para ilustrar la regresión, considere los puntajes trazados en la Figura 2.8a. Obviamente, existe una relación positiva sustancial entre el predictor y el criterio en este caso. Desafortunadamente, la Figura 2.8a no nos proporciona ninguna información sobre la relación exacta que no sea el hecho de que es lineal (r siempre mide solo el grado de relación lineal, en oposición a la relación curvilínea, entre dos variables). Si queremos predecir las puntuaciones de los criterios a partir de algún dispositivo de selección, está claro que debemos describir la relación observada entre el predictor y el criterio más específicamente.

Esto se logra al encontrar la línea o función que mejor describe los puntos de datos. Esto se denomina ajustar una "línea de mejor ajuste" a los datos. Ya que asumimos que la relación es lineal (usamos r para medir su magnitud), el tipo de línea que usamos debe ser recto, es decir, no se permiten líneas curvas. Esta línea recta de mejor ajuste se llama línea de regresión y se puede usar para predecir el criterio a partir del predictor.

La Figura 2.8b muestra dos líneas diferentes de mejor ajuste que podrían obtenerse si les pedimos a dos personas diferentes que examinen los datos y luego dibujen una línea a través de los puntos que, en su opinión, parecen describir mejor la tendencia o relación entre las variables. Si bien la tendencia general es similar, encontramos que las dos personas no están completamente de acuerdo en su estimación de la relación.

Este desacuerdo a su vez resultaría en un desacuerdo en la puntuación del criterio predicho dependiendo de la línea de regresión estimada que se utilizó. En el caso de un candidato con un puntaje x en el instrumento de selección, predeciríamos un puntaje de criterio de y 1 para este candidato si usáramos la línea de regresión de la primera persona; si utilizáramos la línea de regresión de la segunda persona, predeciríamos y 2 como el puntaje de criterio más probable. ¿Qué regresión es correcta?

Esta es una pregunta difícil de responder, a menos que haya alguna base para decidir cuál es realmente la mejor opción. Afortunadamente, los estadísticos generalmente han acordado que una línea de mejor ajuste es una que atraviesa los puntos de manera que minimiza la suma de las distancias al cuadrado (en la dimensión y) de los puntos de la línea, como se muestra en la Figura 2.9.

Una línea que logra minimizar Σd 2 se denomina línea de regresión de "mínimos cuadrados". Tales líneas de regresión están directamente relacionadas matemáticamente con r. El uso del método de mínimos cuadrados para obtener nuestra línea de predicción asegurará que diferentes personas terminarán con la misma línea (asumiendo que no cometan errores en el cálculo). De manera similar, la puntuación del criterio predicho para cualquier valor x particular no variará dependiendo de quién se ajuste a la línea de predicción (consulte la Figura 2.8c).

En este punto, el lector puede preguntar: "¿Por qué necesitamos predecir los puntajes de los criterios cuando ya los tenemos?" La respuesta es bastante simple. La medición inicial del alcance de la relación entre el predictor y el criterio obviamente requiere ambos conjuntos de puntuaciones o, de lo contrario, la relación no se pudo haber establecido. En caso de que el dispositivo de selección resulte útil, se puede utilizar con todos los nuevos solicitantes para los cuales puede haber una puntuación predictiva pero para quienes no existe una puntuación de criterio.

Nuestro objetivo es predecir el criterio de desempeño de los futuros solicitantes. Si un nuevo solicitante obtiene un puntaje alto en una prueba que se encontró que tiene una alta relación positiva con el criterio, entonces debemos esperar que tenga una alta probabilidad de convertirse en una contratación exitosa.