4 medidas de dispersión de uso común

Hay cuatro medidas comúnmente utilizadas para indicar la variabilidad (o dispersión) dentro de un conjunto de medidas. Son: 1. Rango 2. Desviación del cuartil 3. Desviación media 4. Desviación estándar.

Medida # 1. Rango:

Rango es el intervalo entre la puntuación más alta y la más baja. El rango es una medida de la variabilidad o dispersión de las variables u observaciones entre sí y no da una idea acerca de la extensión de las observaciones alrededor de algún valor central.

Simbólicamente R = Hs - Ls. Donde R = Rango;

Hs es la 'Puntuación más alta' y Ls es la Puntuación más baja.

Cálculo de rango (datos desagrupados):

Ejemplo 1:

Las puntuaciones de diez niños en una prueba son:

17, 23, 30, 36, 45, 51, 58, 66, 72, 77.

Ejemplo 2:

Las puntuaciones de diez niñas en un examen son:

48, 49, 51, 52, 55, 57, 50, 59, 61, 62.

En el ejemplo I, la puntuación más alta es 77 y la puntuación más baja es 17.

Entonces el rango es la diferencia entre estas dos puntuaciones:

. . . Rango = 77 - 17 = 60

De manera similar, en el ejemplo II.

Rango = 62 - 48 = 14

Aquí encontramos que las puntuaciones de los niños están muy dispersas. Por lo tanto, los puntajes de los varones varían mucho, pero los puntajes de las niñas no varían mucho (por supuesto, varían menos). Por lo tanto, la variabilidad de las puntuaciones de los niños es más que la variabilidad de las puntuaciones de las niñas.

Cálculo de rango (datos agrupados):

Ejemplo 3:

Encuentra el rango de datos en la siguiente distribución:

Solución:

En este caso, el límite verdadero superior de la clase más alta 70-79 es Hs = 79.5 y el límite verdadero más bajo de la clase más baja 20-29 es Ls = 19.5

Por lo tanto, Rango R = Hs - Ls

= 79.5 - 19.5 = 60.00

El rango es un índice de variabilidad. Cuando el rango es más el grupo es más variable. Cuanto menor es el rango, más homogéneo es el grupo. El rango es la medida más general de "propagación" o "dispersión" de las puntuaciones (o medidas). Cuando deseamos hacer una comparación aproximada de la variabilidad de dos o más grupos, podemos calcular el rango.

El rango comparado con el anterior se encuentra en una forma cruda o es una medida absoluta de dispersión y no es apto para fines de comparación, especialmente cuando las series están en dos unidades diferentes. A efectos de comparación, el coeficiente de rango se calcula dividiendo el rango por la suma de los elementos más grandes y más pequeños.

Ventajas:

1. El rango se puede calcular muy fácilmente.

2. Es una medida de dispersión más simple.

3. Se calcula cuando queremos hacer una comparación aproximada de dos o más gráficos de variabilidad.

Limitaciones:

1. El rango no se basa en todas las observaciones de la serie. Se tiene en cuenta sólo los casos más extremos.

2. Nos ayuda a hacer solo una comparación aproximada de dos o más grupos de variabilidad.

3. El rango toma en cuenta los dos puntajes extremos en una serie.

Por lo tanto, cuando N es pequeño o cuando hay grandes brechas en la distribución de frecuencia, el rango como medida de variabilidad es bastante poco confiable.

Ejemplo 4:

Puntajes del Grupo A - 3, 5, 8, 11, 20, 22, 27, 33

Aquí rango = 33 - 3 = 30

Puntajes del Grupo B - 3, 5, 8, 11, 20, 22, 27, 93

Aquí rango = 93 - 3 = 90.

Simplemente compare la serie de puntuaciones en el grupo A y el grupo B. En el grupo A, si una puntuación única 33 (la última puntuación) se cambia a 93, el rango cambia ampliamente. Por lo tanto, una sola puntuación alta puede aumentar el rango de bajo a alto. Es por esto que el rango no es una medida confiable de variabilidad.

4. Se ve muy afectado por las fluctuaciones en el muestreo. Su valor nunca es estable. En una clase donde normalmente la altura de los estudiantes varía de 150 cm a 180 cm, si se admite un enano cuya altura es de 90 cm, el rango se dispararía desde 90 cm a 180 cm.

5. El rango no presenta la serie y la dispersión de verdad. La distribución asimétrica y simétrica puede tener el mismo rango pero no la misma dispersión. Es de precisión limitada y debe utilizarse con precaución.

Sin embargo, no debemos pasar por alto el hecho de que el rango es una medida bruta de la dispersión y es totalmente inadecuado para estudios precisos y precisos.

Medida # 2. Desviación del cuartil:

El rango es el intervalo o la distancia en la escala de medición que incluye los casos del 100 por ciento. Las limitaciones del rango se deben a su dependencia de los dos valores extremos solamente.

Hay algunas medidas de dispersión que son independientes de estos dos valores extremos. El más común de estos es la desviación del cuartil que se basa en el intervalo que contiene el 50 por ciento de los casos en una distribución dada.

La desviación del cuartil es la mitad de la distancia de escala entre el tercer cuartil y el primer cuartil. Es el rango semi-intercuartil de una distribución:

Antes de tomar la desviación del cuartil, debemos conocer el significado de cuartos y cuartiles.

Por ejemplo, los resultados de una prueba 20 puntuaciones y estas puntuaciones se organizan en orden descendente. Dividamos la distribución de puntajes en cuatro partes iguales. Cada parte presentará un 'cuarto'. En cada trimestre habrá un 25% (o 1/4 de N) de casos.

A medida que las puntuaciones se ordenan en orden descendente,

Las 5 mejores puntuaciones estarán en el 1er trimestre,

Los próximos 5 puntajes estarán en el 2do trimestre,

Los próximos 5 puntajes estarán en el 3er trimestre, y

Y los 5 puntajes más bajos estarán en el cuarto trimestre.

Para tener un mejor estudio de la composición de una serie, puede ser necesario dividirla en tres, cuatro, seis, siete, ocho, nueve, diez o cien partes.

Por lo general, una serie se divide en cuatro, diez o cien partes. Un elemento divide la serie en dos partes, tres elementos en cuatro partes (cuartiles), nueve elementos en diez partes (deciles) y noventa y nueve elementos en cien partes (percentiles).

Hay, por lo tanto, tres cuartiles, nueve deciles y noventa y nueve percentiles en una serie. El segundo cuartil, el quinto decil o el percentil 50 es la mediana (ver Figura).

El valor del elemento que divide la primera mitad de una serie (con valores menores que el valor de la mediana) en dos partes iguales se denomina primer cuartil (Q1) o cuartil inferior. En otras palabras, Q 1 es un punto por debajo del cual se encuentra el 25% de los casos. Q 1 es el percentil 25.

El Segundo Cuartil (Mdn) o el Cuartil Medio es la mediana. En otras palabras, es un punto por debajo del cual se encuentra el 50% de los puntajes. Una mediana es el percentil 50.

El valor del elemento que divide la segunda mitad de la serie (con valores más que el valor de la mediana) en dos partes iguales se denomina Tercer cuartil (Q 3 ) o Cuartil superior. En otras palabras, Q 3 es un punto por debajo del cual se encuentra el 75% de los puntajes. Q 3 es el percentil 75.

Nota:

Un estudiante debe distinguir claramente entre un cuarto y un cuartil. El cuarto es un rango; Pero el cuartil es un punto en la escala. Los cuartos se numeran de arriba a abajo (o de la puntuación más alta a la puntuación más baja), pero los cuartiles se numeran de abajo a arriba.

La desviación del cuartil (Q) es la mitad de la distancia de escala entre el tercer cuartil (Q 3 ) y el primer cuartil (Q 1 ):

L = límite inferior del ci donde se encuentra Q 3,

3N / 4 = 3/4 de Nor 75% de N.

F = total de todas las frecuencias debajo de 'L',

fq = Frecuencia del ci sobre el cual Q 3 se encuentra ei = tamaño o longitud del ci

L = límite inferior del ci donde se encuentra Q 1,

N / 4 = Un cuarto (o 25%) de N,

F = total de todas las frecuencias debajo de 'L',

fq = frecuencia del ci sobre el cual Q 1 se encuentra,

y i = tamaño o longitud de ci

Rango intercuartil:

El rango entre el tercer cuartil y el primer cuartil se conoce como rango intercuartil. Rango simbólicamente intercuartil = Q 3 - Q 1 .

Rango semi-intercuartil:

Es la mitad de la distancia entre el tercer cuartil y el primer cuartil.

Así, SI R. = Q 3 - Q 1/4

La Desviación Q o Cuartil se conoce también como rango semi-intercuartil (o SIR)

Así, Q = Q 3 - Q 1/2

Si comparamos la fórmula de Q 3 y Q 1 con la fórmula de la mediana, las siguientes observaciones serán claras:

yo. En el caso de Median usamos N / 2 mientras que para Q 1 usamos N / 4 y para Q 3 usamos 3N / 4.

ii. En el caso de la mediana, usamos fm para denotar la frecuencia de ci, sobre la cual se encuentra la mediana; pero en el caso de Q 1 y Q 3 usamos fq para denotar la frecuencia de ci en la que Q 1 o Q 3 se encuentra.

Cálculo de Q (datos no agrupados):

Para poder calcular Q, debemos calcular primero Q 3 y Q 1 . Q 1 y Q 3 se calculan de la misma manera que calculamos la mediana.

Las únicas diferencias son:

(i) en el caso de la mediana contábamos 50% de casos (N / 2) desde abajo, pero

(ii) en el caso de Q 1 tenemos que contar el 25% de los casos (o N / 4) desde la parte inferior y

(iii) en el caso de Q 3 tenemos que contar el 75% de los casos (o 3N / 4) desde la parte inferior.

Ejemplo 5:

Averigüe Q de las siguientes puntuaciones 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39.

Hay 20 puntuaciones.

25% de N = 20/4 = 5

Q 1 es un punto por debajo del cual se encuentra el 25% de los casos. En este ejemplo, Q 1 es un punto por debajo del cual se encuentran 5 casos. De la mera inspección de los datos solicitados se encuentra que debajo de 24.5 hay 5 casos. Así Q1 = 24.5

Asimismo, Q 3 es un punto por debajo del cual se encuentra el 75% de las facilidades.

75% de N = 3/4 x 20 = 15

Encontramos que debajo de 34.5, 15 casos se encuentran.

Así Q3 = 34.5.

En una distribución simétrica, la mediana se encuentra en la mitad de la escala de Q 1 y Q 3 . Por lo tanto, el valor Q 1 + Q o Q 3 - Q da el valor de la mediana. Pero, en general, las distribuciones no son simétricas, por lo que Q 1 + Q o Q 3 - Q no darían el valor de la mediana.

Cálculo de Q (Datos Agrupados):

Ejemplo 6:

Las puntuaciones obtenidas por 36 estudiantes en un examen se muestran en la tabla. Encuentra la desviación del cuartil de las puntuaciones.

En la columna 1, hemos tomado la clase Intervalo, en la columna 2, hemos tomado la frecuencia, y en la columna 3, se han escrito las frecuencias acumuladas desde la parte inferior.

Aquí N = 36, entonces para Q 1 tenemos que tomar N / 4 = 36/4 = 9 casos y para Q 3 tenemos que tomar 3N / 4 = 3 x 36/4 = 27 casos. Al mirar en la columna 3, cf = 9 se incluirá en ci 55 - 59, cuyo límite real es 54.5 - 59.5. Q1 estaría en el intervalo 54.5 - 59.5.

El valor de Q 1 debe calcularse de la siguiente manera:

Para calcular Q 3, cf = 27 se incluirá en ci 65 - 69, cuyos límites reales son 64. 5 - 69.5. Entonces, Q 3 estaría en el intervalo 64.5 - 69.5 y su valor se computará de la siguiente manera:

Interpretación de la desviación del cuartil:

Al interpretar el valor de la desviación del cuartil, es mejor tener los valores de Mediana, Q 1 y Q 3, junto con Q. Si el valor de Q es mayor, entonces la dispersión será mayor, pero nuevamente el valor depende de la escala de la medida. Dos valores de Q deben compararse solo si la escala utilizada es la misma. Q medida para puntajes de 20 no puede compararse directamente con Q para puntajes de 50.

Si conocemos la mediana y la Q, podemos decir que el 50% de los casos se encuentran entre 'Mediana - Q' y 'Mediana + Q'. Estos son el 50% medio de los casos. Aquí, llegamos a conocer el rango de solo el 50% de los casos. A través de esta medida no se sabe cómo se distribuyen el 25% de los casos y el 25% de los casos superiores.

A veces, los casos o valores extremos no se conocen, en cuyo caso la única alternativa disponible para nosotros es calcular la desviación de la mediana y el cuartil como la medida de la central, la tendencia y la dispersión. A través de la mediana y los cuartiles podemos inferir acerca de la simetría o la asimetría de la distribución. Permítanos, por lo tanto, tener una idea de distribuciones simétricas y sesgadas.

Distribuciones simétricas y sesgadas:

Se dice que una distribución es simétrica cuando las frecuencias están distribuidas simétricamente alrededor de la medida de la tendencia central. En otras palabras, podemos decir que la distribución es simétrica si los valores a igual distancia en los dos lados de la medida de la tendencia central tienen frecuencias iguales.

Ejemplo 7:

Encuentra si la distribución dada es simétrica o no.

Aquí la medida de la tendencia central, la media y la mediana, es 5. Si comenzamos a comparar las frecuencias de los valores en los dos lados de 5, encontramos que los valores 4 y 6, 3 y 7, 2 y 8, 1 y 9, 0 y 10 tienen el mismo número de frecuencias. Así que la distribución es perfectamente simétrica.

En una distribución simétrica, la media y la mediana son iguales y la mediana se encuentra a la misma distancia de los dos cuartiles, es decir, Q 3 - Mediana = Mediana - Q 1 .

Si una distribución no es simétrica, entonces la desviación de la simetría se refiere a su sesgo. La asimetría indica que la curva está más orientada hacia un lado que hacia el otro. Así que la curva tendrá una cola más larga en un lado.

Se dice que la asimetría es positiva si la cola más larga está en el lado derecho y se dice en negativo si la cola más larga está en el lado izquierdo.

Las siguientes figuras muestran el aspecto de una curva sesgada positivamente y sesgada negativamente:

Q 3 - Mdn> Mdn - Q 1 indica sesgo + ve

Q 3 - Mdn <Mdn - Q 1 indica - ve sesgo

Q 3 - Mdn = Mdn - Q 1 indica cero sesgo

Méritos de Q:

1. Es una medida de variabilidad más representativa y confiable que el rango general.

2. Es un buen índice de densidad de puntuación en la mitad de la distribución.

3. Los cuartiles son útiles para indicar la asimetría de una distribución.

4. Al igual que la mediana, Q es aplicable a las distribuciones abiertas.

5. Siempre que se prefiere la mediana como medida de la tendencia central, se prefiere la desviación del cuartil como medida de la dispersión.

Limitaciones de Q:

1. Sin embargo, al igual que la mediana, la desviación del cuartil no es susceptible de tratamiento algebraico, ya que no toma en cuenta todos los valores de la distribución.

2. Solo calcula el tercer y el primer cuartil y nos habla sobre el rango. De Q 'no podemos obtener una imagen real de cómo se dispersan las puntuaciones del valor central. Eso es 'Q' no nos da ninguna idea sobre la composición de las puntuaciones. 'Q' de dos series puede ser igual, sin embargo, las series pueden ser bastante diferentes en su composición.

3. Aproximadamente da una idea de dispersión.

4. Ignora las puntuaciones por encima del tercer cuartil y las puntuaciones por debajo del primer cuartil. Simplemente nos habla del medio 50% de la distribución.

Usos de Q:

1. Cuando la mediana es una medida de una tendencia central;

2. Cuando la distribución está incompleta en cualquier extremo;

3. Cuando hay puntajes dispersos o extremos que influirían desproporcionadamente en el SD;

4. Cuando la concentración alrededor de la mediana - el 50% medio de los casos es de interés primario.

Coeficiente de desviación del cuartil:

La desviación del cuartil es una medida absoluta de la dispersión y para hacerla relativa, calculamos el 'coeficiente de desviación del cuartil'. El coeficiente se calcula dividiendo la desviación del cuartil por el promedio de los cuartiles.

Está dada por:

Coeficiente de desviación del cuartil = Q 3 - Q 1 / Q 3 + Q 1

Donde Q 3 y Q 1 se refieren a los cuartiles superior e inferior respectivamente.

Medida # 3. Desviación media (AD) o desviación media (MD):

Como ya hemos discutido el rango y la 'Q' aproximadamente nos da una idea de la variabilidad. El rango de dos series puede ser el mismo o la desviación de cuartil de dos series puede ser igual, pero las dos series pueden ser diferentes. Ni el rango ni la 'Q' hablan de la composición de la serie. Estas dos medidas no tienen en cuenta las puntuaciones individuales.

El método de desviación promedio o 'la desviación media', como se le llama a veces, tiende a eliminar un defecto grave de ambos métodos (rango y 'Q'). La desviación promedio también se denomina primer momento de dispersión y se basa en todos los elementos de una serie.

La desviación promedio es la media aritmética de las desviaciones de una serie calculada a partir de alguna medida de tendencia central (media, mediana o modo), y todas las desviaciones se consideran positivas. En otras palabras, el promedio de las desviaciones de todos los valores de la media aritmética se conoce como desviación media o desviación media. (Generalmente, la desviación se toma de la media de la distribución).

Donde ∑ es la suma total de;

X es la puntuación; M es la media; N es el número total de puntuaciones.

Y 'd' significa la desviación de las puntuaciones individuales de la media.

Cálculo de la desviación media (datos no agrupados):

Ejemplo 8:

Encuentra la desviación media para el siguiente conjunto de variables:

X = 55, 45, 39, 41, 40, 48, 42, 53, 41, 56

Solución:

Para encontrar la desviación media, primero calculamos la media para el conjunto dado de observaciones.

Las desviaciones y las desviaciones absolutas se dan en la Tabla 4.2:

Ejemplo 9:

Encuentra la desviación media para los puntajes que se dan a continuación:

25, 36, 18, 29, 30, 41, 49, 26, 16, 27

Se encontró que la media de las puntuaciones anteriores era 29.7.

Para calcular la desviación media:

Nota:

Si aplica algebra, puede ver que ∑ (X - M) es cero

Cálculo de la desviación media (datos agrupados):

Ejemplo 10:

Encuentre la desviación media para la siguiente distribución de frecuencia:

Aquí, en la columna 1, escribimos los ci 's, en la columna 2, escribimos las frecuencias correspondientes, en la columna 3, escribimos los puntos medios de los ci' s que se denota con 'X', en la columna 4, escribimos el producto de las frecuencias y los puntos medios de los ci indicados por X, en la columna 5, escribimos las desviaciones absolutas de los puntos medios de ci de la media que se denota por | d | y en la columna 6, escribimos el producto de desviaciones y frecuencias absolutas, denotadas por | fd |.

Méritos de la desviación media:

1. La desviación media es la medida más simple de dispersión que tiene en cuenta todos los valores en una distribución dada.

2. Es fácilmente comprensible incluso para una persona que no está bien versada en estadísticas.

3. No está muy afectado por el valor de los artículos extremos.

4. Es el promedio de las desviaciones de las puntuaciones individuales de la media.

Limitaciones:

1. La desviación media ignora los signos algebraicos de las desviaciones y, como tal, no es capaz de un tratamiento matemático adicional. Por lo tanto, se utiliza sólo como una medida descriptiva de la variabilidad.

2. De hecho, MD no es de uso común. Rara vez se usa en las estadísticas modernas y, en general, la dispersión se estudia por desviación estándar.

Usos de MD:

1. Cuando se desea pesar todas las desviaciones según su tamaño.

2. Cuando se requiere saber en qué medida las medidas se extienden a ambos lados de la media.

3. Cuando las desviaciones extremas influyen indebidamente en la desviación estándar.

Interpretación de la desviación media:

Para interpretar la desviación media, siempre es mejor examinarla junto con la media y el número de casos. La media es necesaria porque la media y la desviación media son respectivamente el punto y la distancia en la misma escala de medición.

Sin media, la desviación media no se puede interpretar, ya que no hay ninguna pista para la escala de medición o la unidad de medida. El número de casos es importante porque la medida de la dispersión depende de ello. Para un número menor de casos, es probable que la medida sea más.

En los dos ejemplos, tenemos:

En el primer caso, la desviación media es casi el 25% de la media, mientras que en el segundo caso es menor. Pero la desviación media puede ser mayor en el primer caso debido a un menor número de casos. Así que las dos desviaciones medias calculadas anteriormente indican una dispersión casi similar.

Medida # 4. Desviación estándar o desviación estándar y desviación:

De varias medidas de dispersión, la medida más utilizada es la "desviación estándar". También es el más importante debido a que es la única medida de dispersión susceptible de tratamiento algebraico.

Aquí también, se consideran las desviaciones de todos los valores de la media de la distribución. Esta medida adolece de los menos inconvenientes y proporciona resultados precisos.

Elimina el inconveniente de ignorar los signos algebraicos al calcular las desviaciones de los elementos del promedio. En lugar de descuidar los signos, cuadramos las desviaciones, haciendo que todas sean positivas.

Se diferencia de la AD en varios aspectos:

yo. Al calcular AD o MD, ignoramos los signos, mientras que al encontrar SD evitamos la dificultad de los signos al cuadrar las desviaciones separadas;

ii. Las desviaciones cuadradas utilizadas en el cálculo de SD siempre se toman de la media, nunca de la mediana o el modo.

"La desviación estándar o SD es la raíz cuadrada de la media de las desviaciones cuadradas de las puntuaciones individuales de la media de la distribución".

Para ser más claros, debemos tener en cuenta que al calcular la SD, cuadramos todas las desviaciones por separado. Encuentre su suma, divida la suma por el número total de puntajes y luego encuentre la raíz cuadrada de la media de las desviaciones al cuadrado.

Por lo tanto, SD también se denomina "desviación cuadrada media de la raíz" y generalmente se denota por la pequeña letra griega σ (sigma).

Simbólicamente, la desviación estándar para datos desagrupados se define como:

Donde d = desviación de las puntuaciones individuales de la media;

(Algunos autores usan 'x' como la desviación de las puntuaciones individuales de la media)

∑ = suma total de; N = número total de casos.

La media de las desviaciones cuadradas se conoce como varianza. O, en palabras simples, el cuadrado del estándar de desviación se denomina Segundo Momento de Dispersión o Varianza.

Cálculo de SD (datos desagrupados):

Hay dos formas de calcular la SD para datos desagrupados:

(a) Método directo.

(b) Método de atajo.

(a) Método directo:

Encuentra la desviación estándar para las puntuaciones que se dan a continuación:

X = 12, 15, 10, 8, 11, 13, 18, 10, 14, 9

Este método utiliza la fórmula (18) para encontrar SD, que incluye los siguientes pasos:

Paso 1:

Calcular la media aritmética de los datos dados:

Paso 2:

Escriba el valor de la desviación d, es decir, X - M contra cada puntaje en la columna 2. Aquí, las desviaciones de los puntajes deben tomarse de 12. Ahora encontrará que ∑d o ∑ (X - M) es igual a cero. Piensa, ¿por qué es así? Revisalo. Si esto no es así, averigüe el error de cálculo y rectifíquelo.

Paso 3:

Cuadrar las desviaciones y escribir el valor de d 2 contra cada puntaje en la columna 3. Encontrar la suma de las desviaciones cuadradas. ∑d 2 = 84.

Tabla 4.5 Cálculo de SD:

La desviación estándar requerida es 2.9.

Etapa 4:

Calcule la media de las desviaciones al cuadrado y luego encuentre la raíz cuadrada positiva para obtener el valor de la desviación estándar, es decir, σ.

Usando la fórmula (19), la varianza será σ 2 = ∑d 2 / N = 84/10 = 8.4

(b) Método de atajo:

En la mayoría de los casos, la media aritmética de los datos dados resulta ser un valor fraccionario y luego el proceso de tomar desviaciones y cuadrarlas se vuelve tedioso y consume cal en el cálculo de la desviación estándar.

Para facilitar el cálculo en tales situaciones, las desviaciones pueden tomarse de una media supuesta. La fórmula de atajo ajustada para calcular SD será entonces,

dónde,

d = Desviación de la puntuación de una media supuesta, digamos AM; es decir, d = (X - AM).

d 2 = El cuadrado de la desviación.

∑d = La suma de las desviaciones.

∑d 2 = La suma de las desviaciones al cuadrado.

N = No. de las puntuaciones o variables.

El procedimiento de cálculo se aclara en el siguiente ejemplo:

Ejemplo 11:

Encuentre SD para los puntajes dados en la tabla 4.5 de X = 12, 15, 10, 8, 11, 13, 18, 10, 14, 9. Use el método de atajo.

Solución:

Tomemos la media supuesta AM = 11.

Las desviaciones y los cuadrados de desviaciones necesarios en la fórmula se dan en la siguiente tabla:

Poniendo los valores de la tabla en la fórmula, el SD

El método de acceso directo da el mismo resultado que obtuvimos al usar el método directo en el ejemplo anterior. Pero el método abreviado tiende a reducir el trabajo de cálculo en situaciones donde la media aritmética no es un número entero.

Cálculo de SD (datos agrupados):

(a) Método largo / Método directo:

Ejemplo 12:

Encuentra el SD para la siguiente distribución:

Aquí también, el primer paso es encontrar la media M, para lo cual tenemos que tomar los puntos medios de los c.i indicados por X 'y encontrar el producto f X.'. La media está dada por ∑ f x '/ N. El segundo paso es encontrar las desviaciones de los puntos medios de los intervalos de clase X 'de la media, es decir, X'-M denotada por d.

El tercer paso es cuadrar las desviaciones y encontrar el producto de las desviaciones al cuadrado y la frecuencia correspondiente.

Para resolver el problema anterior, los ci se escriben en la columna 1, las frecuencias se escriben en la columna 2, los puntos medios de c.i, es decir, X 'se escriben en la columna 3, el producto de f X' se escribe en la columna 4, la desviación de X 'de la media se escribe en la columna 5, la desviación al cuadrado d 2 se escribe en la columna 6, y el producto f d 2 se escribe en la columna 7,

Como se muestra abajo:

Por lo tanto, las desviaciones de los puntos medios deben tomarse de 11.1.

Por lo tanto, la desviación estándar requerida es de 4.74.

(b) Método de atajo:

A veces, en el método directo, se observa que las desviaciones de la media real en decimales y los valores de d 2 y fd 2 son difíciles de calcular. Para evitar este problema, seguimos un método de corte corto para calcular la desviación estándar.

En este método, en lugar de tomar las desviaciones de la media real, tomamos las desviaciones de una media supuesta adecuadamente elegida, digamos AM

La siguiente fórmula se utiliza para calcular SD:

donde d es la desviación de la media supuesta.

Los siguientes pasos están involucrados en el cálculo de la desviación estándar:

(i) Obtenga desviaciones de las variables de la media AM supuesta como d = (X - AM)

(ii) Multiplique estas desviaciones por las frecuencias correspondientes para obtener la columna fd . La suma de esta columna da ∑ fd.

fd con la desviación correspondiente (d)

(iii) Multiplica para obtener la columna fd 2 . La suma de esta columna será ∑ fd 2 .

(iv) Use la fórmula (22) para encontrar SD

Ejemplo 13:

Utilizando el método abreviado, encuentre SD de los datos en la tabla 4.7.

Solución:

Tomemos una media supuesta AM = 10. Otros cálculos necesarios para calcular SD se muestran en la tabla 4.8.

Poniendo valores de la tabla

Usando la fórmula (19), la varianza

(c) Método de desviación de paso:

En este método, en la columna 1 escribimos ci 's; en la columna 2 escribimos las frecuencias; en la columna 3 escribimos los valores de d, donde d = X'-AM / i; en la columna 4 escribimos el producto de fd, y en la columna 5, escribimos los valores de fd 2, como se muestra a continuación:

Aquí, la Media Asumida es el punto medio de ci 9-11, es decir 10, por lo que las desviaciones d 's se tomaron de 10 y se dividieron por 3, la longitud de ci La fórmula para SD en el método de desviación escalonada es

donde i = longitud de los c.i,

f = frecuencia;

d = desviaciones de los puntos medios de ci 's de la media supuesta (AM) en unidades de intervalo de clase (i), que se pueden indicar:

Poniendo valores de la tabla

Los procedimientos de cálculo también se pueden establecer de la siguiente manera:

Desviación estándar combinada ( σ com b ):

Cuando dos conjuntos de puntuaciones se han combinado en un solo lote, es posible calcular la σ de la distribución total a partir de la σ de las dos distribuciones de componentes.

La fórmula es:

donde σ 1, = SD de distribución 1

σ 2 = SD de la distribución 2

d 1 = (M 1 - M comb )

d 2 = (M 2 - M comb )

N 1 = No. de casos en la distribución 1.

N 2 = No. de casos en la distribución 2.

Un ejemplo ilustrará el uso de la fórmula.

Ejemplo 14:

Supongamos que se nos dan los medios y las calificaciones estándar en una prueba de rendimiento para dos clases que difieren en tamaño, y se nos pide que busquen la o del grupo combinado.

Los datos son los siguientes:

Primero, encontramos que

La fórmula (24) se puede extender a cualquier número de distribuciones. Por ejemplo, en el caso de tres distribuciones, será

Propiedades del SD:

1. Si cada valor de variable se incrementa en el mismo valor constante, el valor de SD de la distribución permanece sin cambios:

Discutiremos este efecto sobre SD considerando una ilustración. La tabla (4.10) muestra las puntuaciones originales de 5 estudiantes en una prueba con una puntuación media aritmética de 20.

Las nuevas puntuaciones (X ') también se dan en la misma tabla que obtenemos al agregar una constante 5 a cada calificación original. Usando la fórmula para datos desagrupados, observamos que la SD de las puntuaciones sigue siendo la misma en ambas situaciones.

Por lo tanto, el valor de SD en ambas situaciones sigue siendo el mismo.

2. Cuando se resta un valor constante de cada variable, el valor de SD de la nueva distribución permanece sin cambios:

Los estudiantes también pueden examinar que cuando restamos una constante de cada puntaje, la media disminuye con la constante, pero la SD es la misma. Es debido a la razón por la que ' d ' permanece sin cambios.

3. Si cada valor observado se multiplica por un valor constante, la DE de las nuevas observaciones también se multiplicará por la misma constante:

Vamos a multiplicar cada puntaje de la distribución original (Tabla 4.10) por 5.

Por lo tanto, la desviación estándar de la nueva distribución se multiplicará por la misma constante (aquí, es 5).

4. Si cada valor observado se divide por un valor constante, la DE de las nuevas observaciones también se dividirá por la misma constante. Los alumnos pueden examinar con un ejemplo:

Por lo tanto, para concluir, la SD es independiente del cambio de origen (suma, resta) pero depende del cambio de escala (multiplicación, división).

Mediciones de dispersión relativa (coeficiente de variación):

Las medidas de dispersión nos dan una idea de hasta qué punto los puntajes se dispersan alrededor de su valor central. Por lo tanto, dos distribuciones de frecuencia que tienen los mismos valores centrales se pueden comparar directamente con la ayuda de varias medidas de dispersión.

Si, por ejemplo, en una prueba en una clase, los niños tienen una puntuación media M 1 = 60 con SD σ 1 = 15 y la puntuación media de las niñas es M 2 = 60 con SD σ 2 = 10. Claramente, las niñas que tienen una SD menor, son más consistentes en anotar alrededor de su puntaje promedio que los niños.

Tenemos situaciones en las que se deben comparar dos o más distribuciones que tienen medios desiguales o diferentes unidades de medida con respecto a su dispersión o variabilidad. Para hacer tales comparaciones usamos coeficientes de dispersión relativa o coeficiente de variaciones (CV).

La fórmula es:

(Coeficiente de variación o coeficiente de variabilidad relativa)

V da el porcentaje que σ es de la media de la prueba. Por lo tanto, es una relación que es independiente de las unidades de medida.

V está restringido en su uso debido a ciertas ambigüedades en su interpretación. Es defendible cuando se usa con escalas de relación: escalas en las que las unidades son iguales y hay un cero verdadero o un punto de referencia.

Por ejemplo, V puede usarse sin dudarlo con escalas físicas, aquellas relacionadas con magnitudes lineales, peso y tiempo.

Surgen dos casos en el uso de V con escalas de ratio:

(1) Cuando las unidades son diferentes, y

(2) cuando las M son desiguales, las unidades de la escala son las mismas.

1. Cuando las unidades son diferentes:

Ejemplo 15:

Un grupo de niños de 10 años tiene una altura media de 137 cm. Con una o de 6, 2 cm. El mismo grupo de niños tiene un peso medio de 30 kg. Con un peso de 3, 5 kg. ¿En qué rasgo es el grupo más variable?

Solución:

Obviamente, no podemos comparar centímetros y kilogramos directamente, pero podemos comparar la variabilidad relativa de las dos distribuciones en términos de V.

En el presente ejemplo, dos grupos no solo difieren con respecto a la media sino también en unidades de medida que es cm. En el primer caso y en kg. en el segundo. Se puede usar el coeficiente de variación para comparar la variabilidad de los grupos en tal situación.

Nosotros, así calculamos:

Por lo tanto, a partir del cálculo anterior, parece que estos niños son aproximadamente el doble de variables (11.67 / 4.53 = 2.58) en peso y en altura.

2. Cuando los medios son desiguales, pero las unidades de escala son iguales :

Supongamos que tenemos los siguientes datos en una prueba para un grupo de niños y un grupo de hombres:

Entonces compare:

(i) El desempeño de los dos grupos en la prueba.

(ii) La variabilidad de las puntuaciones en los dos grupos.

Solución:

(i) Dado que el puntaje promedio del grupo de niños es mayor que el de los hombres, por lo tanto, el grupo de niños ha dado un mejor desempeño de la prueba.

(ii) Para comparar dos grupos con respecto a la variabilidad entre las puntuaciones, se calculan el coeficiente de variación V de niños = 26.67 y V de hombres = 38.46.

Por lo tanto, la variabilidad de las puntuaciones es mayor en el grupo de hombres. Los estudiantes en el grupo de varones, que tienen un CV menor, son más consistentes en calificar alrededor de su puntaje promedio en comparación con el grupo de hombres.

SD y la difusión de observaciones:

En una distribución simétrica (normal),

(i) La media ± 1 SD cubre el 68.26% de los puntajes.

La media ± 2 SD cubre el 95, 44% de las puntuaciones.

La media ± 3 SD cubre el 99, 73% de las puntuaciones.

(ii) En muestras grandes (N = 500), el rango es aproximadamente 6 veces SD.

Si N es aproximadamente 100, el rango es aproximadamente 5 veces el SD.

Si N es aproximadamente 50, el rango es aproximadamente 4.5 veces el SD.

Si N es aproximadamente 20, el rango es aproximadamente 3.7 veces el SD

Interpretación de la desviación estándar:

La desviación estándar caracteriza la naturaleza de la distribución de las puntuaciones. Cuando las puntuaciones están más extendidas, la SD es mayor y cuando las puntuaciones están menos dispersas, la SD es menor. Para interpretar el valor de la medida de dispersión, debemos entender que cuanto mayor sea el valor de ' σ ', más dispersos están los puntajes de la media.

Al igual que en el caso de la desviación media, la interpretación de la desviación estándar requiere el valor de M y N para su consideración.

En los siguientes ejemplos, los valores requeridos de σ, mean y N se dan como:

Aquí, la dispersión es más en el ejemplo 2 en comparación con el ejemplo 1. Esto significa que los valores están más dispersos en el ejemplo 2, en comparación con los valores del ejemplo 1.

Méritos de SD:

1. SD está rígidamente definido y su valor es siempre definido.

2. Es la medida de dispersión más utilizada e importante. Ocupa una posición central en las estadísticas.

3. Al igual que la desviación media, se basa en todos los valores de la distribución.

4. Aquí, los signos de desviaciones no se ignoran, sino que se eliminan al cuadrar cada una de las desviaciones.

5. Es la medida maestra de la variabilidad, ya que es susceptible de tratamiento algebraico y se utiliza en el trabajo correlacional y en el análisis estadístico adicional.

6. Se ve menos afectado por las fluctuaciones del muestreo.

7. Es la medida confiable y más precisa de la variabilidad. SD siempre va con la media, que es la medida más confiable de la tendencia central.

8. Proporciona una unidad de medida estándar que posee un significado comparable de una prueba a otra. Además, la curva normal está directamente relacionada con la SD.

Limitaciones:

1. No es fácil de calcular y no es fácil de entender.

2. Da más peso a los artículos extremos y menos a los que están cerca de la media. Cuando la desviación de una puntuación extrema es cuadrada, da lugar a un valor mayor.

Usos de SD:

Se utiliza la desviación estándar:

(i) Cuando se desea la medida más precisa, confiable y estable de variabilidad.

(ii) Cuando se debe dar más peso a las desviaciones extremas de la media.

(iii) Cuando se calculan posteriormente el coeficiente de correlación y otras estadísticas.

(iv) Cuando se calculan las medidas de confiabilidad.

(v) Cuando las puntuaciones deben interpretarse correctamente con referencia a la curva normal.

(vi) Cuando se deben calcular las puntuaciones estándar.

(vii) Cuando queremos probar el significado de la diferencia entre dos estadísticas.

(viii) Cuando se calculan el coeficiente de variación, la varianza, etc.