Mostrando las entradas con la etiqueta Unidad 3. 2. Medidas de tendencia central y dispersión. Mostrar todas las entradas
Mostrando las entradas con la etiqueta Unidad 3. 2. Medidas de tendencia central y dispersión. Mostrar todas las entradas

lunes, 27 de mayo de 2019

Unidad 3. 2. Medidas de tendencia central y dispersión


Introducción.


Las medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que ayudan a saber dónde están acumulados los datos, pero sin indicar como se distribuyen. Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos. Las medidas de tendencias central más comunes son: la media aritmética, comúnmente conocida como media o promedio, la mediana y la moda.

clip_image002

Datos no agrupados (media, mediana y moda).


Con la finalidad de que las medidas de tendencia central tengan mayor valides estadística se utilizaran formulas diferentes para datos agrupados y datos no agrupados, en donde también se deben distinguir si se trabaja con una muestra o con una población.

Media.


Concepto y fórmula.


La media aritmética o simplemente, media, se denota por clip_image004 o por la letra µ según se calcule en una muestra o en la población, respectivamente. La media es el resultado de dividir la suma de todos los valores (Xi) entre el número total de datos, N para el caso de toda la población y n para el caso de una muestra.

La fórmula para calcular la media de una distribución de datos varía de acuerdo con la manera como se tienen organizados.

Fórmula para calcular la media en datos no agrupados: los datos no agrupados son aquellos que se organizan en una tabla de datos, es decir, cada valor se representa de manera individual. Las fórmulas para calcular la media son:


En una población

En una muestra.

clip_image006

clip_image008

En estas fórmulas la diferencia radica en que el total de la población se representa con la letra N y el total de la muestra con la letra n, en donde la media poblacional se denota con la letra griega “Mu” y la media muestral se presenta como “equis barra”.

Ejemplo.

Una serie de días elegidos al azar se registró el tiempo, en horas, de utilización de dos impresoras en una empresa y se obtuvieron los siguientes resultados:




Impresora I

Impresora II

1

1.9

2.5

2

2.1

2.8

3

2.6

3.3

4

2.7

3.4

5

3.2

3.6

6

3.4

4.3

7

3.8

4.6

8

4



9

4.2



10

5.2



Se requiere lo siguiente para hallar el tiempo medio de utilización de cada impresora.

Respuestas.

Para obtener la media de la impresora I se suma cada uno de los valores: 1.9+2.1+2.7+3.2+3.4+3.8+4.0+4.2+5.2 a continuación el resultado de la sumatoria es 33.1, se divide entre el número de observaciones de la muestra que es 10 y se obtiene el resultado que es 3.31. análogamente se realiza el mismo procedimiento para la impresora II y se obtiene el resultado de 3.5.

Media impresora I =3.31

Media impresora II = 3.5

Mediana.


Concepto.


La mediana (Me) es el valor que divide a la mitad la serie de datos que se tienen. Es decir, la mediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o decreciente, entonces, el número de datos que queda a la izquierda de la mediana es igual al número de datos que queda a la derecha.

Si n es impar hay un dato que queda en medio de todos, este será igual a la mediana. Si n es par hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio de esos dos datos, es decir, su suma dividida entre dos.

Ejemplos.

Para cuando la cantidad de valores de la distribución es impar

Supón que se tienen los siguientes valores: 2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9


1.      Se ordenan los valores de menor a mayor

0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9

2.      Se busca el valor del centro.

El dato que divide a la mitad es: 4, por lo tanto, la mediana Me=4

Para cuando la cantidad de valores es par

Supón que se tienen los siguientes valores: 5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1, 3, 2


1.      Se ordenan los valores de menor a mayor

1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9

2.      Se buscan los valores del centro

1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9

3.      Se promedian los valores del centro

clip_image010

Por lo tanto, Me=4.5

Moda.


Para el caso de la moda (Mo), en los datos no agrupados, la moda corresponde al valor que más se repite, si se tienen los siguientes datos:

1, 1, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7, 8, 9, 9, 9 la Moda es 4.

Datos agrupados (media, mediana y moda)


Media.


Formulas.


Fórmula para calcular la media en datos agrupados por frecuencias simples:

Los datos agrupados en frecuencias son aquellos que se organizan en una tabla de frecuencias, es decir, las tablas que contienen en una columna, el valor de la variable (Xi), y en otra columna, la frecuencia (fi) o el número de veces que se repite cada valor en una serie de datos. Para calcular la media con datos agrupados se procede a realizar la sumatoria del valor de la variable (Xi) por el valor de su frecuencia (fi) y el resultado se divide, para el caso de la población, entre N, y para el caso de la muestra, entre n.

Las fórmulas para calcular la media con los datos organizados de esta manera son:


En una población

En una muestra

clip_image012

clip_image014

Fórmula para calcular la media en datos agrupados por intervalos.

Los datos agrupados en intervalos son aquellos que se organizan dentro de un rango establecido entre un límite inferior y un límite superior. Recuerda que las tablas de intervalos muestran el número de datos que abarca cada intervalo (frecuencia por intervalo).

Las fórmulas para calcular la media con los datos organizados de esta manera son:


En una población

En una muestra

clip_image016

clip_image018

En donde debes realizar la sumatoria de cada marca de clase (Mci) por su frecuencia (fi) y el resultado se divide entre el total de elementos poblacionales – si se trata de población – o bien, entre los elementos de la muestra.

Ejemplo.

En el siguiente cuadro estadístico se presentan, mediante una distribución de frecuencias, los kilómetros recorridos por alumnos en la universidad.


# Clase

Clases



Fi

Fa

Marca de clase Mc

Mc * fi

Li

Ls

1

0.1

18

15

15

9.05

135.75

2

18.1

36

14

29

27.05

378.7

3

36.1

54

28

57

45.05

1261.4

4

54.1

72

26

83

63.05

1639.3

5

72.1

90

17

100

81.05

1377.85







100





4793.00











Media

47.93

Mediana.


Fórmula.


Cuando se quiere calcular la mediana en datos agrupados por intervalos se tiene que buscar el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, es necesario localizar el intervalo donde se encuentre N/2, para lo cual se utiliza la siguiente fórmula:


clip_image020

Li = Límite inferior del renglón en donde debe estar la mediana

Fi-1 = Frecuencia acumulada anterior al renglón de la mediana

Fi =Frecuencia del renglón de la mediana

ai = Tamaño del intervalo

Ejemplo:

Pasos para buscar la mediana.

Recuerda que la mediana representa el valor que divide a los datos en la mitad exacta, es decir, a la derecha del valor de la mediana se encuentran el 50% de los datos y a la izquierda de dicho valor se encuentra el otros 50%, por lo que para una distribución de los datos se deben seguir los siguientes pasos:


1.      Ubicar la clase de la mediana, para ello se debe buscar en que clase se encuentra:

clip_image022

2.      Ubicar en la frecuencia acumulada el dato 20

3.      Ubicar el límite inferior de la clase de la mediana que es igual a 6.63

4.      Ubicar la clase de la mediana que es igual a 12

5.      Ubicar la frecuencia acumulada anterior a la clase de la mediana es igual a 14

6.      Ubicar la amplitud de la clase que es 21

clip_image023

Sustituyendo en la fórmula de la mediana se tiene que el valor de la mediana es 6.73

Moda.


Fórmula.


La moda es el valor del dato que más veces se repite, esto es, el valor cuya frecuencia absoluta es mayor, y se denota como Mo. Algunas veces el valor que más se repite puede no ser único, es decir, puede haber dos o más datos que aparezcan con la misma frecuencia absoluta, siendo esta la mayor. En esas ocasiones se habla de poblaciones o muestra bimodales cuando existen dos modas o multimodales si existen más de dos.

Por ejemplo, si se toma una muestra de hombres y mujeres y se miden sus estaturas se tienen dos modas.

Cuando la distribución de datos es por intervalos de clase, primero se localiza el intervalo que tiene mayor frecuencia absoluta y se utiliza la siguiente fórmula para calcular la moda:


clip_image025

Fi = Frecuencia del renglón de la moda.


Fi+1 = Frecuencia posterior al renglón de la moda.


Fi-1 = Frecuencia anterior al renglón de la moda


Ai = Tamaño de intervalo



Ejemplo.

Como se mencionó con anterioridad, la moda corresponde al valor o valores, si es multimodal, que más se repiten en una distribución; para el caso de datos agrupados se deben seguir los siguientes datos, para obtener el valor de la moda.

Pasos para buscar la moda:

1.      Ubicar la clase de la moda y esta es la clase donde se tienen más datos, es decir, hay 12 datos entre 6.63 y 6.84, como puedes observar en la cuarta fila.

2.      Ubicar el límite inferior de la clase de la moda, cual es 6.63

3.      Calcular (fi – fi-1) = 12 – 7 = 5

4.      Calcular (fi – fi+1) = 12 – 8 = 4

5.      Ubicar la amplitud de la clase 21

Sustituyendo en la fórmula de la moda se tiene 6.74

Medidas de dispersión.


A diferencia de las medidas de tendencia central que miden acumulaciones mediante un solo punto, las medidas de dispersión miden el grado de separación o alejamiento que tiene una variable estadística en torno a una medida de posición o tendencia central. Dicho grado de separación indica lo representativa que es la medida de posición con respecto al conjunto total de datos. A mayor dispersión menor representatividad de la medida de posición y viceversa.

Las medidas de dispersión más comunes son: el recorrido, la varianza y la desviación estándar.

clip_image027

Datos no agrupados (varianza y desviación estándar)


Al igual que las medidas de tendencia central, las medidas de dispersión se pueden obtener a partir de datos agrupados o no agrupados y de manera análoga para datos poblacionales o bien muestrales como a continuación se mostrará.

Varianza.


La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la medida aritmética. Siempre es mayor o igual que cero y menor que infinito. Se define como la media de los cuadrados de las diferencias del valor de los datos menos la media aritmética de estos.

Las fórmulas para datos no agrupados son:


En una población

En una muestra

clip_image029

clip_image031

Para obtener la varianza se realiza la sumatoria de cada valor menos la media y se eleva al cuadrado y el resultado se divide ya sea entre el valor poblacional (N) o bien el muestral menos 1, que corresponde a: n-1

Desviación típica o estándar.


La desviación típica muestra que tan alejado esta un dato del valor de la media aritmética, es decir, la diferencia que hay entre un dato y la media aritmética. Se denota como s o σ, según se calcule en una muestra o en toda la población, respectivamente. Se define como la raíz cuadrada positiva de la varianza.

Las fórmulas de la desviación típica o estándar para datos no agrupados son:


En una población

En una muestra

clip_image033

clip_image035

Es decir que, al valor de la varianza, ya sea poblacional o muestral, se le aplica la raíz cuadrada y se obtiene la desviación típica o estándar.

Datos agrupados (varianza y desviación estándar).


Varianza para datos agrupados por intervalos.


Las fórmulas para calcular la varianza en datos agrupados por intervalos son las siguientes:


En una población

En una muestra.

clip_image037

clip_image039

En este caso se realiza la sumatoria de cada marca de clase menos la media (ya sea poblacional o muestral, según sea el caso) y se eleva al cuadrado, al final se divide entre la población o bien la muestra, según se trate.

Desviación típica o estándar en datos agrupados por intervalos.


Las fórmulas para calcular la desviación típica o estándar en datos agrupados por intervalos son las siguientes:


En una población.

En una muestra

clip_image041

clip_image043

De manera análoga al resultado de la varianza se le aplica y se obtiene la desviación estándar, ya sea para una población o bien una muestra.

Ejemplo.


6

6.25

6.5

6.65

6.75

6.75

7

7.1

6

6.25

6.5

6.7

6.75

7

7

7.15

6.25

6.5

6.5

6.7

6.75

7

7

7.15

6.25

6.5

6.5

6.75

6.75

7

7

7.25

6.25

6.5

6.65

6.75

6.75

7

7.1

7.25

Obtenga la media, la varianza y la desviación estándar.


Li

Ls

Fi

Mc

Fa

Fr

Fra

F.%

(360*Fi) / N

Fi*Mc

(Mc-Media)2*Fi

5.97

6.18

2

6.08

2

0.05

0.05

5

18

12.15

0.83

6.19

6.4

5

6.30

7

0.13

0.18

12.5

45

31.475

0.90

6.41

6.62

7

6.52

14

0.18

0.35

17.5

63

45.605

0.29

6.63

6.84

12

6.74

26

0.30

0.65

30

108

80.82

0.00

6.85

7.06

8

6.96

34

0.20

0.85

20

72

55.64

0.45

7.07

7.28

6

7.18

40

0.15

1.00

15

54

43.05

1.25



N

40









100

360

268.74

3.72

Media = 6.72

Varianza = 0.093

Desviación estándar =0.305

Unidad 2. 1. Antecedentes normativos en suelos

  Es importante conocer los sistemas normativos con respecto a la contaminación del suelo, dado que son estos los que regulan los límit...