Introducción.
Las medidas de tendencia central son los valores que
 representan un conjunto de datos de forma tal que ayudan a saber dónde 
están acumulados los datos, pero sin indicar como se distribuyen. Se llaman así 
porque tienden a ubicarse en la parte central del conjunto de datos. Las medidas 
de tendencias central más comunes son: la media aritmética, comúnmente conocida 
como media o promedio, la mediana
 y la moda.
Datos no agrupados (media, mediana y moda).
Con la finalidad de que las medidas de tendencia 
central tengan mayor valides estadística se utilizaran formulas diferentes para 
datos agrupados y datos no agrupados, en donde también se deben distinguir si se
 trabaja con una muestra o con una población.
Media.
Concepto y fórmula.
La media aritmética o simplemente, media, se denota por 
 o 
por la letra µ 
según se calcule en una muestra o en la población, respectivamente. La media es 
el resultado de dividir la suma de todos los valores (Xi) entre el número total de datos, N para el caso de toda la población 
y n 
para el caso de una muestra.
 o 
por la letra µ 
según se calcule en una muestra o en la población, respectivamente. La media es 
el resultado de dividir la suma de todos los valores (Xi) entre el número total de datos, N para el caso de toda la población 
y n 
para el caso de una muestra.
La fórmula para calcular la media de una distribución 
de datos varía de acuerdo con la manera como se tienen 
organizados.
Fórmula para calcular la media en datos no agrupados: 
los datos no agrupados son aquellos que se organizan en una tabla de datos, es
 decir, cada valor se representa de manera individual. Las fórmulas para 
calcular la media son:
  
 
   
  | 
En una población | 
En una muestra. | 
|  |  | 
En estas fórmulas la diferencia radica en que el total 
de la población se representa con la letra N y el total de la muestra con la
 letra n, 
en donde la media poblacional se denota con la letra griega “Mu” y la media 
muestral se presenta como “equis barra”.
Ejemplo.
Una serie de días elegidos al azar se registró el 
tiempo, en horas, de utilización de dos impresoras en una empresa y se 
obtuvieron los siguientes resultados:
  
 
                              
  |  | 
Impresora I | 
Impresora II | 
| 
1 | 
1.9 | 
2.5 | 
| 
2 | 
2.1 | 
2.8 | 
| 
3 | 
2.6 | 
3.3 | 
| 
4 | 
2.7 | 
3.4 | 
| 
5 | 
3.2 | 
3.6 | 
| 
6 | 
3.4 | 
4.3 | 
| 
7 | 
3.8 | 
4.6 | 
| 
8 | 
4 |  | 
| 
9 | 
4.2 |  | 
| 
10 | 
5.2 |  | 
Se requiere lo siguiente para hallar el tiempo medio de 
utilización de cada impresora.
Respuestas.
Para obtener la media de la impresora I se suma cada 
uno de los valores: 1.9+2.1+2.7+3.2+3.4+3.8+4.0+4.2+5.2 a continuación el 
resultado de la sumatoria es 33.1, se divide entre el número de observaciones de 
la muestra que es 10 y se obtiene el resultado que es 3.31. análogamente se 
realiza el mismo procedimiento para la impresora II y se obtiene el resultado de 
3.5.
Media impresora I =3.31
Media impresora II = 3.5
Mediana.
Concepto.
La mediana (Me) es el valor que divide a la mitad la 
serie de datos que se tienen. Es decir, la mediana queda en medio de todos los 
datos cuando los acomodas ya sea en orden creciente o decreciente, entonces, el 
número de datos que queda a la izquierda de la mediana es igual al número de 
datos que queda a la derecha.
Si n 
es impar hay un dato que queda en medio de todos, este será igual a la mediana. 
Si n 
es par hay dos datos que quedan en medio de todos, en este caso la mediana es el 
promedio de esos dos datos, es decir, su suma dividida entre 
dos.
Ejemplos.
Para cuando la cantidad de valores de la distribución 
es impar
Supón que se tienen los siguientes valores: 2, 4, 0, 8, 
6, 4, 7, 1, 1, 0, 8, 6, 9
  
 
   
  | 
1.      Se ordenan los 
valores de menor a mayor | 
0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8,  8, 
9 | 
| 
2.      Se busca el valor del 
centro. | 
El dato que divide a la mitad es:  4, por lo tanto, la 
mediana Me=4 | 
Para cuando la cantidad de valores es 
par
Supón que se tienen los siguientes valores: 5, 7, 2, 3, 
1, 6, 9, 8, 6, 4, 7, 1, 3, 2
  
 
      
  | 
1.      Se ordenan los 
valores de menor a mayor | 
1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7,  7, 8, 
9 | 
| 
2.      Se buscan los valores 
del centro | 
1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 
7, 7, 8,  9 | 
| 
3.      Se promedian los 
valores del centro | 
Por lo tanto, Me=4.5 | 
Moda.
Para el caso de la moda (Mo), en los datos no 
agrupados, la moda corresponde al valor que más se repite, si se tienen los 
siguientes datos:
1, 1, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7, 8, 9, 9, 9 
la Moda es 4.
Datos agrupados (media, mediana y moda)
Media.
Formulas.
Fórmula para calcular la media en datos agrupados por
 frecuencias simples:
Los datos agrupados en frecuencias son aquellos que se
 organizan en una tabla de frecuencias, es decir, las tablas que contienen en 
una columna, el valor de la variable (Xi), y en otra columna, la 
frecuencia (fi) o el 
número de veces que se repite cada valor en una serie de datos. Para calcular la 
media con datos agrupados se procede a realizar la sumatoria del valor de la 
variable (Xi)
 por el valor de su frecuencia (fi) 
y el resultado se divide, para el caso de la población, entre N, y para el caso de la muestra, 
entre n.
Las fórmulas para calcular la media con los datos
 organizados de esta manera son:
  
 
   
  | 
En  una población | 
En  una muestra | 
|  |  | 
Fórmula para calcular la media en datos agrupados por
 intervalos.
Los datos agrupados en intervalos son aquellos que se
 organizan dentro de un rango establecido entre un límite inferior y un límite 
superior. Recuerda que las tablas de intervalos muestran el número de datos que 
abarca cada intervalo (frecuencia por intervalo).
Las fórmulas para calcular la media con los datos 
organizados de esta manera son:
  
 
   
  | 
En  una población | 
En  una muestra | 
|  |  | 
En donde debes realizar la sumatoria de cada marca de 
clase (Mci) 
por su frecuencia (fi) y el 
resultado se divide entre el total de elementos poblacionales – si se trata de 
población – o bien, entre los elementos de la 
muestra.
Ejemplo.
En el siguiente cuadro estadístico se presentan, 
mediante una distribución de frecuencias, los kilómetros recorridos por alumnos 
en la universidad.
  
                         
  | 
# 
Clase | 
Clases |  | 
Fi | 
Fa | 
Marca de 
clase Mc | 
Mc * 
fi | 
| 
Li | 
Ls | |||||
| 
1 | 
0.1 | 
18 | 
15 | 
15 | 
9.05 | 
135.75 | 
| 
2 | 
18.1 | 
36 | 
14 | 
29 | 
27.05 | 
378.7 | 
| 
3 | 
36.1 | 
54 | 
28 | 
57 | 
45.05 | 
1261.4 | 
| 
4 | 
54.1 | 
72 | 
26 | 
83 | 
63.05 | 
1639.3 | 
| 
5 | 
72.1 | 
90 | 
17 | 
100 | 
81.05 | 
1377.85 | 
|  |  |  | 
100 |  |  | 
4793.00 | 
|  |  |  |  |  | 
Media | 
47.93 | 
Mediana.
Fórmula.
Cuando se quiere calcular la mediana en datos agrupados 
por intervalos se tiene que buscar el intervalo donde la frecuencia acumulada 
llega hasta la mitad de la suma de las frecuencias absolutas, es decir, es 
necesario localizar el intervalo donde se encuentre N/2, para lo
 cual se utiliza la siguiente fórmula:
  
 
         
  |  | 
Li   
= Límite inferior del renglón en 
donde debe estar la mediana | 
| 
Fi-1  = 
Frecuencia acumulada anterior al renglón de la 
mediana | |
| 
Fi  
=Frecuencia del renglón de la mediana | |
| 
ai  = Tamaño 
del intervalo | 
Ejemplo:
Pasos para buscar la 
mediana.
Recuerda que la mediana representa el valor que divide 
a los datos en la mitad exacta, es decir, a la derecha del valor de la mediana 
se encuentran el 50% de los datos y a la izquierda de dicho valor se encuentra 
el otros 50%, por lo que para una distribución de los datos se deben seguir los
 siguientes pasos:
  
 
               
  | 
1.      Ubicar la clase de la 
mediana, para ello se  debe buscar en que clase se 
encuentra: | 
| 
2.      Ubicar en la 
frecuencia acumulada el dato 20 | 
| 
3.      Ubicar el límite 
inferior de la clase de la  mediana que es igual a 
6.63 | 
| 
4.      Ubicar la clase de la 
mediana que es igual a  12 | 
| 
5.      Ubicar la frecuencia 
acumulada anterior a la  clase de la mediana es igual a 
14 | 
| 
6.      Ubicar la amplitud de 
la clase que es 21 | 
Sustituyendo en la fórmula de la mediana se tiene que 
el valor de la mediana es 6.73
Moda.
Fórmula.
La moda es el valor del dato que más veces se repite, 
esto es, el valor cuya frecuencia absoluta es mayor, y se denota como Mo. Algunas veces el valor que más 
se repite puede no ser único, es decir, puede haber dos o más datos que 
aparezcan con la misma frecuencia absoluta, siendo esta la mayor. En esas 
ocasiones se habla de poblaciones o muestra bimodales cuando existen dos modas o 
multimodales si existen más de dos.
Por ejemplo, si se toma una muestra de hombres y 
mujeres y se miden sus estaturas se tienen dos modas.
Cuando la distribución de datos es por intervalos de 
clase, primero se localiza el intervalo que tiene mayor frecuencia absoluta y se
 utiliza la siguiente fórmula para calcular la moda:
  
 
                 |  | 
Fi  = 
Frecuencia del renglón de la moda. | |
| 
Fi+1  = 
Frecuencia posterior al renglón de la moda. | ||
| 
Fi-1  = 
Frecuencia anterior al renglón de la moda | ||
| 
Ai  = Tamaño 
de intervalo | ||
Ejemplo.
Como se mencionó con anterioridad, la moda corresponde 
al valor o valores, si es multimodal, que más se repiten en una distribución; 
para el caso de datos agrupados se deben seguir los siguientes datos, para 
obtener el valor de la moda.
Pasos para buscar la moda:
1.      Ubicar la clase de la 
moda y esta es la clase donde se tienen más datos, es decir, hay 12 datos entre 
6.63 y 6.84, como puedes observar en la cuarta fila.
2.      Ubicar el límite 
inferior de la clase de la moda, cual es 6.63
4.      Calcular 
(fi 
– fi+1) 
= 12 – 8 = 4
5.      Ubicar la amplitud de 
la clase 21
Sustituyendo en la fórmula de la moda se tiene 
6.74
Medidas de dispersión.
A diferencia de las medidas de tendencia central que 
miden acumulaciones mediante un solo punto, las medidas de dispersión miden el 
grado de separación o alejamiento que tiene una variable estadística en torno a 
una medida de posición o tendencia central. Dicho grado de separación indica lo
 representativa que es la medida de posición con respecto al conjunto total de 
datos. A mayor dispersión menor representatividad de la medida de posición y 
viceversa.
Las medidas de dispersión más comunes son: el 
recorrido, la varianza y la desviación estándar.
Datos no agrupados (varianza y desviación estándar)
Al igual que las medidas de tendencia central, las 
medidas de dispersión se pueden obtener a partir de datos agrupados o no 
agrupados y de manera análoga para datos poblacionales o bien muestrales como a 
continuación se mostrará.
Varianza.
La varianza mide la mayor o menor dispersión de los 
valores de la variable respecto a la medida aritmética. Siempre es mayor o igual 
que cero y menor que infinito. Se define como la media de los cuadrados de las
 diferencias del valor de los datos menos la media aritmética de 
estos.
Las fórmulas para datos no agrupados 
son:
  
 
   
  | 
En  una población | 
En  una muestra | 
|  |  | 
Para obtener la varianza se realiza la sumatoria de 
cada valor menos la media y se eleva al cuadrado y el resultado se divide ya sea
 entre el valor poblacional (N) o bien el muestral menos 1, que corresponde a:
 n-1
Desviación típica o estándar.
La desviación típica muestra que tan alejado esta un 
dato del valor de la media aritmética, es decir, la diferencia que hay entre un 
dato y la media aritmética. Se denota como s o σ, 
según se calcule en una muestra o en toda la población, respectivamente. Se 
define como la raíz cuadrada positiva de la varianza.
Las fórmulas de la desviación típica o estándar para 
datos no agrupados son:
  
 
   
  | 
En  una población | 
En  una muestra | 
|  |  | 
Es decir que, al valor de la varianza, ya sea 
poblacional o muestral, se le aplica la raíz cuadrada y se obtiene la desviación 
típica o estándar.
Datos agrupados (varianza y desviación estándar).
Varianza para datos agrupados por intervalos.
Las fórmulas para calcular la varianza en datos 
agrupados por intervalos son las siguientes:
  
 
   
  | 
En  una población | 
En  una muestra. | 
|  |  | 
En este caso se realiza la sumatoria de cada marca de 
clase menos la media (ya sea poblacional o muestral, según sea el caso) y se 
eleva al cuadrado, al final se divide entre la población o bien la muestra, 
según se trate.
Desviación típica o estándar en datos agrupados por intervalos.
Las fórmulas para calcular la desviación típica o 
estándar en datos agrupados por intervalos son las 
siguientes:
  
 
   
  | 
En  una población. | 
En  una muestra | 
|  |  | 
De manera análoga al resultado de la varianza se le 
aplica y se obtiene la desviación estándar, ya sea para una población o bien una
 muestra.
Ejemplo.
  
 
            
  | 
6 | 
6.25 | 
6.5 | 
6.65 | 
6.75 | 
6.75 | 
7 | 
7.1 | 
| 
6 | 
6.25 | 
6.5 | 
6.7 | 
6.75 | 
7 | 
7 | 
7.15 | 
| 
6.25 | 
6.5 | 
6.5 | 
6.7 | 
6.75 | 
7 | 
7 | 
7.15 | 
| 
6.25 | 
6.5 | 
6.5 | 
6.75 | 
6.75 | 
7 | 
7 | 
7.25 | 
| 
6.25 | 
6.5 | 
6.65 | 
6.75 | 
6.75 | 
7 | 
7.1 | 
7.25 | 
Obtenga la media, la varianza y la desviación 
estándar.
  
                      
  | 
Li | 
Ls | 
Fi | 
Mc | 
Fa | 
Fr | 
Fra | 
F.% | 
(360*Fi) / 
N | 
Fi*Mc | 
(Mc-Media)2*Fi | 
| 
5.97 | 
6.18 | 
2 | 
6.08 | 
2 | 
0.05 | 
0.05 | 
5 | 
18 | 
12.15 | 
0.83 | 
| 
6.19 | 
6.4 | 
5 | 
6.30 | 
7 | 
0.13 | 
0.18 | 
12.5 | 
45 | 
31.475 | 
0.90 | 
| 
6.41 | 
6.62 | 
7 | 
6.52 | 
14 | 
0.18 | 
0.35 | 
17.5 | 
63 | 
45.605 | 
0.29 | 
| 
6.63 | 
6.84 | 
12 | 
6.74 | 
26 | 
0.30 | 
0.65 | 
30 | 
108 | 
80.82 | 
0.00 | 
| 
6.85 | 
7.06 | 
8 | 
6.96 | 
34 | 
0.20 | 
0.85 | 
20 | 
72 | 
55.64 | 
0.45 | 
| 
7.07 | 
7.28 | 
6 | 
7.18 | 
40 | 
0.15 | 
1.00 | 
15 | 
54 | 
43.05 | 
1.25 | 
|  | 
N | 
40 |  |  |  |  | 
100 | 
360 | 
268.74 | 
3.72 | 
Media = 6.72
Varianza = 0.093
Desviación estándar =0.305
 
No hay comentarios.:
Publicar un comentario