Introducción.
Las medidas de tendencia central son los valores que
representan un conjunto de datos de forma tal que ayudan a saber dónde
están acumulados los datos, pero sin indicar como se distribuyen. Se llaman así
porque tienden a ubicarse en la parte central del conjunto de datos. Las medidas
de tendencias central más comunes son: la media aritmética, comúnmente conocida
como media o promedio, la mediana
y la moda.
Datos no agrupados (media, mediana y moda).
Con la finalidad de que las medidas de tendencia
central tengan mayor valides estadística se utilizaran formulas diferentes para
datos agrupados y datos no agrupados, en donde también se deben distinguir si se
trabaja con una muestra o con una población.
Media.
Concepto y fórmula.
La media aritmética o simplemente, media, se denota por
o
por la letra µ
según se calcule en una muestra o en la población, respectivamente. La media es
el resultado de dividir la suma de todos los valores (Xi) entre el número total de datos, N para el caso de toda la población
y n
para el caso de una muestra.
La fórmula para calcular la media de una distribución
de datos varía de acuerdo con la manera como se tienen
organizados.
Fórmula para calcular la media en datos no agrupados:
los datos no agrupados son aquellos que se organizan en una tabla de datos, es
decir, cada valor se representa de manera individual. Las fórmulas para
calcular la media son:
En una población
|
En una muestra.
|
|
|
En estas fórmulas la diferencia radica en que el total
de la población se representa con la letra N y el total de la muestra con la
letra n,
en donde la media poblacional se denota con la letra griega “Mu” y la media
muestral se presenta como “equis barra”.
Ejemplo.
Una serie de días elegidos al azar se registró el
tiempo, en horas, de utilización de dos impresoras en una empresa y se
obtuvieron los siguientes resultados:
|
Impresora I
|
Impresora II
|
1
|
1.9
|
2.5
|
2
|
2.1
|
2.8
|
3
|
2.6
|
3.3
|
4
|
2.7
|
3.4
|
5
|
3.2
|
3.6
|
6
|
3.4
|
4.3
|
7
|
3.8
|
4.6
|
8
|
4
|
|
9
|
4.2
|
|
10
|
5.2
|
|
Se requiere lo siguiente para hallar el tiempo medio de
utilización de cada impresora.
Respuestas.
Para obtener la media de la impresora I se suma cada
uno de los valores: 1.9+2.1+2.7+3.2+3.4+3.8+4.0+4.2+5.2 a continuación el
resultado de la sumatoria es 33.1, se divide entre el número de observaciones de
la muestra que es 10 y se obtiene el resultado que es 3.31. análogamente se
realiza el mismo procedimiento para la impresora II y se obtiene el resultado de
3.5.
Media impresora I =3.31
Media impresora II = 3.5
Mediana.
Concepto.
La mediana (Me) es el valor que divide a la mitad la
serie de datos que se tienen. Es decir, la mediana queda en medio de todos los
datos cuando los acomodas ya sea en orden creciente o decreciente, entonces, el
número de datos que queda a la izquierda de la mediana es igual al número de
datos que queda a la derecha.
Si n
es impar hay un dato que queda en medio de todos, este será igual a la mediana.
Si n
es par hay dos datos que quedan en medio de todos, en este caso la mediana es el
promedio de esos dos datos, es decir, su suma dividida entre
dos.
Ejemplos.
Para cuando la cantidad de valores de la distribución
es impar
Supón que se tienen los siguientes valores: 2, 4, 0, 8,
6, 4, 7, 1, 1, 0, 8, 6, 9
1. Se ordenan los
valores de menor a mayor
|
0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8,
9
|
2. Se busca el valor del
centro.
|
El dato que divide a la mitad es: 4, por lo tanto, la
mediana Me=4
|
Para cuando la cantidad de valores es
par
Supón que se tienen los siguientes valores: 5, 7, 2, 3,
1, 6, 9, 8, 6, 4, 7, 1, 3, 2
1. Se ordenan los
valores de menor a mayor
|
1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8,
9
|
2. Se buscan los valores
del centro
|
1, 1, 2, 2, 3, 3, 4, 5, 6, 6,
7, 7, 8, 9
|
3. Se promedian los
valores del centro
|
Por lo tanto, Me=4.5
|
Moda.
Para el caso de la moda (Mo), en los datos no
agrupados, la moda corresponde al valor que más se repite, si se tienen los
siguientes datos:
1, 1, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 7, 8, 9, 9, 9
la Moda es 4.
Datos agrupados (media, mediana y moda)
Media.
Formulas.
Fórmula para calcular la media en datos agrupados por
frecuencias simples:
Los datos agrupados en frecuencias son aquellos que se
organizan en una tabla de frecuencias, es decir, las tablas que contienen en
una columna, el valor de la variable (Xi), y en otra columna, la
frecuencia (fi) o el
número de veces que se repite cada valor en una serie de datos. Para calcular la
media con datos agrupados se procede a realizar la sumatoria del valor de la
variable (Xi)
por el valor de su frecuencia (fi)
y el resultado se divide, para el caso de la población, entre N, y para el caso de la muestra,
entre n.
Las fórmulas para calcular la media con los datos
organizados de esta manera son:
En una población
|
En una muestra
|
|
|
Fórmula para calcular la media en datos agrupados por
intervalos.
Los datos agrupados en intervalos son aquellos que se
organizan dentro de un rango establecido entre un límite inferior y un límite
superior. Recuerda que las tablas de intervalos muestran el número de datos que
abarca cada intervalo (frecuencia por intervalo).
Las fórmulas para calcular la media con los datos
organizados de esta manera son:
En una población
|
En una muestra
|
|
|
En donde debes realizar la sumatoria de cada marca de
clase (Mci)
por su frecuencia (fi) y el
resultado se divide entre el total de elementos poblacionales – si se trata de
población – o bien, entre los elementos de la
muestra.
Ejemplo.
En el siguiente cuadro estadístico se presentan,
mediante una distribución de frecuencias, los kilómetros recorridos por alumnos
en la universidad.
#
Clase
|
Clases
|
|
Fi
|
Fa
|
Marca de
clase Mc
|
Mc *
fi
|
Li
|
Ls
| |||||
1
|
0.1
|
18
|
15
|
15
|
9.05
|
135.75
|
2
|
18.1
|
36
|
14
|
29
|
27.05
|
378.7
|
3
|
36.1
|
54
|
28
|
57
|
45.05
|
1261.4
|
4
|
54.1
|
72
|
26
|
83
|
63.05
|
1639.3
|
5
|
72.1
|
90
|
17
|
100
|
81.05
|
1377.85
|
|
|
|
100
|
|
|
4793.00
|
|
|
|
|
|
Media
|
47.93
|
Mediana.
Fórmula.
Cuando se quiere calcular la mediana en datos agrupados
por intervalos se tiene que buscar el intervalo donde la frecuencia acumulada
llega hasta la mitad de la suma de las frecuencias absolutas, es decir, es
necesario localizar el intervalo donde se encuentre N/2, para lo
cual se utiliza la siguiente fórmula:
|
Li
= Límite inferior del renglón en
donde debe estar la mediana
|
Fi-1 =
Frecuencia acumulada anterior al renglón de la
mediana
| |
Fi
=Frecuencia del renglón de la mediana
| |
ai = Tamaño
del intervalo
|
Ejemplo:
Pasos para buscar la
mediana.
Recuerda que la mediana representa el valor que divide
a los datos en la mitad exacta, es decir, a la derecha del valor de la mediana
se encuentran el 50% de los datos y a la izquierda de dicho valor se encuentra
el otros 50%, por lo que para una distribución de los datos se deben seguir los
siguientes pasos:
1. Ubicar la clase de la
mediana, para ello se debe buscar en que clase se
encuentra:
|
2. Ubicar en la
frecuencia acumulada el dato 20
|
3. Ubicar el límite
inferior de la clase de la mediana que es igual a
6.63
|
4. Ubicar la clase de la
mediana que es igual a 12
|
5. Ubicar la frecuencia
acumulada anterior a la clase de la mediana es igual a
14
|
6. Ubicar la amplitud de
la clase que es 21
|
Sustituyendo en la fórmula de la mediana se tiene que
el valor de la mediana es 6.73
Moda.
Fórmula.
La moda es el valor del dato que más veces se repite,
esto es, el valor cuya frecuencia absoluta es mayor, y se denota como Mo. Algunas veces el valor que más
se repite puede no ser único, es decir, puede haber dos o más datos que
aparezcan con la misma frecuencia absoluta, siendo esta la mayor. En esas
ocasiones se habla de poblaciones o muestra bimodales cuando existen dos modas o
multimodales si existen más de dos.
Por ejemplo, si se toma una muestra de hombres y
mujeres y se miden sus estaturas se tienen dos modas.
Cuando la distribución de datos es por intervalos de
clase, primero se localiza el intervalo que tiene mayor frecuencia absoluta y se
utiliza la siguiente fórmula para calcular la moda:
|
Fi =
Frecuencia del renglón de la moda.
|
|
Fi+1 =
Frecuencia posterior al renglón de la moda.
|
||
Fi-1 =
Frecuencia anterior al renglón de la moda
|
||
Ai = Tamaño
de intervalo
|
||
Ejemplo.
Como se mencionó con anterioridad, la moda corresponde
al valor o valores, si es multimodal, que más se repiten en una distribución;
para el caso de datos agrupados se deben seguir los siguientes datos, para
obtener el valor de la moda.
Pasos para buscar la moda:
1. Ubicar la clase de la
moda y esta es la clase donde se tienen más datos, es decir, hay 12 datos entre
6.63 y 6.84, como puedes observar en la cuarta fila.
2. Ubicar el límite
inferior de la clase de la moda, cual es 6.63
4. Calcular
(fi
– fi+1)
= 12 – 8 = 4
5. Ubicar la amplitud de
la clase 21
Sustituyendo en la fórmula de la moda se tiene
6.74
Medidas de dispersión.
A diferencia de las medidas de tendencia central que
miden acumulaciones mediante un solo punto, las medidas de dispersión miden el
grado de separación o alejamiento que tiene una variable estadística en torno a
una medida de posición o tendencia central. Dicho grado de separación indica lo
representativa que es la medida de posición con respecto al conjunto total de
datos. A mayor dispersión menor representatividad de la medida de posición y
viceversa.
Las medidas de dispersión más comunes son: el
recorrido, la varianza y la desviación estándar.
Datos no agrupados (varianza y desviación estándar)
Al igual que las medidas de tendencia central, las
medidas de dispersión se pueden obtener a partir de datos agrupados o no
agrupados y de manera análoga para datos poblacionales o bien muestrales como a
continuación se mostrará.
Varianza.
La varianza mide la mayor o menor dispersión de los
valores de la variable respecto a la medida aritmética. Siempre es mayor o igual
que cero y menor que infinito. Se define como la media de los cuadrados de las
diferencias del valor de los datos menos la media aritmética de
estos.
Las fórmulas para datos no agrupados
son:
En una población
|
En una muestra
|
|
|
Para obtener la varianza se realiza la sumatoria de
cada valor menos la media y se eleva al cuadrado y el resultado se divide ya sea
entre el valor poblacional (N) o bien el muestral menos 1, que corresponde a:
n-1
Desviación típica o estándar.
La desviación típica muestra que tan alejado esta un
dato del valor de la media aritmética, es decir, la diferencia que hay entre un
dato y la media aritmética. Se denota como s o σ,
según se calcule en una muestra o en toda la población, respectivamente. Se
define como la raíz cuadrada positiva de la varianza.
Las fórmulas de la desviación típica o estándar para
datos no agrupados son:
En una población
|
En una muestra
|
|
|
Es decir que, al valor de la varianza, ya sea
poblacional o muestral, se le aplica la raíz cuadrada y se obtiene la desviación
típica o estándar.
Datos agrupados (varianza y desviación estándar).
Varianza para datos agrupados por intervalos.
Las fórmulas para calcular la varianza en datos
agrupados por intervalos son las siguientes:
En una población
|
En una muestra.
|
|
|
En este caso se realiza la sumatoria de cada marca de
clase menos la media (ya sea poblacional o muestral, según sea el caso) y se
eleva al cuadrado, al final se divide entre la población o bien la muestra,
según se trate.
Desviación típica o estándar en datos agrupados por intervalos.
Las fórmulas para calcular la desviación típica o
estándar en datos agrupados por intervalos son las
siguientes:
En una población.
|
En una muestra
|
|
|
De manera análoga al resultado de la varianza se le
aplica y se obtiene la desviación estándar, ya sea para una población o bien una
muestra.
Ejemplo.
6
|
6.25
|
6.5
|
6.65
|
6.75
|
6.75
|
7
|
7.1
|
6
|
6.25
|
6.5
|
6.7
|
6.75
|
7
|
7
|
7.15
|
6.25
|
6.5
|
6.5
|
6.7
|
6.75
|
7
|
7
|
7.15
|
6.25
|
6.5
|
6.5
|
6.75
|
6.75
|
7
|
7
|
7.25
|
6.25
|
6.5
|
6.65
|
6.75
|
6.75
|
7
|
7.1
|
7.25
|
Obtenga la media, la varianza y la desviación
estándar.
Li
|
Ls
|
Fi
|
Mc
|
Fa
|
Fr
|
Fra
|
F.%
|
(360*Fi) /
N
|
Fi*Mc
|
(Mc-Media)2*Fi
|
5.97
|
6.18
|
2
|
6.08
|
2
|
0.05
|
0.05
|
5
|
18
|
12.15
|
0.83
|
6.19
|
6.4
|
5
|
6.30
|
7
|
0.13
|
0.18
|
12.5
|
45
|
31.475
|
0.90
|
6.41
|
6.62
|
7
|
6.52
|
14
|
0.18
|
0.35
|
17.5
|
63
|
45.605
|
0.29
|
6.63
|
6.84
|
12
|
6.74
|
26
|
0.30
|
0.65
|
30
|
108
|
80.82
|
0.00
|
6.85
|
7.06
|
8
|
6.96
|
34
|
0.20
|
0.85
|
20
|
72
|
55.64
|
0.45
|
7.07
|
7.28
|
6
|
7.18
|
40
|
0.15
|
1.00
|
15
|
54
|
43.05
|
1.25
|
|
N
|
40
|
|
|
|
|
100
|
360
|
268.74
|
3.72
|
Media = 6.72
Varianza = 0.093
Desviación estándar =0.305