Para organizar una gran cantidad de datos es muy útil agruparlos o distribuirlos en categorías o clases y determinar la cantidad de datos que hay en cada clase.
Definición
Una distribución de frecuencias o tabla de frecuencias es un agrupamiento de datos en clases mutuamente excluyentes (cuando dos o más eventos no pueden suceder al mismo tiempo) que muestra el número de observaciones en cada clase.
Construcción de una distribución de frecuencia cuantitativa
Vamos a explicar la forma de construir una distribución de frecuencias a partir del siguiente ejemplo:
Los datos siguientes corresponden a los pesos en kilogramos de ochenta personas:
Obténgase una tabla de distribución de datos.
Numero de datos:
Es la cantidad de observaciones de una muestra, la denotamos con la letra $n$:
En este ejemplo:
$n=80$
Rango
Determinar el rango de variación de los datos, Es el intervalo entre el valor máximo y el valor mínimo, con las mismas unidades de medición que los datos. Se define por:
$$R=\ {Valor}_{maximo}-{Valor}_{minimo}$$
$$ Valor\ máximo=83$$
$$ Valor\ mínimo=52$$
$$ R=83-52=31$$
Cantidad de clases:
Determinar el número de intervalos o clases, $k$, en las que se van a dividir el conjunto de los datos, Recomendación, elegir no más de 20 y más de 5 intervalos.
Se calcula con el entero más cercano (de preferencia el mayor) a:
$$ k=\sqrt n$$
$$ k=\log_2{\left(n\right)}$$
O con la formula conocida como Regla de sturges:
$$ k=1+\frac{10}{3}\times\log_{10}{\left(n\right)}$$
$$ k=1+\frac{10}{3}\times\log_{10}{80}=7.34 $$
$k=8$
Intervalo de clase:
Indica el número de datos que conforman cada intervalo, es la diferencia entre las fronteras superior e inferior de cada clase, se le conoce también como amplitud de clase, tamaño de clase, longitud de clase o anchura de clase.
Se calcula aplicando la siguiente regla:
$$i=\frac{R}{k}=\frac{{\rm Valor}_{max}-{\rm Valor}_{min}}{1+\frac{10}{3}\times{log}_{10}{(n)}}$$
$$i=\frac{31}{8}=3.875$$
Como los datos en este ejemplo son números enteros, redondearemos a $i=4$
Límites de clase
Son los valores que definen una clase, el valor donde inicia se llama límite inferior $(L_i)$ y el valor donde termina se llama límite superior $(L_s)$. La primera clase debe iniciar con un valor igual o menor que el dato más pequeño del conjunto de observaciones
Como estamos hablando de intervalos podemos aplicar la notación de paréntesis, y corchetes. Usamos corchetes $[ ]$ para indicar que el valor de ese extremo está incluido en el intervalo y paréntesis $( )$ cuando el valor se acerca, pero no incluye el valor de ese extremo.
Entonces empezamos a armar los intervalos: Comenzamos con el valor mínimo y le vamos sumando el intervalo de clase, el Límite inferior de cada intervalo está incluido dentro del intervalo, pero el límite superior no se incluye a excepción del último que si está dentro del intervalo.
El cómo se acomode depende de quien este armando la distribución
Marcas de clase (x):
Son los puntos medios de cada clase, se calculan sumando los límites de clase y dividiendo entre dos
$$X_i=\frac{{\rm Lim}_{inf}+{\rm Lim}_{sup}}{2}$$
Frecuencia absoluta
Ahora se deben distribuir los datos en las clases correspondientes, puede hacerse contando el número de datos incluidos en cada clase, el valor obtenido se llama frecuencia de clase o frecuencia absoluta. La representamos con la letra $f$ minúscula.
Frecuencias relativas y porcentajes
Cuando se desea conocer el porcentaje que representan las frecuencias de cada una de las clases de una distribución, es útil transformar las frecuencias absolutas a frecuencias relativas. Para realizar la conversión se hace la relación indicada por la formula siguiente:
Frecuencia relativa de una clase:
$$Frecuencia\ relativa=\ \frac{Frecuencia\ de\ la\ clase}{n}$$
Para expresar como porcentaje:
$$Frecuencia\ porcentual=Frecuencia\ relativa\ \times100$$
Frecuencia acumulada:
Es la función que representa las sumas de las frecuencias por clase, y se simboliza por $F$ Mayúscula
Frecuencia relativa acumulada:
La función que representa la suma de las frecuencias relativas por clases, la simbolizaremos con $Fr$.
Para calcular estos valores solo tenemos que ir sumando el valor de cada frecuencia de clase con la suma de las frecuencias de las clases anteriores
Con esto hemos construido una distribución de frecuencias.
No hay comentarios.:
Publicar un comentario