lunes, 29 de septiembre de 2014

tablas: estadsticas, cualitativas y de frecuencia.




ESTRUCTURA DE TABLAS ESTADSTICAS: 
  1. Mostrar la diferencia entre datos de serie temporal (TS - Time Series) y datos transversales (CS - Cross-Sectional).
  2. Construir la definición de estructura de datos (Data Structure Definition):
·         Definir todos los conceptos relacionados con los datos;
·         Identificar qué conceptos son dimensiones (Dimensions) y cuáles son atributos (Attributes);
·         Declarar las medidas (Measures) y los valores que se observan;
Adjuntar o construir listas de códigos (Code Lists).


Consideremos una población estadística de n individuos, descrita según un carácter o variable C cuyas modalidades han sido agrupadas en un número k de clases, que denotamos mediante . Para cada una de las clases ci, , introducimos las siguientes magnitudes: 
http://upload.wikimedia.org/wikipedia/commons/thumb/9/95/DisNormal08.svg/360px-DisNormal08.svg.png
Frecuencia absoluta
de la clase ci es el número ni, de observaciones que presentan una modalidad perteneciente a esa clase. 

Frecuencia relativa
de la clase ci es el cociente fi, entre las frecuencias absolutas de dicha clase y el número total de observaciones, es decir 



Obsérvese que fi es el tanto por uno de observaciones que están en la clase ci. Multiplicado por $100\%$representa el porcentaje de la población que comprende esa clase.
Frecuencia absoluta acumulada
Ni, se calcula sobre variables cuantitativas o cuasicuantitativas, y es el número de elementos de la población cuya modalidad es inferior o equivalente a la modalidad ci:

\begin{displaymath}N_i = n_1+ n_2 + \dots + n_i = \sum_{j=1}^i \, n_j
\end{displaymath}



Frecuencia relativa acumulada
, Fi, se calcula sobre variables cuantitativas o cuasicuantitativas, siendo el tanto por uno de los elementos de la población que están en alguna de las clases y que presentan una modalidad inferior o igual a la ci, es decir,

\begin{displaymath}F_i = \frac{N_i}{n} = \frac{n_1 + \dots + n_i}{n} = f_1 + \dots +f_i
= \sum_{j=1}^i \, f_j
\end{displaymath}


Como todas las modalidades son exhaustivas e incompatibles ha de ocurrir que

\begin{displaymath}\sum_{i=1}^k n_i = n_1 + n_2 + \dots + n_k = n
\end{displaymath}


o lo que es lo mismo,

\begin{displaymath}\sum_{i=1}^k f_i = \sum_{i=1}^k \frac{n_i}{n} =
\frac{\sum_{i=1}^k n_i}{n} = \frac{n}{n}=1.
\end{displaymath}





Frecuencia absoluta (ni): Número de elementos que presentan la clase xi.

Frecuencia relativa: $\displaystyle f_i = n_i/N$.
Frecuencia absoluta acumulada: $\displaystyle
N_i = \sum_{j=1}^i \, n_j$.
Frecuencia relativa acumulada: $\displaystyle
F_i= N_i/N =\sum_{j=1}^i \, f_j$

Forma de construir tablas de variables cualitativas.

Distribución de frecuencias
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
igualdad
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
igualdad
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
frecuencia relativa
La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.





Forma de construir tablas de frecuencia.
1.-Agrupacion de valores
·         Agrupación de valores en clases y categorías (x): Esto se hace cuando la toma de datos contiene mucha información y no es practico escribirlo en una misma columna
·         Frecuencia de clase (f): es el numero de valores de la variables que pertenece a cada clase.

·          Composición: por edad, sexo y trabajo de una determinada población
 
2.- rango
·       Amplitud o rango (rg): en una serie de datos, constituye la diferencia entre el valor máximo (vmax) y el valor minimo(vmin) de la variable.
De acuerdo con rius et al. (1998) el rango posee las siguientes propiedades:
Ø  Es fácil de calcular y sus unidades son las mismas que las de la variable.
Ø  No utiliza todas las observaciones(solo dos de ellas)
Ø  Se puede ver muy afectada por alguna observación, o bien se queda igual. En cualquier caso nunca disminuye.
 

3.- números de clase.

Cabe mencionar que el numero de clases recomendado por algunos investigadores oscila entre 6-15.
Formula de sturges (k): sugiere un numero de clases, con las que podremos agrupar nuestros datos.
Formula                     k = 1+ 3.322 log N

4.- Tamaño o anchura de una clase.

a)      Una vez conocido el número de clases sugerido (k), se determina el ancho de clase (c) sugerido con la aplicación de las siguientes formulas:
                         C = rg/K = vmax-vmin/1+3.322 log N

5.- limites reales de clase

Ø Limites reales de clase: son números que se emplean para formar las clases. El menos de ellos se llama limite real inferior (Lri) y el mayor, el limite real superior de la clase (Lrs).

6.- Intervalo de clase.

Para agrupar los datos es necesario definir el límite inferior y superior de la clase. La diferencia entre los limites determina el intervalo.

 



7.-Marca de clase.

La marca de clase o punto medio del intervalo se obtiene sumando los límites inferiores y superiores y dividiendo por 2.




No hay comentarios:

Publicar un comentario