Anda di halaman 1dari 12

ANALISIS DESCRIPTIVO DE LOS DATOS Te invito a compartir estos conceptos: Qu es dato estadstico? Cmo se clasifican los datos estadsticos?

Qu es una distribucin de frecuencias? Toda investigacin ya sea censo, encuesta, registro continuo se obtienen datos o informaciones, dando origen como se mostr en el tema anterior a dos tipos de variables: cualitativas (atributo) y cuantitativas (dentro de estas discretas y continuas). Para que los datos sean tiles, necesitamos organizar nuestras observaciones de modo que podamos distinguir patrones y llegar a conclusiones lgicas, para esto, elaboramos las Tablas de Frecuencias que nos permiten agrupar y clasificar datos para determinar la frecuencia con que se repite el atributo o el valor que toma una variable, si las observaciones se enumeran de modo desorganizado la vamos a denominar datos no agrupados. Distribucin de frecuencias: consiste en agrupar los datos a travs de clases y frecuencias, o mas bien, ordenarlo en intervalo de clases indicando el numero de datos comprendido en cada clase, adems, con este mtodo podemos estudiar el comportamiento de un conjunto de datos. Podemos utilizar tablas de frecuencias cuando: a) Organizamos los datos que provienen de una Encuesta b) Presentamos las calificaciones obtenidas en X estudiantes de la carrera de Mercadeo c) Presentamos los resultados para los Partidos Polticos en las elecciones d) Clasificamos las edades de una poblacin e) Clasificamos el peso en libras de una poblacin de estudiantes f) Organizamos los sueldos y salarios de los empleados de una empresa g) Organizamos una poblacin por gnero h) Presentamos los municipios del pas, por Regin i) Elaboramos las cuentas por cobrar de una compaa j) Cuando presentamos la matricula por carrera en la Universidad, entre otras. Caractersticas de una distribucin de frecuencias: 1- Toda tabla de frecuencias debe estar titulada.
1

2- Las clases deben ser mutuamente excluyente, es decir un dato solo puedo formar parte de una sola clase. 3- Las clases deben ser exhaustivas, quiere decir que todos los datos deben estar dentro de algunas de las clases de la distribucin. 4- Las clases deben tener la misma amplitud o intervalos de clases iguales. 5- La cantidad de clases a utilizar es un proceso subjetivo, por lo que se recomiendo de 5 a 15 clases para evitar que algunas caractersticas importantes de los datos queden ocultas, o por el contrario se queden sin valor cuando existen demasiadas clases. 6- El intervalo y el nmero de clase deben ser variables discretas, es decir un nmero entero. 7- Si es posible evitamos clases abiertas.

Trminos a utilizar en una distribucin de frecuencias para variables cualitativas o atributo: N= numero de datos u observaciones. Frecuencia Simple de clase: es el nmero de veces que se repite cada clase, se identifica como fi. Frecuencia Relativa simple: Es el cociente de dividir la frecuencia simple (fi) de clase por el total de observaciones N. Se identifica como fr minscula fr= observaciones Veamos el siguiente ejemplo: Se les pregunta a 30 empleados de una empresa cual es su estado civil segn sexo obteniendo las siguientes informaciones: Casado Casado Soltero
Viudo

fi/n=frecuencia

simple

de

clase/nmero

total

de

Casado Soltero Soltero


Unin Libre

Casado Divorciado Casado


Soltero

Casado

Casado

Divorciado Divorciado Soltero


Unin Libre

Unin Libre
Unin Libre

Unin Libre Casado

Divorciado Viudo

Divorciado Viudo

Divorciado Divorciado Casado Unin Libre

Es evidente que estas caractersticas son cualitativas o de atributos y la construccin de esta tabla de frecuencias es sencilla ya que slo se cuantifica mediante conteo el nmero de veces que se repita la caracterstica investigada. Veamos: Casado Casado Soltero Casado Soltero Soltero Casado Divorciado Casado Casado Casado

Divorciado Divorciado Soltero Unin Unin Libre

Viudo Unin Libre Casado

Unin Libre Divorciado Viudo

Soltero Divorciado Viudo

Libre

Unin Libre

Divorciado Divorciado Casado Unin Libre

fi (no.de Estado Civil empleados)

fr 9 30 = 0.30 5 30 = 0.17 6 30 = 0.20 3 30 = 0.10 7 30 = 0.23 = 1.00

% 0.30 * 100 = 30% 0.17 * 100 = 17% 0.20 * 100 = 20% 0.10 * 100 = 10% 0.23 * 100 = 23% = 100%

Casado Soltero Unin libre Viudo Divorciado Total

9 5 6 3 7 30

El nmero de empleados de cada atributo es la frecuencia absoluta (fi), donde podemos ver que 5 de los 30 empleados son solteros. Sin embargo como 30 es el nmero de muestras y asumiendo que estas muestras son representativas de la poblacin, podemos afirmar que el 17% de los empleados de la empresa son solteros y as sucesivamente para cada caracterstica. Distribucin de frecuencias para variables cuantitativas: Los Trminos tomados en cuenta para la elaboracin de una tabla de

distribucin de frecuencia para variables cuantitativas son: Frecuencia Simple de clase: es el nmero de veces que se repite cada clase, se identifica como fi, donde f es la frecuencia e (i) define el orden de las clases
3

Frecuencia Relativa simple: Es el cociente de dividir la frecuencia simple de clase por el total de observaciones. Se identifica como fr fr= fi/n=frecuencia simple de clase dividido por el nmero total de

observaciones Frecuencia acumulada simple: Se identifica como Fi, se obtiene a travs de la suma sucesiva de la frecuencia simple partiendo de la frecuencia simple uno (1), la ltima frecuencia acumulada ser igual al total de datos. Frecuencia relativa acumulada: Se identifica como Fr y se obtiene por la suma sucesiva de la frecuencia relativa simple o por divisin de la frecuencia acumulada y el total de observaciones. Recorrido o rango: Se identifica como R, es la diferencia existente entre el valor mximo observado y el mnimo en una distribucin u ordenamiento. R=Recorrido=Xmx Xmn Intervalo de clase: Esta definido por la diferencia entre el lmite superior o frontera de clase y el lmite inferior o frontera inferior de una clase, este indica el recorrido o rango de los valores incluidos en una clase. Ci=Limite superior Limite inferior

Punto medio de clase o marca de clase: Para fines de anlisis de datos, los valores de las clases se representan a travs del punto medio de clase o marca de clase, esta se define como la semi-suma de los lmites de clase, se identifica como Xi. Donde:

Li lmite inferior de la clase Ls Lmite superior de la clase PASOS PARA CONSTRUIR UNA DISTRIBUCION DE FRECUENCIAS Con los conocimientos tericos necesarios adquiridos para la construccin y comprensin de una distribucin de frecuencias, procedemos a mostrar los pasos para su ejecucin. R=Xmx Xmn 2do.Calcular el intervalo de clases, siempre que se conozca el nmero de clases
4

Ci=R/NC 3ro. Calcular el nmero de clases, siempre que se conozca el intervalo de clases. NC=R/Ci Observamos que en el segundo y tercer paso resultara difcil resolver estas ecuaciones por simple mtodos matemticos porque cada una de ellas

presenta dos incgnitas. Como la solucin para este caso surge la ecuacin de Sturgees que se expresa de la manera siguiente: Ci=R/1 + 3.22 log N Donde: Ci = intervalo de clase. R= recorrido N= nmero total de valores

Vamos

a mostrar algunos ejemplos

que contribuyen a formalizar

el

conocimiento prctico del manejo de conjunto de datos, generados por una variable, a travs de una tabla de distribucin de frecuencias. Ejemplo 1: Las siguientes observaciones corresponden al nmero de hijos de 30 empleados de una zona franca. Xi= 0,0,0,0,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5. Observamos que sta es una variable discreta, por lo que la tabla de frecuencias es de construccin sencilla, ya que son pocas informaciones y su rango es mnimo es decir que las informaciones estn relativamente concentradas. Veamos la siguiente tabla: Nmero de hijos de 30 empleados de una zona franca. fi (no. de fr 4 4+3 = 7 7 + 8 = 15 15 + 4 =19 19 + 6 =25
5

No. Hijos empleados) FI 0 1 2 3 4 4 3 8 4 6

% 0.13 * 100 =13% 0.10 * 100 =10% 0.27 * 100 =27% 0.13 * 100 =13%

4 30 = 0.13 3 30 = 0.1 8 30 = 0.27 4 30 = 0.13

6 30 = 0.2 0.20 * 100 =20%

5 Total

5 = 30

25 + 5 =30

5 30 = 0.17

0.17 * 100 =17% 100%

= 1 =

Ejemplo 2: Las informaciones siguientes rebelan los salarios mensuales en miles de pesos de los trabajadores de zona franca. Salarios: 12, 13, 22, 23, 15, 17, 19, 19, 20, 5, 7, 45, 7 ,9, 31, 35, 38, 10, 11, 21 ,23, 24,25, 26,27, 28, 30, 40, 41, 42, 50 El proceso de de distribucin de frecuencias para variables continuas como es este caso deben ser tratados con ms cuidado, hay que considerar los aspectos siguientes: a) Ordenar los datos, preferiblemente en orden ascendente (de menor a mayor) 5, 7, 7, 9, 10, 11, 12, 1 3, 15, 17, 19, 19, 20, 21, 22, 23, 23, 24, 25, 26, 27 ,28, 30, 31, 35, 38, 40, 41, 42, 45, 50 b) Determinar el recorrido o rango (R): la diferencia entre el valor mximo y el valor mnimo. En las muestras anteriores el valor mximo es 45 y el mnimo es 5. R= 50 5 = 45 c) Determinar el intervalo de clase (CI): es el cociente de dividir el rango entre el nmero de clase. (NC)

Pero si el NC no se conoce entonces tenemos que utilizar la formula de stuggess:


Valores constantes

NC= numero de clases. N= numero de observaciones (datos) que en este caso son 30.

Sustituyendo a N en la formula tenemos: NC= 1 + 3.22 Log 30 = 1 + 3.22 (1.477) = 1 + 4.76 = 5.76 El NC es una variable discreta, por lo que redondeamos siempre hacia el valor mayor siguiente: NC= 6 Entonces, una vez encontrado del NC buscamos el valor del CI sustituyendo en la frmula del CI: CI = 7.5

El intervalo de clase (CI) tambin es otra variable discreta entonces tenemos que redondear: CI = 7.5 8 Conocido ya el intervalo de clase y el nmero de clase, procedemos a construir una distribucin de frecuencias. Cada clase tiene un lmite inferior (Li) y un lmite superior (Ls), la diferencia numrica entre estos dos valores es el valor del intervalo de clase (CI). En este caso vamos a iniciar escribiendo el nmero ms pequeo de las muestras que es 5. Ese ser el primer lmite inferior, luego para

encontrar el lmite superior de esa clase slo tenemos que sumarle el valor del intervalo de clase a 5. Veamos cmo queda conformada la primera clase: 5 - 13
CI

LI

LS

5 + 8 = 13 La segunda clase es: 13 - 21


CI

13 + 8 = 21 Seguimos as con las dems clases hasta completar las 6 clases que anteriormente calculamos, al final la columna matriz estar conformada de la siguiente manera

Lmite Inferior: LI

Sueldos Miles NC 1 2 3 pesos 5 -- 13 13-- 21 2129 29--37 37--45 45--53

en de

Lmite Superior: LS

En la tabla clases y

4 5 6

anterior se puede observar que hay 6 cada una de ellas tiene un lmite lmite superior.

inferior y un

Una vez construida las clases, se procede a determinar la frecuencia simple (fi) de cada clase (nmero de veces que ser repite cada clase), adems de los dems tipos de frecuencias y el punto medio de clase
Al momento de hacer el conteo se cuentan los sueldos que estn de 5 a menos de 13, o sea el 13 no se incluye en esa clase porque se debe incluir en la siguiente. Debe repetir ese procedimiento de conteo en todas las clases.

Sueldos en Miles de NC pesos 1 2 5 13 1321 2129 2937 3745 4553 fi (No. de FI 7 FR 0.23 Xi 9 17

trabajadores) fr 7 6 7 30 = 0.23 6 30 = 0.20

7 + 6 = 13 0.23 + 0.20 = 0.43 13 + 8 =

8 30 = 0.27

21 21 + 3 =

0.43 + 0.27 = 0.70

25

3 30 = 0.10

24 24 + 4 =

0.70 + 0.10 = 0.80

33

4 30 = 0.13

28 28 + 2 =

0.80 + 0.13 = 0.93

41

2 30 = 0.07

30
8

0.93 + 0.07 = 1.00

49

TOTAL

30

1.00

Ejemplo 3: A continuacin se muestran las ventas de un mes, en miles de RD$(pesos), de 30 vendedores de una compaa 2007) de artculos ferreteros. (Carlos Custodio.

26 57 40.5 83 44.5 73

29,4 30,4 32.3 27.8 35.6 36.9 28.6

64.3 70 50.4

56.5 81.4 76.9

48,5

68

82.4 78 88 67 22 52.8 76.4 63.4 64.3

A) Construya una distribucin de frecuencias Solucin: Procedemos a dar los pasos citados anteriormente, veamos: R=Xmx Xmn R=88 22=66 Como no conocemos el intervalo de clase ni el nmero de clases vamos a aplicar la frmula de Sturgees Ci=R/1+3.22 log N

Ci=66/1+ 3.22 log 30 = 66/5.75 =11.5

Recordando: Como se puede observar, segn la resultados de la frmula anterior el valor de Ci =11.5 y NC=5.75; sucede que el NC (numero de clases) es una variable discreta que no admite fraccionamiento y por tanto no puede ser, en la prctica, igual a 5.75, por lo cual debemos aproximar a un valor entero, que en este saso seria NC=6 . De esta manera y por redondeo: NC=6 y Ci=12.

Dados los pasos anteriores procedemos a la construccin de la distribucin de frecuencias,


9

Ventas de un mes de 30 vendedores En miles de RD$

Ventas 22 34 34 - 46 46 58 58 70 70 82 82 94 Tot al

Vendedores fr

Fi

Fr

Xi

(Miles RD$) fi 7 4 5 5 6 3 30 1 7 30 = 0.233 4 30 = 0.133 5 30 = 0.167 5 30 = 0.167 6 30 = 0.2 3 30 = 0.1 7 7+4=11 11+5=16 16+5=21 21+6=27 27+3=30 7 30 = 0.233 28

11 30 = 0.366 40 16 30 = 0.533 52 21 30 = 0.7 27 30 = 0.9 1 64 76 88

Los diferentes indicadores obtenidos siguiente manera:

anteriormente se interpretan de la

Por ejemplo, si le interesa interpretar el resultado de la frecuencia simple de la quinta clase, puede expresar que: seis vendedores efectuaron ventas durante ese mes entre 70 mil y menos de 82 mil pesos.

Asi mismo, puede sealar, al interpretar la frecuencia relativa simple de la cuarta clase, que el 16.7% de los vendedores realizo ventas durante ese

mes por montos comprendidos entre 58 mil y menos de 70 mil pesos. Al interpretar el resultado de la frecuencia acumulada de la quinta clase , podemos sealar que 27 vendedores durante ese mes realizaron ventas por un monto comprendido entre 22 mil pesos y menos de 82 mil pesos. De igual manera el 53.3 % de los vendedores efectuaron ventas durante ese mes por montos comprendidos entre 22 mil pesos y 58 mil pesos
10

explicando este resultado el contenido de la frecuencia acumulada de la tercera clase de la distribucin. En lo referente al punto medio de cada clase, ste es usado para representar mediante un solo valor el recorrido de cada clase y sirve adems para los fines de anlisis estadsticos de los datos. Ejemplo 4: Construir una distribucin de frecuencias con las puntuaciones de coeficiente de inteligencia de 70 personas tomadas al azar , considerando un intervalo de clase igual a 10.-________________________________________________
64 82 100 112 118 89 135 142 114 151 107 153 95 101 107 126 51 123 109 98 120 67 93 104 121 78 143 84 125 107 101 115 98 114 76 124 128 118 93 104 118 158 91 123 123 73 140 123 78 102 91 98 116 117 102 136 135 116 90 105 147 89 107 105 133 67 107 121 83 105

_______________________________________________________________

Solucin: Tal y como sealamos en el caso anterior, para la distribucin de frecuencia debemos conocer: 1ro. R= Xmx Xmn R =158 51= 107 2do. Ci= 10(conocido previamente) 3ro. NC=R/Ci = 107/10 =10.7 =11 En caso, tendremos una distribucin de frecuencias con un intervalo de clases igual diez, (Ci=10), y 11 clases.

Coeficiente de inteligencia de 70 personas

Coeficiente inteligencia

Frec. Simple

Frec. Relativa

Frec.Acumulada Frec.relativa (Fi) 11 Acum (Fr)

Punto medio

(fi) 50 60 60 - 70 70 80 80 90 90 100 100 110 110 120 120 130 130 140 140 150 150 -160 T otal 1 3 4 5 9 16 10 11 4 4 3 70

Simple (fr) 1/70=0.014 3/70=0.043 4/70=0.057 5/70=0.072 9/70=0.129 16/70=0.228 10/70=0.143 11/70=0.157 4/70=0.057 4/70=0.057 3/70=0.043 1.00 1 1+3=4 4+4=8 8+5=13 13+9=22 22+16=38 38+10=48 48+11=59 59+4=63 63+4=67 67+3=70 0.014

Xi 55

0.014+0.043=0.057 65 0.057+0.057=0.114 75 0.114+0.072=0.186 85 0.186+0.129=0.315 95 0.315+0.228=0.543 105 0.543+0.143=0.686 115 0.686+0.157=0.843 125 0.843+0.057=0.90 0.90+0.057=0.957 0.957+0.043=1.00 135 145 155

a) Interprete el valor de la frecuencia acumulada de la sexta clase. Significa que 38 personas tienen un coeficiente de inteligencia por debajo de 110 b) Interprete el valor de la frecuencia relativa de la octava clase. Significa que el 15.7% de las personas tienen un coeficiente inteligencia comprendido Entre 120 y 130. Fuentes Bibliogrfica Custodio, Carlos (2007) Estadstica Bsica, 4ta. Edicin, Editora Bho, Repblica Dominicana. Johnson, Robert; Kuby, Patricia (2008) Estadstica Elemental, Lo esencial, Edicin 1, Edicin 2008, Editorial: Cengage Learning, Argentina. Pea, Daniel, Fundamentos de Estadstica (2008), 2da. Edicion, Editorial: Alianza, Espaa. Richard I. Levin David S. Rubin (2004), Estadstica para Administradores, 7ma. Edicin, Editorial Printice Hall, Mxico. Weiers, Ronad M. (2006) Introduccin a la Estadstica para Negocios, 5ta. Edicin, Editorial Thomson, Mxico. de

12

Anda mungkin juga menyukai