Anda di halaman 1dari 78

Tratamiento de datos y azar.

1.0 Interpretacion de informacion.

05 /02/2014

1.1Agrupa y grafica conjunto de datos cualitativos y cuantitativos con


base en la distribucion de frecuencias.

A. Descripcion e interpretacion de la estadistica descriptiva Naturaleza de la Estadistica. - Etapas de la investigacion estadistica. - Poblacion. - Muestra. - Tamano de la muestra. - Muestreo aleatorio. - Variable estadistica. - Datos. - Experimento. - Parametros de decision.

Tratamiento de datos y azar.

05 /02/2014

Naturaleza de la Estadistica. La estadstica proporcionan formas para reflexionar acerca del comportamiento de muchos fenmenos con los que se enfrenta el ser humano da a da. La base de la estadstica es poder considerar un conjunto de datos y calcular valores estadsticos o trazar graficas, pero hay que tomar en cuenta que es mucho ms importante comprender las circunstancias que se estn investigando, las variables implicadas, porque se est investigando el problema y se aprende a cuestionar los datos y los resultados estadsticos. La experiencia y situaciones de la vida diaria constituyen la base para comprender la estadstica ya que esta trata sobre la descripcin del mundo que nos rodea y nos proporciona mtodos para analizar los resultados de experimentos efectuados, pero tambin indica cmo se pueden efectuar los experimentos de manera eficaz para disminuir los efectos de la variacin y tener mayor probabilidad de llegar a conclusiones correctas.

Tratamiento de datos y azar.


-

05 /02/2014

Etapas de la investigacion estadistica.

PLANIFICACIN Planteamiento del problema Formulacin Objetivos- Hiptesis de trabajo Fundamento e importancia de la investigacin Determinacin de la unidad de anlisis y variables Identificacin de las fuentes de informacin

RECOLECCION DE LOS DATOS


ORGANIZACIN: Tabulacin Consistencia Procesamiento Presentacin de datos

Tratamiento de datos y azar.

05 /02/2014

ANLISIS E INTERPRETACIN DE RESULTADOS Clculo e interpretacin de indicadores estadsticos RESULTADOS Y CONCLUSIONES Poblacin: El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. "Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones. "Una poblacin es un conjunto de elementos que presentan una caracterstica comn".

Tratamiento de datos y azar.

05 /02/2014

Muestra: En estadstica una muestra estadstica (tambin llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una poblacin estadstica. Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben ser representativas de la misma. Para cumplir esta caracterstica la inclusin de sujetos en la muestra debe seguir una tcnica de muestreo. En tales casos, puede obtenerse una informacin similar a la de un estudio exhaustivo con mayor rapidez y menor coste (vanse las ventajas de la eleccin de una muestra, ms abajo). Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda la poblacin porque el manejo de un menor nmero de datos provoca tambin menos errores en su manipulacin. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados.

Tratamiento de datos y azar.

05 /02/2014

El nmero de sujetos que componen la muestra suele ser inferior que el de la poblacin, pero suficiente para que la estimacin de los parmetros determinados tenga un nivel de confianza adecuado. Para que el tamao de la muestra sea idneo es preciso recurrir a su clculo. Tamao de una Muestra Al definir el tamao de la muestra, nosotros deberemos procurar que sta informacin sea representativa, vlida y confiable y al mismo tiempo nos represente un mnimo costo. Por lo tanto, el tamao de la muestra estar delimitado por los objetivos del estudio y las caractersticas de la poblacin, adems de los recursos y el tiempo de que se dispone. Muestreo aleatorio Consideremos una poblacin finita, de la que deseamos extraer una muestra. Cuando el proceso de extraccin es tal que garantiza a cada uno de los elementos de la poblacin la misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de seleccin muestreo aleatorio.

Tratamiento de datos y azar.

05 /02/2014

El muestreo aleatorio se puede plantear bajo dos puntos de vista: Sin reposicin de los elementos; Con reposicin. variable estadstica Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin. Tipos de variable estadsticas A.- Variable cualitativa Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos: Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Tratamiento de datos y azar.

05 /02/2014

Variable cualitativa ordinal o variable cuasicuantitativa


Una variable cualitativa ordinal presenta modalidades no nmericas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1, 2, 3, ... Medallas de una prueba deportiva: oro, plata, bronce. B.- Variable cuantitativa Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos: Variable discreta Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Tratamiento de datos y azar.

05 /02/2014

Variable continua Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales. Datos Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Experimento. Un experimento es un procedimiento mediante el cual se trata de comprobar (confirmar o verificar) una o varias hiptesis relacionadas con un determinado fenmeno, mediante la manipulacin y el estudio de las correlaciones de la(s) variables que presumiblemente son su causa. La experimentacin constituye uno de los elementos claves de la investigacin cientfica y es fundamental para ofrecer explicaciones causales.

Tratamiento de datos y azar.

05 /02/2014

En un experimento se consideran todas las variables relevantes que intervienen en el fenmeno, mediante la manipulacin de las que presumiblemente son su causa, el control de las variables extraas y la aleatorizacin de las restantes. Estos procedimientos pueden variar mucho segn las disciplinas (no es igual en fsica que en psicologa, por ejemplo), pero persiguen el mismo objetivo: excluir explicaciones alternativas (diferentes a la variable manipulada) en la explicacin de los resultados. Este aspecto se conoce como validez interna del experimento, la cual aumenta cuando el experimento es replicado por otros investigadores y se obtienen los mismos resultados. Cada repeticin del experimento se llama prueba o ensayo. Las distintas formas de realizar un experimento (en cuanto a distribucin de unidades experimentales en condiciones o grupos) son conocidas como protocolo de investigacin. Un parmetro estadstico es un nmero que se obtiene a partir de los datos de una distribucin estadstica.

Tratamiento de datos y azar.

05 /02/2014

Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla o por una grfica. Tipos de parmetros estadsticos Hay tres tipos parmetros estadsticos: De centralizacin. De posicin. De dispersin.

Tratamiento de datos y azar.


Medidas de centralizacin

06 /02/2014

Nos indican en torno a qu valor (centro) se distribuyen los datos. La medidas de centralizacin son: Media aritmtica La media es el valor promedio de la distribucin. Mediana La mediana es la puntacin de la escala que separa la mitad superior de la distribucin y la inferior, es decir divide la serie de datos en dos partes iguales. Moda La moda es el valor que ms se repite en una distribucin.

Tratamiento de datos y azar.


Medidas de posicin

06 /02/2014

Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. La medidas de posicin son:

Cuartiles Los cuartiles dividen la serie de datos en cuatro partes iguales.


Deciles Los deciles dividen la serie de datos en diez partes iguales. Percentiles Los percentiles dividen la serie de datos en cien partes iguales.

Tratamiento de datos y azar.


Medidas de dispersin

06 /02/2014

Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la distribucin. Las medidas de dispersin son: Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Desviacin media La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. Varianza La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media. Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza.

a) Dato de variable cuantitativa Valor numerico de una variable. b) Muestra Subconjunto representativo de una poblacion. c) Parmetro Medida descriptiva de una muestra o poblacion. d) Poblacin Total de elementos en estudio que presentan caracteristicas comunes. e) Datos Es el resultado que se obtiene como resultado de un conteo.

f)

Variable estadstica Caracteristicas de cada elemento de una muestra o poblacion.

g) Estadstica Estudio de metodos para manejar la obtencion, presentacion y analisis de observaciones numericas, para tomar decisiones o realizar generalizaciones acerca de las caracteristicas de una poblacion

Tratamiento de datos y azar.


Medidas de tendencia central.

12/02/2014

La media aritmtica es la suma de los valores de cierto nmero de cantidades dividido entre su nmero. se expresa: X = S Xi / N

Donde N: es el nmero de observaciones X: el valor de cada observacin X : es la media aritmtica, media, o X barra. La media es la nica de la medidas de tendencia central que puede intervenir en operaciones algebraicas. Obtener la media del precio del petrleo registrada en un mes, si se vendi en el mercado mundial en 28, 31, 29, 27, 26 dlares por barril

Tratamiento de datos y azar.


Resolucin:

12/02/2014

X = (28+31+29+27+26) 5 = 141 5 X = 28.2 En un examen extraordinario las calificaciones obtenidas por un grupo de 13 alumnos sobre un mximo de 10 puntos, fueron: En matemticas: 4, 7, 3, 6, 2, 8, 4, 7, 0, 1, 7, 6, 4 En fsica: 8, 4, 3, 6, 7, 5, 6, 2, 1, 7, 6, 7, 0 Calcular el promedio de matemticas, de fsica y el de ambas materias Resolucin X = (4+7+3+6+2+8+4+7+0+1+7+6+4) 13 = 59 13 = 4.54
matemticas

X = (8+4+3+6+7+5+6+2+1+7+6+7+0) 13 = 62 13 = 4.77 fsica

Tratamiento de datos y azar.

12/02/2014

X = (4.5 + 4.7) 2 = 9.2 2 = 4.6 en ambas materias

Media aritmtica ponderada Se aplica para calcular el valor promedio de cantidades a cada una de las cuales est asociado un nmero que lo pondera.
Si un comerciante en ropa compra dos partidas de camisas, una de 60 a $75, cada una, y otra de 30 en $83.5 cada prenda. Obtener el precio promedio de cada camisa. Resolucin Precio promedio= 60(75) + 30(83.5) 60+30 = 4500 + 2505 90 = $77.83

Tratamiento de datos y azar.


Tarea

12/02/2014

La tendencia actual para ingresar a una licenciatura exige que el aspirante tenga un promedio de sus estudios de enseanza media superior de 8.5 y apruebe el examen de admisin con 6 como mnimo. No todas las materias que se evalan en el examen tiene el mismo peso; es decir, cada una tiene una ponderacin diferente. Un aspirante obtuvo las calificaciones siguientes: matemticas 8, fsica 7, espaol 4, ingls 6; para averiguar si el alumno ingresa a la universidad se tiene que calcular el promedio ponderado. Las ponderaciones son: matemticas 7, fsica 7, espaol 3, ingls 5.

Tratamiento de datos y azar.

12/02/2014

La mediana y la moda son medidas de tendencia central que por sus propiedades destacan los valores individuales de un colectivo; en cambio, la media aritmtica, al promediar todos los valores igualando en su justo reparto todas las observaciones, suprime sus individualidades. Mediana La mediana se define como el valor que divide un conjunto de datos previamente ordenados de menor a mayor, y es el punto intermedio entre todos ellos. Si el nmero N de datos es impar, entonces hay un nmero intermedio; por ejemplo, si tenemos cinco datos, 3,5,7, 9, 11 el nmero 7 es el punto intermedio. Si el nmero N de datos es par, entonces hay dos datos intermedios; por ejemplo, la media de los valores 8,10,16,19,23,25, hay dos valores centrales que son 16 y 19; el valor equidistante entre ellos es la mediana: (16 + 19) 2 = 35 2 = 17.5 es la mediana

Tratamiento de datos y azar.

12/02/2014

Moda En un conjunto de datos de una distribucin de frecuencias, la moda es el valor que ocurre con mayor frecuencia; por ejemplo, en los valores: 1,2,5,5,6,6,6,6,7,8,9,9,9, la moda es el 6. la moda es el valor ms representativo o tpico de una serie de valores, en el sentido que ocurre con mayor frecuencia. Ejercicio: Seala la moda de los valores siguientes: 12, 13, 15, 15, 16, 16, 16, 17,17,17,17, 18,18,18,18 19,19,19,19, 20, 20,20, 20, 21, 21, 21, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 24, 25, 25, 25, 26, 27, 27, 28,

Tratamiento de datos y azar.

12/02/2014

Distribucin de frecuencias con datos no agrupados. Una vez reunidos los datos de un colectivo para obtener a partir de ellos conclusiones, es necesario organizarlos en una tabla de distribucin de frecuencias.

La tabla de distribucin de frecuencias es una funcin, ya que cada medida est relacionada con un nmero que es su frecuencia y como tal se puede puede expresar: como una lista, una grfica o una regla; en estadstica se hace con una lista que es la tabla de frecuencias o con una grfica, por ejemplo, un diagrama de frecuencia de puntos.
Las distribuciones de una sola variable se clasifican en tres tipos, segn el nmero de observaciones y el nmero de valores distintos que toma la variable.

Tratamiento de datos y azar.

12/02/2014

A. Distribuciones del tipo Uno. Son aquellas que constan de un reducido nmero de observaciones y en consecuencia de un reducido nmero de valores distintos que toma la variable; para su presentacin no es necesaria una tcnica determinada, ya que adems casi no son susceptibles de tratamiento estadstico, puesto que para que ste exista es necesario un volumen considerable de observaciones.

B. Distribuciones del tipo Dos Son las que el nmero de observaciones es grande, pero el nmero de valores distintos que toma la variable es pequeo; en este tipo, se distribuyen o agrupan los resultados disponibles en dos columnas, una para los valores distintos que toma la variable, y otra para la frecuencia de cada uno de ellos.

Tratamiento de datos y azar.

12/02/2014

Para determinar el grado de nutricin de 20 alumnos de secundaria se toma la altura en centmetros de cada uno de ellos, y son:
128 140 136 136 146 124 120 134 136 134 130 142 136 142 136 132 150 138 132 144

Para facilitar su interpretacin se ordenan de forma ascendente o descendente, a este proceso se le llama orden de rango.
120 132 136 142

124
128 130 132

134
134 136 136

136
136 138 140

142
144 146 150

Tratamiento de datos y azar.

12/02/2014

Para proceder a organizar los datos se usa la tabla de frecuencia que expresa el nmero de casos de cada categora ( es una distribucin del tipo Dos).
Altura X1 120 121 122 123 124 125 126 127 128 129 Frecuencia n1 1 0 0 0 1 0 0 0 1 0 Altura X1 130 131 132 133 134 135 136 137 138 139 Frecuencia n1 1 0 2 0 2 0 5 0 1 0 Altura X1 140 141 142 143 144 145 146 147 148 150 Frecuencia n1 1 0 2 0 1 0 1 0 0 2

Tratamiento de datos y azar.

19/02/2014

Frecuencia absoluta (para datos no agrupados). La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi.
Datos X Conteo Frecuencia Absoluta Frecuencia Absoluta Acumulada Frecuencia Relativa Frecuencia Relativa Acumulada 0.100 0.233 0.500 0.767 0.900 1.000 Frecuencia Relativa Frecuencia Relativa Acumulada

(fi)
0 1 2 3 4 5 III IIII IIIII III IIIII III IIII III 3 4 8 8 4 3

(Fi)
3 7 15 23 27 30

(fr)
3/30 = 0.100 4/30 = 0.133 8/30 = 0.267 8/30 = 0.267 4/30 = 0.133 3/30 = 0.100

Fr (%)
10 13.3 26.7 26.7 13.3 10 100

Fra (%)
10 23.3 50 76.7 90 100

n=

30

Tratamiento de datos y azar.

12/02/2014

C. Distribucin del tipo TRES. Si el nmero de observaciones y el nmero de valores que toma la variable son grandes para su manejo se agrupan las observaciones en intervalos Li-1 Li, eligiendo entre ellos una amplitud fija o variable, mismos que se anotarn en una primera columna; en la segunda, se tabularn los valores para facilitar su conteo; y en la tercera, se pondr el nmero de frecuencia (f) correspondiente a cada intervalo. Los grupos o categoras que incluye Li-1 Li se llaman intervalos de clase; los valores Li-1 son lmites inferiores, y Li los limites superiores de estos intervalos.
Clases Li-1 Li
L0 L1 L1 L2 L2 L3 Lk-1 Lk

Tabulaciones

Frecuencias (f) n1
n1 n2 n3 nk

Tratamiento de datos y azar.

12/02/2014

En un examen departamental de fsica se examinaron 50 alumnos con los resultados siguientes: 87 66 73 68 48

37
93 49 89 76 64 77 71 80

76
77 57 96 68 83 88 73 77

85
66 38 78 63 67 74 61 85

74
83 69 97 70 61 75 57 80

65
68 78 74 81 90 80 72 89

Expresar la tabla de frecuencias

Tratamiento de datos y azar.


Resolucin Expresamos los datos en forma ascendente: 37 38 48 49 57 65 66 66 67 68 73 73 74 74 74 78 78 78 80 80

12/02/2014

85 85 87 88 89

57
61 61 63

68
69 70 71

76
76 77 77

80
81 83 83

89
90 93 96

64

72

77

85

97

Tratamiento de datos y azar.


Clases Li-1 Li 35 - 39 40 - 44 45 - 49 50 - 54 II Tabulaciones II

12/02/2014
Frecuencias (f) ni 2 0 2 0

55 - 59
60 - 64 65 - 69 70 - 74 75 - 79 80 - 84 85 - 89 90 - 94 95 - 100

II
IIII IIII II IIII III IIII III IIII I IIII II II II

2
4 7 8 8 6 7 2 2

Tratamiento de datos y azar.

12/02/2014

Al disponer los datos primarios en una distribucin del tipo TRES como en la tabla de frecuencias, tiene lugar una prdida de informacin, ya que no se consideran los resultados obtenidos en forma exacta, sino por aproximacin: no se dir que dicho valor se encuentra entre Li-1 y Li. Como lo que interesa es elegir una amplitud constante o variable lo suficientemente pequea para que la prdida sea lo menos posible, y al mismo tiempo lo suficientemente grande para que el agrupamiento presente una distribucin de no demasiados valores, pues de lo contrario, el haber hecho el agrupamiento perder su finalidad, es decir, la comodidad del manejo. Para facilitar el calculo es recomendable escoger estos intervalos de manera que sus puntos medios sean mltiplos de nmeros como el 5 o como el 10 y generalmente no debe haber menos de 7 intervalos ni ms de 15, aunque no hay normas fijas. No es necesario que los intervalos de clase sean iguales, tampoco aqu hay reglas fijas y cada uno elige el intervalo de clase ms adecuado.

Tratamiento de datos y azar.

12/02/2014

Antes de aplicar a la informacin los mtodos estadsticos, es necesario sustituir cada intervalo por un nmero, a este nmero se le llama marca de clase y es el valor central de cada intervalo, es decir, la media aritmtica de los lmites inferior y superior. Marca de clase = Xi = (Li-1 + Li)/2 se abrevia (m.c) Para obtener las marcas de clase del ejemplo anterior tenemos: (35 + 39)/2 = 37 (40 + 44)/2 = 42 (45 + 49)/2 = 47 (50 + 54)/2 = 52 (55 + 59)/2 = 57 (60 + 64)/2 = 62 (65 + 69)/2 = 67 (70 + 74)/2 = 72 (75 + 79)/2 = 77 (80 + 84)/2 = 82 (85 + 89)/2 = 87 (90 + 94)/2 = 92 (95 + 100)/2 = 97.5

Tratamiento de datos y azar.


Clases Li-1 Li 35 - 39 40 - 44 45 - 49 50 - 54 55 - 59 60 - 64 II IIII II Tabulaciones Frecuencias (f) ni II 2 0 2 0 2 4

12/02/2014
Marca de clase (m.c) Xi 37 42 47 52 57 62

65 - 69
70 - 74 75 - 79 80 - 84 85 - 89 90 - 94 95 - 100

IIII II
IIII III IIII III IIII I IIII II II II

7
8 8 6 7 2 2

67
72 77 82 87 92 975

Tratamiento de datos y azar.

19/02/2014

Observa: al poner la marca de clase se comete un error de agrupamiento pues las ni ( frecuencias f) no son las veces que se repite el valor Xi de la variable, sino que son las veces que aparecen valores de la variable considerados entre Li-1 Li. Aceptamos que la prdida de informacin a que nos referimos y este error de agrupamiento son absolutamente necesarios para que las distribuciones del tipo TRES puedan recibir un tratamiento estadstico. Para obtener el rango de un serial de datos, hay que identificar el valor ms pequeo de los datos (Xm) y el valor ms grande de los datos (XM), entonces el RANGO (R) = XM Xm. El nmero de intervalos lo podemos obtener utilizando la siguiente frmula (esta formula es valida si el nmero de datos es menor que 200)

K = n ,
Donde: K = nmero de clases o intervalos de clase

Tratamiento de datos y azar.

1/02/2014

Para determinar la amplitud o ancho de clase que deber tener cada intervalo, se aplica la siguiente formula:

A = R/K A = ancho del intervalo R = Rango de los datos K = nmero de clase o intervalo. Limites reales o fronteras reales.
Los lmites reales son valores que unen a las clases y se forman nicamente de nmeros enteros, estos se obtienen al restar 0.5 a los limites de la izquierda y sumar 0.5 a los limites de la derecha; cuando las clases tengan un decimal, habr que restar 0.05 a los limites de la izquierda y sumar 0.05 limites de la derecha y as sucesivamente.

Tratamiento de datos y azar.

19/02/2014

Pasos para la elaboracin de tablas de distribucin de frecuencias


Recopilacin de datos. Clasificacin de los datos de menor a mayor(opcional) Especificacin del nmero de clases. Clculo del tamao exacto del ancho de clase. Determinacin del tamao ajustado del ancho de clase. Identificacin de los limites de clase. Conteo de los datos. Los siguientes valores corresponden a la produccin mensual, en toneladas, de una empacadora de pltanos. Clasifique estos datos en clases de tamao uniforme: 782, 1333, 515, 1475, 696, 832, 1052, 700, 987, 542, 1296, 704, 814, 1482, 1023, 739, 643, 956, 1023 y 784.

Datos ordenados
515 704 832 1052 542 739 956 1296 643 782 987 1333 696 784 1023 1475 700 814 1023 1482

Tratamiento de datos y azar.


Determinacin del nmero de clases:

19/02/2014

Nmero de clases = nmero de datos = 20 = 4.47 = 5 Tamao del intervalo o ancho de clase: Intervalo exacto = (Valor mayor Valor menor) Nmero de clases = (1482 515) 5 = 193.4 se ajusta el tamao a 194 Determinacin de los limites de clase:
Limite inferior de la clase = limite inferior de la clase anterior + tamao del intervalo Limite inferior de la clase A = 515 Limite inferior de la clase B = 515 + 194 = 709 Limite inferior de la clase C = 709 + 194 = 903 Limite inferior de la clase D = 903 + 194 = 1097 Limite inferior de la clase E = 1097 + 194 = 1291

Tratamiento de datos y azar.


Limite superior de la clase A = 515 + 194 1 = 708 Limite superior de la clase B = 709 + 194 1 = 902 Limite superior de la clase C = 903 + 194 1 = 1096 Limite superior de la clase D = 1097 + 194 - 1 = 1290 Limite superior de la clase E = 1291 + 194 1 = 1484

19/02/2014

Limite superior de la clase = limite inferior de la clase + intervalo unidad de variacin.

La tabla siguiente muestra los lmites de cada clase, as como el conteo de los datos.

Clase

Limite inferior (toneladas)

Limite superior (toneladas)

Frecuencia (meses)

A B C

515 709 903

708 902 1096

IIII II IIII I IIII I IIII

6 5 5

D
E

1097
1291

1290
1484

0
4

Tratamiento de datos y azar.


Soluciones alternativas:

19/02/2014

Considerando cinco clases con intervalos uniformes de 200, y que stas deben incluir todos los valores, puede seleccionarse a 500 como lmite inferior de la primera clase, y a partir de este lmite identificar los dems.
Lmite inferior de la clase = lmite inferior de la clase anterior + tamao del intervalo. Limite inferior de la clase A = 500 Limite inferior de la clase B = 500 + 200 = 700 Limite inferior de la clase C = 700 + 200 = 900 Limite inferior de la clase D = 900 + 200 = 1100 Limite inferior de la clase E = 1100 + 200 = 1300 Limite superior de la clase = limite inferior de la clase + intervalo unidad de variacin.

Limite superior de la clase A = 500 + 200 1 = 699 Limite superior de la clase B = 700 + 200 1 = 899 Limite superior de la clase C = 900 + 200 1 = 1099 Limite superior de la clase D = 1100 + 200 - 1 = 1299 Limite superior de la clase E = 1300 + 200 1 = 1499

Tratamiento de datos y azar.


Clase Lmite inferior (toneladas) Lmite superior (toneladas)

19/02/2014
Frecuencia (meses)

La siguiente tabla muestra los limites de cada clase, as como el conteo de los datos.

A B C D E

500 700 900 1100 1300

699 899 1099 1299 1499

IIII IIII III IIII I I III

4 7 5 1 3

Lmites reales o Fronteras reales de clase. El lmite inferior real de cada clase se calcula restando la mitad de la diferencia entre el lmite inferior de la clase siguiente y el lmite superior de la clase, esto es, la mitad de la unidad de variacin de los datos. El lmite superior real de cada clase se calcula sumando la mitad de la diferencia entre el lmite inferior de la clase siguiente y el lmite superior de la clase, esto es, la mitad de la unidad de variacin de los datos.

Tratamiento de datos y azar.

19/02/2014

Ejemplo. Determine los lmites reales o fronteras y la marca de clase de cada una de las clases de la siguiente tabla, en la que se presenta el peso, en libras, de los nios de una escuela primaria. Clase A B C D Lmite Inferior (Lb) 101 116 131 146 Lmite superior (Lb) 115 130 145 160

Tratamiento de datos y azar.

19/02/2014

Solucin. Una formula para calcular el lmite inferior real de cada clase es la siguiente:
Lmite inferior real de la clase = lmite inferior de la clase (lmite inferior de la clase siguiente lmite superior de clase) 2 Nota: el lmite inferior de la clase siguiente a la ltima es el lmite superior de la ltima clase, ms la diferencia entre el lmite inferior de la ltima clase y el lmite superior de la penltima clase.

A B C D

101 - 115 116 - 130 131 - 145 146 - 160 161

Tratamiento de datos y azar.


Lmite inferior real de la clase A = 101 (116 115)/2 = 100.5 Lmite inferior real de la clase B = 116 (131 130)/2 = 115.5

19/02/2014

Lmite inferior real de la clase C = 131 (146 145)/2 = 130.5


Lmite inferior real de la clase D = 146 (161 160)/2 = 145.5 Lmite superior real de la clase = lmite superior de la clase + (lmite inferior de la clase siguiente lmite superior de clase) 2 Lmite superior real de la clase A = 115 + (116 115)/2 = 115.5 Lmite inferior real de la clase B = 130 + (131 130)/2 = 130.5

Lmite inferior real de la clase C = 145 (146 145)/2 = 145.5


Lmite inferior real de la clase D = 160 (161 160)/2 = 160.5

Tratamiento de datos y azar.

19/02/2014

Marca de la clase = (Lmite inferior de clase + Lmite superior de clase) 2

Marca de la clase A = (101 + 115)/2 = 108

Marca de la clase B = (116 + 130)/2 = 123


Marca de la clase C = (131 + 145)/2 = 138 Marca de la clase D = (146 + 160)/2 = 153
Clase Lmite inferior (lb) Lmite Superior (lb) Lmite inferior Real (lb) Lmite superior Real (lb) Marca de clase (lb)

A B

101 116

115 130

100.5 115.5

115.5 130.5

108 123

C
D

131
146

145
160

130.5
145.5

145.5
160.5

138
153

Tratamiento de datos y azar.


Construccin e interpretacin de grficas.

19/02/2014

Una grfica vale ms que mil palabras, dice el refrn. Esto es particularmente cierto en el caso de los anlisis estadsticos, donde los datos al natural e incluso tabulados pueden ser abrumadores, difciles de comprender. Grfica circular (de pastel). Las grficas circulares o grficas de pastel son figuras que representan, por medio de segmentos de crculo, la frecuencia, absoluta o relativa de una tabla de distribucin de frecuencias. La presentacin de datos en esta forma es impresionante, sobre todo cuando se les aaden efectos visuales tales como color y grosor a los segmentos, o se separa alguno de ellos del centro. Estas grficas se preparan con base en el ngulo que resulta de multiplicar 360(los grados de un circulo) por la frecuencia relativa de cada clase, por lo que su clculo es muy sencillo.

Tratamiento de datos y azar.

19/02/2014

Tratamiento de datos y azar.


Diagrama de barras:

19/02/2014

Un grfico de barras es aquella representacin grfica bidimensional en que los objetos grficos elementales son un conjunto de rectngulos dispuestos paralelamente de manera que la extensin de los mismos es proporcional a la magnitud que se quiere representar. Los rectngulos o barras pueden estar colocados horizontal o verticalmente. En ste ltimo caso reciben tambin el nombre de grficos de columnas. Utilizacin. Tpicamente se utilizan para comparar magnitudes entre varias categoras o la evolucin en el tiempo (el cambio) de una determinada magnitud. La comparacin de la evolucin en el tiempo de varias categoras, esto es, se suelen usar tambin para la mezcla de las dos utilidades anteriores.

Tratamiento de datos y azar.

19/02/2014

Tratamiento de datos y azar.

19/02/2014

Histograma. A modo de resumen un histograma es una grfica de barras que nos permite describir el comportamiento de un conjunto de datos, pero en este caso las diferentes observaciones de una misma variable se grafican alrededor de un valor medio o central.

Tratamiento de datos y azar.

19/02/2014

Polgono de frecuencias. Un polgono de frecuencias se forma uniendo los extremos de las barras de un diagrama de barras mediante segmentos. Tambin se puede realizar trazando los puntos que representan las frecuencias y unindolos mediante segmentos.

HoraTemperatura 6 7 9 12 12 14 15 11 18 12 21 10 24 8

Tratamiento de datos y azar.

19/02/2014

Polgonos de frecuencia para datos agrupados Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectngulo de un histograma. Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla:
fi [50, 60) 55 [60, 70) 65 [70, 80) 75 [80, 90) 85 [90, 100) 95 [100, 110) 110 [110, 120) 115 ci Fi 8 10 16 14 10 5 2 65 8 18 34 48 58 63 65

Tratamiento de datos y azar.

19/02/2014

Ojivas. La ojiva es el polgono de frecuencias acumuladas, es decir, que en ella se permite ver cuntas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los nmeros asignados a cada intervalo.

Tratamiento de datos y azar.


Grfica de tallo y hojas.

19/02/2014

El Diagrama de Tallo y Hoja, a pesar de no ser un grfico definitivo para la presentacin de datos, es fcil y rpido para realizar a mano, con el se puede dar una mirada no pulida de los datos. Una ventaja de este diagrama sobre la distribucin de frecuencias consiste en que no pierde la identidad de cada observacin. Es una tcnica estadstica para la prestacin de un conjunto de datos. Cada valor numrico se divide en 2 partes. El dgito principal se convierte en el tallo y los dgitos secundarios en las hojas. El tallo se localiza a lo largo del eje vertical y los valores de las hojas se apilan unos contra otros a lo largo del eje horizontal. Como construirlo? En un grfico de tallo y hoja cada valor de datos es partido en "un tallo" "y una hoja". "La hoja" es por lo general el ltimo dgito del nmero y los otros dgitos a la izquierda "de la hoja" forman "el tallo". Por ejemplo, el nmero 136 sera partido como: TALLO: 13HOJA: 6

Tratamiento de datos y azar.

19/02/2014

1. Puede ordenar los datos de menor a mayor, esto ayudara a la organizacin de los datos (Opcional) 2. Separe cada nmero en un tallo y una hoja. 3. Agrupe los nmeros con los mismos tallos. Ponga los tallos en una lista en orden creciente. Veamos un Ejemplo con los siguientes 15 datos: 35, 36, 38, 40, 42, 42, 44, 45, 45, 47, 48, 49, 50, 50, 50

Algunos software como SPSS o MINITAB pueden separar el Tallo en una parte inferior(hojas desde el cero al 4) y otra superior (hojas desde el 5 al 9)

Tratamiento de datos y azar.

12/02/2014

Media aritmtica de una distribucin de frecuencias agrupadas


Para calcular la media aritmtica de una distribucin de frecuencias agrupadas consideramos que todos los valores que hay dentro de un intervalo de clase se les considera de un mismo valor igual a la marca de clase, y las frecuencias son las ponderaciones de los valores en correspondencia con las marcas de clase y la suma de las frecuencias es el total de veces que se tiene registro.

Tratamiento de datos y azar.

12/02/2014

Ejemplo: Calcular la media aritmtica de la distribucin de frecuencias agrupadas de la tabla de frecuencias que obtuvimos anteriormente
Clases Li-1 Li 35 - 39 40 - 44 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 80 - 84 85 - 89 90 - 94 95 - 100 II IIII IIII II IIII III IIII III IIII I IIII II II II II Tabulaciones II Frecuencias (f) ni 2 0 2 0 2 4 7 8 8 6 7 2 2 Marca de clase (m.c) Xi 37 42 47 52 57 62 67 72 77 82 87 92 975

Tratamiento de datos y azar.


Intervalos 35 - 39 40 - 44 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 Marca X 37 42 47 52 57 62 67 2 0 2 0 2 4 7

12/02/2014
f( X ) 74 0 94 0 114 248 469

Frecuencia ( f )

70 - 74
75 - 79 80 - 84 85 - 89 90 - 94 95 - 100 Suma

72
77 82 87 92 97.5

8
8 6 7 2 2 50

576
616 492 609 184 195 3671

Tratamiento de datos y azar.


fi = 50
Sustituimos en

12/02/2014

fiXi = 3671

X = fiXi fi = 3671 50 = 73.4


El valor de media obtenida da la frecuencia agrupada es suficientemente aproximado para trabajos de estadstica.
Mediana La mediana de una distribucin de frecuencias para datos agrupados inicialmente se calcula N 2 A continuacin determinamos cul de las clases est a la mitad, y le llamaremos clase de la media, dentro de ella se localiza la mediana con una interpolacin lineal en la forma siguiente:

Tratamiento de datos y azar.

12/02/2014

Calcula la mediana de la distribucin de frecuencias. Clases Frecuencias 28.5 33.5 33.5 38.5 38.5 43.5 7 13 20

43.5 48.5
48.5 53.5 Total Resolucin Como N = 56 N 2 = 56 2 = 28

11
5 56

En este ejemplo la clase de mediana es ( 38.5 43.5)

Tratamiento de datos y azar.

12/02/2014

Al observar la columna de las frecuencias y sumando 7 + 13 = 20 vemos que hay 20 frecuencias antes del valor de la clase media, los 8 que faltan se interpolan en el ancho de la clase de la mediana, que en este ejemplo es de 5; ( la diferencia de 43.5 38.5). Interpolamos con la relacin proporcional (razones y proporciones); para obtener el valor de 8 razonamos as: 20 es a 5 como 1 es a X 20:5::1:X 20X = 5(1) X = 5 / 20 Como al 1 corresponden 5/20 Para los 8 que faltan tenemos: 8(5/20) = 40/20 = 2 Entonces 38.5 + 2 = 40.5 es el valor de la mediana

Tratamiento de datos y azar.

14/02/2014

La moda de datos agrupados La moda en una distribucin de datos agrupados, es la marca del intervalo de clase que contiene la mayor frecuencia. la moda variar segn la forma de agrupar. Seala la moda de los valores siguientes

Valores sin agrupar


X
12 13 14 15 16 17 18 19 20 21

Tratamiento de datos y azar.


f
1 1 0 2 3 4 4 5 4 3

14/02/2014
Frecuencia 2 9 13 14 5 3 46 Frecuencia
7 20 16 3

Valores agrupados en 6 clases Clases 11.5 - 14.5 14.5 - 17.5 17.5 - 20.5 20.5 - 23.5 23.5 - 26.5 26.5 29.5 Total En 4 clases Clases
11.5 - 16.5 16.5 - 21.5 21.5 - 26.5 26.5 - 31.5

22
23 24 25 26

5
6 1 3 1

27
28

2
1

Total

46

Total

46

Tratamiento de datos y azar.

14/02/2014

la moda en los datos sin agrupar es 23, por corresponderle la mayor frecuencia que es 6.
Para valores agrupados: En el agrupamiento de 6 clases, la moda es 22, que es la marca de clase de 20.5 - 23.5 clase que contiene la mayor frecuencia ( 14 ). En el agrupamiento de 4 clases, la moda es 19, que es la marca de clase de 16.5 - 21.5 clase que contiene la mayor frecuencia ( 20 ). Al fin de atender la demanda salarial de un grupo de 11 trabajadores, se analiza su ingreso en pesos y que son : 32, 40, 40, 45, 50, 55, 200, 300. Media = X = (32+40+40+45+50+55+200+300) 8 = $95.25 Mediana = (45 + 50) 2 = $ 47.5 Moda = $ 40.0

Tratamiento de datos y azar.


Media Geomtrica.

14/02/2014

la media, mediana y moda son las medidas de tendencia central ms fciles de calcular y las de mayor aplicacin. otras dos medidas de tendencia central se aplican en determinadas problemas y por ello, es conveniente conocerlas; stas son: Media Geomtrica. Media Armnica. Media Geomtrica. se define como la raz n del producto de n trminos. su uso permite el clculo de tasas de crecimiento. Media Geomtrica = n X1X2....Xn el crecimiento de las ventas de petrleo fue en los ltimos cuatro aos de 8%, 16%, 17%, 19%. Calcula la media geomtrica anual de crecimiento.

Tratamiento de datos y azar.


Resolucin

14/02/2014

1 + 8 100 = 1.08 primer ao. 1 + 16 100 = 1.16 segundo ao. 1 + 17 100 = 1.17 tercer ao. 1 + 19 100 = 1.19 cuarto ao. Media geomtrica = 4 1.08(1.16)(1.17)(1.19) = 41.742 = 1.15 1.15 - 1 = 0.15 Media anual de crecimiento = 0.15(100) = 15%

Media armnica

la media armnica H de una serie de nmeros es el reciproco de la media aritmtica de los recprocos de los nmeros de la serie

Tratamiento de datos y azar.


Calcular la media armnica de los nmeros 2,5,7. Resolucin.

14/02/2014

1/H = (1/2 + 1/5 + 1/7) 3 = (35 + 14 + 10)/70 3 = (59/70) 3 = 59/210


1/H = 59/210 La media armnica es H = 210/59 = 3.559 Medidas de dispersin. anteriormente estudiamos las medidas de tendencia central: media aritmtica, la mediana, la moda; y tambin la media geomtrica y la media armnica, que describen el comportamiento de los datos en una distribucin de frecuencias.

Tratamiento de datos y azar.

14/02/2014

Estas medidas no proporcionan informacin sobre la forma en que estn distribuidos o dispersos los valores con relacin a la tendencia central, y poco informan sobre un dato especifico con relacin a los otros en la distribucin de frecuencias. En un examen extraordinario de 40 alumnos que reprobaron matemticas y fsica calificados sobre 30 puntos, obtuvieron las calificaciones que se expresan en el cuadro de frecuencias agrupadas que se citan. Juan obtuvo 16 puntos en los dos exmenes que present, calcula qu resultado debe esperar en su calificacin.

Tratamiento de datos y azar.


Clases (calificaciones) 0.5 - 3.5 3.5 - 6.5 6.5 - 9.5 9.5 - 12.5 12.5 - 15.5 15.5 - 18.5 18.5 - 21.5 21.5 - 24.5 24.5 - 27.5 Frecuencias Matemticas 2 4 9 10 8 4 0 2 1

14/02/2014
Frecuencias Fsica 3 3 0 1 2 2 7 9 12

27.5 - 30.5
Total

0
40

1
40

Tratamiento de datos y azar.

14/02/2014

Juan obtuvo 16 puntos en ambos exmenes. en matemticas su calificacin ser bastante alta ya que slo hay 3 calificaciones mejores, y en el examen de fsica su resultado no es bueno porque hay 29 mejores que la suya. para la interpretacin de los resultados individuales de estos exmenes se necesita ms informacin que permita apreciar la dispersin de los valores en el entorno de la tendencia central.
Rango En toda distribucin hay valores extremos, uno menor y otro mayor, la diferencia entre estos valores se llama Rango y en l estn distribuidos todos los dems valores, por eso tambin se le llama recorrido.

Tratamiento de datos y azar.

14/02/2014

Desviacin media. La desviacin media de los valores absolutos de las desviaciones de cada uno de los valores de la variable, respecto a la media aritmtica, es la desviacin media. La desviacin media es una medida de dispersin muy objetiva, y cuanto mayor sea su valor mayor es la dispersin de los datos. Pero no proporciona una relacin matemtica precisa entre su magnitud y la posicin de un dato dentro de la distribucin; adems, al tomarse los valores absolutos, mide la desviacin de una observacin sin mostrar si est por encima o por debajo de la media aritmtica. Se expresa: desviacin media = DM = X-X N Y para una distribucin frecuencias agrupadas: DM = fX-X N

Tratamiento de datos y azar.

14/02/2014

Ejemplo: Calcular la DM de los nmeros: 6, 3, 4,12, 10, 2, 7, 5. Inicialmente calculamos el valor de X (media aritmtica): X = X N = (6+3+4+12+10+2+7+5)/8 = 6.12 Ahora, obtenemos la desviacin media DM = X X N =(6-6.12+3-6.12+4-6.12+12-6.12+10-6.12+2-6.12+ 7-6.12+5-6.12) 8 = 21.24 8 = 2.655 es la desviacin media. Calcula la desviacin media(DM) de la distribucin de frecuencias agrupadas que citamos a continuacin.

Tratamiento de datos y azar.


Clases (estatura) 121.5 126.5 126.5 131.5 131.5 136.5 136.5 141.5

14/02/2014

Frecuencias (alumnos) 2 3 8 23

141.5 146.5 146.5 151.5


151.5 156.5 156.5 161.5 161.5 166.5

27 20
16 3 2

Tratamiento de datos y azar.


Clases
(intervalos)
121.5 126.5 126.5 131.5 131.5 136.5 136.5 141.5 141.5 146.5 146.5 151.5 151.5 156.5 156.5 161.5 161.5 166.5

14/02/2014
X-X
20.62 15.62 10.62 5.62 0.62 4.38 9.38 14.38 19.38

Marca (X)
124 129 134 139 144 149 154 159 164

f
2 3 8 23 27 20 16 3 2 104

fX
248 387 1072 3197 3888 2980 2464 477 328 15041

fX-X
41.24 46.86 84.96 129.26 16.74 87.60 150.08 43.14 38.76 638.64

Totales

Tratamiento de datos y azar.

14/02/2014

Los datos numricos para llenar el cuadro para calcular la desviacin media (DM) se obtuvieron as: a) Las clases tambin se suelen citar como intervalos. b) La marca o marca de clase es el punto medio entre los extremos de un intervalo, en el ejemplo son: (121.5 + 126.5) 2 = (248.0) 2 = 124 (126.5 + 131.5) 2 = (258.0) 2 = 129 Y as se calculan las dems. c) Frecuencias (f), es el nmero de elementos que hay en el intervalo, se tomaron del cuadro donde se organizaron las estaturas de los alumnos en forma ascendente. d) f(X) es el resultado del producto de la marca de clase por la frecuencia (124)(2) = 248 (129)(2) = 387 Y as se calcularon las dems.

Tratamiento de datos y azar.

14/02/2014

e) X X es el valor absoluto de la diferencia de X y X. El valor de X est dentro del intervalo correspondiente, por eso tomamos el de la marca que lo representa. El de X = fX N = 15041 104 = 144.62 Operaciones para obtener los resultados de X X 124 144.62 = 20.62 129 144.62 = 15.62 134 144.62 = 10.62

139 144.62 = 5.62


144 144.62 = 0.62 149 142.62 = 4.38 154 142.62 = 9.38 159 142.62 = 14.38 164 142.62 = 19.38

Tratamiento de datos y azar.

14/02/2014

f) Hechos los clculos necesarios para obtener los valores del cuadro, tenemos que la Desviacin media DM = fX X N DM = 638.64 104 = 6.14 Varianza La varianza (S2) es la media aritmtica de los cuadrados de desviaciones respecto a la media aritmtica. Al calcular la desviacin media fue necesario no tomar en consideracin los signos negativos y tomar los valores absolutos de las desviaciones respecto a la media aritmtica. Si elevamos al cuadrado las desviaciones, logramos que todas las desviaciones den resultado positivo, sumando los cuadrados de las desviaciones y dividiendo entre N obtenemos la varianza.

Tratamiento de datos y azar.

14/02/2014

La varianza sirve de base para calcular la desviacin estndar o desviacin tpica que es la ms importante de todas las medidas de dispersin. La varianza (S2) para datos no agrupados se obtiene con: S2 = (X X)2 N Para datos agrupados:

S2 = f(X X)2 N
Calcula la desviacin media DM y la varianza de la serie de nmeros 9, 11, 1, 8, 14, 5, 6, 7, 11, 9. Resolucin Calculamos la media X X = X N = (9 + 11 + 1 + 8 + 14 + 5 + 6 + 7 + 11 + 9) 10= 81 10 = 8.1

Tratamiento de datos y azar.


DM = X X N

14/02/2014

= (9-8.1+11-8.1+1-8.1+8- 8.1+ 14 -8.1+5-8.1+6-8.1+7-8.1+11-8.1+9-8.1) 10 = ( 0.9+2.9+7.1+0.1+5.9+3.1+2.1+1.1+2.9+0.9) DM = 2.7

10

= 27 10

Para obtener la varianza, y como X = 8.1 sustituimos en S2 = (X - X )2 N =[(9-8.1)2 + (11-8.1)2 + (1-8.1)2 + (8-8.1)2 + (14-8.1)2 + (5-8.1)2 + (6-8.1)2 + (7-8.1)2 + (11-8.1)2 +(9-8.1)2] 10 = [(0.9)2 + (2.9)2 + (7.1)2 +(0.1)2 + (5.9)2 +(3.1)2 +(2.1)2 +(1.1)2 +(2.9)2 + (0.9)2 ] 10 = 11.89

Anda mungkin juga menyukai