05 /02/2014
A. Descripcion e interpretacion de la estadistica descriptiva Naturaleza de la Estadistica. - Etapas de la investigacion estadistica. - Poblacion. - Muestra. - Tamano de la muestra. - Muestreo aleatorio. - Variable estadistica. - Datos. - Experimento. - Parametros de decision.
05 /02/2014
Naturaleza de la Estadistica. La estadstica proporcionan formas para reflexionar acerca del comportamiento de muchos fenmenos con los que se enfrenta el ser humano da a da. La base de la estadstica es poder considerar un conjunto de datos y calcular valores estadsticos o trazar graficas, pero hay que tomar en cuenta que es mucho ms importante comprender las circunstancias que se estn investigando, las variables implicadas, porque se est investigando el problema y se aprende a cuestionar los datos y los resultados estadsticos. La experiencia y situaciones de la vida diaria constituyen la base para comprender la estadstica ya que esta trata sobre la descripcin del mundo que nos rodea y nos proporciona mtodos para analizar los resultados de experimentos efectuados, pero tambin indica cmo se pueden efectuar los experimentos de manera eficaz para disminuir los efectos de la variacin y tener mayor probabilidad de llegar a conclusiones correctas.
05 /02/2014
PLANIFICACIN Planteamiento del problema Formulacin Objetivos- Hiptesis de trabajo Fundamento e importancia de la investigacin Determinacin de la unidad de anlisis y variables Identificacin de las fuentes de informacin
05 /02/2014
ANLISIS E INTERPRETACIN DE RESULTADOS Clculo e interpretacin de indicadores estadsticos RESULTADOS Y CONCLUSIONES Poblacin: El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. "Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones. "Una poblacin es un conjunto de elementos que presentan una caracterstica comn".
05 /02/2014
Muestra: En estadstica una muestra estadstica (tambin llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una poblacin estadstica. Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben ser representativas de la misma. Para cumplir esta caracterstica la inclusin de sujetos en la muestra debe seguir una tcnica de muestreo. En tales casos, puede obtenerse una informacin similar a la de un estudio exhaustivo con mayor rapidez y menor coste (vanse las ventajas de la eleccin de una muestra, ms abajo). Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda la poblacin porque el manejo de un menor nmero de datos provoca tambin menos errores en su manipulacin. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados.
05 /02/2014
El nmero de sujetos que componen la muestra suele ser inferior que el de la poblacin, pero suficiente para que la estimacin de los parmetros determinados tenga un nivel de confianza adecuado. Para que el tamao de la muestra sea idneo es preciso recurrir a su clculo. Tamao de una Muestra Al definir el tamao de la muestra, nosotros deberemos procurar que sta informacin sea representativa, vlida y confiable y al mismo tiempo nos represente un mnimo costo. Por lo tanto, el tamao de la muestra estar delimitado por los objetivos del estudio y las caractersticas de la poblacin, adems de los recursos y el tiempo de que se dispone. Muestreo aleatorio Consideremos una poblacin finita, de la que deseamos extraer una muestra. Cuando el proceso de extraccin es tal que garantiza a cada uno de los elementos de la poblacin la misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de seleccin muestreo aleatorio.
05 /02/2014
El muestreo aleatorio se puede plantear bajo dos puntos de vista: Sin reposicin de los elementos; Con reposicin. variable estadstica Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin. Tipos de variable estadsticas A.- Variable cualitativa Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos: Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
05 /02/2014
05 /02/2014
Variable continua Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales. Datos Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Experimento. Un experimento es un procedimiento mediante el cual se trata de comprobar (confirmar o verificar) una o varias hiptesis relacionadas con un determinado fenmeno, mediante la manipulacin y el estudio de las correlaciones de la(s) variables que presumiblemente son su causa. La experimentacin constituye uno de los elementos claves de la investigacin cientfica y es fundamental para ofrecer explicaciones causales.
05 /02/2014
En un experimento se consideran todas las variables relevantes que intervienen en el fenmeno, mediante la manipulacin de las que presumiblemente son su causa, el control de las variables extraas y la aleatorizacin de las restantes. Estos procedimientos pueden variar mucho segn las disciplinas (no es igual en fsica que en psicologa, por ejemplo), pero persiguen el mismo objetivo: excluir explicaciones alternativas (diferentes a la variable manipulada) en la explicacin de los resultados. Este aspecto se conoce como validez interna del experimento, la cual aumenta cuando el experimento es replicado por otros investigadores y se obtienen los mismos resultados. Cada repeticin del experimento se llama prueba o ensayo. Las distintas formas de realizar un experimento (en cuanto a distribucin de unidades experimentales en condiciones o grupos) son conocidas como protocolo de investigacin. Un parmetro estadstico es un nmero que se obtiene a partir de los datos de una distribucin estadstica.
05 /02/2014
Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla o por una grfica. Tipos de parmetros estadsticos Hay tres tipos parmetros estadsticos: De centralizacin. De posicin. De dispersin.
06 /02/2014
Nos indican en torno a qu valor (centro) se distribuyen los datos. La medidas de centralizacin son: Media aritmtica La media es el valor promedio de la distribucin. Mediana La mediana es la puntacin de la escala que separa la mitad superior de la distribucin y la inferior, es decir divide la serie de datos en dos partes iguales. Moda La moda es el valor que ms se repite en una distribucin.
06 /02/2014
Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. La medidas de posicin son:
06 /02/2014
Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la distribucin. Las medidas de dispersin son: Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Desviacin media La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. Varianza La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media. Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza.
a) Dato de variable cuantitativa Valor numerico de una variable. b) Muestra Subconjunto representativo de una poblacion. c) Parmetro Medida descriptiva de una muestra o poblacion. d) Poblacin Total de elementos en estudio que presentan caracteristicas comunes. e) Datos Es el resultado que se obtiene como resultado de un conteo.
f)
g) Estadstica Estudio de metodos para manejar la obtencion, presentacion y analisis de observaciones numericas, para tomar decisiones o realizar generalizaciones acerca de las caracteristicas de una poblacion
12/02/2014
La media aritmtica es la suma de los valores de cierto nmero de cantidades dividido entre su nmero. se expresa: X = S Xi / N
Donde N: es el nmero de observaciones X: el valor de cada observacin X : es la media aritmtica, media, o X barra. La media es la nica de la medidas de tendencia central que puede intervenir en operaciones algebraicas. Obtener la media del precio del petrleo registrada en un mes, si se vendi en el mercado mundial en 28, 31, 29, 27, 26 dlares por barril
12/02/2014
X = (28+31+29+27+26) 5 = 141 5 X = 28.2 En un examen extraordinario las calificaciones obtenidas por un grupo de 13 alumnos sobre un mximo de 10 puntos, fueron: En matemticas: 4, 7, 3, 6, 2, 8, 4, 7, 0, 1, 7, 6, 4 En fsica: 8, 4, 3, 6, 7, 5, 6, 2, 1, 7, 6, 7, 0 Calcular el promedio de matemticas, de fsica y el de ambas materias Resolucin X = (4+7+3+6+2+8+4+7+0+1+7+6+4) 13 = 59 13 = 4.54
matemticas
12/02/2014
Media aritmtica ponderada Se aplica para calcular el valor promedio de cantidades a cada una de las cuales est asociado un nmero que lo pondera.
Si un comerciante en ropa compra dos partidas de camisas, una de 60 a $75, cada una, y otra de 30 en $83.5 cada prenda. Obtener el precio promedio de cada camisa. Resolucin Precio promedio= 60(75) + 30(83.5) 60+30 = 4500 + 2505 90 = $77.83
12/02/2014
La tendencia actual para ingresar a una licenciatura exige que el aspirante tenga un promedio de sus estudios de enseanza media superior de 8.5 y apruebe el examen de admisin con 6 como mnimo. No todas las materias que se evalan en el examen tiene el mismo peso; es decir, cada una tiene una ponderacin diferente. Un aspirante obtuvo las calificaciones siguientes: matemticas 8, fsica 7, espaol 4, ingls 6; para averiguar si el alumno ingresa a la universidad se tiene que calcular el promedio ponderado. Las ponderaciones son: matemticas 7, fsica 7, espaol 3, ingls 5.
12/02/2014
La mediana y la moda son medidas de tendencia central que por sus propiedades destacan los valores individuales de un colectivo; en cambio, la media aritmtica, al promediar todos los valores igualando en su justo reparto todas las observaciones, suprime sus individualidades. Mediana La mediana se define como el valor que divide un conjunto de datos previamente ordenados de menor a mayor, y es el punto intermedio entre todos ellos. Si el nmero N de datos es impar, entonces hay un nmero intermedio; por ejemplo, si tenemos cinco datos, 3,5,7, 9, 11 el nmero 7 es el punto intermedio. Si el nmero N de datos es par, entonces hay dos datos intermedios; por ejemplo, la media de los valores 8,10,16,19,23,25, hay dos valores centrales que son 16 y 19; el valor equidistante entre ellos es la mediana: (16 + 19) 2 = 35 2 = 17.5 es la mediana
12/02/2014
Moda En un conjunto de datos de una distribucin de frecuencias, la moda es el valor que ocurre con mayor frecuencia; por ejemplo, en los valores: 1,2,5,5,6,6,6,6,7,8,9,9,9, la moda es el 6. la moda es el valor ms representativo o tpico de una serie de valores, en el sentido que ocurre con mayor frecuencia. Ejercicio: Seala la moda de los valores siguientes: 12, 13, 15, 15, 16, 16, 16, 17,17,17,17, 18,18,18,18 19,19,19,19, 20, 20,20, 20, 21, 21, 21, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 24, 25, 25, 25, 26, 27, 27, 28,
12/02/2014
Distribucin de frecuencias con datos no agrupados. Una vez reunidos los datos de un colectivo para obtener a partir de ellos conclusiones, es necesario organizarlos en una tabla de distribucin de frecuencias.
La tabla de distribucin de frecuencias es una funcin, ya que cada medida est relacionada con un nmero que es su frecuencia y como tal se puede puede expresar: como una lista, una grfica o una regla; en estadstica se hace con una lista que es la tabla de frecuencias o con una grfica, por ejemplo, un diagrama de frecuencia de puntos.
Las distribuciones de una sola variable se clasifican en tres tipos, segn el nmero de observaciones y el nmero de valores distintos que toma la variable.
12/02/2014
A. Distribuciones del tipo Uno. Son aquellas que constan de un reducido nmero de observaciones y en consecuencia de un reducido nmero de valores distintos que toma la variable; para su presentacin no es necesaria una tcnica determinada, ya que adems casi no son susceptibles de tratamiento estadstico, puesto que para que ste exista es necesario un volumen considerable de observaciones.
B. Distribuciones del tipo Dos Son las que el nmero de observaciones es grande, pero el nmero de valores distintos que toma la variable es pequeo; en este tipo, se distribuyen o agrupan los resultados disponibles en dos columnas, una para los valores distintos que toma la variable, y otra para la frecuencia de cada uno de ellos.
12/02/2014
Para determinar el grado de nutricin de 20 alumnos de secundaria se toma la altura en centmetros de cada uno de ellos, y son:
128 140 136 136 146 124 120 134 136 134 130 142 136 142 136 132 150 138 132 144
Para facilitar su interpretacin se ordenan de forma ascendente o descendente, a este proceso se le llama orden de rango.
120 132 136 142
124
128 130 132
134
134 136 136
136
136 138 140
142
144 146 150
12/02/2014
Para proceder a organizar los datos se usa la tabla de frecuencia que expresa el nmero de casos de cada categora ( es una distribucin del tipo Dos).
Altura X1 120 121 122 123 124 125 126 127 128 129 Frecuencia n1 1 0 0 0 1 0 0 0 1 0 Altura X1 130 131 132 133 134 135 136 137 138 139 Frecuencia n1 1 0 2 0 2 0 5 0 1 0 Altura X1 140 141 142 143 144 145 146 147 148 150 Frecuencia n1 1 0 2 0 1 0 1 0 0 2
19/02/2014
Frecuencia absoluta (para datos no agrupados). La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi.
Datos X Conteo Frecuencia Absoluta Frecuencia Absoluta Acumulada Frecuencia Relativa Frecuencia Relativa Acumulada 0.100 0.233 0.500 0.767 0.900 1.000 Frecuencia Relativa Frecuencia Relativa Acumulada
(fi)
0 1 2 3 4 5 III IIII IIIII III IIIII III IIII III 3 4 8 8 4 3
(Fi)
3 7 15 23 27 30
(fr)
3/30 = 0.100 4/30 = 0.133 8/30 = 0.267 8/30 = 0.267 4/30 = 0.133 3/30 = 0.100
Fr (%)
10 13.3 26.7 26.7 13.3 10 100
Fra (%)
10 23.3 50 76.7 90 100
n=
30
12/02/2014
C. Distribucin del tipo TRES. Si el nmero de observaciones y el nmero de valores que toma la variable son grandes para su manejo se agrupan las observaciones en intervalos Li-1 Li, eligiendo entre ellos una amplitud fija o variable, mismos que se anotarn en una primera columna; en la segunda, se tabularn los valores para facilitar su conteo; y en la tercera, se pondr el nmero de frecuencia (f) correspondiente a cada intervalo. Los grupos o categoras que incluye Li-1 Li se llaman intervalos de clase; los valores Li-1 son lmites inferiores, y Li los limites superiores de estos intervalos.
Clases Li-1 Li
L0 L1 L1 L2 L2 L3 Lk-1 Lk
Tabulaciones
Frecuencias (f) n1
n1 n2 n3 nk
12/02/2014
37
93 49 89 76 64 77 71 80
76
77 57 96 68 83 88 73 77
85
66 38 78 63 67 74 61 85
74
83 69 97 70 61 75 57 80
65
68 78 74 81 90 80 72 89
12/02/2014
85 85 87 88 89
57
61 61 63
68
69 70 71
76
76 77 77
80
81 83 83
89
90 93 96
64
72
77
85
97
12/02/2014
Frecuencias (f) ni 2 0 2 0
55 - 59
60 - 64 65 - 69 70 - 74 75 - 79 80 - 84 85 - 89 90 - 94 95 - 100
II
IIII IIII II IIII III IIII III IIII I IIII II II II
2
4 7 8 8 6 7 2 2
12/02/2014
Al disponer los datos primarios en una distribucin del tipo TRES como en la tabla de frecuencias, tiene lugar una prdida de informacin, ya que no se consideran los resultados obtenidos en forma exacta, sino por aproximacin: no se dir que dicho valor se encuentra entre Li-1 y Li. Como lo que interesa es elegir una amplitud constante o variable lo suficientemente pequea para que la prdida sea lo menos posible, y al mismo tiempo lo suficientemente grande para que el agrupamiento presente una distribucin de no demasiados valores, pues de lo contrario, el haber hecho el agrupamiento perder su finalidad, es decir, la comodidad del manejo. Para facilitar el calculo es recomendable escoger estos intervalos de manera que sus puntos medios sean mltiplos de nmeros como el 5 o como el 10 y generalmente no debe haber menos de 7 intervalos ni ms de 15, aunque no hay normas fijas. No es necesario que los intervalos de clase sean iguales, tampoco aqu hay reglas fijas y cada uno elige el intervalo de clase ms adecuado.
12/02/2014
Antes de aplicar a la informacin los mtodos estadsticos, es necesario sustituir cada intervalo por un nmero, a este nmero se le llama marca de clase y es el valor central de cada intervalo, es decir, la media aritmtica de los lmites inferior y superior. Marca de clase = Xi = (Li-1 + Li)/2 se abrevia (m.c) Para obtener las marcas de clase del ejemplo anterior tenemos: (35 + 39)/2 = 37 (40 + 44)/2 = 42 (45 + 49)/2 = 47 (50 + 54)/2 = 52 (55 + 59)/2 = 57 (60 + 64)/2 = 62 (65 + 69)/2 = 67 (70 + 74)/2 = 72 (75 + 79)/2 = 77 (80 + 84)/2 = 82 (85 + 89)/2 = 87 (90 + 94)/2 = 92 (95 + 100)/2 = 97.5
12/02/2014
Marca de clase (m.c) Xi 37 42 47 52 57 62
65 - 69
70 - 74 75 - 79 80 - 84 85 - 89 90 - 94 95 - 100
IIII II
IIII III IIII III IIII I IIII II II II
7
8 8 6 7 2 2
67
72 77 82 87 92 975
19/02/2014
Observa: al poner la marca de clase se comete un error de agrupamiento pues las ni ( frecuencias f) no son las veces que se repite el valor Xi de la variable, sino que son las veces que aparecen valores de la variable considerados entre Li-1 Li. Aceptamos que la prdida de informacin a que nos referimos y este error de agrupamiento son absolutamente necesarios para que las distribuciones del tipo TRES puedan recibir un tratamiento estadstico. Para obtener el rango de un serial de datos, hay que identificar el valor ms pequeo de los datos (Xm) y el valor ms grande de los datos (XM), entonces el RANGO (R) = XM Xm. El nmero de intervalos lo podemos obtener utilizando la siguiente frmula (esta formula es valida si el nmero de datos es menor que 200)
K = n ,
Donde: K = nmero de clases o intervalos de clase
1/02/2014
Para determinar la amplitud o ancho de clase que deber tener cada intervalo, se aplica la siguiente formula:
A = R/K A = ancho del intervalo R = Rango de los datos K = nmero de clase o intervalo. Limites reales o fronteras reales.
Los lmites reales son valores que unen a las clases y se forman nicamente de nmeros enteros, estos se obtienen al restar 0.5 a los limites de la izquierda y sumar 0.5 a los limites de la derecha; cuando las clases tengan un decimal, habr que restar 0.05 a los limites de la izquierda y sumar 0.05 limites de la derecha y as sucesivamente.
19/02/2014
Datos ordenados
515 704 832 1052 542 739 956 1296 643 782 987 1333 696 784 1023 1475 700 814 1023 1482
19/02/2014
Nmero de clases = nmero de datos = 20 = 4.47 = 5 Tamao del intervalo o ancho de clase: Intervalo exacto = (Valor mayor Valor menor) Nmero de clases = (1482 515) 5 = 193.4 se ajusta el tamao a 194 Determinacin de los limites de clase:
Limite inferior de la clase = limite inferior de la clase anterior + tamao del intervalo Limite inferior de la clase A = 515 Limite inferior de la clase B = 515 + 194 = 709 Limite inferior de la clase C = 709 + 194 = 903 Limite inferior de la clase D = 903 + 194 = 1097 Limite inferior de la clase E = 1097 + 194 = 1291
19/02/2014
La tabla siguiente muestra los lmites de cada clase, as como el conteo de los datos.
Clase
Frecuencia (meses)
A B C
6 5 5
D
E
1097
1291
1290
1484
0
4
19/02/2014
Considerando cinco clases con intervalos uniformes de 200, y que stas deben incluir todos los valores, puede seleccionarse a 500 como lmite inferior de la primera clase, y a partir de este lmite identificar los dems.
Lmite inferior de la clase = lmite inferior de la clase anterior + tamao del intervalo. Limite inferior de la clase A = 500 Limite inferior de la clase B = 500 + 200 = 700 Limite inferior de la clase C = 700 + 200 = 900 Limite inferior de la clase D = 900 + 200 = 1100 Limite inferior de la clase E = 1100 + 200 = 1300 Limite superior de la clase = limite inferior de la clase + intervalo unidad de variacin.
Limite superior de la clase A = 500 + 200 1 = 699 Limite superior de la clase B = 700 + 200 1 = 899 Limite superior de la clase C = 900 + 200 1 = 1099 Limite superior de la clase D = 1100 + 200 - 1 = 1299 Limite superior de la clase E = 1300 + 200 1 = 1499
19/02/2014
Frecuencia (meses)
La siguiente tabla muestra los limites de cada clase, as como el conteo de los datos.
A B C D E
4 7 5 1 3
Lmites reales o Fronteras reales de clase. El lmite inferior real de cada clase se calcula restando la mitad de la diferencia entre el lmite inferior de la clase siguiente y el lmite superior de la clase, esto es, la mitad de la unidad de variacin de los datos. El lmite superior real de cada clase se calcula sumando la mitad de la diferencia entre el lmite inferior de la clase siguiente y el lmite superior de la clase, esto es, la mitad de la unidad de variacin de los datos.
19/02/2014
Ejemplo. Determine los lmites reales o fronteras y la marca de clase de cada una de las clases de la siguiente tabla, en la que se presenta el peso, en libras, de los nios de una escuela primaria. Clase A B C D Lmite Inferior (Lb) 101 116 131 146 Lmite superior (Lb) 115 130 145 160
19/02/2014
Solucin. Una formula para calcular el lmite inferior real de cada clase es la siguiente:
Lmite inferior real de la clase = lmite inferior de la clase (lmite inferior de la clase siguiente lmite superior de clase) 2 Nota: el lmite inferior de la clase siguiente a la ltima es el lmite superior de la ltima clase, ms la diferencia entre el lmite inferior de la ltima clase y el lmite superior de la penltima clase.
A B C D
19/02/2014
19/02/2014
A B
101 116
115 130
100.5 115.5
115.5 130.5
108 123
C
D
131
146
145
160
130.5
145.5
145.5
160.5
138
153
19/02/2014
Una grfica vale ms que mil palabras, dice el refrn. Esto es particularmente cierto en el caso de los anlisis estadsticos, donde los datos al natural e incluso tabulados pueden ser abrumadores, difciles de comprender. Grfica circular (de pastel). Las grficas circulares o grficas de pastel son figuras que representan, por medio de segmentos de crculo, la frecuencia, absoluta o relativa de una tabla de distribucin de frecuencias. La presentacin de datos en esta forma es impresionante, sobre todo cuando se les aaden efectos visuales tales como color y grosor a los segmentos, o se separa alguno de ellos del centro. Estas grficas se preparan con base en el ngulo que resulta de multiplicar 360(los grados de un circulo) por la frecuencia relativa de cada clase, por lo que su clculo es muy sencillo.
19/02/2014
19/02/2014
Un grfico de barras es aquella representacin grfica bidimensional en que los objetos grficos elementales son un conjunto de rectngulos dispuestos paralelamente de manera que la extensin de los mismos es proporcional a la magnitud que se quiere representar. Los rectngulos o barras pueden estar colocados horizontal o verticalmente. En ste ltimo caso reciben tambin el nombre de grficos de columnas. Utilizacin. Tpicamente se utilizan para comparar magnitudes entre varias categoras o la evolucin en el tiempo (el cambio) de una determinada magnitud. La comparacin de la evolucin en el tiempo de varias categoras, esto es, se suelen usar tambin para la mezcla de las dos utilidades anteriores.
19/02/2014
19/02/2014
Histograma. A modo de resumen un histograma es una grfica de barras que nos permite describir el comportamiento de un conjunto de datos, pero en este caso las diferentes observaciones de una misma variable se grafican alrededor de un valor medio o central.
19/02/2014
Polgono de frecuencias. Un polgono de frecuencias se forma uniendo los extremos de las barras de un diagrama de barras mediante segmentos. Tambin se puede realizar trazando los puntos que representan las frecuencias y unindolos mediante segmentos.
HoraTemperatura 6 7 9 12 12 14 15 11 18 12 21 10 24 8
19/02/2014
Polgonos de frecuencia para datos agrupados Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectngulo de un histograma. Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla:
fi [50, 60) 55 [60, 70) 65 [70, 80) 75 [80, 90) 85 [90, 100) 95 [100, 110) 110 [110, 120) 115 ci Fi 8 10 16 14 10 5 2 65 8 18 34 48 58 63 65
19/02/2014
Ojivas. La ojiva es el polgono de frecuencias acumuladas, es decir, que en ella se permite ver cuntas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los nmeros asignados a cada intervalo.
19/02/2014
El Diagrama de Tallo y Hoja, a pesar de no ser un grfico definitivo para la presentacin de datos, es fcil y rpido para realizar a mano, con el se puede dar una mirada no pulida de los datos. Una ventaja de este diagrama sobre la distribucin de frecuencias consiste en que no pierde la identidad de cada observacin. Es una tcnica estadstica para la prestacin de un conjunto de datos. Cada valor numrico se divide en 2 partes. El dgito principal se convierte en el tallo y los dgitos secundarios en las hojas. El tallo se localiza a lo largo del eje vertical y los valores de las hojas se apilan unos contra otros a lo largo del eje horizontal. Como construirlo? En un grfico de tallo y hoja cada valor de datos es partido en "un tallo" "y una hoja". "La hoja" es por lo general el ltimo dgito del nmero y los otros dgitos a la izquierda "de la hoja" forman "el tallo". Por ejemplo, el nmero 136 sera partido como: TALLO: 13HOJA: 6
19/02/2014
1. Puede ordenar los datos de menor a mayor, esto ayudara a la organizacin de los datos (Opcional) 2. Separe cada nmero en un tallo y una hoja. 3. Agrupe los nmeros con los mismos tallos. Ponga los tallos en una lista en orden creciente. Veamos un Ejemplo con los siguientes 15 datos: 35, 36, 38, 40, 42, 42, 44, 45, 45, 47, 48, 49, 50, 50, 50
Algunos software como SPSS o MINITAB pueden separar el Tallo en una parte inferior(hojas desde el cero al 4) y otra superior (hojas desde el 5 al 9)
12/02/2014
12/02/2014
Ejemplo: Calcular la media aritmtica de la distribucin de frecuencias agrupadas de la tabla de frecuencias que obtuvimos anteriormente
Clases Li-1 Li 35 - 39 40 - 44 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 80 - 84 85 - 89 90 - 94 95 - 100 II IIII IIII II IIII III IIII III IIII I IIII II II II II Tabulaciones II Frecuencias (f) ni 2 0 2 0 2 4 7 8 8 6 7 2 2 Marca de clase (m.c) Xi 37 42 47 52 57 62 67 72 77 82 87 92 975
12/02/2014
f( X ) 74 0 94 0 114 248 469
Frecuencia ( f )
70 - 74
75 - 79 80 - 84 85 - 89 90 - 94 95 - 100 Suma
72
77 82 87 92 97.5
8
8 6 7 2 2 50
576
616 492 609 184 195 3671
12/02/2014
fiXi = 3671
12/02/2014
Calcula la mediana de la distribucin de frecuencias. Clases Frecuencias 28.5 33.5 33.5 38.5 38.5 43.5 7 13 20
43.5 48.5
48.5 53.5 Total Resolucin Como N = 56 N 2 = 56 2 = 28
11
5 56
12/02/2014
Al observar la columna de las frecuencias y sumando 7 + 13 = 20 vemos que hay 20 frecuencias antes del valor de la clase media, los 8 que faltan se interpolan en el ancho de la clase de la mediana, que en este ejemplo es de 5; ( la diferencia de 43.5 38.5). Interpolamos con la relacin proporcional (razones y proporciones); para obtener el valor de 8 razonamos as: 20 es a 5 como 1 es a X 20:5::1:X 20X = 5(1) X = 5 / 20 Como al 1 corresponden 5/20 Para los 8 que faltan tenemos: 8(5/20) = 40/20 = 2 Entonces 38.5 + 2 = 40.5 es el valor de la mediana
14/02/2014
La moda de datos agrupados La moda en una distribucin de datos agrupados, es la marca del intervalo de clase que contiene la mayor frecuencia. la moda variar segn la forma de agrupar. Seala la moda de los valores siguientes
14/02/2014
Frecuencia 2 9 13 14 5 3 46 Frecuencia
7 20 16 3
Valores agrupados en 6 clases Clases 11.5 - 14.5 14.5 - 17.5 17.5 - 20.5 20.5 - 23.5 23.5 - 26.5 26.5 29.5 Total En 4 clases Clases
11.5 - 16.5 16.5 - 21.5 21.5 - 26.5 26.5 - 31.5
22
23 24 25 26
5
6 1 3 1
27
28
2
1
Total
46
Total
46
14/02/2014
la moda en los datos sin agrupar es 23, por corresponderle la mayor frecuencia que es 6.
Para valores agrupados: En el agrupamiento de 6 clases, la moda es 22, que es la marca de clase de 20.5 - 23.5 clase que contiene la mayor frecuencia ( 14 ). En el agrupamiento de 4 clases, la moda es 19, que es la marca de clase de 16.5 - 21.5 clase que contiene la mayor frecuencia ( 20 ). Al fin de atender la demanda salarial de un grupo de 11 trabajadores, se analiza su ingreso en pesos y que son : 32, 40, 40, 45, 50, 55, 200, 300. Media = X = (32+40+40+45+50+55+200+300) 8 = $95.25 Mediana = (45 + 50) 2 = $ 47.5 Moda = $ 40.0
14/02/2014
la media, mediana y moda son las medidas de tendencia central ms fciles de calcular y las de mayor aplicacin. otras dos medidas de tendencia central se aplican en determinadas problemas y por ello, es conveniente conocerlas; stas son: Media Geomtrica. Media Armnica. Media Geomtrica. se define como la raz n del producto de n trminos. su uso permite el clculo de tasas de crecimiento. Media Geomtrica = n X1X2....Xn el crecimiento de las ventas de petrleo fue en los ltimos cuatro aos de 8%, 16%, 17%, 19%. Calcula la media geomtrica anual de crecimiento.
14/02/2014
1 + 8 100 = 1.08 primer ao. 1 + 16 100 = 1.16 segundo ao. 1 + 17 100 = 1.17 tercer ao. 1 + 19 100 = 1.19 cuarto ao. Media geomtrica = 4 1.08(1.16)(1.17)(1.19) = 41.742 = 1.15 1.15 - 1 = 0.15 Media anual de crecimiento = 0.15(100) = 15%
Media armnica
la media armnica H de una serie de nmeros es el reciproco de la media aritmtica de los recprocos de los nmeros de la serie
14/02/2014
14/02/2014
Estas medidas no proporcionan informacin sobre la forma en que estn distribuidos o dispersos los valores con relacin a la tendencia central, y poco informan sobre un dato especifico con relacin a los otros en la distribucin de frecuencias. En un examen extraordinario de 40 alumnos que reprobaron matemticas y fsica calificados sobre 30 puntos, obtuvieron las calificaciones que se expresan en el cuadro de frecuencias agrupadas que se citan. Juan obtuvo 16 puntos en los dos exmenes que present, calcula qu resultado debe esperar en su calificacin.
14/02/2014
Frecuencias Fsica 3 3 0 1 2 2 7 9 12
27.5 - 30.5
Total
0
40
1
40
14/02/2014
Juan obtuvo 16 puntos en ambos exmenes. en matemticas su calificacin ser bastante alta ya que slo hay 3 calificaciones mejores, y en el examen de fsica su resultado no es bueno porque hay 29 mejores que la suya. para la interpretacin de los resultados individuales de estos exmenes se necesita ms informacin que permita apreciar la dispersin de los valores en el entorno de la tendencia central.
Rango En toda distribucin hay valores extremos, uno menor y otro mayor, la diferencia entre estos valores se llama Rango y en l estn distribuidos todos los dems valores, por eso tambin se le llama recorrido.
14/02/2014
Desviacin media. La desviacin media de los valores absolutos de las desviaciones de cada uno de los valores de la variable, respecto a la media aritmtica, es la desviacin media. La desviacin media es una medida de dispersin muy objetiva, y cuanto mayor sea su valor mayor es la dispersin de los datos. Pero no proporciona una relacin matemtica precisa entre su magnitud y la posicin de un dato dentro de la distribucin; adems, al tomarse los valores absolutos, mide la desviacin de una observacin sin mostrar si est por encima o por debajo de la media aritmtica. Se expresa: desviacin media = DM = X-X N Y para una distribucin frecuencias agrupadas: DM = fX-X N
14/02/2014
Ejemplo: Calcular la DM de los nmeros: 6, 3, 4,12, 10, 2, 7, 5. Inicialmente calculamos el valor de X (media aritmtica): X = X N = (6+3+4+12+10+2+7+5)/8 = 6.12 Ahora, obtenemos la desviacin media DM = X X N =(6-6.12+3-6.12+4-6.12+12-6.12+10-6.12+2-6.12+ 7-6.12+5-6.12) 8 = 21.24 8 = 2.655 es la desviacin media. Calcula la desviacin media(DM) de la distribucin de frecuencias agrupadas que citamos a continuacin.
14/02/2014
Frecuencias (alumnos) 2 3 8 23
27 20
16 3 2
14/02/2014
X-X
20.62 15.62 10.62 5.62 0.62 4.38 9.38 14.38 19.38
Marca (X)
124 129 134 139 144 149 154 159 164
f
2 3 8 23 27 20 16 3 2 104
fX
248 387 1072 3197 3888 2980 2464 477 328 15041
fX-X
41.24 46.86 84.96 129.26 16.74 87.60 150.08 43.14 38.76 638.64
Totales
14/02/2014
Los datos numricos para llenar el cuadro para calcular la desviacin media (DM) se obtuvieron as: a) Las clases tambin se suelen citar como intervalos. b) La marca o marca de clase es el punto medio entre los extremos de un intervalo, en el ejemplo son: (121.5 + 126.5) 2 = (248.0) 2 = 124 (126.5 + 131.5) 2 = (258.0) 2 = 129 Y as se calculan las dems. c) Frecuencias (f), es el nmero de elementos que hay en el intervalo, se tomaron del cuadro donde se organizaron las estaturas de los alumnos en forma ascendente. d) f(X) es el resultado del producto de la marca de clase por la frecuencia (124)(2) = 248 (129)(2) = 387 Y as se calcularon las dems.
14/02/2014
e) X X es el valor absoluto de la diferencia de X y X. El valor de X est dentro del intervalo correspondiente, por eso tomamos el de la marca que lo representa. El de X = fX N = 15041 104 = 144.62 Operaciones para obtener los resultados de X X 124 144.62 = 20.62 129 144.62 = 15.62 134 144.62 = 10.62
14/02/2014
f) Hechos los clculos necesarios para obtener los valores del cuadro, tenemos que la Desviacin media DM = fX X N DM = 638.64 104 = 6.14 Varianza La varianza (S2) es la media aritmtica de los cuadrados de desviaciones respecto a la media aritmtica. Al calcular la desviacin media fue necesario no tomar en consideracin los signos negativos y tomar los valores absolutos de las desviaciones respecto a la media aritmtica. Si elevamos al cuadrado las desviaciones, logramos que todas las desviaciones den resultado positivo, sumando los cuadrados de las desviaciones y dividiendo entre N obtenemos la varianza.
14/02/2014
La varianza sirve de base para calcular la desviacin estndar o desviacin tpica que es la ms importante de todas las medidas de dispersin. La varianza (S2) para datos no agrupados se obtiene con: S2 = (X X)2 N Para datos agrupados:
S2 = f(X X)2 N
Calcula la desviacin media DM y la varianza de la serie de nmeros 9, 11, 1, 8, 14, 5, 6, 7, 11, 9. Resolucin Calculamos la media X X = X N = (9 + 11 + 1 + 8 + 14 + 5 + 6 + 7 + 11 + 9) 10= 81 10 = 8.1
14/02/2014
10
= 27 10
Para obtener la varianza, y como X = 8.1 sustituimos en S2 = (X - X )2 N =[(9-8.1)2 + (11-8.1)2 + (1-8.1)2 + (8-8.1)2 + (14-8.1)2 + (5-8.1)2 + (6-8.1)2 + (7-8.1)2 + (11-8.1)2 +(9-8.1)2] 10 = [(0.9)2 + (2.9)2 + (7.1)2 +(0.1)2 + (5.9)2 +(3.1)2 +(2.1)2 +(1.1)2 +(2.9)2 + (0.9)2 ] 10 = 11.89