Anda di halaman 1dari 102

INSTITUTO SUPERIOR TECNOLGICO NORBERT WIENER

Manual del Alumno


ASIGNATURA:

Estadstica I

Lima-Per

Manual del Alumno

Los hombres dudan muchas veces antes de dar el primer paso, porque piensan que no podrn alcanzar la meta que se han propuesto. Esta actitud es el principal obstculo que se opone a su progreso, y que cada uno de nosotros con un pequeo esfuerzo de voluntad puede vencer.
Mahatma Gandhi

CURSO: ESTADISTICA I CICLO III

Manual del Alumno

ESTADISTICA I ndice General


Pag N 1. Estadstica General ............................................................ 5 2. Estadstica Descriptiva....................................................... 7 3. Las Variables Estadsticas..................................................10 4. La Organizacin de los Datos.....................................11 5. Prctica Calificada.......................................................... 6. Presentacin de los Datos...................................................24 7. Estadgrafos de Tendencia Central.................................... 25 8. Estadgrafos de Tendencia Central .................................. 29 9. Estadgrafos de Tendencia No Central...35 11 Estadgrafos de Dispersin.........41

CURSO: ESTADISTICA I CICLO III

Manual del Alumno 12. Distribucin Bidimensional ............................................. .34 14. Regresin Lineal.................................................45 15. Regresin Lineal - Anlisis de Correlacin ...............49 16. Anlisis de Regresin Lineal .............................................65 17. Nmeros Indices ................................................................75 Problemas resueltos..... ...................................83 10. Problemas propuestos....90

CURSO: ESTADISTICA I CICLO III

Manual del Alumno


SESION #1

CAPITULO I ESTADISTICA GENERAL


DEFINICION Y CLASIFICACION DE LA ESTADISITICA

ESTADISTICA: Es una ciencia aplicada a cualquier tema del saber humano y se encarga de recopilar, ordenar, clasificar y presentar una informacin llamada Muestra, con el fin de inferir acerca del comportamiento de una poblacin. La Estadstica se clasifica en: 1. Estadstica Descriptiva; es la que se encarga de recopilar, ordenar, clasificar y presenta una informacin, llamada muestra aleatoria. 2. Estadstica Inferencial; es la parte de la Estadstica que se encarga de inferir sobre el comportamiento de una poblacin a partir de una muestra, bajo un margen de error o incertidumbre que es cuantificado por la teora de probabilidades. CONCEPTOS FUNDAMENTALES EN ESTADISTICA POBLACION: Es un conjunto de observaciones que tienen una caracterstica en comn la cual se desea estudiar, la poblacin representa la totalidad de elementos de un determinado estudio y puede ser finita o infinita. Ejemplos: 1. Habitantes de Lima (aptos para el sufragio). Infinita
CURSO: ESTADISTICA I CICLO III

Poblacin

Manual del Alumno 2. Alumnos de WIENER (altura en mts.) Poblacin Finita

Una poblacin si es infinita no se puede estudiar en forma completa; an si es finita es muy engorroso estudiarla en forma completa por que involucra prdida de tiempo, dinero, etc., por esta razn nos basamos en una muestra aleatoria. MUESTRA Es un subconjunto de la poblacin y para que la muestra sea representativa debe ser aleatoria o no sesgada.
Una muestra es aleatoria cuando cada elemento de la poblacin tiene la misma posibilidad de ser seleccionado en la muestra. La demostraremos por: n= tamao de la muestra nmero total de observaciones en la muestra.

Ejemplos: 1. Encuesta a 900 personas de Lima aptos para el sufragio. n = 900 2. Altura (mts) de 45 alumnos de WIENER
n = 45.

PARAMETRO
Nmero que representa a la poblacin. Este valor generalmente es estimado a partir de una muestra, porque para que sea calculado exactamente se requiere de la informacin completa de una poblacin lo cual es muy difcil (los procesos de estimacin de parmetros ser tema de estudio en Estadstica Inferencial).

ESTADIGRAFO
Llamado tambin estadstico o estimador. Nmero que representa a la muestra y que puede ser calculado teniendo la informacin de una muestra. Los Estadgrafos se dividen en:

CURSO: ESTADISTICA I CICLO III

Manual del Alumno 1. Estadgrafos de Posicin o Tendencia Central: Son aquellos nmeros que tienden al centro de las observaciones. 2. Es tadgrafos de Dispersin: Son aquellos nmeros que cuantifican la variabilidad de las observaciones de una muestra.

DATO:
Es la recopilacin o anotacin de cada caracterstica de las observaciones de una muestra.

Ejemplo: Altura (mts) de n=5 alumnos de WIENER: 1.65, 1.59, 1.68, 1.63, 1.69.

SESION # 2

CAPITULO II ESTADISTICA DESCRIPTIVA La Estadstica Descriptiva, se encarga de recopilar la informacin de una muestra aleatoria, esta informacin tiene que ser ordenada para una buena presentacin; Esta ordenacin se basa en las llamadas Tablas de Frecuencias y tambin en los Grficos Estadsticos. RECOPILACION DE DATOS Es el momento en el cual el investigador se pone en contacto con los objetos o elementos sometidos a estudio, con el propsito de obtener datos o respuestas de las variables consideradas; a partir de estos

CURSO: ESTADISTICA I CICLO III

Manual del Alumno datos o respuestas se calculan los Estadgrafos o indicadores estadsticos. FUENTES DE DATOS La fuente de datos, es el lugar, la institucin, las personas o elementos donde estn o que poseen los datos que se necesitan para cada uno de las variables o aspectos de la investigacin o estudio. En general, se puede disponer de cinco tipos de fuentes de datos: 1. Las Oficinas de Estadstica.- Como instituciones responsables de recopilar, procesar y publicar las estadsticas sociales o nacionales.

2. Archivos o Registros Administrativos.- Como el Registro Civil, Electoral, Escalafn o Personal, Padrn de Contribuyentes, etc.. Estos registros no tienen fines Estadsticos, su funcin es de tipo legal y administrativo, sin embargo pueden utilizarse como fuentes de datos estadsticos. 3. Documentos.- Boletines, e informes estadsticos que son las publicaciones o estudios que preparan los organismos especializados. 4. Encuestas y Censos.- Son fuentes directas y especiales, que se construyen en un momento determinado, recopilando datos de una parte o de la totalidad de una poblacin. 5. Los Elementos o Sujetos.- Son aquellos que estn sometidos a un estudio, pueden ser personas, instituciones, animales u objetos.
CURSO: ESTADISTICA I CICLO III

Manual del Alumno

TECNICAS DE RECOPILACION O RECOLECCION DE DATOS Es el conjunto de mtodos y procedimientos que se llevan a cabo para recolectar los datos. Las ms frecuentes tcnicas utilizadas son: 1. La Observacin.- Es la accin de mirar de mirar en forma sistemtica y profunda, con el inters de descubrir la importancia de aquello que se observa. 2. La Tcnica Documental.- Es aquella que busca datos a travs de documentos, fuentes escritas o grficas de todo tipo. Ejm.: Libros, Informes, Autobiografas, fotografas, planos, videos, etc. 3. La Entrevista.- Es la interrelacin o dilogo entre personas, donde una de ellas se llama Entrevistador o Encuestador quien solicita a otra persona llamada Entrevistado o Encuestado le proporcione algunos datos o informacin. 4. El Cuestionario.- Es un instrumento constituido por un conjunto de preguntas sistemticamente elaboradas, que se formulan al Entrevistado o Encuestado, con el propsito de obtener los datos de las variables consideradas en el estudio. El Cuestionario se desarrolla en el Formulario o Cdula, en donde las preguntas estn debidamente organizadas. 5. La Encuesta.- Es la tcnica por la cual se obtiene la informacin tal como se necesita, preparada exprofesamente y con objetivo estadstico. Permite observar y registrar caractersticas en las unidades de anlisis de una determinada poblacin o muestra,

CURSO: ESTADISTICA I CICLO III

10

Manual del Alumno delimitada en el tiempo y en el espacio. El Entrevistado da respuesta a las preguntas en el formulario o Cdula..

SESION # 3

CAPITULO III LAS VARIABLES ESTADISTICAS LA VARIABLE: Es la representacin simblica de los datos. Ejemplo: Sea X: altura de 5 alumnos de WIENER Donde: X1= 1.65 mts., X4 = 1.63 mts. Las variables se clasifican en: I. Variable Cualitativa: Es aquella variable que representa a datos que indican cualidades, caractersticas, propiedades, etc., no son numricas (no medibles).

Xi, i= 1 a 5

Ejemplos: X= Control de calidad de productos de una industria. Bueno, Malo, Regular, Muy Bueno.
Estado Civil de una muestra de 200 personas. Soltero, Casado, Viudo, Divorciado.

Y=

II.

Variable Cuantitativa: Es aquella variable que representa a datos que indican valores numricos (son medibles), y se clasifican en:

CURSO: ESTADISTICA I CICLO III

11

Manual del Alumno

Variable Discreta: Es aquella que representa a datos numricos que no se pueden fraccionar, sirven para contar o enumerar (pertenecen a los reales). Variable Continua: Es aquella variable que representa a datos que pueden ser fraccionados (pertenecen a los reales). Ejemplo: El Peso (Kg.) de 6 personas. 65, 56, 59, 70, 63.
La variable continua es la que ms utilizamos, especialmente para los estudios correspondientes en Ingeniera (Volumen, Temperatura, Pesos, Mediciones, etc.).

SESION # 4

CAPITULO IV LA ORGANIZACIN DE LOS DATOS

Distribucin o Tablas de Frecuencias: Es la condensacin, simplificacin, ordenacin, del conjunto de observaciones que forman la muestra; la caracterstica principal es no perder ningn dato de la muestra. Tambin se puede decir que la Distribucin de Frecuencia es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia. Categoras o Clases.- Son los datos que estn agrupados por sus caractersticas comunes.

CURSO: ESTADISTICA I CICLO III

12

Manual del Alumno Frecuencia de Clases.- Es el nmero o cantidad de datos que componen una Categora o Clase. Las Frecuencias se clasifican en : 1. Frecuencia Absoluta (Simple).- Representa a la cantidad de datos de cada Clase. 2. Frecuencia Absoluta Acumulada.- Representa a la suma en forma acumulativa de Clase en Clase de sus respectivas Frecuencias Absolutas. 3. Frecuencia Relativa (Simple) .- Es el % que representa a la cantidad de datos de una Clase con respecto al total de datos. 4. Frecuencia Relativa Acumulada.- Representa a la suma en forma acumulativa de Clase en Clase de sus respectivas Frecuencias Relativas. Veamos un ejemplo (4.1) : Medimos la altura de los nios de una clase y obtenemos los siguientes resultados (cm): Alumno Estatura Alumno Estatura Alumno Estatura x x X x x x Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21 Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29 Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26 Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22 Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28 Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27 Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26 Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23 Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22 Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21 Si presentamos esta informacin estructurada obtendramos la siguiente Tabla de Frecuencias:
CURSO: ESTADISTICA I CICLO III

13

Manual del Alumno Variable (Valor) X 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 Frecuencias Absolutas Frecuencias Relativas Simple Acumulada Simple Acumulada X X X x 1 4 4 2 1 2 3 3 4 3 3 1 5 9 11 12 14 17 20 24 27 30 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos de sntesis. Segn los tipos de variables y formas de la tabla de frecuencias, tendremos las siguientes Tablas de frecuencias 1ER. CASO: Tablas de Frecuencias para la variable Cualitativa:
En este caso como la variable cualitativa indica cualidades, propiedades, etc., y no son medibles; entonces se agrupa de acuerdo a cada categora que se diferencia en la variable cualitativa. (Sin un orden establecido).

Ejemplo: (4.2).
CURSO: ESTADISTICA I CICLO III

14

Manual del Alumno

Se tiene la siguiente informacin que representa el Estado Civil de 50 personas encuestadas (edad; 20-30 aos).

Estado Civil Soltero Casado Viudo Divorciado Conviviente

No. de personas 25 10 1 6 8

% 50% 20% 2% 12% 16%

Los grficos que se presentan en este caso son los siguientes:

1). Diagrama de barra:


30 25 20 15 10 5 0
Divorciado Casado Soltero Viudo

N DE PERSONAS

ESTADO CIVIL
CURSO: ESTADISTICA I CICLO III

Conviviente

15

Manual del Alumno

2. Grfico por Sectores Circulares.

PORCENTAJES
Soltero Conviviente

Divorciado Viudo

Casado

2DO. CASO: Tabla de frecuencia para la variable discreta y n < 30 :


En este caso la variable es discreta y la muestra pequea, adems hay que considerar que no haya muchos datos diferentes. La Tabla de frecuencias es por CLASES, donde cada clase representa el valor numrico de la variable.

CURSO: ESTADISTICA I CICLO III

16

Manual del Alumno La tdf es de la sgte. forma general: Clase Xi x1 x2 . . . Xm Donde: n = numero de clases o intervalos de clase. fi = frecuencia absoluta: es el nmero de observaciones que hay en cada clase o intervalo de clase. Adems: fi+f2+f3+. ...+ fm =n m fi = n i=1 Fi f1 f2 . . . Fm Fi F1 F2 . . . Fm=n hi h1 h2 . . . hm Hi H1 H2 . . . .Hm=1

Fi = frecuencia absoluta acumulada: es el numero de observaciones acumuladas hasta la clase i, es decir: F1=f1 F2=f1+f2 . .
CURSO: ESTADISTICA I CICLO III

17

Manual del Alumno Fm=f1+f2+f3...+fm =

hi = frecuencia relativa: representa la relacin que existe entre la frecuencia absoluta y el nmero total de observaciones:

hi

fi n

Generalmente la frecuencia relativa se expresa en forma porcentual: hi % = 100%. Hi = frecuencia relativa acumuladas hasta la clase i. Hi=h1 H2=h1+h2 . . Hm=h1+h2+....hm=1 acumulada: frecuencias relativas

Tambin :

Hi

Fi n

Se expresa en forma porcentual. Hi x 100% Ejemplo:


CURSO: ESTADISTICA I CICLO III

18

Manual del Alumno

Los siguientes datos representan el numero de defectos en 15 diskettes: 5, 10, 5, 11,6,6,3,3,3,5,5,5,10,6,3. Agrupar en tabla de frecuencias: Solucin: Como la muestra es pequea y la variable representa a datos discretos, entonces agrupamos en clases: No de Defectos Xi 3 5 6 10 11 No. diskettes fi 4 5 3 2 1
Fi

hi%

Hi%

4 9 12 14 15

26.7 33.3 20.0 13.3 6.7

23.7 60.0 80.0 93.3 100.0

Los grficos que se presentan en este 2do. Caso son:

1. Histograma de frecuencias: En el sistema de coordenadas rectangulares comparamos Xi vs. fi (o hi%).

CURSO: ESTADISTICA I CICLO III

19

Manual del Alumno


HISTOGRAMA

N DE DISKETTES

6 4 2 0 3 5 6 DEFECTOS 10 11

3ER. CASO: Tabla de frecuencias por intervalos de clase: En este caso generalmente la variable es continua, tambin puede ser usado para la variable discreta siendo la muestra grande (generalmente n >= 30).
La tdf tiene la siguiente forma:
Intervalos (Li - Ls) [Xo - X1> [X1 X2> . . . . . [Xm-1- Xm]

Xi X1 X2 . . . . . Xm

Fi f1 f2 . . . . . Fm

Fi F1 F2 . . . . . Fm

hi h1 h2 . . . . . hm

Hi H1 H2 . . . . . Hm

Donde:

CURSO: ESTADISTICA I CICLO III

20

Manual del Alumno X i= marca de clase o punto medio de cada intervalo de clase, se obtiene mediante la semisuma de los limites de cada intervalo.

X i = Ls + Li 2 fi , Fi, hi, Hi ; representan las frecuencias definidas en el caso anterior. Procedimiento para construir una tdf por intervalos de clase: 1er. Paso: Calcular el nmero de intervalos de clase (K):
Para calcular el valor de K, tenemos dos criterios:

a) Criterio personal; de acuerdo a la experiencia del investigador se puede asumir un valor de m para un tamao de muestra determinado. b) Mediante la Regla de Sturges: K =1 +3.3 log. n 2do. Paso: Calcular la amplitud o tamao del intervalo de clase:(A)
Para calcular la amplitud del intervalo (A) nos basaremos en la siguiente expresin:

CURSO: ESTADISTICA I CICLO III

21

Manual del Alumno A = Rango de la muestra K donde: Rango de la muestra = Valor Mayor Valor Menor Con este procedimiento calculamos una amplitud que ser constante para cada intervalo, y lo mismo ocurrir entre cada marca de clase. Los intervalos sern de la forma: [Li Ls], pudiendo ser considerado cerrado en el ltimo intervalo. La amplitud A es preferible que sea redondeada considerando la misma cantidad de decimales que tengan los dato de la muestra. 3er. Paso: Tabulaciones Tabular y presentar los datos agrupados en la tdf., Ejemplos: (2.3) Los siguientes datos representan el peso (gr.) de 35 sobrecitos de unas sustancias: 68, 73, 61, 46, 49, 96, 68, 90, 97, 53, 75, 93, 72, 60, 71, 75, 74, 75, 71, 77, 83, 68, 85, 76, 88, 59, 78, 62, 55, 48, 43, 47, 60, 84, 80. Agrupar en tdf. Solucin: 1) Calculamos K = 1 +3,3 Log 35 = 6.095 = 6 2) Calcula la amplitud del intervalo A:

CURSO: ESTADISTICA I CICLO III

22

Manual del Alumno

97 43 6

3) Tabular en tdf: Peso (grs) [43 52> [52 61> [61 70> [70 79> [79 88> [88 97] Xi 47.5 56.5 65.5 74.5 83.5 92.5

A = 9

fi 5 5 5 11 4 5

Fi 5 10 15 26 30 35

hi% 14.3 14.3 14.3 31.4 11.4 14.3

Hi% 14.3 28.6 42.9 74.3 85.7 100.0

Se observa por ejemplo que: 11 sobrecitos tienen un peso comprendido en el intervalo [70-79> grs. y representan el 31.4% del total. Tambin vemos que 15 sobrecitos pesan menos de 70 grs. y representan el 42.9% del total.

CURSO: ESTADISTICA I CICLO III

23

Manual del Alumno


SESION # 5

PRIMERA PRACTICA CALIFICADA

SESION # 6

PRESENTACION DE DATOS

LOS GRAFICOS Los grficos son representaciones en forma de figuras geomtricas, de superficie o volumen con el objeto de ilustrar los cambios o dimensin de una variable, para comparar visualmente dos o ms variables similares o relacionadas. Para una rpida comprensin de situaciones o variaciones en cantidades, es muy til traducir los nmeros en grficos o imgenes. Por su naturaleza, un grfico no toma en cuenta los detalles y no tiene la misma precisin que una tabla estadstica. Veamos algunos tipos de Grficos : 1. Histograma de frecuencias: Representa un conjunto de rectngulos levantados desde cada intervalo de clase hasta la frecuencia correspondiente (absoluta relativa). 2. Polgono de frecuencias: Consiste en unir los puntos medios marcas de clase levantadas hasta cada frecuencia correspondientes, generalmente para su construccin nos podemos basar del Histograma de frecuencias. Propiedad: Area del Histograma = Area del Polgono de frecuencia.
CURSO: ESTADISTICA I CICLO III

24

Manual del Alumno

3. Ojiva: Se construye basndose en un diagrama escalonado, es decir considerando las frecuencias acumuladas (absoluta relativa), y uniendo los lmites de cada intervalo.

HISTOGRAMA Y POLIGONO DE FRECUENCIAS

HISTOGRAMA DE FRECUENCIAS
12.00 10.00 8.00 6.00 4.00 2.00 0.00 .47.5 .56.5 .65.5 .74.5 .83.5 .92.5

fi

Xi

SESION # 7

LOS ESTADIGRAFOS DE TENDENCIA CENTRAL


Se llaman as, porque tienden a ubicar el centro de las observaciones; Estos estadgrafos de posicin son: media, mediana, moda, media geomtrica, media armnica, etc. Estudiaremos los ms importantes:

CURSO: ESTADISTICA I CICLO III

25

Manual del Alumno

X 1. La Media Aritmtica Llamada tambin promedio, es el estadigrafo de posicin ms simple y fcil de calcular, por eso es el ms comn. Se calcula teniendo en cuenta los siguientes casos:

1er. Caso: Datos no agrupados en tablas de frecuencias: Sean X1, X2............, Xn variables que representan los n datos de una muestra, la media aritmtica se calcula:
n

X
i

Xi 1 n

2do. Caso: Datos Agrupados en tabla de frecuencias:


En este caso se calcula mediante la siguiente frmula:

Xi * fi n

fi = frec. Absoluta hi = frec. Relativa .

tambin:

X
CURSO: ESTADISTICA I CICLO III

Xi * hi

26

Manual del Alumno hi = frec. Relativa

PROPIEDADES DE LA MEDIA ARITMETICA 1. La media de los datos todos iguales a una misma constante es igual a la constante: Sea K = cte. y cada Xi = k ----------------X X (K ) K

2. Si a cada dato e le suma o resta una constante k, la media queda sumada o restada por dicha constante: Si Xi = Xi + K -------------------- X(Y) = X(X+k) = X (X) + k 3. Si a cada dato se le multiplica o divide por una constante k, la media queda multiplicada o dividida por dicha constante. 4. S Yi = Xi* k ------------------------- X(Y) = X(X* k) = X (X) * k
NOTA. Todas las propiedades cumplen para datos agrupados y no agrupados

CURSO: ESTADISTICA I CICLO III

27

Manual del Alumno

( Xi X )

0 0

Datos no agrupados

( Xi X ) * fi

Datos agrupados
es igual a cero.

5. La suma de las desviaciones respecto a la media

CURSO: ESTADISTICA I CICLO III

28

Manual del Alumno

SESION # 8

ESTADIGRAFOS DE TENDENCIA CENTRAL 2. Media Geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todo estos resultados y al producto final se le calcula la raz "n" (siendo "n" el total de datos de la muestra).

Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto multiplicador sobre el de los aos anteriores. En todo caso, la media aritmtica es la medida de posicin central ms utilizada. Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna informacin. Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como geomtrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anmalos podran condicionar en gran medida el valor de la media, perdiendo sta representatividad.

CURSO: ESTADISTICA I CICLO III

29

Manual del Alumno

3. La Mediana (Me) : Es aquel estadgrafo de posicin que divide en dos partes iguales al conjunto de observaciones; es decir la mediana representa el valor central de una distribucin de datos ordenados en forma creciente o decreciente. 1er. Caso: Datos No agrupados en TDF: Primero se ordena los datos en forma creciente o decreciente y luego se tiene en cuenta s: a) n es impar. La mediana es el valor central.
Me X n 1 2

Es el elemento que ocupa la posicin (n+1) /2

Ejemplo: Calcular la Me de los siguientes valores: 32, 34, 31, 42, 36, 41, 32, 45, 37, n=9 Ordenando: 31, 32, 32, 34, 34, 36, 37, 41, 42, 45. Observamos el valor central: Me=36 (representa el 5to. dato) b) n es par.La mediana es igual al promedio o la semisuma de los valores centrales.

CURSO: ESTADISTICA I CICLO III

30

Manual del Alumno

Ejemplo: la Me de 12,21,16,18,20,19,16,15,16,17. Ordenando: 12,15,16,16,16,17,18,19,20,21,

Me

16 17 2

16.5

2do. Caso: Datos Agrupados en TD:


En este caso la Se me calcula mediante la siguiente frmula:

Me

Li

Ame * n

2 f me

Fme

Donde: Li = Ame := Fme-1 = mediana. fme = limite inferior de la clase mediana. tamao del intervalo de la clase mediana. Frec. Abs. Acumulada anterior a la clase Frecuencia absoluta de la clase mediana.

Clase Mediana: Es aquel intervalo que contiene el valor que ocupa la posicin media, es decir contiene a la mediana. Se calcula mediante: El primer valor Fi mayor o igual que n/2
CURSO: ESTADISTICA I CICLO III

31

Manual del Alumno

4. LA MODA (Mo)
Representa al valor que ms se repite en un conjunto de observaciones:

Si la distribucin de frecuencias tiene un solo valor mximo, entonces: UNIMODAL. - Si la distribucin presenta ms de un valor mximo: , entonces: POLIMODAL. Si no hay algn valor que se repita con ms frecuencia: DISTRIBUCION UNIFORME 1er. Caso: Datos no agrupadas Sealar el valor que ms se repite. Ej. 4,5,6,7,4,5,4,6,5,5,4,5,5 UNIMODAL Ej.

Mo = 5

7,7,6,8,8,6,8,7,7,9,12,11,10,8 Mo = 8 BIMODAL

2do. Caso: Datos Agrupados en Tablas de Frecuencias_

Mo

Li

Amo *

D1 D1 D 2

CURSO: ESTADISTICA I CICLO III

32

Manual del Alumno


Donde:

Li = Amo =
D1 D2 = =

limite inferior de la clase modal. Amplitud de la clase modal. Diferencia ente la Frec. Absoluta de la clase modal menos la frecuencia absoluta anterior. Diferencia ente la Frec. Absoluta de la clase modal menos la siguiente.

Clase Modal: Representa el intervalo con la mayor frecuencia absoluta. Ejemplos. (3.1)

CURSO: ESTADISTICA I CICLO III

33

Manual del Alumno

Calcular la Media Aritmtica, Mediana y Moda de la Tabla de frecuencias del ejemplo (2.3).

47.5 * 5 56.5 * 5 .... 92.5 * 5 35

70.336

gramos

Para calcular la mediana, la clase mediana es el 4to. intervalo:

35 Me 70 9 *

2 11

15

72.05

gramos

Para calcular la Moda, la clase modal es el 4to. intervalo, por que presenta la mayor frecuencia absoluta. D1=11 - 5 = 6 D2=11 4 =7
Mo 70 9 * 6 6 7 74 .15

Gramos

Nota: La media =mediana = moda, si la distribucin es simtrica.

SESION # 9

CURSO: ESTADISTICA I CICLO III

34

Manual del Alumno ESTADIGRAFOS DE TENDENCIA NO CENTRAL

Las medidas de Posicin o de Tendencia no centrales permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. Ejemplo: Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos). Los deciles y percentiles se calculan de igual manera,

CURSO: ESTADISTICA I CICLO III

35

Manual del Alumno

aunque hara falta distribuciones con mayor nmero de datos.


Variable (Valor) X 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 x Frecuencias absolutas Simple Acumulada x 1 4 4 2 1 2 3 3 4 3 3 1 5 9 11 12 14 17 20 24 27 30 x Frecuencias relativas Simple Acumulada X 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

1 cuartil: es el valor 1,22 cm, ya que por debajo suya se situa el 25% de la frecuencia (tal como se puede ver en la columna de la frecuencia relativa acumulada). 2 cuartil: es el valor 1,26 cm, ya que entre este valor y el 1 cuartil se situa otro 25% de la frecuencia. 3 cuartil: es el valor 1,28 cm, ya que entre este valor y el 2 cuartil se sita otro 25% de la frecuencia. Adems, por encima suya queda el restante 25% de la frecuencia.
CURSO: ESTADISTICA I CICLO III

36

Manual del Alumno

Atencin: cuando un cuartil recae en un valor que se ha repetido ms de una vez (como ocurre en el ejemplo en los tres cuartiles) la medida de posicin no central sera realmente una de las repeticiones Frmulas para calcular los Cuartiles Para calcular el Primer Cuartil
n 4 F1 i F2

Q1

Li

Para calcular el Segundo Cuartil


n 2 F1 i F2

Q2

Li

Para calcular el Tercer Cuartil


3n 4

F1 i F2

Q3

Li

DONDE:
Q1 = Primer Cuartil Q2 = Segundo Cuartil Q3 = Tercer Cuartil
CURSO: ESTADISTICA I CICLO III

37

Manual del Alumno


Li = Lmite Real inferior de la Clase que contiene el Cuartil n = Nmero de datos F1 = Frec. Acumulada de la clase anterior a la clase del Cuartil F2 = Frecuencia absoluta de la Clase del Cuartil i = Intervalo de Clase

Ejemplo: Calcular el Primer Cuartil de la siguiente distribucin de frecuencias, referente al consumo de energa elctrica de un grupo de usuarios
Consumo Kw Hora 05 - 24 25 - 44 45 - 64 65 - 84 85 - 104 105 - 124 125 - 144 145 - 164 Nmero de Frecuencia Consumidor Acumulada 4 4 6 10 14 24 22 46 14 60 5 65 7 72 3 75 75 Lmites Reales 4.5 24.5 44.5 64.5 84.5 104.5 124.5 144.5 - 24.5 - 44.5 - 64.5 - 84.5 - 104.5 - 124.5 - 144.5 - 164.5

Q1

44 .5

75 4

10 20 14 57 KwHora

Como cada Cuartil representa el 25%, entonces el Primer Percerntil ser el 25%. Respuesta.- El 25% de los usuarios consume 57 KW Hora.

Frmula para calcular los Deciles


CURSO: ESTADISTICA I CICLO III

38

Manual del Alumno

D = El Decil Li = Lmite Real inferior de la Clase que contiene el Decil D # = El nmero de Decil que se quiere hallar n = Nmero de datos F1 = Frec. Acumulada de la clase anterior a la clase del Cuartil F2 = Frecuencia absoluta de la Clase del Cuartil i = Intervalo de Clase

Utilizando el ejemplo: Calcular el Cuarto Decil de la distribucin de frecuencias, referente al consumo de energa elctrica del grupo de usuarios

Como cada Decil representa el 10%, entonces el Cuarto Decil ser el 40%.. Respuesta.- El 40% de los usuarios consume 69.95 KW Hora.

Frmula para calcular los Percentiles

P = El Percentil Li = Lmite Real inferior de la Clase que contiene el Percentil


CURSO: ESTADISTICA I CICLO III

39

Manual del Alumno


P # = El nmero de Percentil que se quiere hallar n = Nmero de datos F1 = Frec. Acumulada de la clase anterior a la clase del Percentil F2 = Frecuencia absoluta de la Clase del Percentil i = Intervalo de Clase

Utilizando el ejemplo: Calcular el Percentil 79 de la distribucin de frecuencias, referente al consumo de energa elctrica del grupo de usuarios

Como cada Percentil representa el 1%, entonces el Percerntil 79 ser el 79%.. Respuesta.- El 79% de los usuarios consume 103.43 KW Hora. SESION # 10

EXAMEN PARCIAL
SESION # 11

ESTADIGRAFOS DE DISPERSION O VARIABILIDAD


Son aquellos nmeros que miden o cuantifican la variabilidad de las observaciones, con respecto a un estadgrafo posicin (generalmente la media aritmtica). Los principales estadgrafos de dispersin son los siguientes: 1. LA VARIANZA: V (X)

CURSO: ESTADISTICA I CICLO III

40

Manual del Alumno


Se define como el promedio del cuadrado de las desviaciones con respecto a la media. Cuando la varianza es muestral, entonces V(x) se puede denotar como y si la varianza es poblacional, entonces V(x) se denota como .En este captulo estudiaremos la varianza muestral. La varianza se calcula, teniendo en cuenta los siguientes casos: 1er. Caso: Datos no agrupados en tablas de frecuencia:

Desarrollando esta sumatoria, obtenemos una forma ms simple para calcular la varianza:

2do. Caso: Datos agrupados en tablas de frecuencias:

CURSO: ESTADISTICA I CICLO III

41

Manual del Alumno

O tambin:

CURSO: ESTADISTICA I CICLO III

42

Manual del Alumno


Desarrollando esta sumatoria, obtenemos:

O tambin:

Donde: Xi fi hi = = = marca de clases. frecuencia absoluta frecuencia relativa

Propiedades de la Varianza: 1. 2, 3. V(X) >= 0 (siempre la varianza es positiva igual a cero). Esto es si cada Xi = k (constante). si a cada Xi se le suma (o resta), entonces la varianza no varia. si a cada dato se multiplica (o por una constante K, entonces la constante sale elevada cuadrado).

V(K) = 0 V(X+/- K) = V(X) una constante K

4.

CURSO: ESTADISTICA I CICLO III

Siendo a y b constantes, X e Y variables independientes

43

Manual del Alumno


5.

2. DESVIACION STANDART O TIPICA : S(X)


Se define como la raz cuadrada positiva de la varianza, y como la varianza esta expresada en unidades cuadradas, la desviacin standart (que esta expresada en las mismas unidades de los datos), representa mejor la variabilidad de las observaciones.

3. COEFICIENTE DE VARIACION: C.V.

Representa la relacin que existe entre la desviacin standart y el promedio de un conjunto de observaciones. El C.V. como no tiene unidades se debe expresar en porcentaje y sirve como medios de comparacin con otras distribuciones de cualquier tipo de unidad. Se calcula:

Donde: S(x) = X =
CURSO: ESTADISTICA I CICLO III

desviacin tpica promedio aritmtico

44

Manual del Alumno


Ejemplos: 1. Los siguiente datos son temperaturas en grados Fahrenheit 415,500,480,490,476,500,432,479,489,497,496,478,453. Sin ordenar en tablas de frecuencias: a) Calcular la varianza. b) Si a cada dato se le divide entre 5 y luego se suma 10. Hallar la nueva varianza. Solucin: a) Primero tenemos que calcular el promedio para datos no agrupados:

F
Entonces, calculamos la varianza:

CURSO: ESTADISTICA I CICLO III

45

Manual del Alumno

b) Es decir:

Esto se resuelve usando propiedades:

2. Dada la siguiente tabla de frecuencias, que representa el peso (grs), de 34 sobres de cartas: Intervalos [ 7 8> [ 8 9> [ 9 10> [10 11> [11 12> [12 13] Xi 7.5 8.5 9.5 10.5 11.5 12.5 fi 1 2 8 11 6 6 Fi 1 3 11 22 28 34

a) Calcular el peso promedio y la mediana. b) Calcular el Coeficiente de Variacin (C.V.)

CURSO: ESTADISTICA I CICLO III

46

Manual del Alumno


Solucin: a) Calculando el promedio:

Gramos

Calculando la mediana:

Gramos

b) Para calcular el C.V. debemos primero calcular la varianza

Calculamos la desviacin standart: S(X)=-1.2708 grs. Entonces:

3. Se tiene dos muestras:

En qu muestra cree Ud. Que halla menos variabilidad?

CURSO: ESTADISTICA I CICLO III

47

Manual del Alumno

Solucin: Primero hay que tener en cuenta que no se puede comparar las desviaciones standares de cada nuestra, porque estn expresadas en diferente unidades, pero si podemos compararlas con sus C.V. respectivos:

Entonces, comprando ambos coeficientes nos damos cuenta que existe menor dispersin en los datos de la primera muestra.

CURSO: ESTADISTICA I CICLO III

48

Manual del Alumno


NOTA: Un C.V. ideal debe estar:

SESION # 12

CAPITULO V: DISTRIBUCION BIDIMENSIONAL ANALISIS DE REGRESION Y CORRELACION LINEAL SIMPLE


Los mtodos estadsticos presentados lo hemos referido hasta Ahora a una sola variable, muchos de los problemas de trabajo estadstico, sin embargo involucran 2 ms variables. En algunos casos las variables se estudian Simultneamente, para ver la forma en que se encuentran interrelacionadas, tambin si se desea estudiar una variable de inters particular. Estos dos casos de problemas se conocen por lo general con los nombres de correlacin y regresin. Antes de definir estos casos hablaremos sobre aspectos importantes que involucran 2 variables: Distribucin Bidimensional.

5.1. Clculo de la Covarianza: S (XY) La varianza, es la medida que estudia la dispersin de dos variables, se calcula teniendo en cuenta:

1er. Caso: Datos no agrupados en tablas de frecuencia: En este caso, las variables X Y se toman en forma simultnea; es decir se considera no agrupados porque se toman los valores

CURSO: ESTADISTICA I CICLO III

49

Manual del Alumno


como puntos cartesianos (pares (X2,Y2)..........(Xm,Ym). Esto es: X Y X1 Y1 X2 Y2 X3 Y3 de valores). (X1,Y2),

.......... XN .......... YN

N: nmero de observaciones total de pares de valores. De cada observacin se analiza dos variables Simultneamente. Las Covarianza; S (XY) se define:

............................. ( I )

desarrollando la sumatoria y simplificando:

.........................( II)

CURSO: ESTADISTICA I CICLO III

50

Manual del Alumno


Para calcular la covarianza S(XY), es preferible utilizar la ec. (II). Los promedios de X y de Y, as como las desviaciones standares S(X) Y S(Y), se calculan como en los captulos 3 y 4. 2do. Caso: Datos Agrupados en tablas de frecuencias: En este caso cada variable X e Y, estn agrupados en tablas de frecuencias presentndose lo que se llama: Distribucin Bidimensional o Tabla de Doble Entrada.

En forma tabular: X Y Donde: Xi Yj fij : : : marca de clase (variable X) marca de clase (variable Y) frecuencia absoluta conjunta, corresponde al nmero de observaciones que existe en el I-simo intervalo de X con el j-simo intervalo de Y. : : agrupado en K intervalos (y = 1... k) agrupado en m intervalos (j = 1.. m).

Observaciones: (1) Segn la definicin de la covarianza (tanto para datos agrupados como no agrupados), la covarianza puede ser negativa. La covarianza presenta unidades de cada una de las variables involucradas. La covarianza S(XY), tambin se denota: Cov (X,Y)

(2) (3)

CURSO: ESTADISTICA I CICLO III

51

Manual del Alumno


Ejemplos: (5.1) Dada la siguiente tabla, que representa la medida (X) en cm. De 8 barretas de metal y el peso (Y) en libras de cada una de ellas, calcular: a) S(X) b) S(Y) c) S(XY) 1 3 4 6 1 2 4 4

X Y

8 5

9 7

11 8

14 9

Solucin: Este ejemplo, corresponde a datos no agrupados en tabla de frecuencias. a) (X) S


2

=
2

S (X) = 4.06 cm.

b) S (Y)

S (Y) = 2.65 lbs

CURSO: ESTADISTICA I CICLO III

52

Manual del Alumno

S (XY) = 10.5 cm. lbs

(5.2)

Dada la siguiente tabla en el cual se estudia las alturas (pulg) y los pesos (libras) de 300 estudiantes hombres en una Universidad: X Y : : altura (pulgadas). peso (libras).

58-62

62-66

66-70

70-74

74-78

Total fy 3 21 50 101 79 39 7 300

90-110 100-120 130-140 50-160 170-180 190-200 210-220 Total Fx

2 7 5 2

1 8 15 12 7 2

4 22 63 28 10 1 128

2 7 19 32 20 4 84

1 5 12 7 2 27

16

45

Calcular:

CURSO: ESTADISTICA I CICLO III

53

Manual del Alumno


S (X) , S(Y) , S (XY)

Solucin: Como la tabla es Bidimensional, podemos formar tablas de frecuencias para cada una de las variables por separado, a este proceso se le conoce como TABLAS MARGINALES.

CURSO: ESTADISTICA I CICLO III

54

Manual del Alumno


Tabla marginal para x:: Intervalos Xi 58 62 60 62 66 64 66 70 68 70 74 72 74 78 76

Fi 16 45 128 84 27 300

Tabla Marginal para Yi: Intervalos Yj 90 110 100 110 130 120 130 150 140 150 170 160 170 190 180 190 210 200 210 230 220

f.j. 3 21 50 101 79 39 7 300

La variable X presenta 5 intervalos ( i = 1 .....5) La variable Y presenta 7 intervalos ( j = 1 .....7) Calculando:

CURSO: ESTADISTICA I CICLO III

55

Manual del Alumno

S (X) = 3.929 pulgadas

S (Y) = 24.202 Lbs.

Calculando la Covarianza:

S(XY) =51.370 pulg/lib.


CURSO: ESTADISTICA I CICLO III

56

Manual del Alumno

CURSO: ESTADISTICA I CICLO III

57

Manual del Alumno SESION # 14 REGRESION LINEAL


5.2. Diagrama de Puntos y Curvas de Ajuste: Representan los puntos (X1, Y1), (X2, Y2)..... (XN, YN) en un sistema de coordenadas rectangulares, donde al sistema de puntos resultantes lo llamaremos Diagrama de Dispersin o Diagrama de Puntos: Con el diagrama de dispersin es posible representar una curva que se aproxime a los datos: Curva de Aproximacin. Entonces, encontrar ecuaciones de curvas de aproximaciones que se ajusten a los datos, es buscar una: Curva de Ajuste. Tenemos: a) Conjunto de puntos que se ajustan a una lnea recta (ajuste lineal o relacin lineal).

* * * * * * * * *

Observamos que el diagrama de puntos gira alrededor de una recta: Y = a+ bX

CURSO: ESTADISTICA I CICLO III

58

Manual del Alumno


b) lineal. Conjunto de puntos o diagrama de puntos cuya relacin no es

*** *** *** *** ***

Algunas de las ecuaciones de curvas de aproximacin:

CURSO: ESTADISTICA I CICLO III

59

Manual del Alumno

Relacin lineal
Parbola o curva cadratica Curva Polinomial

Hiprbola

O log Y= log(a) + X* log(b) Curva Exponencial


Entonces, lo que se desea es encontrar una curva de aproximacin que se ajuste mejor a los datos, y as mostrar la ecuacin de la curva respectiva. El tipo ms sencillo de una curva de aproximacin es la lnea recta cuya ecuacin puede escribirse: Y = a +b*X

CURSO: ESTADISTICA I CICLO III

60

Manual del Alumno


5.3 Mtodo de mnimos Cuadrados: De todas las curvas de aproximacin a una serie de datos puntuales, la curva tiene la propiedad de que:

sea mnimo
Se conoce como la mejor curva de ajuste por el mtodo de mnimos cuadrados. Di= desviacin de cada punto con respecto ala lnea recta. Este mtodo consiste en minimizar la suma de los cuadrados de las desviaciones Di. Entonces para ajustar un diagrama de dispersin a la lnea recta, utilizaremos este mtodo de los MINIMOS CUADRADOS. Es decir una recta de aproximacin de mnimos cuadrados del conjunto de puntos (x1, y1), (x2,y2),......,(xn,yn), tiene la ecuacin: Y = a+b*X , donde a y b se determinan mediante el sistema de ecuaciones normales, son las siguientes:

Donde al desarrollar y despejar a y b se obtienen:

CURSO: ESTADISTICA I CICLO III

61

Manual del Alumno

Otras ecuaciones ms practicas para calcular los valores de a y b de la ecuacin aproximada Y = a +b*X son las siguientes:

Ejemplo: Sean los valores: x 3 y 2

1 1

4 4

6 4

8 5

9 7

11 8

14 9

a) Construye el diagrama de puntos b) Encuentra las ecuaciones normales c) Encuentra la ecuacin de la curva de ajuste.

CURSO: ESTADISTICA I CICLO III

62

Manual del Alumno

Solucin: a) Llevando los puntos al sistemas de coordenadas rectangulares.

DISPERSION
10 8 6 Y 4 2 0
0 2 4 6 8 10 12 14

b) Al observar el diagrama de puntos, notamos que se aproxima o ajusta a una lnea recta, cuya ecuacin es: Y = a+b*X c) Para encontrar las ecuaciones normales:

CURSO: ESTADISTICA I CICLO III

63

Manual del Alumno

Entonces las ecuaciones normales son: 40 = 8*a +b* 56 364 = 56*a +b*524 Resolviendo el sistema (Mtodo de Mnimos Cuadrados) a= 6/11 = 0.545 b=7/11=0.636

d) La ecuacin resultante ser : Y = 0.545 + 0.636X nota : Si la ecuacin es Y = a +b*X entonces b mide la pendiente de la lnea recta.

CURSO: ESTADISTICA I CICLO III

64

Manual del Alumno SESION # 15 SEGUNDA PRACTICA CALIFICADA SESION # 16


5.4 Anlisis de correlacin lineal simple: Definicin: Estudia el grado de asociacin que existe entre las variables en estudio, el coeficiente que mide la mutua asociacin se denomina: Coeficiente de Correlacin (r). Las asociaciones que se pueden presentar son: 1) Correlacin o asociacin Positiva (+), es decir a medidas altas de una variable, le corresponden medidas altas de otra variable, cambios en el mismo sentido (Relacin Directamente Proporcional) X X entonces Y entonces Y

Ejemplo : altura y peso 2) Correlacin o Asociacin Negativa (-), En este caso, a valores altos de una variable, corresponden valores bajos de la otra variable y viceversa. (Relacin inversamente proporcional). 3) Medidas no Correlacinales; No existe ninguna asociacin entre las variables. Caractersticas de Coeficiente de Correlacin Lineal Simple

CURSO: ESTADISTICA I CICLO III

65

Manual del Alumno


1) r se calcula mediante la siguiente frmula:

S (XY) : S (X) : S (Y) :

covarianza de X e Y desviacin standart de X desviacin standart de Y (sin unidades) y oscila entre 1 y 1, es

2) r es un nmero abstracto decir:

3) - Si r es positivo (Correlacin Positiva), entonces las dos caractersticas tienden a variar en el mismo sentido. Si r es negativo (Correlacin Negativa), las dos caractersticas tienden a variar en sentido contrario.

4) Si r=+1 r=-1, entonces la asociacin es perfecta. 5) Si r = 0, no existe asociacin entre las variables: 6) La asociacin, tiende a ser ms estrecha, cuando r:

CURSO: ESTADISTICA I CICLO III

66

Manual del Alumno


Ejemplo: (5.4) Calcula el coeficiente de correlacin, del ejemplo (5.1); donde: S(X) =4.06; S(Y) =2.65; S(XY)=10.5

Interpretacin.- Existe una alta asociacin entre las variables estudiadas. (5.5) del ejemplo (5.2), donde: S(X)=3.929 pulgadas S(Y)=24.202 libras, S(XY)=51.370 pulg/lbs

Interpretacin.- Existe asociacin entre las alturas y pesos de los estudiantes de la Universidad dada, esta asociacin es directamente proporcional.

CURSO: ESTADISTICA I CICLO III

67

Manual del Alumno


5.4 Anlisis de Regresin Lineal Simple: En las relaciones entre las variables se pueden presentar los siguientes casos: i) X influye en Y : X Y

X Y

: :

variable independiente variable dependiente

Ejemplo: Edad ii)

agilidad mental Y X X = f(Y)

Y influye en X Y: variable independiente X: Variable dependiente

III) Las dos estn influenciadas entre si: X Y X Y Ejemplo : precio y produccin de un articulo. Definicin: La regresin permite estudiar la dependencia de una caracterstica respecto a la otra, para establecer como vara el promedio de la primera caracterstica al variar la segunda en una unidad de su medida. Se dice regresin lineal, porque las variaciones de la variable independiente, pueden provocar variaciones proporcionales en las variables dependientes (ajuste a la lnea recta). Se dice que la regresin es simple, si una variable independiente influye sobre otra variable dependiente.

CURSO: ESTADISTICA I CICLO III

68

Manual del Alumno


Ejemplo: Protena de harina volumen de pan

Ecuacin de Regresin Lineal Simple. Es una ecuacin para estimar una variable dependiente a partir de la variable independiente. Si X : Variable independiente Y : Variable dependiente

Donde :

Y = variable dependiente estimada : b = coeficiente de R.L.S.

Caractersticas del Coeficiente de R.L.S. (b) 1) b : indica el nmero de unidades en que vara la variable dependiente al variar la independiente en una unidad de su medida. 2) Si b es positivo los cambios son directamente proporcionales. Si b es negativo entonces los cambios son inversamente proporcional 3) b : mide la pendiente de la lnea de regresin. 4) b, esta dado en unidades de la variable dependiente. 5) b y r siempre tienen el mismo signo. 6) b se calcula:

CURSO: ESTADISTICA I CICLO III

69

Manual del Alumno

S Y = f(X), entonces:

Y el valor de la constante a:

Si X= f (Y)

(se realiza cambio de X por Y y viceversa)

Lnea de Regresin.- consiste en el trazo o grfica de la ecuacin de regresin lineal simple, es decir el grfico de los puntos si la ecuacin es: Regresin de Y sobre X; o el grfico de los puntos (X,Y) si la ecuacin es X= a+ bY : Regresin de X sobre Y. Ejemplo: selecciona al azar cuatro meses de un ao y se registra tanto los ingresos como los gastos, en miles de dlares, de cierta empresa: Ingreso (miles de dlares) Egresos (miles de dlares) I. 10 4 11 5 12 9 13 10

Efectuar un estudio de Regresin Lineal Simple, asumiendo que los egresos estn en funcin de los Ingresos: 1) Calculando el coeficiente de Regresin b e interpretndolo 2) Calculando el coeficiente de interseccin a

CURSO: ESTADISTICA I CICLO III

70

Manual del Alumno


3) Encontrando la ecuacin trazar la lnea de Regresin. II. de Regresin Lineal Simple y

Realiza un anlisis de Correlacin Lineal Simple, e interprete el valor de r.

Solucin: I. Como el egreso est en funcin de los ingresos:

Egresos: variable dependiente: Y Ingresos: variable independiente: X 1) Calculando b Primero calculamos:

Entonces:

CURSO: ESTADISTICA I CICLO III

Mil es

71

Manual del Alumno


Interpretacin.- Por cada mil dlares adicional en el Ingreso de dicha empresa, habr un aumento en el Egreso de 2.2 miles de dlares en promedio. 2) Para calcular a :

3) Ecuacin de Regresin Lineal Simple: Como Y es variable dependiente, entonces:

Para el trazo en el sistema de ejes cartesianos se tendr que reemplazar en la ecuacin de Regresin, los diferentes valores de X: Y=-18.30 +2.2. (10) = 3.7 Y=-18.30 +2.2 (11) = 5.9 Y=-18.30 +2.2 (12) = 8.1 Y=-18.30 +2.2 (13) =10.30 Tambin se puede estimar nuevos valores de los Egresos (Yi) a partir de un valor Xi. Ejemplo: Para un ingreso de 15mil dlares, se espera tener en promedio un Egreso de: Y =-18.30 + (2.2) (15) = 14.7 miles de dlares La lnea de Regresin: unin de puntos (Xi,Yi) II. Anlisis de Correlacin:

CURSO: ESTADISTICA I CICLO III

72

Manual del Alumno


Interpretacin.- Existe una alta asociacin entre los ingresos y los egresos, siendo los cambios directamente proporcionales.

CURSO: ESTADISTICA I CICLO III

73

Manual del Alumno


SESION #17 CAPITULO VI: NUMEROS INDICES
Definicin.- Un nmero ndice es una medida estadstica diseada para mostrar los cambios en una variable (o en un grupo de variables) con respecto al tiempo, situacin geogrfica, renta, profesin, etc. Aplicaciones: 1. Comparar el costo de alimentos en otros costos de vida durante un ao o perodo con respecto al ao o perodo anterior. 2. En negocios y Economa. Tipos de Indice: (6.1) Indices Simples: Cambios en un solo bien determinado 1) Indices de Precios Relativos.- uno de los ejemplos ms sencillos de nmero ndice es un precio relativo, que representa la razn del precio de un bien determinado en un perodo con respecto a otro perodo llamado base. Indice de Precio Relativo: IPR

Po : precio de un bien en perodo base Pn : precio de un bien en perodo dado S Pa: precio de un bien en el perodo a Pb : precio de un bien en el perodo b

Ejemplo:

CURSO: ESTADISTICA I CICLO III

74

Manual del Alumno


(6.1) Supngase que los precios de consumo de 1 tarro de leche en junio de 1990 es de 22,000 intis y en junio de 1989 fue de 5,000 intis, tomando 89 como base. El IPR Simple:

Es decir: en 1990 el precio de leche fue el 440% del que tena en el ao 89, es decir se increment en un 340% Observacin: IPR Simple es un bien en un perodo a (Pa), con respecto al mismo perodo a (Pa) =1 2) Indices de Cantidades (o volumen) Relativos.- En lugar de comparar precios de un bien, se puede tambin comparar cantidades de un bien (cantidad de produccin, consumo, exportacin, etc.) calculemos la cantidad o volumen relativo (suponiendo que las cantidades dentro de cualquier otro perodo son constantes). Indice de Cantidad Relativo: IQR

qn : cantidad de un bien en el perodo n qo : cantidad de un bien en el perodo base 3) Valor Relativo.- Si p es precio de un bien durante un perodo y la cantidad o volumen producido, vendido, etc., durante ese perodo. Valor total = p * q Ejemplo: Si se han vendido 1000 tarros de leche a $0.75 c/u Valor total = 0.75 * 1000 = $ 750
CURSO: ESTADISTICA I CICLO III

75

Manual del Alumno


Si Po Y qo denotan precio y cantidad de un bien durante un perodo base y pn y qn denotan el precio correspondiente durante un perodo dado, los valores totales durante estos perodos son Vo y Vn respectivamente y el valor relativo (VR) se define:

(6.2)

Indices Compuestos: En la prctica, no se esta tan interesada en comparaciones de precios, cantidades etc., de bienes individualmente considerados, como en comparaciones de grandes grupos de tales bienes, es decir es preferible considerar un grupo de bienes para medir los cambios respectivos. Los principales Indices compuestos se calculan teniendo en cuenta los siguientes mtodos: 1) Mtodo de Agregacin Simple.- Este mtodo de clculo de un ndice de precio (o cantidad), expresa el total de los precios (o cantidades) de bienes en el perodo dado, como porcentaje del total de los precios (o cantidades de bienes en el perodo base. Tenemos: Indice de Precios de Agregacin Simple: IPAS

CURSO: ESTADISTICA I CICLO III

76

Manual del Alumno


Donde:

Pn = suma total de precios de bienes empleados en el periodo dado. Po = suma total de precios de bienes empleados en el ao base. Desventaja: No tiene en cuenta la importancia relativa de las cantidades de los diferentes bienes. 2) mtodo de Media de Relativo Simple. En este mtodo existen varias posibilidades dependiendo del procedimiento empleado para promediar los precios relativos (o cantidades relativas), tal como la media aritmtica, media geomtrica, Mediana, etc.

Tenemos : Indice de precios de Media de Relativo Simple: IPMRS (Promedio de los precios relativos de cada uno de los bienes empleados):

Donde: (Pn/Po) = suma de los precios relativos de bienes. N = nmero total de bienes empleados.

CURSO: ESTADISTICA I CICLO III

77

Manual del Alumno


Mtodo de Agregacin Ponderada. Para salvar algn inconveniente del mtodo de agregacin simple, se da un peso al precio de cada bien mediante un factor adecuado, tomando a menudo una cantidad o volumen del bien determinado durante el periodo dado, o algn periodo tpico (que puede ser una media de varios aos). Tales pesos indican la importancia de cada bien particular. Aparecen as, los tres siguientes ndices para precios: (I). Indice de Precios de Laspeyres (o mtodo del ao base): IPL Pondera los precios considerando como factor de ponderacin a las cantidades en el periodo base.

Cuando los bienes empleados corresponden a la canasta familiar, el IPL se denomina ndice de Precios del Consumidor o Indice del Costo de Vida, y se utiliza para medir el nivel de inflacin. (II) Indice de Precios de Paasche (o mtodo del ao dado): IPP Pondera los precios de cada bien, considerando como factor de ponderacin a las cantidades del periodo dado.

CURSO: ESTADISTICA I CICLO III

78

Manual del Alumno

(III). Indice Ideal de Fisher Representa la media geomtrica de los ndices de Laspeyres y Paasche (promedio de los ndices ponderados).

Ejemplo: (6.3) La tabla muestra los precios y cantidades consumidas de cierto pas de distintos productos frreos en los aos 79, 86 y 87. Precios ($/Lbs) 1979 1986 17.00 19.36 15.18 99.32 12.15 26.01 41.88 15.81 101.26 13.49

Ao Plata Cobre Plomo Stao Zinc

1987 27.52 29.99 14.46 96.17 11.40

CURSO: ESTADISTICA I CICLO III

79

Manual del Alumno


Cantidad (Mills de bls) 1979 1986 1357 2144 1916 161 1872 3707 2734 2420 202 2018

Ao Plata Cobre Plomo Stao Zinc

1987 3698 2478 2276 186 1424

a) Calcular Indice de Precios de Agregacin Simple para el ao 86, considerando como ao base 1979 b) Calcular el IPL para el ao 87, con base en el ao 79 c) Calcular el IPP para el ao 87, con ao 86 Solucin

Esto significa, que los precios del conjunto de productos frreos, en el ao 86, representa el 121.7% de los precios que tenan en el ao 79, es decir se incrementaron en 21%.

Nota: Las frmulas descritas anteriormente para obtener nmeros ndice de precios se modifican fcilmente para obtener nmeros ndices de cantidad o volumen, con el simple intercambio de p y q.

CURSO: ESTADISTICA I CICLO III

80

Manual del Alumno


Ejemplo : Indice de cantidad de Agregacin Simple: IQAS

(6.4)

Deflacin Aunque los ingresos de las personas pueden elevarse tericamente en un perodo de dos aos, su ingreso real puede netamente ser inferior, debido al incremento del costo de vida y por consiguiente su poder de adquisicin. Ejemplo (5.3) Si el ingreso de una persona en 1990 es el 150% de su ingreso en 1989 (es decir a aumentado en 50%) mientras que el ICV es el 500% del ao 89, el salario real de la persona ser en 1990

Salario Real

El salario real de la persona en 1990 es el 30% del que tena en 1989, es decir el poder adquisitivo de esta persona ha disminuido en 70%.

CURSO: ESTADISTICA I CICLO III

81

Manual del Alumno


ANEXOS PROBLEMAS RESUELTOS a) tablas de frecuencia y Estadigrafos de posicin:

1) La siguiente distribucin muestra el peso en gramos de 30 paquetes de un determinado producto: Gramos hi


[10 14.5> M/2 [14.5 19.5> 0.17 [19.5 24.5> 2M [24.5 29.5> M

Se pide completar la tabla: Solucin Si la sumatoria de las hi = 1 Sabemos que : M/2 + 0.17 +2M +M +0.13 = 1

M/2 +3M = 1-0.30 M/2 +3M = 0.7 7M = 1.4

M = 0.2

sabemos que

hi

fi n

Por lo tanto fi = hi * n

Remplazando valores de hi

CURSO: ESTADISTICA I CICLO III

82

Manual del Alumno


hi M/2 0.17 2M M 0.13 hi 0.10 0.17 0.40 0.20 0.13

Completando el cuadro: Intervalos Xi [10.5 14.5> 12.25 [14.5 19.5> 17 [19.5 24.5> 22 [24.5 29.5> 27 [29.5 35> 32.25 30

fi 3 5 12 6 4

Fi 3 5 12 6 4 1.00

hi 0.10 0.17 0.40 0.20 0.13

Hi 0.10 0.17 0.67 0.87 1.00

2)Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen de Estadstica I: 33, 50, 61, 69, 80, 35, 52, 64, 71, 81, 35, 53, 65, 73, 84, 39, 54, 65, 73, 85, 41, 55, 65, 74, 85, 41, 55, 66, 74, 88, 42, 57, 66, 76, 89, 45, 59, 66, 77, 91, 47, 60, 67, 77, 94, 48, 60, 68, 78, 97.

Clasificar estos datos convenientemente en intervalos de clase de igual amplitud y construir los grficos respectivos. Solucin I) Rango = 97-33 = 64 II) K = 1+3.32 * log (10) = 1+ 3.22 (1.699) = 6.47

CURSO: ESTADISTICA I CICLO III

83

Manual del Alumno


Redondeando al entero inmediato superior intervalos) K = 7 (siete

III) La amplitud de Clase A = 64 / 7 = 9.14, aproximando al entero mayor (recuerda que la amplitud debe tener la caracterstica de los datos) A = 10 Para facilitar el conteo de las frecuencias, tomaremos como lmite inferior de la primera clase 30. clases [30, 40> [40, 50> [50, 60> [60, 70 > [70, 80> [80, 90> [90, 100> TOTAL xi 35 45 55 65 75 85 95 fi 4 6 8 13 9 7 3 50 Fi 4 10 18 31 40 47 50 hI 0.08 0.12 0.16 0.26 0.18 0.14 0.06 1.00 HI 0.08 0.20 0.36 0.62 0.80 0.94 1.00

Ntese que en el ultimo intervalo el lmite superior puede ser abierto ya que sobrepasa al valor ms alto de los datos.

GRAFICOS

CURSO: ESTADISTICA I CICLO III

84

Manual del Alumno

CURSO: ESTADISTICA I CICLO III

85

Manual del Alumno

2) El supervisor de una planta de produccin desea comprobar si los pesos netos de las latas de conserva de durazno tienen el peso reglamentario (18 onzas) para lo cual registra el peso de 36 latas obteniendo los siguientes datos:

17.0, 17.6, 18.1, 18.4,

17.5, 18.5, 18.1, 17.5, 18.0, 17.5, 17.3, 18.0, 18.0, 18.0, 18.2, 17.6, 18.4, 17.7, 17.7, 17.9, 18.3, 17.1, 17.8, 17.3, 17.6, 17.7, 18.2, 18.4, 18.0, 18.2, 17.1, 18.6, 18.1, 18.5, 17.9, 18.2.

Se pide : a) b) c) d) Presentar los datos en una tabla de frecuencia. Determine el peso promedio. Determine el peso central (la mediana). Determine el peso Modal.

CURSO: ESTADISTICA I CICLO III

86

Manual del Alumno


Solucin i) Rango = 18.6 17.0 =1.6

ii)

K = 1+ 3.32 * log (36) = 6.17 redondeamos a 6 intervalos

iii)

A = 1.6 / 6 = 0.266 lo aproximamos a 0.3 (recuerden siempre se redondea A hacia el mayor respetando la caracterstica de los datos, en este caso con un digito decimal). A = 0.3

a) La tabla queda: Clases [17.0, 17.3> [17.3, 17.6> [17.6, 17.9> [17.9, 18.2> [18.2, 18.5> [18.5, 18.8> TOTAL Xi 17.15 17.45 17.75 18.05 18.35 18.65 fi 3 5 7 11 8 2 36 Fi 3 8 15 26 34 36 hi 0.08 0.14 0.19 0.31 0.22 0.06 1.00 Hi 0.08 0.22 0.42 0.72 0.94 1.00 Xi*fi 51 87 124 199 147 37 645.6

Clase mediana
b)

Clase modal

onzas

c) Para la mediana buscar en Fi aquel que sea igual o mayor que n/2, es decir

CURSO: ESTADISTICA I CICLO III

87

Manual del Alumno


Fi>= 36/2 =18.

Onzas

d) Para calcular la moda usamos el intervalo de mayor fi

Onzas

CURSO: ESTADISTICA I CICLO III

88

Manual del Alumno


PROBLEMAS PROPUESTOS: 1) La siguiente tabla muestra las frecuencias relativas de 200 alumnos.
EDADES Hi% 16 10 19 15 22 37 25 75 28 85 31 100

a) Muestra los lmites de cada intervalo de clase. b) Que tanto por ciento de los estudiantes tienen edades entre 12 y 26 aos. 2) Los siguientes datos son las velocidades en Km./h. De 30 carros que pasaron por un punto de control de velocidades. 60, 49, a) b) c) 30, 38, 60, 45, 20, 35, 20, 40, 54, 38, 35, 40, 10, 45, 60, 49, 30, 55, 46, 105, 29, 38, 80, 40, 28, 15, 82, 72. Calcular la media de los datos sin clasificar. Agrupa estos datos convenientemente. Calcule la media, mediana y moda.

3)Un grupo de 50 empleados de sistemas de una gran compaa recibe un curso intensivo de Programacin de Ordenadores. De los varios ejercicios distribuidos durante el curso, se muestra el nmero de ejercicios completados satisfactoriamente por los miembros del grupo: 13, 9, 8, 14, 16, 15, 6, 15, 11, 5, 3, 11, 11, 9, 18, 18, 5, 1,15, 12, 16, 12, 14, 9, 6, 10, 5, 12, 17, 11, 12, 13, 8, 19, 12, 11, 18, 15, 13, 9, 10, 9, 10, 7, 21, 16, 12, 9, 2, 13. a) Agrupar estas cifras en una tabla de distribucin de frecuencias, usando el mtodo de Sturges. b) Calcula la media, mediana y moda. c) Estima la desviacin tpica para datos no agrupados. 4) Sean los siguientes datos: f1=3, F2=8, F3=18, f5=2, x4=3, K=6, H4=0.875, A=2, n=24. Completa la tabla de distribucin de frecuencias y calcular la Varianza.

CURSO: ESTADISTICA I CICLO III

89

Manual del Alumno


5) y dada la siguiente tdf: intervalos 2.5> 4.5> 6.5> 8.5> 10.5> 12.5> 14.5> hi% 2% 10% h3% 16% h5% 10% 2%

[0.5 [2.5 [4.5 [6.5 [8.5 [10.5 [12.5 a)Calcula h3% y h5% b)Calcula la Varianza.

7) Se tiene una distribucin simtrica de frecuencias con 7 intervalos de igual amplitud A =20 y considerando los siguientes datos: X3*f3 = 1260, f2 + f5 = 62, H6% = 96%, f1 = 8, h3% = 21%. a) Calcula la media, mediana y moda b) Calcula el C.V. 8) Se conocen los siguientes datos del peso de un grupo de estudiantes: Intervalos [20 30> [30 40> [40 50> [50 60> [60 70> fi Hi

fi = 50
5 0.96

si se sabe que: h1=h3 y h2=h4

Determina: a) La media, mediana y desviacin tpica. b) Presenta los datos en un Histograma y polgono de frecuencias.

CURSO: ESTADISTICA I CICLO III

90

Manual del Alumno


9) Sabiendo que la tabla de frecuencias, es simtrica, completarla con los datos, dados, si adems se sabe que la mediana es igual a 27.5. Luego calcula la media, la moda y la desviacin estndar.

Intervalo L0 L1 L1 L2 L2 L3 L3 L4 L4 L5 L5 50 50 L7

Xi

fi

Fi

hi

Hi

0.20 0.65 0.95

fi = 60
10) Una fabrica tiene dos departamentos uno de produccin y otro de ventas. Las siguientes tablas de frecuencias presentan los haberes percibidos hasta fines de abril en cada uno de los departamentos.

CURSO: ESTADISTICA I CICLO III

91

Manual del Alumno


Haberes semanales en dlares [10 15> [15 20> [20 25> [25 30> [30 35> [35 40 [40 45 Total Nde trabajadores dpto. de produccin 15 25 30 20 5 5 0 100

Haberes mensuales en N de trabajadores dlares Dpto. de Ventas [20 60> 0 [60 80> 5 [80 100> 5 [100 120> 15 [120 140> 20 [140 160> 5 total 50 Calcule: a) El haber promedio mensual y la desviacin tpica correspondiente a cada departamento. b) El haber promedio mensual y la desviacin tpica del conjunto de trabajadores de ambos departamentos. 11) Se ha recibido una muestra compuesta de 100 probetas de concreto con el objetivo de analizarlas. Una de las pruebas consisti en determinar la carga de rotura de dichas probetas, encontrndose los siguientes resultados:

CURSO: ESTADISTICA I CICLO III

92

Manual del Alumno


Intervalo de rotura [120 125> [125 130> [130 135> [135 140> [140 145> Determine : a) La carga media de rotura. b) La carga mediana de rotura. N de probetas 10 20 38 25 7

Regresin lineal 1) La tabla muestra alturas con aproximacin de pulgadas y los pesos con aproximacin de libras de una muestra seleccionada al azar:
altura peso 70 155 63 150 72 180 60 135 66 156 70 168 74 178 65 160 62 132 67 145 65 139 68 152

a) Hallar la ecuacin de la recta de ajuste usando mnimos cuadrados. b) Estimar el peso de un estudiante cuya altura es de 61 pulgadas. c) Estimar la altura de un estudiante cuyo peso es de 170 libras.

CURSO: ESTADISTICA I CICLO III

93

Manual del Alumno

Solucin: X 70 63 72 60 66 70 74 65 62 67 65 68 X = 802 Y 155 150 180 135 156 168 178 160 132 145 139 152 Y=1850 X*Y 10850 9450 12960 8100 10296 11760 13172 10400 8184 9715 9035 10336 X*Y 124258

4900 3969 5184 3600 4356 4900 5476 4225 3844 4489 4225 4624 = 53792

Calculando a y b:

CURSO: ESTADISTICA I CICLO III

94

Manual del Alumno

a = -60.75

b = 3.22
a)

Y = -60.75 + 3.22 X

b)Y = -60.75 + 3.22(61) = 135.67 libras. Redondeando Y =136 libras.

c) 170 = -60.75 + 3.22 X

Pulgadas, redondeando X = 72 pulgadas

2) La produccin de acero en Estados Unidos en millones de toneladas cortas (una tonelada corta = 2000 libras), durante los aos 1946 1956 aparecen en la siguiente tabla:

CURSO: ESTADISTICA I CICLO III

95

Manual del Alumno

Aos 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956

Produccin en Ton. cortas 66.6 84.9 88.6 78.0 96.8 105.2 93.2 111.6 88.3 117.0 115.2

a) Halla la ecuacin de ajuste (recta de mnimos cuadrados). b) Estima la produccin de acero durante los aos 1957 y 1958. c) Estima la produccin de acero durante los aos 1945 y 1944.

CURSO: ESTADISTICA I CICLO III

96

Manual del Alumno


Solucin: Para poder trabajar con los aos se debe colocar una escala paralela que inicie en cero (pues las fechas no sirven para estos clculos). Aos 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 TOTALES X 0 1 2 3 4 5 6 7 8 9 10 55 Y 66.6 84.9 88.6 78.0 96.8 105.2 93.2 111.6 88.3 117.0 115.2 1045.4 0 1 4 9 16 25 36 49 64 81 100 385 X*Y 0 84.9 177.2 234.0 387.2 526.0 559.2 781.2 706.4 1053 1152 5661.1

a) Hallando la recta de ajuste

a = 75.30

b = 3.95 Y = 75.30 + 3.95 X

CURSO: ESTADISTICA I CICLO III

97

Manual del Alumno


b y c) Estimando la produccin:

Aos 1944 1945 1957 1958

X -2 -1 11 12

Produccin 67.40 71.35 118.75 122.70

CURSO: ESTADISTICA I CICLO III

98

Manual del Alumno

PROBLEMAS PROPUESTOS 1) Construir una lnea recta que aproxime los datos de la tabla: a) estimar los valores de y para: x= 11, x= 15, x=4, x= 6 b) estimar los valores de x para: y= 2, y=5, y= 18, y= 2)La produccin de acero en Estados Unidos en millones de 15 toneladas cortas(1 tonelada corta = 2000 libras) durante los aos 1986 1996 aparece en la tabla:

2 1

3 3

5 7

7 11

9 15

10 17

CURSO: ESTADISTICA I CICLO III

99

Manual del Alumno

Ao 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996

Produccin de acero en EE.UU.(millones de toneladas cortas)

66.6 84.9 88.6 78.0 96.2 105.2 93.2 111.6 88.3 117.0 115.2

a) Realiza el diagrama de dispersin. b) Determina la ecuacin de la recta de ajuste. c) Estima la produccin de acero durante los aos: 1997 y 1998. d) Estima la produccin de acero durante los aos: 1985 y1984 e) Halla r e interpreta.

3)Se desea encontrar una ecuacin que estime los ingresos anuales en funcin de los salarios mensuales,con este fin se ha recopilado los salarios mensuales e ingresos anuales de 8 trabajadores de una empresa.
Salarios mensuales Ingresos anuales 100 1200 150 1800 200 2400 275 3300 300 3600 325 3900 350 4200 375 4500

a) Crea el diagrama de dispersin respectivo. b) Determina la recta CURSO: ESTADISTICA I de mnimos cuadrados. CICLO III c) Estima los salarios mensuales para aquellos trabajadores cuyo ingreso anual es de 5700. d) Calcula el coeficiente de Correlacin (interpretar).

100

Manual del Alumno


4)La produccin de cigarrillos en Per durante los aos 1985 1992 fue:

Ao
Ncigarrillos (millones)

1985 98.2

1986 92.3

1987 80.0

1988 89.1

1989 83.5

1990 68.9

1991 69.2

1992 7.1

a) b) c) d)

Representa el diagrama de dispersin con recta de aproximacin. Halla la ecuacin de mnimos cuadrados. Determina e interpretar el coeficiente de Correlacin Estima la produccin de cigarrillos para los aos 1995 y 1998.

Nmeros ndices Problemas propuestos: 1) La siguiente tabla muestra los precio y cantidades de alguno cereales en los aos 1989 y 1998.

CURSO: ESTADISTICA I CICLO III

101

Manual del Alumno


1989
producto Cebada Maz Avena Arroz Centeno Trigo Precio 1.39 1.24 0.72 0.086 1.42 2.24 Cantidad 237 3238 1220 4077 18.1 1098

1998
producto Cebada Maz Avena Arroz Centeno Trigo Precio 1.24 1.15 0.65 0.097 1.27 2.23 Cantidad 470 3800 1422 4702 32.5 1462

A) Tomando como base a 1989 hallar el ndice de Laspeyres, El ndice de Paashe, el ndice ideal de Fisher. Para el ao 1998. B) Tomando como base a 1989 hallar el ndice de Laspeyres, El ndice de Paashe, el ndice ideal de Fisher. Para el ao 1989. C) Determine el ndice de agregacin simple para los aos 1989 y 1998.

2) La tabla muestra los precios al por menor y producciones medias de antracita y gasolina en EE.UU. durante los aos 1949 y 1958.

precios
producto 1949 1958

CURSO: ESTADISTICA I CICLO III

102

Manual del Alumno


antracita gasolina $20.13 por tonelada corta 28.20 por tonelada corta 20.3 cent. Por tonelada 21.4 cent. Por tonelada corta. corta

cantidades
producto antracita gasolina 1949 1958 3559 millones de 1821 millones de toneladas cortas toneladas cortas 80.2 millones de barriles * 118.6 millones de barriles

*
Cada barril contiene 42 galones. a) Determina el ndice de agregacin simple para 1958 con base en 1949. b) Determina el ndice de agregacin simple para 1949 con base en 1958. c) Halla el ndice de Laspeyres, Paashe, Fisher para el ao 1958 con respecto a 1949. Interpretar.

CURSO: ESTADISTICA I CICLO III