Anda di halaman 1dari 51

ESTADISTICA GENERAL

INTRODUCCIN INTRODUCCIN CONCEPTOS BASICOS CONCEPTOS BASICOS ORGANIZACIN DE DATOS ORGANIZACIN DE DATOS Profesor del curso: Ing. Celso Gonzales Profesor del curso: Ing. Celso Gonzales

INTRODUCCION
OBJETIVOS
Comprender qu es y porqu se estudia la estadstica. Comprender los conceptos bsicos de la estadstica. Explicar lo que significan estadstica inferencial. estadstica descriptiva y

Diferenciar entre una variable cualitativa y cuantitativa.

Qu es estadstica?
Recolecta Organiza Presenta Analiza interpreta

Para qu sirve la estadstica?

La Estadstica se utiliza como tecnologa al servicio de las ciencias.......

TIPOS DE ESTADISTICA

Estadstica Descriptiva Estadstica Descriptiva Estadstica Inferencial Estadstica Inferencial

RAMAS DE LA ESTADSTICA

ESTADSTICA DESCRIPTIVA

ESTADSTICA INFERENCIAL

SE OCUPA DE LA COLECCIN Y CLASIFICACIN DE INFORMACIN, DE SU RESUMEN EN CUADROS Y GRFICOS ADECUADOS QUE RESUMAN EN FORMA APROPIADA LA INFORMACIN CAPTADA.

SE OCUPA DE LOS PROCESOS DE ESTIMACIN, ANLISIS Y PRUEBA DE HIPTESIS, CON ELPROPSITO DE LLEGAR A CONCLUSIONES QUE BRINDEN UNA ADECUADA BASE CIENTFICA PARA LA TOMA DE DECISIONES TOMANDO COMO BASE LA INFORMACIN CAPTADA POR LA MUESTRA.

Pasos en un estudio estadstico

Plantear hiptesis sobre una poblacin Decidir qu datos recoger (diseo de experimentos)
Qu individuos pertenecern al estudio (muestras) Qu datos recoger de los mismos (variables)

Recoger los datos (muestreo)


Estratificado? Sistemticamente?

Describir (resumir) los datos obtenidos Realizar una inferencia sobre la poblacin Cuantificar la confianza en la inferencia
Nivel de confianza Margen de error:

CONCEPTOS BSICOS
Poblacin Muestra Individuo o unidad elemental Observacin Variable Parmetro Estadstico

POBLACIN Y MUESTRA

Poblacin Conjunto de observaciones o datos obtenidos de una medicin, conteo o cualidad de ciertos caracteres de los mismos. Muestra Deber ser representativo

Unidad elemental
Todo elemento que est afectado por la caracterstica o factor que se desea estudiar. Ejemplo: Se desea hacer un estudio sobre el ingreso familiar de Lima Metropolitana Identifique: Poblacin, una posible muestra, la caracterstica en estudio y la unidad elemental.

Observacin
Dato o registro realizado, producto de la apreciacin de una caracterstica en una unidad elemental. De una observacin para el ejemplo anterior.

EJEMPLO1 Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte de las amas de casa. Entre las 50 amas de casa entrevistadas, 30 dijeron que preferan esta marca. a. Qu constituye la muestra?. b. Qu constituye la poblacin?. c. Cul es la proporcin, dentro de la muestra, de las amas de casa que prefieren la marca del detergente?

Variables
Son las caractersticas que se desea apreciar de los elementos de la poblacin.

CLASIFICACIN DE VARIABLES

CUALITATIVAS

CUANTITATIVAS

Atributos

Numrico
Ordinal Discreto Continuo

Nominal

TIPOS DE VARIABLES
Cualitativas Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No) Ordinales: Si sus valores se pueden ordenar Grado de satisfaccin, Intensidad del color Cuantitativas o Numricas Discretas: Si toma valores enteros Nmero de hijos, Nmero de desempleados Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, ingreso mensual,

EJEMPLO2
Clasificar cada una de las siguientes variables: a. Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad. b. Tiempo que requiere un estudiante para responder a un examen. c. Llamadas que llegan a la central telefnica de la USB en un da. d. Preferencia por cierta marca de refresco. e. Sexo de las estudiantes que toman el curso de estadstica en el semestre. f. Nmero de acciones vendidas en un da en la Bolsa de Valores.

Parmetro
Es una funcin de todas las observaciones de una poblacin ( ) MEDIDA USADA PARA DESCRIBIR UNA VARIABLE DE UNA POBLACION El parmetro resume la informacin contenida en las observaciones que comprenden a una poblacin, por lo que su valor es nico y generalmente desconocido y por tato debe ser ESTIMADO.

Parmetro
La media

La varianza 2 Proporcin

x1 + x2 + ...+ xN = N
p

Estadstico o estimador
Es una funcin de los valores muestrales y que no depende de parmetro alguno. Se caracterizan porque pueden tomar valores diferentes de muestra a muestra.

= f (x1, x2,...,xn )

Por ejemplo, la media muestral

x1 + x2 + ...+ xn X= n

ORGANIZACIN DE DATOS OBJETIVOS


Organizar los datos en una distribucin de frecuencias Presentar una distribucin de frecuencias en un histograma, un polgono de frecuencias y una ojiva. Elaborar e interpretar una representacin de tallo y hoja.

ORGANIZACIN DE DATOS
VARIABLE CUALITATIVA

Para representar grficamente la distribucin de frecuencias de una variable cualitativa se utilizan las barras y los sectores circulares. Nota Si trabajamos con variables nominales las categoras pueden ser colocadas en cualquier orden. En el caso de escala ordinal las categoras debern ser colocadas en orden

EJEMPLO: En una planta embotelladora se registraron 54 accidentes y de acuerdo con la parte del cuerpo lesionada, dedos (D), ojos (O), brazo (B), y piernas (P); se registraron los datos (cuadro 1). Se pide organizar los datos.

CUADRO 1:
D D D O D P D D B D D P B B B P D P B D D B B P D D B P P O O D D D B O B D D B O D P O D B O P D B P B P D

PARTE LESIONADA BRAZOS DEDOS OJO PIERNA Total

NMERO DE ACCIDENTES 14 22 7 11 54

Accidentes ocurridos en la planta segn la parte lesionada


20

Nmero de accidentes

10

0 Brazo Dedos Ojos Pierna

Parte Lesionada
Fuente: Elaborado por el Departamento de Personal. Julio del 2005

ACCIDENTES OCURRIDOS EN LA PLANTA SEGN LA PARTE LESIONADA


BRAZO (14, 25.9%)

DEDO (22, 40.7%)

PIERNA (11, 20.4%)

OJO ( 7, 13.0%)

Si adems de registrar la parte lesionada se registra el sexo de los trabajadores se podra tener un grfico de este tipo.
Registro de accidentes segn el tipo de lesin y sexo
15 Hombre

Nm ero de trabajadores

Mujer 10

0 B D O P

LESION
Fuente: Departamento Mdico Julio del 2005

ORGANIZACIN DE DATOS
VARIABLE CUANTITATIVA DISCRETA

Variable Cuantitativa Discreta


(Pocos valores diferentes de la variable)

Variable X1 X2 Xn

Frecuencia f1 f2 fn n

Porcentaje (f1/n)x100 (f2/n)x100 (fn/n)x100 1

Ejemplo Construir la distribucin de frecuencias del nmero de trabajadores que se ausentaron en 20 das laborales:
2 3 3 3 1 2 2 3 2 3 1 1 4 2 3 2 1 0 2 4

Ausencias de Trabajadores 0 1 2 3 4

N de das

Porcentajes

1 4 7 6 2 20

0.05x100=5% 0.20x100=20% 0.35x100=35% 0.30x100=30% 0.10x100=10% 100%

Distribucin de Frecuencia del nmero de trabajadores que sea ausentaron por da.
7

Nmero de trajadores

6 5 4 3 2 1 0 0 1 2 3 4

Nmero de Ausencias por da

Tablas de frecuencias: Ejemplo


Cuntos individuos tienen menos de 2 hijos?
674 individuos 0 1 2 3 4 5 6 7 Ocho+ Total Frec. 419 255 375 215 127 54 24 23 17 1509 Nmero de hijos Porcent. (vlido) 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcent. acum. 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0

Qu porcentaje de individuos tiene 6 hijos o menos?


97,3%

50%

Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual?
2 hijos

MEDIDAS DE VARIABILIDAD
Rango Rango intercuartil Variancia Desviacin estndar Coeficiente de variabilidad

ORGANIZACIN DE DATOS
VARIABLE CUANTITATIVA CONTINUA

En la oficina de un diario, el tiempo que se tardan en imprimir la primera plana fue registrado durante 50 das. A continuacin se transcriben los datos, aproximados a dcimas de minuto:
20,8 25,3 23,7 21,3 19,7 22,8 20,7 20,3 21,5 24,2 21,9 22,5 23,6 23,1 23,8 22,0 21,2 19,0 19,9 20,7 20,7 23,8 25,1 24,2 23,8 20,9 23.3 25,0 24,1 24,3 25,0 20,9 19,5 19,8 21,1 22,2 22,9 24,1 23,9 20,9 22,8 23,5 24,2 22,8 21,6 20,1 19,5 21,8 23,9 22,7

a. Construya con los datos una tabla de distribucin de frecuencia, usando la regla de sturges. b. Construya un polgono de frecuencias. c. Construya una ojiva. d. Por medio de la ojiva estime que porcentaje de las veces la primera plana del peridico puede imprimirse en menos de 24 minutos.

PROCEDIMIENTO Calcular el rango (R) o recorrido, el cual se define de la siguiente manera: R = Obs. mxima Obs. Mnima R = 25.3 - 19.0 = 6.3 Determine el nmero de intervalos (k) K = 1 + 3.3 log (n) (Frmula de Sturges) K = 1 + 3.3 log (50) = 6.607 = 7 (entero) (Redondeo simple)

Determinar del tamao del intervalo TIC (Redondeado por exceso) Se redondea sugn el nmero de decimales que se tiene en la muestra

R TIC = K 6. 3 TIC = = 0.9 7

Elabore la tabla de frecuencia segn la informacin anterior donde: fi= Frecuencia absoluta Fi= Frecuencia acumulada absoluta fri= Frecuencia relativa=fi/n Fri= Frecuencia acumulada relativa

f
i =1

=n

fr
i =1

=1

Fi =

f
j =1

Fri = fr j = Fi / n
j =1

Marca de clase

X i =

LI i + LS i 2

Distribucin de frecuencias del tiempo que tardan en imprimir la primera plana de un diario
Tiempo (minutos) [19.0-19.9> [19.9-20.8> [20.8-21.7> [21.7-22.6> [22.6-23.5> [23.5-24.4> [24.4-25.3] fi 5 6 9 5 7 14 4 50 fri 0.10 0.12 0.18 0.10 0.14 0.28 0.08 1 Fi 5 11 20 25 32 46 50 Fri 0.10 0.22 0.40 0.50 0.64 0.92 1.00 Xi 19.45 20.35 21.25 22.15 23.05 23.95 24.85

Grficos para datos intervalos de clase

cuantitativos

Agrupados

en

HISTOGRAMA DE FRECUENCIA POLIGONO DE FRECUENCIA OJIVA

Grfico de Tallos y hojas Grfico para datos cuantitativos seriados en el tiempo

HISTOGRAMA DE FRECUENCIA
Distribucin del tiempo que se tardan en imprimir la primera plana del diario 14 12 10 8 6 4 2 0

Nmero de das

19.0

19.9

20.8

21.7 22.6 Tiempo

23.5

24.4

25.3

POLIGONO DE FRECUENCIAS
Distribucin del tiempo que se tardan en imprimir la primera plana del diario 14 12 10 8 6 4 2 0

POLIGONO

Nmero de das

19.45

20.35

21.25

22.15 Tiempo

23.05

23.95

24.85

OJIVA
OJIVA 60 50 N Acum ulado de dias 40 30 20 10 0 19 19.9 20.8 21.7 22.6 23.5 24.4 25.3 Tiempo(en minutos)

EJERCICIO Para evaluar la viabilidad de un proyecto de reforestacin de una zona sometidas a estrs turstico, para el que se ha solicitado una subvencin publica, se analiz la composicin en mg/cm3 de desechos orgnicos del territorio. Los datos obtenidos fueron:
Composicin (mg/cm3) 8.2 9.2 9.4 10.8 10.8 11.1 11.9 12.9 12.9 14 14.3 14.4 15.1 15.1 15.3 15.8 15.9 16.9 18.2 18.4 18.6 18.8 19.7 20.3 20.3 20.3 20.4 20.7 20.8 21 21.4 22.2 22.5 23.2 25.8

A. Construir la tabla de frecuencias y representar la informacin grficamente. B. A partir de la tabla de frecuencias interprete: f3 y 1-Fr2 C. Entre qu niveles de composicin se encuentra aproximadamente el 51,4% de las observaciones con menores niveles registrados?.

Composicin [8.2 - 11.2> [11.2 - 14.2> [14.2 - 17.2> [17.2 - 20.2> [20.2 - 23.2> [23.6 - 26.2>

Nmero de observaciones 6 4 8 5 10 2

Fi 6 10 18 23 33 35

fri 0.17142857 0.11428571 0.22857143 0.14285714 0.28571429 0.05714286

Fri 0.17142857 0.28571429 0.51428571 0.65714286 0.94285714 1

EJERCICIO Para los artculos anteriores se tienen las siguientes distribuciones de los precios (en dlares) en la primera semana de agosto y en la primera semana de setiembre del 2005.
CANTIDAD DE ARTICULOS PUNTOS MEDIOS 61 64 67 70 73 76 79 AGOSTO 0 1 2 4 6 4 3 SETIEMBRE 3 4 6 4 2 1 0

a) Grafique las dos distribuciones anteriores en un slo grfico donde se aprecien el comportamiento de las mismas y calcule el promedio y la desviacin estndar de la distribucin de agosto b) Realice un comentario segn lo observado en el grfico anterior

DIAGRAMA DE TALLOS Y HOJAS


Los datos tienen un decimal
Stem-and-Leaf Display: Tiempo Stem-and-leaf of Tiempo N = 50 Leaf Unit = 0.10

tallo
1 19 0 6 19 55789 8 20 13 15 20 7778999 18 21 123 22 21 5689 24 22 02 (6) 22 578889 20 23 13 18 23 56788899 10 24 112223 4 24 4 25 0013

hojas

Terminacin de dgitos del 0 al 4

Terminacin de dgitos del 5 al 9

15 datos menores e iguales que 20.9

6 datos entre 22.5 y 22.9 y uno de ellos es la mediana 10 datos mayores e iguales que 24.1