12/03/2012
ESTADISTICA DESCRIPTIVA
QU ES LA ESTADISTICA?
una rama de la matemtica que trata de la recopilacin, el anlisis, la interpretacin y la presentacin de una cantidad de datos numricos (New Collegiate Dictionary de Webster)
es la rama del mtodo cientfico que trata de los datos reunidos al contar o medir propiedades de alguna poblacin (Kendall y Stuart) el conocimiento relacionado con el tomar decisiones en situaciones de incertidumbre (Freund)
ESTADISTICA DESCRIPTIVA
12/03/2012
Poblacin
Se extrae
Se quiere conocer
Parmetros
(caractersticas)
Muestra
Se miden
Se pueden estimar
Variables
Se registran
Distribuciones de probabilidad
Conociendo sus
Datos
Se describen utilizando Mtodos Grficos Mtodos Numricos Permiten calcular
Estadsticos
ESTADISTICA DESCRIPTIVA
12/03/2012
Definiciones tericas
Poblacin: El conjunto total de elementos bajo estudio, tambin denominado Universo
Muestreo: Es la tcnica empleada para la seleccin de los elementos que conformaran una muestra. Muestra: Subconjunto de la poblacin. Descansa en el principio de que las partes representan al todo. Por lo tanto, para ser una buena muestra, debe reflejar las caractersticas que definen a la poblacin de la cual fue extrada (ser representativa). Unidad de anlisis: Es el elemento menor e indivisible del conjunto llamado universo, en el cual se produce o est presente el o los fenmenos que constituyen el objeto de estudio. Es el objeto o individuo del que se debe obtener la informacin.
Parmetro: Medida caracterstica de la poblacin. Es un nmero que se calcula usando todas las unidades de la poblacin.
Estadstico: Medida caracterstica de una muestra. Es un nmero que se calcula usando todas las unidades de la muestra Variables: Conceptos que pueden asumir distintos valores al medirlos en los diferentes elementos de la poblacin.
ESTADISTICA DESCRIPTIVA
12/03/2012
9% de la poblacin en Argentina ha hecho ms de 5 viajes a Europa. En una muestra de 400 Argentinos, 12.5% hizo ms de 5 viajes a Europa. En este ejemplo: a) 9% es ........................................... b) 12.5% es ......................................
EXPERIMENTOS Y ESTUDIOS
Las unidades son los objetos sobre los cuales se hacen las mediciones. Si las unidades son personas, se las llama sujetos. En un experimento, un tratamiento se aplica activamente a las unidades o sujetos para luego observar las respuestas. En un estudio observacional simplemente se observa a las unidades o sujetos y se registran las variables de inters. El investigador no intenta influenciar las respuestas. Piense en una situacin en la cual no se podra disear un experimento. Explique por qu.
ESTADISTICA DESCRIPTIVA
12/03/2012
Experimentos
variable independiente
modifica
variable dependiente
Determinar el estado inicial de la variable dependiente Introducir modificacin, manipulando la variable independiente Determinar el valor final de la variable dependiente Comparar el estado inicial y final de la variable dependiente
GRUPO EXPERIMENTAL
versus
GRUPO CONTROL
ASIGNACION ALEATORIA !
Investigacin o Estudio
Etapas del Diseo Lgico
I Etapa Previa: Eleccin del Objeto y Universo. Revisin bibliogrfica y de antecedentes. Estudio de la situacin (informantes clave, observacin participante) Construccin del sistema de hiptesis y del Marco Terico. II Diseo Lgico: Construccin, evaluacin y manejo del Instrumento de recoleccin de datos (Formulario / Cuestionario y Muestreo). III Recoleccin de Datos: Trabajo de campo. IV Procesamiento de datos: Codificacin, tabulacin y organizacin de los datos. V Anlisis y Presentacin de los datos: Aplicacin de las medidas estadsticas, construccin de tablas de presentacin y grficos.
ESTADISTICA DESCRIPTIVA
12/03/2012
Mtodos de Muestreo
Mtodo Deductivo
Teora de probabilidad, a partir de
Mtodo Inductivo
Inferencia Estadstica, utiliza las
caractersticas del subconjunto (muestra) para hacer afirmaciones inferencia) sobre la poblacin en general.
CENSO = EXACTITUD?
ESTADISTICA DESCRIPTIVA
12/03/2012
The necessity of training farm hands for first class farms in the fatherly handling of farm livestock is foremost in the minds of effective farm owners. Since the forefathers of the farm owners trained the farm hands for first class farms in the fatherly handling of farm livestock, the farm owners feel they should carry on with the former family tradition of training farmhands of first class farms in the effective fatherly handling of farm live stock, however futile, because of their belief that it forms the basis of effective farm management efforts.
resultantes sobre el universo sern confiables. Mayor rapidez para obtener resultados, ya que solamente se estudia una parte del universo. Mayor exactitud o mejor calidad de la informacin. Factibilidad de hacer los estudios cuando la toma de datos implica tcnicas destructivas. (ej.pruebas de (ej.pruebas germinacin, Anlisis de sangre)
ESTADISTICA DESCRIPTIVA
12/03/2012
Tipos de Muestreo
Probabilsticos Se basan en el concepto de equiprobabilidad. El mtodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacin, y dicha probabilidad no es nula para ningn elemento. Todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de la muestra.
No Probabilsticos Se basan sobre el criterio del investigador, no se usa el azar. Suelen presentar grandes sesgos y son poco fiables. No garantizan la representatividad de la muestra. No permiten realizar estimaciones inferenciales sobre la poblacin. Se utilizan principalmente para estudios exploratorios.
Tipos de Muestreo
Probabilsticos Muestreo simple al azar o Aleatorio simple. Muestreo sistemtico al azar Muestreo estratificado al azar Muestreo por conglomerados
No Probabilsticos Muestreo por conveniencia Muestreo por voluntarios Muestreo por cuotas Bola de Nieve
ESTADISTICA DESCRIPTIVA
12/03/2012
Cada uno de las unidades de la poblacin (Marco de Muestreo) tiene igual probabilidad de ser incluida en la muestra. Seleccin con reposicin o sin reposicin. Debe usarse algn instrumento que genere nmeros aleatorios: Tabla de nmeros aleatorios o calculadora.
ESTADISTICA DESCRIPTIVA
12/03/2012
Muestreo Sistemtico
Se selecciona aleatoriamente 1 elemento del 1er. grupo Se selecciona cada k unidades a partir del primero elegido.
N = 64 n = 16 k=4 Primer Grupo
Muestreo Estratificado
La Poblacin es dividida en 2 grupos o algunos ms (k estratos) de acuerdo a alguna caracterstica que est vinculada con la variable principal. Los estratos deben ser homogneos adentro y entre s muy diferentes. De cada estrato se extrae una muestra aleatoria simple de tamao ni, i=1,...,k. Utilizar algn tipo de afijacin: Proporcional, uniforme u ptima Luego todas las muestras son combinadas en una.
10
ESTADISTICA DESCRIPTIVA
12/03/2012
Definicin de objetivos: Identificacin del problema y establecimiento de las metas del estudio. Definicin del Marco de muestreo: puede ser de dos tipos. 2.a Marco Lista: Es una lista depurada (sin duplicaciones) que permite identificar a cada unidad de muestreo. 2.b Plano o Mapa: Permite identificar pequeas reas usadas como unidades de muestreo en las que se ha dividido l rea total. Definicin de variables y Mtodos de medicin: El tipo de variable por medir ayuda a definir el esquema o tipo de muestreo. Definicin del tipo de muestreo: Muestreo simple aleatorio, muestreo estratificado, muestreo por conglomerados, etc.
3. 4.
11
ESTADISTICA DESCRIPTIVA
12/03/2012
Determinacin del Tamao de la Muestra: Este punto depende de lo que se desea estimar y el esquema o tipo de muestreo seleccionado. Seleccin de las unidades de muestreo: Extraccin de un nmero n de unidades muestrales de una poblacin de tamao N. Organizacin del trabajo de campo: Capacitacin del personal y todas las operaciones necesarias para obtener la informacin buscada. Anlisis y edicin de resultados: Puede consistir slo en la presentacin e interpretacin de estadsticos simples y grficos o puede considerar un anlisis estadstico ms complejo ( estimacin, prueba de hiptesis, anlisis multivariado, etc.) Esto depende de los objetivos del trabajo.
incluidos en la muestra.
Que sea suficiente, que la cantidad de elementos seleccionados sea el que se
12
ESTADISTICA DESCRIPTIVA
12/03/2012
Tipos de errores
Error Muestral
Es el error que se comete
Error no muestral
Generalmente es
debido al hecho de que se obtienen conclusiones sobre la realidad a partir de la observacin slo de una parte de ella. Es la diferencia entre un estadstico y su parmetro correspondiente disminuye conforme el tamao de la muestra aumenta.
subestimado por el investigador. Es todo lo dems -adems del error muestral- que puede introducir sesgos en los resultados de un estudio.
El error de muestreo
REGISTRO DE DATOS
unidades
variables
datos
13
ESTADISTICA DESCRIPTIVA
12/03/2012
Escalas de Medicin
1. Nominal Aplica a datos categricos Nominal:
2. Ordinal Aplica a datos categricos que tienen un orden Ordinal: implcito. 3. De Intervalo Aplica a datos numricos con propiedades de Intervalo: los ordinales, en los cuales el intervalo entre las observaciones se expresa en trminos de una unidad fija de medida. Existe un cero arbitrario. 4. De Razn Aplica a datos con propiedades de los de intervalo, Razn: pero para los cuales, adems, tiene sentido el cociente entre las mediciones. Existe un cero real que coincide con la ausencia de atributos.
Poblacin
Se extrae
Se quiere conocer
Parmetros
(caractersticas)
Muestra
Se miden
Se pueden estimar
Variables
Se registran
Distribuciones de probabilidad
Conociendo sus
Datos
Se describen utilizando Mtodos Grficos Mtodos Numricos Permiten calcular
Estadsticos
14
ESTADISTICA DESCRIPTIVA
12/03/2012
ESTADISTICA DESCRIPTIVA:
METODOS TABULARES Y GRAFICOS
Presentacin de la informacin
Matriz de datos: si a cada unidad se la coloca en una matriz de manera tal que
en cada variable expresa el valor que ocupa, se obtendr una matriz de datos. Matriz de datos.xls
de la variable, presentada ordenadamente. Es el resumen tabular de un conjunto de datos que muestra la frecuencia (o la cantidad) de casos en cada una de varias clases que no se superponen.
15
ESTADISTICA DESCRIPTIVA
12/03/2012
Medios de Arribo
mnibus de lnea 15% Avin 10% mnibus de excursin 1%
Diagrama Circular
Medios de Arribo
1000 900 800 700 600 500 400 300 200 100 0
GRAFICO DE BARRAS
Auto particular
Avin
mnibus de lnea
Vehculo de alquiler
mnibus de excursin
16
ESTADISTICA DESCRIPTIVA
12/03/2012
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% A B Causas Penales C D Causas no penales E
Barras al 100%!!!!!!!!!!
17
ESTADISTICA DESCRIPTIVA
12/03/2012
Duracin de los procesos Duracin De 1 mes a 2 meses Entre 2 y 3 meses Entre 3 y 4 meses Entre 4 y 5 meses Vlidos Entre 5 y 6 Meses Entre 6 meses y 1 ao Ms de 1 ao Frecuencia 15031 7150 4435 2426 1674 4512 1682 Porcentaje 40,7 19,4 12,0 6,6 4,5 12,2 4,6 Porcentaje acumulado 40,7 60,1 72,1 78,7 83,2 95,4 100,0
Total
36910
100,0
Total
36910
100,0
18
ESTADISTICA DESCRIPTIVA
12/03/2012
Representaciones grficas
Histograma: Se utiliza para describir variables continuas, agrupadas en clases. La superficie de cada barra es proporcional a la frecuencia de los valores representados
Duracin de los procesos
60
Frecuencia
40
20
Das corridos
Polgono de Frecuencias
19
ESTADISTICA DESCRIPTIVA
12/03/2012
Ojiva
TABLA DE CONTINGENCIA Relacin entre dos variables: cuali cuali cuali cuanti cuanti cuanti
Una empresa de coches de alquiler quiere estudiar la asociacin entre el sexo y la marca de coches que se alquilan
20
ESTADISTICA DESCRIPTIVA
12/03/2012
21
ESTADISTICA DESCRIPTIVA
12/03/2012
ESTADISTICA DESCRIPTIVA:
METODOS NUMERICOS
observaciones, es el valor medio tal que si todas las observaciones tuvieran ese valor, la suma de ellas sera igual a la suma de las observaciones de la distribucin original. Puede interpretarse como el punto de equilibrio del conjunto de datos. Es sensible a la presencia de datos extremos. Solo puede calcularse a partir de variables cuantitativas.
x=
x
i =1
x1 + x2 + ... + xn n
22
ESTADISTICA DESCRIPTIVA
12/03/2012
176
200
187
220
201
x=
x=
23
ESTADISTICA DESCRIPTIVA
12/03/2012
cuando las observaciones se han ordenado en funcin de los valores de la variable. Es robusta a la presencia de datos extremos. Se calcula a partir de variables cuantitativas, aunque a veces tambin cuando las variables estn medidas en escala ordinal.
Si los datos son: 150 176 200 187 220 201 Al ordenarlos: 150 176 187 200 201 220 Mediana=193.5 Agregando otra vez el valor extremo, 500 150 176 187 200 201 220 500 Mediana=200
24
ESTADISTICA DESCRIPTIVA
12/03/2012
conjunto de datos ordenados. Ejemplo, el percentil de orden 10 deja por debajo al 10% de las observaciones, y por encima queda el 90%.
10%
90% P10
con la Mediana
25
ESTADISTICA DESCRIPTIVA
12/03/2012
Estadsticos
Duracin N Media Mediana Moda Percentiles 25 50 75 Vlidos Perdidos 36910 19 88,6479 43,0000 ,00 12,0000 43,0000 101,0000
El valor de la Media es mucho mayor al de la Mediana debido a los valores extremos de la derecha.
Presentacin de resultados
Box Plot : Describe al mismo tiempo varias caractersticas Describe importantes de un conjunto de datos, tales como el centro, la dispersin, el alejamiento de la simetra, y la identificacin de valores extremos (puntos atpicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.
LS Q3
Mediana
Atpicos
Q2 Q1
LI
26
ESTADISTICA DESCRIPTIVA
12/03/2012
Presentacin de resultados
Box Plot: Duracin de procesos
Outliers
3 Cuartil Mediana
1 Cuartil
Presentacin de resultados
Box Plot: Duracin de procesos
Resmenes de casos
Duracin Resolucin Archivos Incompetencias Mediacin Caducidades Desistimientos Resoluciones Segunda Instancia Sentencias Suspensin del proceso a pruea Extinciones de la Accin Excepciones Total Media 75,8633 55,6326 78,8693 408,4615 64,0363 266,6863 147,7373 127,8609 496,8133 153,5532 88,6479 Mediana 34,0000 33,0000 59,0000 389,5000 47,0000 208,0000 98,0000 97,0000 419,0000 107,0000 43,0000
27
ESTADISTICA DESCRIPTIVA
12/03/2012
120 100 80 60 40 20 0 1 2 3 4 5 6
120 100 80 60 40
120 100 80 60 40
20
20
0 1 2 3 4 5 6
0 1 2 3 4 5 6
28
ESTADISTICA DESCRIPTIVA
12/03/2012
recorrido. La amplitud (A) de un conjunto de datos es la diferencia entre las (A observaciones que tienen el mayor y el menor valor numrico en el mismo.
Rango=5
Rango=1
Rango=7
9
1
10
1
11
12
2 2
29
ESTADISTICA DESCRIPTIVA
12/03/2012
que hay entre cada uno de los valores respecto a su punto central (Media). (Media). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de observaciones que se tengan.
9
-1 -2
10
1
11
2
12
s2 =
( - 2 ) 2 + ( - 1) 2 + 0 2 + 12 + 2 2 = 5 4 +1+ 0 +1+ 4 =2 5
s = s2 =
2 = 1 . 4142 ...
30
ESTADISTICA DESCRIPTIVA
12/03/2012
31