Anda di halaman 1dari 31

ESTADISTICA DESCRIPTIVA

12/03/2012

ESTADISTICA DESCRIPTIVA

Lic. Gabriela Benedicto Facultad de Ciencias Econmicas UNPSJB Sede Esquel

QU ES LA ESTADISTICA?
una rama de la matemtica que trata de la recopilacin, el anlisis, la interpretacin y la presentacin de una cantidad de datos numricos (New Collegiate Dictionary de Webster)

es la rama del mtodo cientfico que trata de los datos reunidos al contar o medir propiedades de alguna poblacin (Kendall y Stuart) el conocimiento relacionado con el tomar decisiones en situaciones de incertidumbre (Freund)

Mg. Gabriela Benedicto

ESTADISTICA DESCRIPTIVA

12/03/2012

Poblacin
Se extrae

Se quiere conocer

Parmetros
(caractersticas)

Muestra
Se miden

Se pueden estimar

Variables
Se registran

Distribuciones de probabilidad
Conociendo sus

Datos
Se describen utilizando Mtodos Grficos Mtodos Numricos Permiten calcular

Estadsticos

Preguntas: - Cmo se determina la muestra? Mtodos de muestreo

- Cmo se obtienen los datos? - Fuentes existentes - Experimentos - Estudios observacionales

Mg. Gabriela Benedicto

ESTADISTICA DESCRIPTIVA

12/03/2012

Definiciones tericas
Poblacin: El conjunto total de elementos bajo estudio, tambin denominado Universo

Muestreo: Es la tcnica empleada para la seleccin de los elementos que conformaran una muestra. Muestra: Subconjunto de la poblacin. Descansa en el principio de que las partes representan al todo. Por lo tanto, para ser una buena muestra, debe reflejar las caractersticas que definen a la poblacin de la cual fue extrada (ser representativa). Unidad de anlisis: Es el elemento menor e indivisible del conjunto llamado universo, en el cual se produce o est presente el o los fenmenos que constituyen el objeto de estudio. Es el objeto o individuo del que se debe obtener la informacin.

Parmetro: Medida caracterstica de la poblacin. Es un nmero que se calcula usando todas las unidades de la poblacin.

Estadstico: Medida caracterstica de una muestra. Es un nmero que se calcula usando todas las unidades de la muestra Variables: Conceptos que pueden asumir distintos valores al medirlos en los diferentes elementos de la poblacin.

Mg. Gabriela Benedicto

ESTADISTICA DESCRIPTIVA

12/03/2012

9% de la poblacin en Argentina ha hecho ms de 5 viajes a Europa. En una muestra de 400 Argentinos, 12.5% hizo ms de 5 viajes a Europa. En este ejemplo: a) 9% es ........................................... b) 12.5% es ......................................

EXPERIMENTOS Y ESTUDIOS
Las unidades son los objetos sobre los cuales se hacen las mediciones. Si las unidades son personas, se las llama sujetos. En un experimento, un tratamiento se aplica activamente a las unidades o sujetos para luego observar las respuestas. En un estudio observacional simplemente se observa a las unidades o sujetos y se registran las variables de inters. El investigador no intenta influenciar las respuestas. Piense en una situacin en la cual no se podra disear un experimento. Explique por qu.

Mg. Gabriela Benedicto

ESTADISTICA DESCRIPTIVA

12/03/2012

Experimentos
variable independiente

modifica

variable dependiente

Determinar el estado inicial de la variable dependiente Introducir modificacin, manipulando la variable independiente Determinar el valor final de la variable dependiente Comparar el estado inicial y final de la variable dependiente

GRUPO EXPERIMENTAL

versus

GRUPO CONTROL

ASIGNACION ALEATORIA !

Investigacin o Estudio
Etapas del Diseo Lgico
I Etapa Previa: Eleccin del Objeto y Universo. Revisin bibliogrfica y de antecedentes. Estudio de la situacin (informantes clave, observacin participante) Construccin del sistema de hiptesis y del Marco Terico. II Diseo Lgico: Construccin, evaluacin y manejo del Instrumento de recoleccin de datos (Formulario / Cuestionario y Muestreo). III Recoleccin de Datos: Trabajo de campo. IV Procesamiento de datos: Codificacin, tabulacin y organizacin de los datos. V Anlisis y Presentacin de los datos: Aplicacin de las medidas estadsticas, construccin de tablas de presentacin y grficos.

Mg. Gabriela Benedicto

ESTADISTICA DESCRIPTIVA

12/03/2012

Mtodos de Muestreo

Mtodo Deductivo
Teora de probabilidad, a partir de

Mtodo Inductivo
Inferencia Estadstica, utiliza las

las caractersticas de la poblacin se obtienen las posibles caractersticas de una muestra.

caractersticas del subconjunto (muestra) para hacer afirmaciones inferencia) sobre la poblacin en general.

Por una muestra pequea podemos juzgar la pieza entera. Cervantes

CENSO = EXACTITUD?

Problemas de medicin Imposibilidad

Mg. Gabriela Benedicto

ESTADISTICA DESCRIPTIVA

12/03/2012

The necessity of training farm hands for first class farms in the fatherly handling of farm livestock is foremost in the minds of effective farm owners. Since the forefathers of the farm owners trained the farm hands for first class farms in the fatherly handling of farm livestock, the farm owners feel they should carry on with the former family tradition of training farmhands of first class farms in the effective fatherly handling of farm live stock, however futile, because of their belief that it forms the basis of effective farm management efforts.

Ventajas del muestreo


Costos reducidos Si la muestra es representativa, las deducciones

resultantes sobre el universo sern confiables. Mayor rapidez para obtener resultados, ya que solamente se estudia una parte del universo. Mayor exactitud o mejor calidad de la informacin. Factibilidad de hacer los estudios cuando la toma de datos implica tcnicas destructivas. (ej.pruebas de (ej.pruebas germinacin, Anlisis de sangre)

Mg. Gabriela Benedicto

ESTADISTICA DESCRIPTIVA

12/03/2012

Tipos de Muestreo

Probabilsticos Se basan en el concepto de equiprobabilidad. El mtodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacin, y dicha probabilidad no es nula para ningn elemento. Todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de la muestra.

No Probabilsticos Se basan sobre el criterio del investigador, no se usa el azar. Suelen presentar grandes sesgos y son poco fiables. No garantizan la representatividad de la muestra. No permiten realizar estimaciones inferenciales sobre la poblacin. Se utilizan principalmente para estudios exploratorios.

Tipos de Muestreo

Probabilsticos Muestreo simple al azar o Aleatorio simple. Muestreo sistemtico al azar Muestreo estratificado al azar Muestreo por conglomerados

No Probabilsticos Muestreo por conveniencia Muestreo por voluntarios Muestreo por cuotas Bola de Nieve

Mg. Gabriela Benedicto

ESTADISTICA DESCRIPTIVA

12/03/2012

Muestreo: Definiciones tericas


Marco Muestral: Es la enumeracin completa y ordenada de los elementos sobre los cuales se realizarn las inferencias estadsticas en el muestreo probabilstico. Error de muestreo: Es el error que se comete debido al hecho de que se obtienen conclusiones sobre la realidad a partir de la observacin slo de una parte de ella. Es la diferencia entre un estadstico y su parmetro correspondiente. Nivel de confianza: Es la probabilidad de que el intervalo construido en torno a un estadstico capte el verdadero valor del parmetro.

Muestreo Aleatorio Simple

Cada uno de las unidades de la poblacin (Marco de Muestreo) tiene igual probabilidad de ser incluida en la muestra. Seleccin con reposicin o sin reposicin. Debe usarse algn instrumento que genere nmeros aleatorios: Tabla de nmeros aleatorios o calculadora.

Mg. Gabriela Benedicto

ESTADISTICA DESCRIPTIVA

12/03/2012

Muestreo Sistemtico

Se decide el tamao de muestra: n Se divide a la Poblacin de N unidades en grupos de k unidades: k N/n

Se selecciona aleatoriamente 1 elemento del 1er. grupo Se selecciona cada k unidades a partir del primero elegido.
N = 64 n = 16 k=4 Primer Grupo

Muestreo Estratificado
La Poblacin es dividida en 2 grupos o algunos ms (k estratos) de acuerdo a alguna caracterstica que est vinculada con la variable principal. Los estratos deben ser homogneos adentro y entre s muy diferentes. De cada estrato se extrae una muestra aleatoria simple de tamao ni, i=1,...,k. Utilizar algn tipo de afijacin: Proporcional, uniforme u ptima Luego todas las muestras son combinadas en una.

Mg. Gabriela Benedicto

10

ESTADISTICA DESCRIPTIVA

12/03/2012

Muestreo por Conglomerados


La Poblacin es dividida en muchos conjuntos llamados conglomerados . Cada conglomerado es representativo de la poblacin. Heterogneos adentro y parecidos entre s y a la poblacin. Si se selecciona una muestra aleatoria de los conglomerados y en la muestra entran todas las unidades elementales del mismo, el muestreo es DE UNA ETAPA. Cada conglomerado se denomina UPE. Si se realiza una seleccin dentro del conglomerado, el muestreo es bietpico. Las muestras son combinadas en una sola de tamao n.

La Poblacin es dividida en 6 conglomerados


Lic. M. Gabriela Benedicto

Principales etapas de un estudio por muestreo


1. 2.

Definicin de objetivos: Identificacin del problema y establecimiento de las metas del estudio. Definicin del Marco de muestreo: puede ser de dos tipos. 2.a Marco Lista: Es una lista depurada (sin duplicaciones) que permite identificar a cada unidad de muestreo. 2.b Plano o Mapa: Permite identificar pequeas reas usadas como unidades de muestreo en las que se ha dividido l rea total. Definicin de variables y Mtodos de medicin: El tipo de variable por medir ayuda a definir el esquema o tipo de muestreo. Definicin del tipo de muestreo: Muestreo simple aleatorio, muestreo estratificado, muestreo por conglomerados, etc.

3. 4.

Mg. Gabriela Benedicto

11

ESTADISTICA DESCRIPTIVA

12/03/2012

Principales etapas de un estudio por muestreo


5. 6. 7. 8.

Determinacin del Tamao de la Muestra: Este punto depende de lo que se desea estimar y el esquema o tipo de muestreo seleccionado. Seleccin de las unidades de muestreo: Extraccin de un nmero n de unidades muestrales de una poblacin de tamao N. Organizacin del trabajo de campo: Capacitacin del personal y todas las operaciones necesarias para obtener la informacin buscada. Anlisis y edicin de resultados: Puede consistir slo en la presentacin e interpretacin de estadsticos simples y grficos o puede considerar un anlisis estadstico ms complejo ( estimacin, prueba de hiptesis, anlisis multivariado, etc.) Esto depende de los objetivos del trabajo.

Principios bsicos para la construccin de una muestra


Independencia en la seleccin de los individuos que la conformarn. Todos los individuos debern tener una probabilidad conocida de ser

incluidos en la muestra.
Que sea suficiente, que la cantidad de elementos seleccionados sea el que se

requiere para que el nivel de confiabilidad sea el que se ha establecido previamente.

Mg. Gabriela Benedicto

12

ESTADISTICA DESCRIPTIVA

12/03/2012

Tipos de errores

Error Muestral
Es el error que se comete

Error no muestral
Generalmente es

debido al hecho de que se obtienen conclusiones sobre la realidad a partir de la observacin slo de una parte de ella. Es la diferencia entre un estadstico y su parmetro correspondiente disminuye conforme el tamao de la muestra aumenta.

subestimado por el investigador. Es todo lo dems -adems del error muestral- que puede introducir sesgos en los resultados de un estudio.

El error de muestreo

REGISTRO DE DATOS

unidades

variables

datos

CUALITATIVA VARIABLE CUANTITATIVA discreta continua

Mg. Gabriela Benedicto

13

ESTADISTICA DESCRIPTIVA

12/03/2012

Escalas de Medicin
1. Nominal Aplica a datos categricos Nominal:

2. Ordinal Aplica a datos categricos que tienen un orden Ordinal: implcito. 3. De Intervalo Aplica a datos numricos con propiedades de Intervalo: los ordinales, en los cuales el intervalo entre las observaciones se expresa en trminos de una unidad fija de medida. Existe un cero arbitrario. 4. De Razn Aplica a datos con propiedades de los de intervalo, Razn: pero para los cuales, adems, tiene sentido el cociente entre las mediciones. Existe un cero real que coincide con la ausencia de atributos.

Poblacin
Se extrae

Se quiere conocer

Parmetros
(caractersticas)

Muestra
Se miden

Se pueden estimar

Variables
Se registran

Distribuciones de probabilidad
Conociendo sus

Datos
Se describen utilizando Mtodos Grficos Mtodos Numricos Permiten calcular

Estadsticos

Mg. Gabriela Benedicto

14

ESTADISTICA DESCRIPTIVA

12/03/2012

ESTADISTICA DESCRIPTIVA:
METODOS TABULARES Y GRAFICOS

Presentacin de la informacin
Matriz de datos: si a cada unidad se la coloca en una matriz de manera tal que

en cada variable expresa el valor que ocupa, se obtendr una matriz de datos. Matriz de datos.xls

Distribucin de frecuencias: se llama as a la forma que asume la distribucin

de la variable, presentada ordenadamente. Es el resumen tabular de un conjunto de datos que muestra la frecuencia (o la cantidad) de casos en cada una de varias clases que no se superponen.

Mg. Gabriela Benedicto

15

ESTADISTICA DESCRIPTIVA

12/03/2012

Medios de Arribo
mnibus de lnea 15% Avin 10% mnibus de excursin 1%

Diagrama Circular

Auto particular 74%

Medios de Arribo
1000 900 800 700 600 500 400 300 200 100 0

GRAFICO DE BARRAS

Auto particular

Avin

mnibus de lnea

Vehculo de alquiler

mnibus de excursin

Mg. Gabriela Benedicto

16

ESTADISTICA DESCRIPTIVA

12/03/2012

Grficos que engaan


En qu Circunscripcin es ms importante el ingreso de Causas Penales?
Ingreso de Causas Penales VS no Penales por Circunscripcin
14000 12000 10000 8000 6000 4000 2000 0 A B Causas Penales C D Causas no penales E

Ingreso de Causas Penales VS no Penales por Circunscripcin

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% A B Causas Penales C D Causas no penales E

Barras al 100%!!!!!!!!!!

Mg. Gabriela Benedicto

17

ESTADISTICA DESCRIPTIVA

12/03/2012

Resumen de datos cuantitativos

Duracin de los procesos Duracin De 1 mes a 2 meses Entre 2 y 3 meses Entre 3 y 4 meses Entre 4 y 5 meses Vlidos Entre 5 y 6 Meses Entre 6 meses y 1 ao Ms de 1 ao Frecuencia 15031 7150 4435 2426 1674 4512 1682 Porcentaje 40,7 19,4 12,0 6,6 4,5 12,2 4,6 Porcentaje acumulado 40,7 60,1 72,1 78,7 83,2 95,4 100,0

Total

36910

100,0

Resumen de datos cuantitativos


Duracin de los procesos. Cantidad de das <= 29,00 30,00 - 59,00 60,00 - 89,00 90,00 - 129,00 Vlidos 120,00 - 149,00 150,00 - 179,00 180,00+ Frecuencia 14811 7176 4512 2475 1700 1466 4770 Porcentaje 40,1 19,4 12,2 6,7 4,6 4,0 12,9 Porcentaje acumulado 40,1 59,6 71,8 78,5 83,1 87,1 100,0

Total

36910

100,0

Mg. Gabriela Benedicto

18

ESTADISTICA DESCRIPTIVA

12/03/2012

Representaciones grficas
Histograma: Se utiliza para describir variables continuas, agrupadas en clases. La superficie de cada barra es proporcional a la frecuencia de los valores representados
Duracin de los procesos

60

Frecuencia

40

20

0 0 500 1000 1500 2000 2500 3000

Das corridos

Polgono de Frecuencias

Mg. Gabriela Benedicto

19

ESTADISTICA DESCRIPTIVA

12/03/2012

Ojiva

TABLA DE CONTINGENCIA Relacin entre dos variables: cuali cuali cuali cuanti cuanti cuanti

Una empresa de coches de alquiler quiere estudiar la asociacin entre el sexo y la marca de coches que se alquilan

Mg. Gabriela Benedicto

20

ESTADISTICA DESCRIPTIVA

12/03/2012

DIAGRAMA DE DISPERSION Relacin entre dos variables: cuanti - cuanti


Existe relacin entre el precio por noche de una habitacin individual y la puntuacin recibida por 9 hoteles en un congreso?

Mg. Gabriela Benedicto

21

ESTADISTICA DESCRIPTIVA

12/03/2012

ESTADISTICA DESCRIPTIVA:
METODOS NUMERICOS

Medidas que describen un conjuntos de datos:

De Posicin o Tendencia Central De Variabilidad

Medidas de tendencia central


MEDIA ARITMETICA O PROMEDIO (/X ): Dada una distribucin de

observaciones, es el valor medio tal que si todas las observaciones tuvieran ese valor, la suma de ellas sera igual a la suma de las observaciones de la distribucin original. Puede interpretarse como el punto de equilibrio del conjunto de datos. Es sensible a la presencia de datos extremos. Solo puede calcularse a partir de variables cuantitativas.

Si se trabaja con la poblacin completa:


x + x + ... + x N = i =1 = 1 2 N N
i

Si se trabaja con una muestra:

x=

x
i =1

x1 + x2 + ... + xn n

Mg. Gabriela Benedicto

22

ESTADISTICA DESCRIPTIVA

12/03/2012

Ubicando los siguientes datos sobre un eje: 26 34 33 38 40 33 22 24

Si los datos son 150

176

200

187

220

201

x=

150 + 176 + 200 + 187 + 220 + 201 = 189 6

Agregando un valor extremo, 500

x=

150 + 176 + 200 + 187 + 220 + 201 + 500 = 233.43 7

Mg. Gabriela Benedicto

23

ESTADISTICA DESCRIPTIVA

12/03/2012

Medidas de tendencia central


MEDIANA(Md): Es el valor de la distribucin que posee el orden medio MEDIANA(Md):

cuando las observaciones se han ordenado en funcin de los valores de la variable. Es robusta a la presencia de datos extremos. Se calcula a partir de variables cuantitativas, aunque a veces tambin cuando las variables estn medidas en escala ordinal.

Si los datos son: 150 176 200 187 220 201 Al ordenarlos: 150 176 187 200 201 220 Mediana=193.5 Agregando otra vez el valor extremo, 500 150 176 187 200 201 220 500 Mediana=200

Medidas de tendencia central


MODA:Valor que presenta la mayor frecuencia.No necesariamente MODA: frecuencia.No

describe el comportamiento de la mayora.

En el conjunto de datos datos: 26 34 33 38 40 33 22 24 La Moda es el valor 33

Mg. Gabriela Benedicto

24

ESTADISTICA DESCRIPTIVA

12/03/2012

Medidas de tendencia central


PERCENTILES: son 99 valores que dividen en cien partes iguales el

conjunto de datos ordenados. Ejemplo, el percentil de orden 10 deja por debajo al 10% de las observaciones, y por encima queda el 90%.

10%

90% P10

Medidas de tendencia central


CUARTILES: Dividen al conjunto de datos en cuartos . CUARTILES:
Q1(1er cuartil): Por debajo de l se encuentra el 25% de los datos Q2 (2do cuartil): Por debajo de l se encuentra el 50% de los datos. Coincide

con la Mediana

Q3 (3er cuartil): Por debajo de l se encuentra el 75% de los datos.

Mg. Gabriela Benedicto

25

ESTADISTICA DESCRIPTIVA

12/03/2012

Medidas de tendencia central


Duracin de Procesos
Qu porcentaje de Causas tiene una duracin mayor a 101 das?

Estadsticos
Duracin N Media Mediana Moda Percentiles 25 50 75 Vlidos Perdidos 36910 19 88,6479 43,0000 ,00 12,0000 43,0000 101,0000

El valor de la Media es mucho mayor al de la Mediana debido a los valores extremos de la derecha.

Presentacin de resultados
Box Plot : Describe al mismo tiempo varias caractersticas Describe importantes de un conjunto de datos, tales como el centro, la dispersin, el alejamiento de la simetra, y la identificacin de valores extremos (puntos atpicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.

LS Q3
Mediana

Atpicos

Q2 Q1

LI

Mg. Gabriela Benedicto

26

ESTADISTICA DESCRIPTIVA

12/03/2012

Presentacin de resultados
Box Plot: Duracin de procesos

Outliers

3 Cuartil Mediana

1 Cuartil

Presentacin de resultados
Box Plot: Duracin de procesos
Resmenes de casos
Duracin Resolucin Archivos Incompetencias Mediacin Caducidades Desistimientos Resoluciones Segunda Instancia Sentencias Suspensin del proceso a pruea Extinciones de la Accin Excepciones Total Media 75,8633 55,6326 78,8693 408,4615 64,0363 266,6863 147,7373 127,8609 496,8133 153,5532 88,6479 Mediana 34,0000 33,0000 59,0000 389,5000 47,0000 208,0000 98,0000 97,0000 419,0000 107,0000 43,0000

Observar si las cajas se solapan o no

Mg. Gabriela Benedicto

27

ESTADISTICA DESCRIPTIVA

12/03/2012

Medidas de variabilidad o dispersin


Tienen por objeto medir la magnitud de los desvos de los valores de la variable con respecto al valor central de la distribucin. Sealan cun concentrada est una distribucin alrededor de sus medidas de tendencia central.

Tambin son medidas de grado de representatividad de las medidas de tendencia central.

Medidas de variabilidad o dispersin


La misma Media para distintos conjuntos de datos no garantiza la misma forma de la distribucin

120 100 80 60 40 20 0 1 2 3 4 5 6

120 100 80 60 40

120 100 80 60 40

20

20
0 1 2 3 4 5 6

0 1 2 3 4 5 6

Mg. Gabriela Benedicto

28

ESTADISTICA DESCRIPTIVA

12/03/2012

Medidas de variabilidad o dispersin


RANGO La medida de dispersin ms simple recibe el nombre de amplitud o

recorrido. La amplitud (A) de un conjunto de datos es la diferencia entre las (A observaciones que tienen el mayor y el menor valor numrico en el mismo.

Rango=5

Rango=1

Rango=7

Medidas de variabilidad o dispersin


DESVIACION MEDIA: Mide, en promedio, la distancia que existe

entre los datos y la media aritmtica.

9
1

10
1

11

12

2 2

Desv. Media= 2+1+0+1+2 = 6 = 1,2 5 5

Mg. Gabriela Benedicto

29

ESTADISTICA DESCRIPTIVA

12/03/2012

Medidas de variabilidad o dispersin


VARIANZA: Esta medida nos permite identificar la diferencia promedio VARIANZA:

que hay entre cada uno de los valores respecto a su punto central (Media). (Media). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de observaciones que se tengan.

9
-1 -2

10
1

11
2

12

s2 =

( - 2 ) 2 + ( - 1) 2 + 0 2 + 12 + 2 2 = 5 4 +1+ 0 +1+ 4 =2 5

Medidas de variabilidad o dispersin


DESVIO ESTANDAR: Es la raz cuadrada de la Varianza. Permite regresar a las unidades originales. La desviacin estndar nos da como resultado un valor numrico que representa en promedio la distancia que existe entre los datos y la media aritmtica.

s = s2 =

2 = 1 . 4142 ...

Mg. Gabriela Benedicto

30

ESTADISTICA DESCRIPTIVA

12/03/2012

Medidas de Tendencia Central y de variabilidad o dispersin


Duracin de Procesos
Estadsticos
Duracin N Media Mediana Moda Desv. tp. Varianza Rango Mnimo Mximo Percentiles 25 50 75 Vlidos Perdidos 36910 19 88,6479 43,0000 ,00 136,60280 18660,325 1344,00 ,00 1344,00 12,0000 43,0000 101,0000

Mg. Gabriela Benedicto

31

Anda mungkin juga menyukai