Introduccin
Qu es la estadstica?
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo de los ltimos aos.
2) En Economa: para medir la evolucin de los precios mediante nmeros ndice o para
estudiar los hbitos de los consumidores a travs de encuestas de presupuestos
familiares.
1
Estadstica
Introduccin
Ejemplos de su aplicacin son:
3) En Ciencias Polticas: para conocer las preferencias de los electores antes de una
votacin mediante sondeos y as orientar las estrategias de los candidatos.
4) En Sociologa: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.
5) En Psicologa: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).
En general en las Ciencias Sociales, la estadstica se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.
2
Estadstica
Introduccin
Etapas de un estudio estadstico
Un anlisis estadstico se lleva a cabo siguiendo las etapas habituales en el llamado
mtodo cientfico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la investigacin y
precisar el universo o poblacin.
5) Diagnstico: consiste en verificar la validez de los supuestos del modelo que nos
han permitido interpretar los datos y llegar a conclusiones sobre la poblacin
3
Estadstica
Introduccin
Esquema de las etapas de un estudio estadstico
ORGANIZAR Y RESUMIR
Probabilidad
INFORMACIN
4
Estadstica
Introduccin
Ejemplos de algunos problemas a estudiar
5
Estadstica
Poblacin: Muestra
6
Estadstica
TIPOS DE VARIABLES
Variables Cuantitativas Variables Cualitativas
CONTINUA DISCRETA NOMINAL ORDINAL
Intervalo
8
Estadstica
Variables
- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal)
- N de Empleados: se refiere al nmero de empleados en las lneas de produccin. ( cuantitativa
discreta)
- Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las reas de
produccin. (cuantitativa continua)
- Calificacin: calificacin realizada por una institucin pblica sobre cumplimiento de ciertos
estndares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinal)
Datos
Industria n Tipo N Empleados Superficie Calificacin
1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
. . . . .
. . . . .
. . . . .
299 D 250 800,3 Mal
300 C 300 4000,2 Regular
9
Estadstica
Problema de Investigacin:
Investigacin: Se quiere establecer el perfil de las industrias de conserva en
EJEMPLO funcin de algunas caractersticas.
Tipo de Frecuencia Frecuencia Porcentaje Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Industria Absoluta (F j) Relativa (fj) (%) Calificacin Absoluta (F j) (fj) o % Acum. (FAAj) Acum. (fraj) o %
A Muy Bien
B Bien
C Regular
D Mal 300 1 (o 100)
Total 300 1 100 Total 300 1 (o 100)
(2)
(1) Numero de Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Empleados Absoluta (F j) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<100
[100-150[
. (3)
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)
Superficie Frec. Frec.Relativa Frec. Absol. Frec. Relat.
(mt2) Absoluta (F j) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<200
(4) [200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%) 10
Estadstica
Centro
Intervalo de clase Amplitud F f FAA fra
[LI1 ; LS1 [
I1 c1 a1
[LI2 ; LS2 [ I2 c2 a2
.
.
[LIk ; LSk] Ik ck ak n 1
Total n 1
11
Estadstica
12
Estadstica
C
D A 40% B
10% 20% 30%
C
B
40%
30%
13
Estadstica
variable 1
400 C
300
B
N
200
100 A
0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporcin de unidad de anlisis
variable 1
-Este tipo de grfico se utiliza generalmente para
Porcentaje de unidad de anlisis de acuerdo a representar la frecuencia de las categoras de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de grfico slo si la variable se ha
variable 1
C
transformada en categoras.
B
-Hay distintas versiones de estos grficos (por ejemplo
A
en Excel), y en algunos casos son muy tiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de anlisis
grupos. 14
Estadstica
TIPOS DE 3. Histograma
GRFICOS Histograma
Histograma
Distribucin de los hijos de trabajadores
de la empresa de acuerdo a edad - Permite la representacin de
15
la frecuencia de una variable
Cuantitativa.
10
Frecuencia
- El eje x se refiere a la
N
5
variable.
- El eje y se refiere a la
0
frecuencia (N , %).
7 8 9 10 11 12 13 14
edad
edad
- Cada barra representa la
Ejemplo
frecuencia de la variable en la
poblacin en estudio (o la
En el grfico se puede observar el nmero de muestra).
hijos , de menor edad (7-8 aos), las de mayor
edad (13-14 aos); y adems que la mayora de -El histograma se puede
hijos de los trabajadores estn entre los 10 y 12 construir desde los datos de la
aos. tabla de frecuencia de la
variable en estudio.
15
Estadstica
edad cuantitativas.
N
5
-El eje x se refiere a la
variable.
0
7 8 9 10 11 12 13 14
- El eje y se refiere a la
edad frecuencia (N , %).
-Los puntos que permiten la
unin de las lneas representa
el centro de clase (o marca de
clase).
16
Estadstica
90
80
70
50
(percentiles 25 y 75), mnimo y
40 mximo de una variable.
30 - Slo es til para variables
20 cuantitativas.
10 -El eje x permite identificar la
0 poblacion en estudio.
N= 584 1473
- El eje y representa los valores de la
Mujeres Hombres
variable en estudio. 17
Estadstica
TIPOS DE 6. Otros
GRFICOS
Nmero de alumnos matriculados en la Nmero de alumnos matriculados en la
Carrera A segn ao de ingreso Carrera B segn ao de ingreso
100 100
N de alumnos
N de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
ao de ingreso ao de ingreso
1998 60 80 150
1999 55 70
100
2000 80 50
2001 40 60 50
2002 68 50
0
2003 70 75
1998 1999 2000 2001 2002 2003
Carrera B ao ingreso
Carrera A 18
Estadstica
NOTACION
Variables Cuantitativas
i 1 frecuencia. i 1 i 1 i 1
n n n
* Al igual que las tablas, los grficos deben ser auto-explicativos.
(axi b) (ax1 b) (axn b) a xi b 2
( xi ) ( x1 xn ) 2
i 1 i 1 i 1
n
( xi yi ) ( x1 y1 ) ( xn y n )
i 1
n
( xi yi ) ( x1 y1 ) ( xn y n )
i 1
19
Estadstica
Datos Moda
Cualitativos y Cuantitativos M o " el dato que ms se repite"
20
Estadstica
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los
n datos estn ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que rene al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posicin 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posicin 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que rene al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posicin 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posicin 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que rene al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posicin 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posicin 64. 21
Estadstica
-Rango
MEDIDAS DE DISPERSIN -Varianza
-Desviacin Estndar
-Asimetra
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Adems de la posicin y la dispersin de los datos, otra medida de inters en una distribucin de frecuencias
es la simetra y el apuntamiento o kurtosis.
(x
i 1
i x)3 Si CA=0 si la distribucin es simtrica alrededor de la media.
Si CA<0 si la distribucin es asimtrica a la izquierda
Coeficiente de Asimetra CA Si CA>0 si la distribucin es asimtrica a la derecha
n s3
n
- Si CAp=0 la distribucin se dice normal (similar
( xi x ) 4
i 1
a la distribucin normal de Gauss) y recibe el
Coeficiente de Apuntamiento CAp nombre de mesocrtica.
n s4 - Si CAp>0, la distribucin es ms puntiaguda que
la anterior y se llama leptocrtica, (mayor
concentracin de los datos en torno a la media).
- Si CAp<0 la distribucin es ms plana y se
llama platicrtica.
23
Estadstica
-Asimetra
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
14 30 6
12 5
10
20 4
8
3
10 2
4
V2 V4 V5
24
Estadstica
-Asimetra
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Ejemplos
1 4 4 Media 3,9
14
1 4 4 Mediana 4
1 4 5
12 Moda 4
2 4 6 kurtosis -0,43
6
2 4 6 Coeficiente de asimetra -0,02
3 4 6 4 Rango 6
V1
25
Estadstica
(c
k
Mediac x c c j f j j xc ) 4 f j
j 1
j 1 CAp c
s c4
26
Estadstica
Bicicleta 8 13,3
Estudia 21 35,0
TOTAL 60 100
27
Estadstica
Distribucin conjunta
N de personas
Tabla 2 Actividad
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
28
Estadstica
Distribucin conjunta
N de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
29
Estadstica
Distribucin conjunta
N de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
30
Estadstica
- Covarianza Datos
MEDIDAS DE ASOCIACIN LINEAL
- Correlacin Cuantitativos
x
x
1
Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersin
x
2 (Varianza y Desviacin Estndar) para una Variable
Cuantitativa (x).
x
n
1 n
x y cov( x , y ) ( xi x )( yi y )
y
n i 1
x
(
1) (1
)
Si Cov(x,y) es positiva: la asociacin entre x e y es directamente proporcional,
x
(2
)
y
(2) es decir que cuando x aumenta y tambin aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociacin entre x e y es inversamente
x
(n
)
y
(n) proporcional, es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociacin entre x e y.
31
Estadstica
- Covarianza Datos
MEDIDAS DE ASOCIACIN LINEAL
- Correlacin Cuantitativos
Correlacin: Se refiere al grado de asociacin entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlacin de Pearson (r): Mide el grado de Asociacin Lineal
entre dos variables Cuantitativas
n
x y
x y r
cov( x , y ) xi yi nx y 1 r 1
(
1) (1
)
sx s y r i 1
x
(2
)
y
(2)
( n 1 )s x s y
Si r es positivo: la asociacin entre x e y es directamente proporcional, es decir que
x
(n
)
y
(n) cuando x aumenta y tambin aumenta; y viceversa. Si r=1: la asociacin lineal es
perfecta.
Si r es negativo: la asociacin entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociacin lineal es
perfecta.
Si r es cero: no existe asociacin entre x e y.
32
Estadstica
r=1 r=-1
33
Estadstica
Datos Cuantitativos
Determinar si existe relacin x
(n
)
y
(n) Estudiar la dependencia de una
entre las variables x e y: variable respecto de la otra:
Coeficiente de Correlacin Modelo de Regresin
Trminos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relacin Lineal (modelo lineal)
Parmetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)
34
Estadstica
Datos Cuantitativos
i 1 i 1
35
Estadstica
x
(2
)
y
(2)
ESTIMADORES ERRORES
x
(n
)
y
(n) a y bx ei y i y i
n n n
n xy xi y i
b i 1 i 1 i 1
2
n
n
n x 2 xi
i 1 i 1
36
Estadstica
37
Estadstica
b 2 , 44 a 53 , 64
y 53 , 64 2 , 44 x
n
i
o e
dad(m
es
es) ta
lla(
c m
)Ta
llaes
tim
ad
a e
rr
o r
i x y y
i e
i 14
( yi yi )2 402,86
i i
1 3 5
5 6
1,0 -6,0
i1
2 6 6
8 6
8,3 -0,3 14 14
3 5 6
4 6
5,8 -1,8 ( yi yi )2 ei2 92,7
4 5 6
6 6
5,8 0
,2 i 1 i 1
5 3 6
2 6
1,0 1
,0
6 4 6
5 6
3,4 1
,6
7 9 7
4 7
5,6 -1,6 Bondad de Ajuste del Modelo
8 8 7
5 7
3,2 1
,8 R2 = 0,77
9 9 7
3 7
5,6 -2,6
1
0 7 6
9 7
0,7 -1,7 De acuerdo al coeficiente de
1
1 6 7
3 6
8,3 4
,7 determinacin, el modelo ajustado
1
2 5 6
8 6
5,8 2
,2 a los datos es adecuado (R2
1
3 8 7
3 7
3,2 -0,2
cercano a 1)
1
4 6 7
1 6
8,3 2
,7
39