Curso de estadstica
inferencial aplicada al anlisis
de la educacin superior
LUZ KARINE ARDILA VARGAS
2015
1. Contenido
1.
Introduccin a la estadstica
2.
Anlisis Univariado
3.
i.
ii.
iii.
Pruebas de hiptesis
iv.
Anlisis Multivariado
i.
ii.
1. Contenido
4.
iii.
Anlisis Factorial
iv.
v.
Anlisis multivariado
1. Introduccin a la estadstica
Definiciones
1. Introduccin a la estadstica
Satisfaccin
Servicios acadmicos
Servicios
administrativos
Servicios estudiantiles
Apoyos
:muestra
auxiliar
:Poblacin
: Peso
Varianza=0,5^2
: Margen de error
:1,96
Infraestructura
1. Introduccin a la estadstica
Definiciones
1. Introduccin a la estadstica
Una
1. Introduccin a la estadstica
Las distribuciones tienen formas o caractersticas sobre el proceso generador de datos. Dos de
ellos son muy conocidos: la media y la varianza.
Histograma de frecuencias relativas
80.0
70.0
60.0
50.0
40.0
30.0
20.0
10.0
-
54.2
28.9
12.3
3.4
-
0.8
0.5
1
Satisfaccin
Satisfaccin con el programa (%)
Investigacin (%)
Cafetera (%)
1. Introduccin a la estadstica
Las distribuciones tienen formas o caractersticas sobre el proceso generador de datos. Dos de
ellos son muy conocidos: la media y la varianza.
10
1. Introduccin a la estadstica
Curtosis
11
1. Introduccin a la estadstica
Funciones de distribucin
Discretas
Bernoulli
0.6
0.5
0.4
0.3
0.29
0.2
0.1
0
xito
No xito
12
1. Introduccin a la estadstica
10
13
1. Introduccin a la estadstica
Poisson
Distribucin Poisson (Tasa =2,89)
0.25
0.2
0.15
0.1
0.05
0
10
11
14
1. Introduccin a la estadstica
0
0
0
0
15
Tcnicas univariadas
16
Distribuciones de muestras
Continuas
Normal
T student
Chi cuadrado
17
Distribucin normal
Su importancia:
18
Distribucin normal
19
20
21
22
Teorema
23
Pruebas de hiptesis
Las funciones de probabilidad nos permitan saber con que ocurrencia
podra ocurrir un evento. De ella sabemos cmo est definida, por ende
su media y su varianza. Sin embargo, en la realidad lo que vemos es lo
contrario, vemos son las realizaciones y debemos es estimar su
distribucin para hacer algn tipo de inferencia.
Cuando asumimos que las realizaciones que vemos siguen alguna
distribucin debemos estimar sus parmetros. A este mtodo nos
referimos como estimacin paramtrica.
24
Estimacin puntal
25
Estimacin puntal
Si no se conoce la media
Si no se conoce la varianza
Si X se distribuye binomial
26
=0,99999999999999
Para solucionar este hecho debemos saber sobre qu intervalo es cierta la anterior
afirmacin. Para ello necesitamos saber como se distribuye . Pero antes necesitamos
definir dos conceptos: Error tipo 1 y el error tipo 2.
27
28
29
30
31
32
33
Pruebas de hiptesis
Rechazar
No rechazar
34
Pruebas de hiptesis
y/o
Vs
Vs
35
Pruebas de hiptesis
En este caso se
conoce la
varianza. Si no
fuese as, sera la
distribucin t.
36
Pruebas de hiptesis
Por ejemplo:
Vs
Vs
Vs
Equivalente
Vs
37
variabilidad
38
Por
simplicidad diremos que buscamos explicar la variable (Puntaje de
la prueba saber pro). Adems, se considera que la fuente de variacin
de es la variable categrica (Programa acadmico). Cada una de las
categoras es independiente.
39
Diferencias
de las medias
40
poblacional
Entonces:
+()+(-)
()+(-)
Grupo
Error
41
En trminos conocidos:
()+(-)
+
Suma de
cuadrados
Totales
(SCT)
Suma de
cuadrados
Tratados(S
CTR)
Suma de
cuadrados
de los
errores
42
En trminos conocidos:
()+(-)
Grados de
libertad
Suma de
cuadrados
Totales (SCT)
Suma de
cuadrados
Tratados(SCT
R)
Suma de
cuadrados de
los errores
N-1
J-1
N-J
43
Nuestro
propsito ser identificar si la variacin corresponde al grupo o
no, es decir, la hiptesis nula a probar es si . Si lo es, la mayor fuente
de explicacin ser motivado por la suma de los errores.
44
45
Tcnicas multivariadas
46
Correlacin de Pearson
47
Correlacin de Pearson
Mtodos no paramtricos de
correlacin
MTODO KOLMOGOROV SMIRNOV
Por ejemplo es til para contrastar la distribucin de los puntajes del ICFES
segn Instituciones de Educacin Superior.
48
Mtodos no paramtricos de
correlacin
KOLMOGOROV SMIRNOV
49
50
Mtodos no paramtricos de
correlacin
Frecuencia relativa
Categoras
F(1)
F(2)
F(1)
F(2)
F(1)
F(2)
F(1) - F(2)
Muy insatisfecho
20
0,1613
0,0323
0,1613
0,0323
0,1290
Insatisfecho
30
27
0,2419
0,2177
0,4032
0,2500
0,1532
Ni satifecho o
insatisfecho
13
28
0,1048
0,2258
0,5081
0,4758
0,0323
Satisfecho
20
18
0,1613
0,1452
0,6694
0,6210
0,0484
Muy satisfecho
41
47
0,3306
0,3790
1,0000
1,0000
0,0000
Total
124
124
1,0000
1,0000
D
0,1532
Valor Cr
0,1221316
1
(1,36/Raz(
N))
Mtodos no paramtricos de
correlacin
TABLA DE CONTINGENCIA
51
Mtodos no paramtricos de
correlacin
52
Mtodos no paramtricos de
correlacin
El estadstico de prueba ser:
53
54
Indicadores sintticos
Es una medida analtica muy utilizada en las ciencias sociales y tiles en las
tomas de decisiones.
55
Indicadores sintticos
Los elementos importantes de los indicadores son:
El rango
La normalizacin
% de estudiantes en los
3 primeros deciles de la
prueba SaberPro
Indicador de
eficiencia de
programas
acadmicos
56
Anlisis factorial
Conjunto de mtodos
57
Pasos
58
Pasos
El anlisis factorial
Pueden incluirse ms
59
variables a explicar.
Ese nmero debe ser
menor a los factores.
60
Anlisis factorial
El anlisis factorial
La representacin:
Entonces:
Pueden incluirse ms
61
variables a explicar.
Ese nmero debe ser
menor a los factores.
62
Pasos
63
El anlisis factorial
matriz
La
64
Pasos
65
Anlisis factorial
mtodo comn para saber si el Anlisis factorial es indicado es
Un
mediante al anlisis de las covarianzas de los factores. Una de sus
medidas es el anlisis de adecuacin muestral.
Medida de
adecuacin
muestra para
cada i
66
Anlisis factorial
Recordemos que
covarianza poblacional es:
Objetivo
67
Pasos
68
Anlisis factorial
Se pueden utilizar varias estrategias para determinar los factores a utilizar:
1.
La experiencia.
2.
3.
4.
69
Pasos
70
Anlisis factorial
La rotacin (transformacin) elimina ambigedades de las conclusiones
en las etapas previas.
De esa forma con la rotacin algunos pesos (a) sern mayores o nulos en
las variables. Identificando la relacin entre las variables no incluidas y las
incluidas.
Es decir, encontrar un mtodo ms simple. No se pierden las propiedades
matemticas de la matriz.
71
Pasos
72
Regresin lineal
73
Regresin lineal
Los supuestos en la versin ideal
No hay endogenidad.
74
Regresin lineal