Anda di halaman 1dari 40

ESTADISTICA APLICADA A LA EDUCACION

Universidad
Santander
Rodolfo Gallardo-Rosales
gallardo33@gmail.com

01 02 03 04 05 06

Conceptos fundamentales
E t d ti descriptiva
Estadstica
d
i ti
Probabilidad
Estimacin
Prueba de hiptesis sobre poblaciones
Prueba de hiptesis
p
sobre proporciones
p p

Estadstica descriptiva

01 02 03 04 05 06

REPRESENTACION GRAFICA DE DATOS


Grficas de crculos y grficas de barras:
son grficas que se usan para resumir
d t cualitativos,
datos
lit ti
o por atributos,
t ib t
o
datos categricos. Las grficas de
crculos (diagramas de pastel) muestran
la cantidad de datos que pertenecen a
cada una de las categoras como parte
proporcional de un crculo. Las grficas
de barras muestran la cantidad de datos
que pertenecen a cada una de las
categoras como un rea rectangular de
tamao proporcional
proporcional.

Estadstica descriptiva

01 02 03 04 05 06
TABLA DE DATOS

14 a 15

16 a 17

18 a 19

20 o ms

99

142

Estadstica descriptiva

01 02 03 04 05 06
GRAFICO DE CIRCULO

EDAD DE LOS
ENCUESTADOS
2
6
14 a 15
99

16 a 17
18 a 19
20 o ms

142

Estadstica descriptiva

01 02 03 04 05 06
HISTOGRAMA
((GRAFICO DE BARRAS))

EDAD DE LOS
ENCUESTADOS

160

142
140
120
100

99

80
60
40
20

18 a 19

20 o ms

0
14 a 15

16 a 17

Estadstica descriptiva

01 02 03 04 05 06
OJIVA
(Distribucin acumulativa de frecuencia)

frecuencia
frecuencia
Numerode Fronterasde
frecuencia acumulativ
grupo
grupo
a

frecuencia
frecuencia
acumulativa
relativa

35X<45

(2)

2/50
2/50

0,04

45X<55

(2+2)

4/50

0,08

55X<65

11

(7+4)

11/50

0,22

65X<75

13

24

(13+11)

24/50
24/50

0 48
0,48

75X<85

11

35

(11+24)

35/50

0,70

85X<95

11

46

(11+35)

46/50

0,92

95X<105

50

(4+46)

50/50
50/50

1 00
1,00

50

Estadstica descriptiva

01 02 03 04 05 06
OJIVA
(Distribucin acumulativa de frecuencia)

Calificaciones de examen final en


estadstica elemental
1,20
1 00
1,00
0,80
0,60
0 40
0,40
0,20
0,00
0

20

40

Estadstica descriptiva

60

80

100

120

01 02 03 04 05 06

MEDIDAS DE TENDENCIA
CENTRAL
Son valores numricos que
localizan, en algn sentido, el
centro de un conjunto de datos.
Es frecuente que el trmino
promedio se asocie con todas
las medidas de tendencia
central.

Estadstica descriptiva

01 02 03 04 05 06
Media (Media aritmtica):
Es el promedio con el que probablemente estemos ms
familiarizados. La media muestral se representa por x
(lase x barra o media muestral). La media se
encuentra
t all sumar todos
t d los
l valores
l
de
d la
l variable
i bl x ((esta
t
suma de valores se simboliza como x ) y dividir la suma
entre el nmero de estos valores , n (el tamao muestral).
Expresamos esto mediante frmula como
suma de todas las x
Media muestral: x barra = ---------------------------nmero de las x

x=
n

Estadstica descriptiva

01 02 03 04 05 06

EJEMPLO
Un conjunto de datos consta de cinco valores:
6 3,
6,
3 8
8, 6
6, y 4
4. E
Encuentre
t lla media.
di
SOLUCION:
Con la frmula anterior, encontramos:

x =

6+ 3+8+ 6+ 4
27
=
= 5 .4
=
5
5

Por lo tanto, la media de esta muestra es 5.4

Estadstica descriptiva

01 02 03 04 05 06

Mediana:
Es el valor de los datos que ocupa la
posicin media cuando los datos estn
clasificados
l ifi d en orden
d de
d acuerdo
d con
su tamao. La mediana muestral se
representa por ~
x (lase x tilde o
mediana muestral).
muestral)

Estadstica descriptiva

01 02 03 04 05 06
Procedimiento para determinar la mediana:
PASO 1: Clasifique los datos
PASO 2: Determine la profundidad de la mediana. La profundidad,
o posicin (nmero de posiciones desde cualquiera de los
extremos), se determina con la frmula

nmero + 1
Profundidad de mediana:
2

n +1
~
d (x ) =
2

PASO 3
3: D
Determine
t
i ell valor
l d
de lla mediana.
di
C
Cuente
t llos d
datos
t
~
clasificados, localizando los datos en la posicin d (x )
La mediana ser la misma cualquiera que sea el extremo de los
datos clasificados (alto o bajo) desde el que se cuente.
cuente De hecho
hecho,
contar desde ambos extremos servir como excelente prueba.

Estadstica descriptiva

01 02 03 04 05 06
EJEMPLO DE MEDIANA PARA n IMPAR
Encuentre la mediana para el conjunto de datos
{6, 3, 8, 5, 3}
SOLUCION
PASO 1: Los datos, clasificados en orden de tamao, son:
3, 3, 5, 6 y 8
n +1 5 +1
PASO 2: Profundidad de la mediana: d ( ~
x) =
=
=3

(L 3.
(La
3 P
Posicin)
i i )
PASO 3: La mediana es el tercer nmero desde cualquier extremo
~
de los datos clasificados,
clasificados es decir: x = 5

Estadstica descriptiva

01 02 03 04 05 06
EJEMPLO DE MEDIANA PARA n PAR
Encuentre la mediana para el conjunto de datos
{9, 6, 7, 9, 10, 8}
SOLUCION
PASO 1: Los datos, clasificados en orden de tamao, son:
6, 7, 8, 9, 9 Y 10
~ n +1 = 6 +1
PASO 2: Profundidad de la mediana: d ( x ) =

= 3.5

(La 3.5ava Posicin)


PASO 3: La mediana es est a mitad entre los datos tercero y
cuarto, se suman los dos valores y se dividen entre dos, la mediana
es:

8+9
~
x=
= 8.5
2

Estadstica descriptiva

01 02 03 04 05 06

MEDIDAS DE DISPERSION
Una vez que se ha localizado el medio mediante
la aplicacin de las medidas de tendencia central,
nuestra
t b
bsqueda
d d
de iinformacin
f
i a partir
ti d
de
conjuntos de datos se dirige ahora a las medidas
de dispersin. Las medidas de dispersin incluyen
el rango,
rango varianza y desviacin estndar
estndar.
Estos valores numricos describen la cantidad de
dispersin o variabilidad que se encuentra entre los
datos: los datos agrupados de manera estrecha
tienen valores relativamente pequeos y aquellos
datos que estn ms dispersos tienen valores ms
grandes.

Estadstica descriptiva

01 02 03 04 05 06
Rango:
Es la diferencia de valor entre los datos de valor ms
alto, H, y los de valor ms bajo, L.
rango = valor alto valor bajo
rango = H L
Por ejemplo:
La muestra
L
t 3,
3 4
4, 5,
5 6,
6 8 ti
tiene un rango d
de
H L = 8 3 = 5.
El rango de 5 nos dice que estos datos caen todos
ellos dentro de un intervalo de 5 unidades.

Estadstica descriptiva

01 02 03 04 05 06

Las otras medidas de dispersin que


se van a estudiar
estudiar, son medidas de
dispersin alrededor de la media.
Para desarrollar una medida de
dispersin alrededor de la media,
contestemos primero a la pregunta:
qu tan lejos de la media est cada x?

Estadstica descriptiva

01 02 03 04 05 06

Desviacin desde la media:


Una desviacin desde la media , (x - x ) es la diferencia
entre el valor de x y la media x .
Cada valor individual de x se desva de la media en una
cantidad igual
g
a (x
( - x )).
Esta desviacin (x - x ) es cero cuando x es igual a la
media x .
La desviacin (x - x ) es positiva cuando x es mayor que x
y es negativa cuando x es menor que x .

Estadstica descriptiva

01 02 03 04 05 06

Ejemplo:
Considere la muestra {6, 3, 8, 5, 3}, de la cual encontramos
su media:

x=
n

Encontramos que la media es 5.

Cada desviacin (x - ) se encuentra entonces al restar 5 de


cada valor:
Datos, x
6
3
8
5
3
-------------------------------------------------------------------------Desviacin, x 1
-2
3
0
-2

Estadstica descriptiva

01 02 03 04 05 06

Desviacin media absoluta:


Es la media de los valores absolutos de las desviaciones desde la
media:
(suma de valores absolutos de desviaciones)
Desviacin media absoluta = ---------------------------------------------------------------nmero

Desviacin media absoluta =

Estadstica descriptiva

| x x |
n

01 02 03 04 05 06

Para nuestro ejemplo:


La suma de las desviaciones absolutas es 8 :
(1 + 2 + 3 + 0 + 2) y

| xx| 8

= = 1.6
Desviacin media absoluta =
n

Estadstica descriptiva

01 02 03 04 05 06

Varianza muestral:
La varianza muestral, s2, es la media del cuadrado de las
desviaciones, calculada usando n-1 como divisor:
suma de (cuadrado de desviaciones)
Varianza muestral: s2 = -----------------------------------------------------nmero 1

s2 =

2
(
x

x
)

n 1

Donde n es el tamao muestral,, es decir,, el nmero de datos de la


muestra.

Estadstica descriptiva

01 02 03 04 05 06
EJEMPLO:
Para encontrar la varianza de la muestra 6, 3, 8, 5, 3 se calcula:
---------------------------------------------------------------------------------------------------------------------P
Paso
1
Paso
P
2
P
Paso 3
P
Paso 4
P
Paso 5
2
Hallar x
Hallar
Hallar toda x Hallar ( x x )
Hallar s2
---------------------------------------------------------------------------------------------------------------------6
65= 1
(1)2 = 1
x
( x x )2
2
s =
x=
3
3 5 = -2
(-2)2 = 4
n 1
n
8
85= 3
(3)2 = 9
18
5
55= 0
(0)2 = 0
25
2
s
=
2
x
=
3
3 5 = -2
2
( 2) = 4
(-2)
4
5
----------------------------------------2

x = 25

x =5

(x x) = 0 (x x)

= 18

s = 4.5

----------------------------------------------------------------------------------------------------------------------

Estadstica descriptiva

01 02 03 04 05 06

Desviacin muestral estndar


Para obtener la desviacin estndar de una muestra, s, es la raz
cuadrada positiva de la varianza:

D
Desviacin
i i muestral
t l estndar:
t d
s = raz
cuadrada
d d de
d varianza
i
muestral
t l

s = s2

Estadstica descriptiva

01 02 03 04 05 06

MEDIDAS DE POSICION
Las medidas de posicin se utilizan
para describir la posicin que un
dato especfico posee en relacin
con ell resto
t d
de los
l datos
d t cuando
d
estn en orden por categoras.
Cuartiles y percentiles son dos de
las medidas de posicin ms
populares.

Estadstica descriptiva

01 02 03 04 05 06

Cuartiles
Son valores de la variable que dividen los datos ordenados en
cuartos; cada conjunto de datos tiene tres cuartiles. El primer
cuqrtil Q1, es un nmero tal que a lo sumo 25% de datos son
cuqrtil,
menores en valor que Q1, y a lo sumo 75% son mayores. El segundo
cuartil es la mediana. El tercer cuartil, Q3, es un nmero tal que a lo
sumo 75% de los datos son menores en valor que Q3 y a lo sumo
25% son mayores.
Datos clasificados,, orden creciente
25%

25%

25%

Q1

Estadstica descriptiva

Q2

25%

Q3

01 02 03 04 05 06

El procedimiento para determinar


los valores de los cuartiles es el
mismo que para percentiles y se
muestra en la descripcin de
percentiles. Recordemos que los
datos debe estar clasificados de
bajo (L) a alto (H)

Estadstica descriptiva

01 02 03 04 05 06
Percentiles
Son los valores de la variable que dividen un conjunto de datos clasificados
en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El
k-simo percentil Pk es un valor tal que a lo sumo k% de los datos son
menores en valor q
que Pk y a lo sumo ((100 k)%
)% de los datos son mayores.
y
Percentiles
Datos clasificados, orden creciente
1% 1% 1% 1% 1%

L P1 P2 P3 P4

1% 1% 1% 1%

P97 P98 P99 H

K-simo percentil
Datos clasificados, orden creciente
a lo
l sumo (100 k) %

a lo
l sumo k%

Pk

Estadstica descriptiva

01 02 03 04 05 06

Notas:
1. El primer cuartil y el 25avo percentil, son lo
mismo, es decir, Q1 = P25 Tambin Q3 = P75.
2 L
2.
La mediana,
di
ell segundo
d cuartil
til y ell 50avo
50
percentil son todos lo mismo: Med = Q2 =
P50. Por tanto, cuando se nos pida hallar P50
o Q2, usamos el procedimiento para hallar la
mediana

Estadstica descriptiva

01 02 03 04 05 06
INTERPRETACION Y COMPRENSION DE LA
DESVIACION ESTANDAR
Las desviacin estndar es una medida de
variacin (dispersin) en los datos. Se ha definido
como un valor calculado con el uso de frmulas.
An as, podemos preguntarnos qu es realmente
y cmo se relaciona con los datos. Es una clase de
medidor por el que podemos comparar la
variabilidad de un conjunto de datos con la de otro.
Esta
E
t medida
did particular
ti l puede
d comprenderse
d
mejor al examinar dos enunciados que nos dicen
cmo se relaciona la desviacin estndar con los
datos: la regla emprica y el teorema de
Chebyshev.

Estadstica descriptiva

01 02 03 04 05 06
Regla emprica
Si una variable est normalmente distribuida, entonces :
1. Dentro de una desviacin estndar de la media habr
aproximadamente 68% de los datos
2. Dentro de dos desviaciones estndar de la media, habr
aproximadamente 95% de los datos; y
3. Dentro de tres desviaciones estndar de la media, habr
aproximadamente 99.7% de los datos
Esta regla aplica de manera especfica a una distribucin
normal [en forma de campana], pero con frecuencia se
aplica como gua interpretativa a cualquier distribucin
agrupada.

Estadstica descriptiva

01 02 03 04 05 06
99.7%
95%
68%

x 3s

x 2s

Estadstica descriptiva

xs

x+s

x + 2 s x + 3s

01 02 03 04 05 06

En la figura anterior, se muestran los intervalos de


1 2y3d
1,
desviaciones
i i
estndar
t d alrededor
l d d de
d la
l
media de una distribucin aproximadamente
normal.
Por lo general estas proporciones no se presentan
de manera exacta en una muestra, pero los valores
observados estarn cercanos cuando una muestra
grande se tome de una poblacin normalmente
distribuida.
Si una distribucin es aproximadamente normal,
ser casi simtrica y la media dividir la
distribucin en dos (la media y la mediana son
iguales en una distribucin simtrica

Estadstica descriptiva

01 02 03 04 05 06

34% 34%

13.5%

13.5%

2.5%

Calificaciones z

2.5%

x 3s

x 2s

xs

x+s

x + 2s

x + 3s

-3

-2

-1

Estadstica descriptiva

01 02 03 04 05 06

Teorema de Chebyshev
La proporcin de cualquier distribucin que se
encuentre dentro de k desviaciones estndar de la
media es al menos

1
11 2
k
Donde k es cualquier
q
nmero positivo
p
mayor
y a 1.
Este teorema aplica a todas las distribuciones de
datos.

Estadstica descriptiva

01 02 03 04 05 06

Este teorema indica que dentro de 2 desviaciones


estndar de la media (k=2), siempre se encontrar al
menos 75% (es decir, 75% o ms) de los datos.

1
1
1 3
=
1

=
1

= = 0.75
2
2
k
2
4 4

La siguiente figura muestra una distribucin agrupada


que ilustra al menos 75%.

Estadstica descriptiva

01 02 03 04 05 06
Teorema de Chebyshev k=2
s

Al menos 3/4

x 2s
Estadstica descriptiva

x + 2s

01 02 03 04 05 06

Si consideramos el intervalo encerrado por 3


desviaciones estndar en cualquier lado de la
media (k=3), el teorema dice que siempre
encontraremos all menos 89% ((es d
decir,
i 89% o
ms) de los datos, como se ilustra en la siguiente
figura:

1
1
1 8
1 2 = 1 2 = 1 = = 0.89
k
3
9 9

Estadstica descriptiva

01 02 03 04 05 06
Teorema de Chebyshev k=3
s

Al menos 8/9

x 3s
Estadstica descriptiva

x + 3s

Anda mungkin juga menyukai