Anda di halaman 1dari 29

Inferencia Estad

Inferencia Estad

stica
stica
Aplicada
Aplicada
Materiales did Materiales did cticos cticos
Pgina de la clase:
www.geociencias.unam.mx/~ramon/estinf.html
Nota: se puede accesar tambin como:
http://www.geociencias.unam.mx/%7Eramon/estinf.html
Es muy conveniente, aunque no indispensable, contar con el software Minitab.
Una muestra tomada de una poblaci Una muestra tomada de una poblaci n s n s lo puede ser de valor mientras lo puede ser de valor mientras
nos permita formar un juicio sobre las condiciones nos permita formar un juicio sobre las condiciones y caracter y caracter sticas de sticas de
la poblaci la poblaci n a la que n a la que sta sta pertence pertence (Gosset, 1908). (Gosset, 1908).
Los grandes consumidores de Coca Cola son: Ms Ricos
Le crees al
encabezado de
estas grficas?
Ms Sanos Ms Libres
Introducci Introducci n n
Estad Estad stica stica: En el lenguaje comn (por ejemplo en las crnicas deportivas) es
conocida como un conjunto de datos. Se refiere a un conjunto de mtodos para
manejar la obtencin, presentacin y el anlisis de observaciones numricas. Sus
fines son: Describir al conjunto de datos obtenidos y tomar decisiones, o bien,
realizar generalizaciones acerca de las caractersticas de todas las posibles
observaciones bajo consideracin.
La Estadstica es una de las ramas de la matemtica con ms aplicaciones ya que
casi en cualquier rama del conocimiento humano tiene aplicacin. Se considera
como su fundador a Godofredo Achenwall, profesor alemn (1719-1772), l y sus
seguidores estructuraron mtodos estadsticos para estudiar las riquezas de las
naciones.
Existen muchas definiciones dependientes de sus aplicaciones, pero en el fondo
todas ellas coinciden de una u otra forma en el que la estadstica es un mtodo
cientfico de operar con los datos y de interpretarlos.
De la definicin anterior pueden percibirse dos grandes reas de accin de la
Estadstica:
Si tenemos la posibilidad de conocer a todos y cada uno de los integrantes de una
poblacin a la cual queremos estudiar, entonces usaremos los mtodos de la
Estad Estad stica Descriptiva stica Descriptiva, que incluye la obtencin, organizacin, presentacin y
descripcin de la informacin numrica.
Pero si no nos es posible conocer a toda la poblacin entonces tomaremos una
muestra de ella, la estudiaremos y se sacarn conclusiones que se extrapolarn a
toda la poblacin, para lo que se usarn los mtodos de la Estad Estad stica stica Inferencial Inferencial.
Estad Estad stica Descriptiva stica Descriptiva
Estad Estad stica stica Inferencial Inferencial
Estadstica Descriptiva. Se refiere a aquella parte del estudio que incluye la
obtencin, organizacin, presentacin y descripcin de la informacin numrica.
Estadstica Inferencial. Es una tcnica de la cual se obtienen generalizaciones o se
toman decisiones con base a informacin parcial o incompleta obtenida mediante
tcnicas descriptivas.
Los conceptos bsicos de Probabilidad y de distribuciones muestrales sirven como
introduccin al m al m todo de Inferencia Estad todo de Inferencia Estad stica stica; esta se compone en dos reas:
La estimacin se encarga de buscar establecer los valores de los parmetros de la
poblacin.
Las pruebas de Hiptesis constituyen un proceso relacionado con aceptar o rechazar
afirmaciones acerca de los parmetros de la poblacin.
Los dos pasos anteriores se pueden resumir diciendo que el propsito es hacer
inferencias inferencias sobre la poblacin a partir de una muestra y estmar la confianza con la
que estas inferencias pueden ser verdaderas.
Pruebas de Hip Pruebas de Hip tesis tesis
Estimaci Estimaci n n
Para poder entablar las bases de lo que conlleva un estudio estadstico necesitamos
algunas definiciones:
Poblaci Poblaci n n. Conjunto de todas las posibles observaciones. Sinnimo de Conjunto
Universal se le define como la totalidad de todas las posibles mediciones
observables, bajo consideracin en una situacin dada por determinado problema,
circunstancias diferentes implican situaciones diferentes.
Las Poblaciones se clasifican en funcin a su cardinalidad (cuantificacin).
Poblacin Finita. Es aquella que incluye un nmero limitado de medidas y
observaciones.
Poblacin Infinita. Es aquella que por incluir un gran nmero de medidas y
observaciones no es posible determinar la cantidad de stas.
En lo general, las caractersticas medibles de una poblacin son denominadas
Parmetros.
Muestra Muestra. Es un conjunto de observaciones o medidas tomadas a partir de una
poblacin dada, es decir, es un subconjunto de la poblacin. Desde luego, la
cardinalidad de la muestra depende de la cardinalidad de la poblacin. Las muestras
deben ser representativas para evitar un sesgo u error.
A pesar de que puede existir una poblacin de un tamao especfico
(generalmente grande), lo que tenemos a la mano es una parte de dicha una parte de dicha
poblaci poblaci n n, o sea, una muestra una muestra.
Cuando la estad Cuando la estad stica causa problemas stica causa problemas:
Yule(1926) descubri una relacin positiva muy estrecha entre la tasa de
matrimonios realizados por la iglesia de Inglaterra y la tasa de mortalidad en el pas.
En otro caso, se encontr una alta relacin entre el nmero de ministros religiosos
ordenados y el nmero de nacimientos.
Ambos casos son resultado de estudios estadsticos serios
Podras establecer que en verdad existiera una relacin entre estas situaciones?
Sumatoria
La sumatoria se denota con el smbolo



Se usa para indicar una suma de trminos, por ejemplo:

=
+ + + + =
n
i
n i
x x x x x
1
3 2 1
...
Ejemplo:
si queremos sumar los siguientes valores:
1
x
2
x
3
x
4
x
5
x
6
x
3 2 4 2 1 3

a)

=
+ =
3
2
3 2
i
i
x x x

=
+ =
3
2
4 2
i
i
x

=
=
3
2
6
i
i
x

b)

=
+ + + + + =
6
1
6 5 4 3 2 1
i
i
x x x x x x x

=
+ + + + + =
n
i
i
x
1
3 1 2 4 2 3

=
=
n
i
i
x
1
15
Repaso de Conceptos B Repaso de Conceptos B sicos sicos
Actividad 1 Calcular las siguientes sumatorias:
a)

=
=
7
1 i
i
x b)

=
=
5
1
2
i
i
x c)

=

4
1
) 4 ( 3
i
i
x

1
x
2
x
3
x
4
x
5
x
6
x
7
x
2.3 3.5 6.2 7.1 8.3 10.4 15.3

Distribuci Distribuci n de frecuencias. n de frecuencias.
Cuando los datos son numerosos, es conveniente agruparlos para que la informacin sea
ms fcil de interpretar. El primer tipo de agrupacin se hace contando el nmero de
veces que se repite cada valor, a lo que se le llama frecuencia.
Ejemplo: Se midieron las estaturas en cm de las alumnas de 1 de Secundaria
y nos reportan los datos siguientes:
152 157 153 154 147 150 151 149 142 157 145 152 143 151 144 148 138 139 145
137 146 155 141 148 154 154 162 142 159 152 140 131 143 158 139 145 149 142
137 147 146 138 139 139 159 140 143 142 125 153 160 144 152 148 146 158 143
137 144 152 131 150 149 144 151 139 137 144 143 154 145 153 157 146 147 158
138 132 137 139 143 132 142 146 143 136 149 151 152 141 154 143 145 144 158
140 147 145 144 150 145 145 146 148 149 153 155 159
Actividad 2. Ordenar los datos anteriores y anotar sus frecuencias.
Con los datos anteriores se van a formar lo que se conoce como una Tabla de Tabla de
Distribuci Distribuci n de Frecuencias n de Frecuencias.
Tabla de Distribucin de Frecuencias de las estaturas de las nias de 1 de
Secundaria
X Frecuencia X Frecuencia X Frecuencia
125 / 1
126 0
127 0
128 0
129 0
130 0
131 // 2
132 // 2
133 0
134 0
135 0
136 / 1
137 //// 5

138 /// 3
139 //// / 6
140 /// 3
141 // 2
142 //// 5
143 //// /// 8
144 //// // 7
145 //// /// 8
146 //// / 6
147 //// 4
148 //// 4
149 //// 5
150 /// 3
151 //// 4
152 //// / 6
153 //// 4
154 //// 5
155 // 2
156 0
157 /// 3
158 //// 4
159 /// 3
160 / 1
161 0
162 / 1

Suman N = 108

Tabla de Distribuci Tabla de Distribuci n de Frecuencias de Datos Agrupados n de Frecuencias de Datos Agrupados
Con una distribucin de frecuencias podemos ya ver algunas caractersticas de los
datos, pero no podemos tener una visin integral de su comportamiento.
Para ello vamos a construir lo que se conoce como una tabla de distribucin de
frecuencias de datos agrupados. Esto es agrupar datos en clases.
Un Intervalo Intervalo o clase o clase es un subconjunto de todos los datos enmarcado entre dos valores.
La Marca de clase Marca de clase se llama al valor intermedio del intervalo, es el que va a representar
a todos los valores que caigan en el intervalo.
Los datos anteriores pueden agruparse por intervalos de clases (pensemos en cajitas) e
indicar el nmero de datos que contiene cada clase (frecuencia), de la forma similar a
lo que hicimos en las grficas de barras. A esta distribucin se le llama distribuci distribuci n de n de
frecuencias agrupadas frecuencias agrupadas. .
A continuacin se dan algunas recomendaciones para construir este tipo de tabla
1. El nmero total de intervalos de clase no deber ser menor que 6 ni mayor de 20
para no perder la ventaja de visualizacin de los datos.
2. El nmero de intervalos deber aproximarse a la raz cuadrada del nmero total de
datos
3. Los puntos medios o marcas de clase debern tener el mismo nmero de dgitos de
los datos en bruto
4. La longitud del intervalo deber ser impar para que los extremos del intervalo no
incluyan datos observados
5. Las marcas de clase debern ser fciles de manejar
6. La diferencia entre marcas de clase deber ser constante e igual a la longitud del
intervalo
Ahora, para hacer la agrupacin de los datos se siguen los siguientes pasos:
1 se calcula el rango (R) que es la diferencia entre los valores extremos de los datos
si ste no es entero se tiene que redondear al entero superior,
Ejemplo (las estaturas): Si y entonces R = 162 -125 = 37
2 Se elige el nmero de intervalos, debemos escoger el nmero de intervalos de clase
de preferencia entre 6 y 20. Podemos tener una buena idea del nmero adecuado de
intervalos aplicando la recomendacin de que
Ejemplo: Si N =108, entonces , con lo que el intervalo quedara con la
siguiente longitud
pero como no es impar se tiene que cambiar el nmero de intervalos
inf sup
X X R =
162
sup
= X 125
inf
= X
N n =
10 108 = n
37
3.7 4
10
R
i
n
= = =
Si usamos 9 intervalos, entonces por lo que estaramos en la misma
situacin (no es impar), y tenemos que buscar otro nmero de intervalos.
Empleando 8 intervalos nos da y como es impar podemos usar ste
nmero de intervalos.
3 Una vez que se decidi el nmero de intervalos y la longitud de stos para empezar
a formarlos vemos cul es el nuevo rango que nos da el nmero de intervalos
multiplicado por la longitud, siendo en el caso del ejemplo
con lo que tenemos 3 elementos ms de los que tenamos originalmente (el Rango era
de 37) y debemos decidir cmo distribuirlos, preferiblemente de manera equilibrada, es
decir, en el caso del ejemplo podemos iniciar el conteo en 123 y terminar en 163
4 Para asegurarnos de que ningn dato queda en los extremos de los intervalos nos
moveremos media unidad.
Para el ejemplo entonces vamos a empezar en 122.5 y terminaremos en 162.5
37
4.11 4
9
i = =
37
4.6 5
8
i = =
40 8 5 = = = ) ( n i R
Actividad 3. Construir una tabla con las caractersticas anteriores usando los datos de
las estaturas de nias de secundaria.
Intervalos de clase
Estaturas en centmetros
Marca de clase Frecuencia
Alumnos
122.5 -127.5
127.5 -132.5
132.5 -137.5
137.5 -142.5
142.5 -147.5
147.5 -152.5
152.5 -157.5
157.5 -162.5
126
131
136
141
146
151
156
161
1
4
9
24
29
22
14
5
Total N = 108

Histograma de Frecuencias Histograma de Frecuencias
Se llama Histograma de frecuencias a la grfica en la que en el eje de las abscisas se
grafican los intervalos y en el de las ordenadas se grafican las frecuencias.
Para nuestro ejemplo:
Histograma de Frecuencias de las Estaturas de las Nias de 1 de Secundaria
160 155 150 145 140 135 130 125
35
30
25
20
15
10
5
0
C1
F
r
e
q
u
e
n
c
i
a
Alturas de alumnas de secundaria
Pol Pol gono de Frecuencias gono de Frecuencias
Se llama polgono de frecuencias a la poligonal que une los puntos medios de los
extremos superiores de las barras (marcas de clase) empezando en una marca de clase
antes y terminando una despus. Muchas veces se grafican el histograma y el polgono
de frecuencia juntos, para lo cual se tiene que agregar a la tabla de distribucin de
frecuencias agrupada la columna con las marcas de clase.
Polgono de Frecuencias de las Estaturas de las Nias de 1 de Secundaria
160 155 150 145 140 135 130 125
35
30
25
20
15
10
5
0
C1
F
r
e
q
u
e
n
c
i
a
Alturas de alumnas de secundaria
Medidas de tendencia central Medidas de tendencia central
Al ver las tablas de frecuencias se hizo evidente que algunos datos se repiten ms que
otros, al ver las grficas de frecuencias se puede observar fcilmente la tendencia a
repetirse los valores en vecindarios.
Por lo general la mayor densidad de datos se encuentra en la parte central de la grfica
y cada que nos alejemos del centro va disminuyendo la frecuencia en que aparecen los
datos, de igualmente de ambos lados, formando una curva parecida a una campana, a
lo que se llama comportamiento normal.
En el ejemplo anterior se tiene un ligero sesgo positivo ( hacia la derecha), pero para
dar ms sentido a estas observaciones y poder hacer comparaciones con otras
poblaciones se ide que se pueden medir el promedio de una poblacin, o el valor que
ms se repite en ella, o el valor que queda al centro de nuestra poblacin los que nos
pueden ayudar a ver que tan normal es nuestra distribucin.
Podemos pensar que si estas tres medidas son muy parecidas entre s, entonces la
poblacin s tiene un comportamiento normal, mientras ms se alejen entre ellas, ms
lejos de un comportamiento normal estar nuestra poblacin.
Ahora veamos estas medidas que se conocen como medidas de tendencia central que
son la media aritmtica, la mediana y la moda, vamos a ver cmo se diferencian para
datos agrupados o no. En datos no agrupados, las definiremos como:
Moda Moda Es el valor del dato que ms se repite
Mediana Mediana El valor que queda en la mitad de la muestra
Media Media Promedio aritmtico de nuestros datos
Para el ejemplo:
Moda= en este caso 143 y 145 en los datos originales (se llama multimodal)
Mediana. , por lo que la Mediana = 145 (se cuentan los datos hasta
llegar al dato 54)
Media =
En datos agrupados (histograma) la moda es el valor (marca de clase) de la
barra ms alta, en nuestro ejemplo, Moda = 145. Se localiza el valor de la Media
(146.3) y de la Mediana en el eje de las X (tambin 145 para el ejemplo).
54
2
108
2
= = =
N
n
34 . 146
108
15805
= =

N
x
x
i
160 155 150 145 140 135 130 125
35
30
25
20
15
10
5
0
C1
F
r
e
q
u
e
n
c
y
Mean 146.3
StDev 7.242
N 108
Alturas de alumnas de secundaria
Normal
Media
Moda
Mediana
Actividad 4. Calcular la moda, la mediana y la media de los datos no agrupados que se
presentan a continuacin
Dato
Frecuencia
Dato
Frecuencia
Dato
Frecuencia
Dato
Frecuencia
1. 1
2. 1
3. 1
4. 2
5. 1
6. 5
7. 5
8. 4
9. 5
10. 6

11. 7
12. 7
13. 7
14. 4
15. 4
16. 4
17. 5
18. 5
19. 4
20. 2

21. 2
22. 1
23. 1
24. 1
25. 5
26. 1
27. 0
28. 1
29. 1
30. 2

31. 0
32. 1
33. 1
34. 1
35. 0
36. 0
37. 0
38. 1
39. 0
40. 1
Total 100

Distribucin de Frecuencias de la Duracin en Servicio de los Profesores
Universitarios
Moda: son 11, 12 y 13 por lo que sera multimodal
Mediana: 50
2
100
2
= = =
N
n 13 = Mediana
Media:
150
15
100
i
x
x
N
= = =


40 30 20 10 0
30
25
20
15
10
5
0
C1
F
r
e
q
u
e
n
c
y
Mean 15
StDev 7.991
N 100
Duracin en Servicio de los Profesores Universitarios
Normal
Actividad 5. Calcular la moda, la mediana y la media de los datos agrupados del
ejemplo anterior (9 intervalos)
Cmo calculas la
media si tienes datos
con frecuencias?
Moda = 10
100
50
2 2
N
n= = = ,
13 = Mediana
Media:
150
15
100
i
x
x
N
= = =


Moda
Mediana
Media
Tarea 1. Calcular la Moda, Mediana y Media de los siguientes datos sin
agrupar y agrupados, y elaborar una tabla de distribucin de frecuencias
acumuladas, un histograma y polgono de frecuencias.
Tabla de Distribucin de Frecuencias de distancias alcanzadas por pelotas
de golf nuevas
Dato
Frecuencia
Dato
Frecuencia
Dato
Frecuencia
Dato
Frecuencia
223.7 1
224.4 1
226.9 1
232.3 1
232.7 1
233.5 1
237.4 1
239.9 1
243.6 1
247.2 1
248.3 1
249.2 1
252.8 1
253.6 1
256.3 1
256.5 1
258.8 1
260.4 1
264.3 1
265.1 1
267.5 1

269.6 1
271.4 1
278.7 1
294.1 1

Total 25

Anda mungkin juga menyukai