TEMA: PRUEBA DE
HIPTESIS
INTEGRANTES:
Clark Renato Pla Pla
Francisco Rivas Segura
PARALELO # 04
PROFESOR: Ing. Wendy Plata
FECHA: 10/09/2015
GUAYAQUIL- ECUADOR
1.
NDICE
INTRODUCCIN....................................................................................................4
2. OBJETIVOS................................................................................................................4
2.1. Objetivo General...................................................................................................4
2.2. Objetivo Especfico...............................................................................................4
3. MARCO TERICO....................................................................................................5
3.1. Estadstica Inferencial..........................................................................................5
1.1.1
Estadstico:.................................................................................................5
1.1.2
Estimador:..................................................................................................5
3.2. Estimacin.............................................................................................................5
3.2.1 Estimacin Puntual:........................................................................................5
3.2.2 Estimacin por Intervalo:...............................................................................5
3.3 Prueba de Hiptesis...............................................................................................5
3.3.1 Estimador Insesgado:......................................................................................5
3.3.2 Estimador ms Eficiente:...............................................................................5
3.3.3 Estimador Consistente:..................................................................................5
ESTADSTICA DESCRIPTIVA...........................................................................11
4.1.
Caminata en el csped.....................................................................................11
5.
4.2.1.
Media Aritmtica.....................................................................................12
4.2.2.
4.3.
4.4.
ESTADSTICA INFERENCIAL..........................................................................17
5.1.
5.2.
Intervalos de confianza...................................................................................18
5.3.
Contraste de hiptesis.....................................................................................19
6.
RESULTADOS DE ANLISIS.............................................................................21
7.
CONCLUSIONES..................................................................................................21
8.
RECOMENDACIONES........................................................................................22
9.
BIBLIOGRAFA...................................................................................................22
NDICE DE TABLAS
Tabla 1 Tiempo en segundos de la caminata en csped.............................................11
Tabla 2. Datos de la caminata a travs del piso slido..................................................12
Tabla 3. Datos ordenados del tiempo de la caminata en piso slido y csped..............13
Tabla 4. Media, varianza y tamao muestral................................................................18
1. INTRODUCCIN
Suponga que elige 1000 personas al azar y les pregunta sobre cul es su candidato
favorito para ganar las prximas elecciones, y encuentra que el 60% de ellos tienen
preferencia para cierto candidato X con una desviacin estndar de +/-10 personas. A
partir de esta informacin, Cmo puedo estimar cul es la proporcin de la poblacin
que est a favor del candidato X, si la poblacin es muy grande y no cuento con los
recursos ni el tiempo necesario para realizar un censo?
La estadstica inferencial nos aporta las herramientas necesarias para enfrentar este
problema, y no slo para estimar proporciones, sino tambin, se puede estimar medias,
varianzas entre otros parmetros que identifican a una poblacin, de la cual es conocida
su distribucin.
En el presente proyecto, se realizar el experimento de caminar sobre csped y cemento,
y registrar el tiempo que toma recorrer cierta distancia. Luego se extrae informacin a
partir de las muestras con su respectiva representacin grfica. Usando los mtodos de
la estadstica inferencial, se proceder a comparar las medias de las poblaciones
mediante una prueba de hiptesis para la diferencia de medias. Hecho esto, se podr
responder a la pregunta sobre qu tarda ms tiempo, caminar sobre csped o sobre
cemento.
2. OBJETIVOS
2.1. Objetivo General
Realizar un contraste de hiptesis, donde la hiptesis nula sea que las medias
de las poblaciones son iguales y la hiptesis alterna de que las medias son
distintas.
3. MARCO TERICO
3.1. Estadstica Inferencial
La estadstica inferencial proporciona las tcnicas para formular proposiciones,
incluyendo una media para determinar el riesgo de la informacin.
1.1.1 Estadstico: Es una funcin de los valores de la muestra. Es una variable
aleatoria, cuyos valores dependen de la muestra seleccionada. Su
distribucin de probabilidad, se conoce como Distribucin muestral del
estadstico.
1.1.2 Estimador: Estimador es una variable aleatoria de los datos obtenidos en
la muestra, hay un riesgo en la certeza de la afirmacin propuesta, y es
necesario cuantificar el valor de este riesgo.
3.2. Estimacin
Consiste en la bsqueda del valor de los parmetros poblacionales objeto de estudio.
Puede ser puntual o por intervalo de confianza:
3.2.1 Estimacin Puntual: Se trata de determinar la distancia, o error
mximo entre la estimacin puntual y el valor del parmetro que se desea
estimar, con algn nivel de certeza especificado.
||
3.2.2 Estimacin por Intervalo: Con el valor del estimador se
construye un intervalo que contenga al valor del parmetro que se desea
estimar, con algn nivel de certeza especificado.
Li Ls
3.3 Prueba de Hiptesis
Se formula una hiptesis acerca del parmetro asignndole un valor supuesto 0 y con
el valor de del estimador se realiza una prueba para aceptar o rechazar la hiptesis
propuesta con algn nivel de certeza especificado.
Hiptesis propuesta: = 0
Las siguientes definiciones establecen las caractersticas deseables de los estimadores:
3.3.1 Estimador Insesgado: Se dice que el estimador es un estimador
insesgado del parmetro si E ()=
3.3.2 Estimador ms Eficiente: Se dice que un estimador 1 es ms
eficiente que otro estimador 2 si ambos son insesgados y adems V ( 1) <V
(2).
3.3.3 Estimador Consistente: Se dice que un estimador es un
estimador consistente del parmetro si es un estimador insesgado de y
lim V ( ) =0
n
El sesgo B de una estimador est dado por: B=E ()- . Es la diferencia entre el valor
esperado del estadstico y el valor esperado del parmetro.
3.3.4 Error Cuadrtico Medio (ECM): Es el valor esperado del
cuadrado de la diferencia entre el estimador y el parmetro: ECM ()= E [- ]2.
3.4 Inferencias Relacionadas con la Media
x
Z/2 n
+ Z/2 n
x
x
- t/2 n
+ Z/2 n para con un nivel de 1-.
Paso 5: Calcular el valor del estadstico de prueba con los datos de la muestra
Paso 6: Tomar una decisin.
CASO: Muestra Pequea (n<25)
Parmetro: (Es la medida poblacional)
Poblacin con distribucin desconocida, varianza 2
Estimador: T (Variable aleatoria con distribucin T, con v=n-1)
Valor propuesto para el parmetro: 0
Para realizar inferencias se usa una variable aleatoria con distribucin T
Procedimiento:
Paso 1: Formular la Hiptesis nula: H0: = 0
Paso 2: Formular una hiptesis alterna, la cual es de inters probar. Elegir una entre:
1 Ha: > 0
2 Ha: < 0
3 Ha:
0
Paso 5: Calcular el valor del estadstico de prueba con los datos de la muestra
Paso 6: Tomar una decisin.
3.5.2. Valor P de una Prueba de Hiptesis
El valor-p de una prueba de hiptesis es el valor de la probabilidad correspondiente al
rea de la cola (o colas), a partir del valor observado y representa el nivel de
significancia obtenido con la muestra.
Si esta probabilidad es pequea, es un indicativo de que los datos de una muestra no
apoyan a la hiptesis nula propuesta pues el valor del estadstico de prueba se ubica
lejos del valor propuesto para el parmetro. Pero si esta probabilidad es grande,
significa que los datos de la muestra favorecen a la hiptesis nula pues el valor del
estadstico se ubica cerca del valor especificado para el parmetro.
3.5.3. Clculo del Error Tipo I
El Error Tipo I tiene el mismo valor de probabilidad que el nivel de significancia de
la prueba y representa el error en que se incurrir si la evidencia de la muestra nos hace
rechazar Ho, sin conocer que H0 es verdadera.
Suponga que se define la siguiente hiptesis relacionada con la media, con una muestra
grande.
Ho: = 0 (Hiptesis Nula)
Ha: > 0 (Hiptesis alterna)
7
c 0
/n
2. ESTADSTICA DESCRIPTIVA
4.1. Caminata en el csped
Caminata en el csped
N
Tiempo(segundos)
1
13.46
2
14.21
3
14.6
4
12.79
5
14.27
6
14.37
7
14.2
8
15
9
13.92
10
13.52
Tabla 1 Tiempo en segundos de la caminata en csped
x =
i=1
xi
n
x =
13.46+14.21+ 14.6+12.79+14.27+14.37+14.2+15+13.92+13.52
10
x =
140.34
10
x =14.034
s =
2
i=1
( x ix )
n1
s= 0.4039
s=0.6355
x =
i=1
xi
n
x =
x =
142.05
10
x =14.205
4.2.2. Varianza y desviacin estndar
n
s =
2
i=1
s 2=
( x ix )
n1
10
s = 0.4841
s= 0.4841
s=0.6957
Caminata en csped
Primer cuartil:
Q 1=13.46+0.75(0.06)
11
Q1=13.505
Segundo cuartil:
posicin=( n+1 )50
Q2=14.20+0.5( 0.01 )
posicin=5.5
Q2=14.205
Tercer cuartil:
posicin=( n+1 )75
posicin=( 10+1 )75
posicin=8.25
12
Q 1=13.41+0.75(0.51)
Q1=13.7925
Q2=14.17+0.5( 0.3 )
Segundo cuartil:
posicin=( n+1 )50
Q2=14.32
Tercer cuartil:
posicin=( n+1 )75
posicin=( 10+1 )75
posicin=8.25
Q3=x (i , a)=x i +0, a(x i+1x i )
13
El tiempo promedio que tard en recorrer 15 m en slido es mayor que en csped. Sin
embargo, la diferencia corresponde a dcimas de segundo. Este sesgo es casi
imperceptible en la experimentacin, pero una vez analizadas las muestras, se aclara que
s existe diferencia. Como se muestra en los diagramas de cajas, no existen datos
aberrantes en ninguna de las dos muestras. La mayor diferencia entre las dos muestras
est en los cuartiles uno y tres; las varianzas son bajas y similares lo que indica que no
existe mucha dispersin en ellas.
5. ESTADSTICA INFERENCIAL
Se deber presentar un intervalo del 95% de confianza para la diferencia de medias, as
como el contraste de hiptesis: La hiptesis nula es que el tiempo que toma caminar en
cualquiera de los dos suelos es en promedio el mismo, versus la hiptesis alternativa de
que los tiempos son en promedio distintos.
5.1. Contraste de hiptesis para dos varianzas
Suponer que son muestras aleatorias independientes y que vienen de poblaciones
normales
14
H 0 : 1 = 2 Vs . H 1 : 1 2
1=n11=9
2=n21=9
Estadstico de prueba
S2 2
F= 2 > F
S1
F=
0.4841
=1.1986
0.4039
F=1.1986> F ( 9,9)
Valor p=1.1986
Si =0.05
F=1.1986> F 0.05( 9,9)
valor p=1.1986<3.18
Si =0.10
F=1.1986> F 0.10( 9,9)
valor p=1.1986<2.44
No existe evidencia para rechazar Ho en favor de Hi, es decir, no existe evidencia
estadstica para decir que las varianzas no son iguales.
5.2. Intervalos de confianza
Suponer que son muestras aleatorias independientes y que vienen de poblaciones
normales con varianzas desconocidas
2
2
Para muestras pequeas con 1 y 2 desconocidas
( x 1 x 2)+ T S P
2
1 1
+
n1 n2
CSPED
x 1=
14.034
S 12= 0.4039
PISO SLIDO
x 2=
14.205
S 22= 0.4841
15
n1=10
n2=
10
SP=
1.6948
1 =0.95
=0.05
=0.025
2
=n1 +n22=18
( x2 x1 )T S P n + n < 21 < ( x2 x1 ) +T S P n + n
1
2
1
2
2
2
( 0.171 )2.1011.6948
1 1
1 1
+ < 2 1< ( 14.20514.034 ) +T 0.025 1.6948
+
10 10
10 10
1 1
1 1
+ < 21 < ( 0.171 ) +2.1011.6948
+
10 10
10 10
[ 1.4214 ; 1.6531 ]
16
H o : 12=0
H 1 : 1 2 0
=n1 +n22
=18
( 9 ) 0,4039+ ( 9 ) 0.4841
18
S P =1.6948
El estadstico de prueba es:
| |
T=
( x 1 x2 ) d 0
SP
T=
1 1
+
n1 n2
( 14.03414.205 )0
1 1
1.6948
+
10 10
>t (18)
|0.171
0.7579 |
T=
T =0.2256>t (18)
2
H0
en favor de
H1
. Por lo tanto, el
17
6. RESULTADOS DE ANLISIS
La media de la muestra del tiempo en csped result menor que la media de la muestra
del tiempo en superficie slida. Esto dio un indicio de que la hiptesis planteada es
verdadera pero fue necesario realizar la prueba de hiptesis para la diferencia de medias.
El intervalo creado va desde -1,4214 hasta 1,6531. Este intervalo fue construido con un
95% de confianza, lo que significa que si se repite el experimento N veces, el 95% de
los resultados caern en ese rango. Como el intervalo incluye al cero, habra la
posibilidad de que los tiempos promedios sea iguales o que el tiempo en csped sea
menor que el tiempo en superficie slida, lo que contradice la hiptesis original. La
decisin final fue tomada a partir de los resultados del contraste de hiptesis.
En el contraste de hiptesis para las varianzas, se obtuvo evidencia estadstica para
probar que son iguales. Esto nos permiti aplicar el mtodo adecuado para el contraste
de la diferencia de medias.
7. CONCLUSIONES
1. Se indica que, efectivamente, no existe diferencia entre caminar en csped que
en una superficie slida y que en sta ltima, no se requiere ms tiempo para
recorrer cierta distancia comparado con el tiempo requerido en csped para
recorrer la misma distancia.
2. La estadstica inferencial es una herramienta muy poderosa para estimar
parmetros de las poblaciones a partir de la informacin obtenida de una
muestra. Tambin se puede aplicar cuando no conocemos la distribucin de la
poblacin.
3. Suponer que el tiempo promedio que toma caminar en cualquiera de las dos
superficies tiene distribucin normal, brinda una buena aproximacin del
comportamiento de estas variables aleatorias.
4. Dado que no se conoca las varianzas de las poblaciones, fue necesario hacer una
prueba de hiptesis para rechazar o no rechazar la hiptesis de que las varianzas
son iguales. Esto permite establecer el tipo de contraste para la diferencia de
medias.
8. RECOMENDACIONES
1. Durante el desarrollo del experimento, se recomienda que una sola persona haga
las caminatas para evitar que el sesgo sea muy grande. Adems se recomienda
alternar entre csped y superficie slida con el fin de evitar el cansancio.
2. En lo posible, realizar el mayor nmero de repeticiones del experimento dado
18
que de esta forma se obtiene mayor precisin en los clculos. Modular el paso en
cada caminata, es importante para evitar conclusiones errneas.
3. No pasar por alto el hecho de que no se conocen las varianzas y que
necesariamente se debe realizar un contraste de hiptesis para inferir si son
iguales o no. A partir de esta informacin, se proceder a aplicar el mtodo
adecuado para el contraste de diferencia de medias.
4. Para la grfica del diagrama de cajas se recomienda usar la aplicacin Minitab
17 debido a su facilidad en la comprensin y manejo de sus herramientas.
9. BIBLIOGRAFA
[1] R. C. P.-D. G. Gmez, administraciondelasoperaciones, [En lnea]. Available:
http://nulan.mdp.edu.ar/1618/1/13_muestreo_aceptacion.pdf. [ltimo acceso: 3
Julio 2015].
[2] A. R.-F. Rojas, cortland, Febrero 2006. [En lnea]. Available:
http://web.cortland.edu/matresearch/Aceptacion.pdf. [ltimo acceso: 3 Julio 2015].
[3] G. Zurita, Estadistica y Probabilidad, Guayaquil, 2012.
19