Anda di halaman 1dari 8

Las variables asignadas para la realizacin de este trabajo fueron X1, X2, X3, X4.

Se tienen dos poblaciones a las cuales se les midieron estas cuatro variables, las cuales estn
identificadas por los cdigos 0 y 1 de la columna X10

1. Realizar la prueba de igualdad de matrices de varianzas-covarianzas poblacionales para las


dos poblaciones consideras. A partir de la prueba de igualdad de matrices de varianzas-
covarianzas realizar la prueba de igualdad de vectores de medias para las dos poblaciones
consideradas.

Como ambas poblaciones son pequeas se asume normalidad.

Poblacin 1. 1 , 2 , , 1 , ~4 (1 , 1 ), n1=10
Poblacin 2. 1 , 2 , , 2 , ~4 (2 , 2 ), n2=43

n=n1+n2=53
0 : 1 = 2 : 1 2

Para realizar esta prueba de hiptesis se har uso de la funcin boxM del paquete
biotools en R, a esta funcin se le debe ingresar una matriz de datos numrica, la cual en
este caso corresponde a la matriz formada por las n observaciones de las p variables
(X1, X2, X3, X4), en este caso n=53 y p=4, y adems se le debe suministrar un vector de
longitud n que contiene la clase de cada observacin, en este caso este vector
corresponde al vector X10 puesto que en l se encuentra la clasificacin al grupo que
pertenece cada observacin.

> library(biotools)
> x10<-base[,-c(1,2,3,4,5,6,7,8,9)]
> datos<-base[,-c(5,6,7,8,9,10)]
> boxM(data=datos,grouping=X10)

Box's M-test for Homogeneity of Covariance Matrices

data: datos
Chi-Sq (approx.) = 28.314, df = 10, p-value = 0.001608

Como el valor-P de la prueba es 0.001608 menor que un alfa de 0.05 entonces se rechaza
la hiptesis nula y se concluye que hay evidencia muestral suficiente para sugerir que las
matrices de varianzas-covarianzas de ambas poblaciones son diferentes con una confianza
del 95%.

A continuacin se realiza la prueba de igualdad de vectores de medias, con 1 2 -


Desconocidas
0 : 1 = 2 : 1 2
0 : 1 2 = 0 : 1 2 0

Un estimador adecuado para : 1 2 es 1 2 y su distribucin es:

1 2
( 1 2 ) = 1 2 , ( 1 2 ) = +
1 2

1 2 ~4 (1 2 , 1 + 2 )
1 2

1 = 1
Como 1 2 son desconocidas se estimaran, 2 = 2

Finalmente como son dos poblaciones normales (pequeas) con 1 2 desconocidas


un estadstico de prueba es:

S1 S2 1
02 = ( 1 2 0) ( + ) ( 1 2 0) ~

1 2 + 1 ,+1
() + [()]2
= , = 1 + 2 , =
1
2=1 {() + [()]2
1

Donde 1 es la media muestral de la poblacin 1

> x1bar<-colMeans(poblacion1)
> x1bar
X1 X2 X3 X4
44.98 6.49 22.31 41.03

Donde 2 es la media muestral de la poblacin 2

> x2bar<-colMeans(poblacion2)#media muestral de la poblacion 1


> x2bar
X1 X2 X3 X4
35.797674 6.613953 22.176744 18.951163

S1 es la matriz de varianzas y covarianzas mustrales de la poblacin 1


> s1<-var(poblacion1)# varianza muestral de la poblacion1
> s1
X1 X2 X3 X4
X1 2318.52844 79.266444 1218.1247 1657.32956
X2 79.26644 3.925444 37.8290 75.09478
X3 1218.12467 37.829000 804.6921 1108.40078
X4 1657.32956 75.094778 1108.4008 3189.15789

S2 es la matriz de varianzas y covarianzas mustrales de la poblacin 2


> s2<-var(poblacion2)# varianza muestral de la poblacion2
> s2
X1 X2 X3 X4
X1 1293.89690 27.062414 720.62780 301.74417
X2 27.06241 1.211229 14.85128 14.34927
X3 720.62780 14.851285 597.20373 151.85431
X4 301.74417 14.349269 151.85431 398.19446

Realizando las diferentes operaciones en R se obtuvo que 02 = 10.48782 y = 10.56433


11, recodar que p=4

Criterio de rechazo: se rechaza 0 si 02 > +1 ,,+1

11(4)
= = 5.5 y ,,+1 = 0.05,4,8 =3.837853
+1 114+1

11(4)
Finalmente como 02 = 10.48782 < 114+1 0.05,4,8 = (5.5)(3.837853) = 21.10819

Entonces no se rechaza 0 , es decir con una confianza del 95% hay evidencia muestral
Suficiente para sugerir que los vectores de medias poblacionales para las dos poblaciones
consideradas son iguales.

3. Realizar la siguiente prueba de hiptesis acerca del vector de media poblacional uno
(ie. Para X10 =0)

0 : 1 = 0 : 1 0
(ii) Suponga que la poblacin de donde provienen los datos es normal 4-variada y que la
matriz de varianzas-covarianzas es desconocida.

un estimador adecuado para : 1 es 1 y su distribucin es:

1
( 1 ) = 1 , ( 1 ) =
1

1 ~ 4 (1, 11 )

1 = 1
Como 1 es desconocidas se estimara,

Finalmente como la poblacin es normal (pequeas) con 1 desconocidas un estadstico


de prueba es:
(1 1)
02 = 1 ( 1 0) (1 )1 ( 1 0) ~
1 ,
Con n1=10, p=4
Vector de medias muestral 1 para la poblacin 1

> x1bar<-colMeans(poblacion1)# media muestral de la poblacion 1


> x1bar
X1 X2 X3 X4
44.98 6.49 22.31 41.03

1 Matriz de varianzas y covarianzas de la poblacin1:


> s1<-var(poblacion1)# matriz de var-cov muestrales de la poblacin 1
> s1
X1 X2 X3 X4
X1 2318.52844 79.266444 1218.1247 1657.32956
X2 79.26644 3.925444 37.8290 75.09478
X3 1218.12467 37.829000 804.6921 1108.40078
X4 1657.32956 75.094778 1108.4008 3189.15789

(1 )1 Inversa de la matriz de varianzas y covarianzas de la poblacin 1


> invs1<-solve(s1)#inversa de la matriz de var-cov muestrales de la pobla
cin 1
> invs1
X1 X2 X3 X4
X1 0.004931254 -0.06007940 -0.005868737 0.0008917240
X2 -0.060079404 1.27865882 0.056213933 -0.0184239218
X3 -0.005868737 0.05621393 0.009795918 -0.0016784194
X4 0.000891724 -0.01842392 -0.001678419 0.0008673202

Estadistico de prueba
> to2<-n1*(t(x1bar))%*%invs1%*%(x1bar)
> to2
[,1]
[1,] 299.999

Finalmente al realizar las operaciones en R se obtiene que:

02 = 299.999
(1 1) (10 1)4
= = 6 ,,1= 0.05,4,6= 4.533677
10 4
Entonces:
(1 1) (10 1)4
,,= 0.05,4,6 = (6)4.533677 = 27.20206
10 4

(101)4
Finalmente como 02 = 299.999 > 0.05,4,6 = 27.20206 entonces se rechaza 0
104
es decir con una confianza del 95% existe evidencia muestral suficiente para sugerir que
que el vector de medias de la poblacin 1 es diferente del vector cero.
4. Asumiendo que lo que se tiene en los datos es una sola muestra aleatroria de tamao
53 correspondiente a una sola poblacin de inters. Realizar la siguiente prueba de
hiptesis acerca del vector de media poblacional.

0 : = 0 : 0

Poblacin Total. 1 , 2 , , , ~4 (, ), n=53

Primero haremos algunos clculos en R los cuales nos servirn para calcular los
estadsticos de pruebas.

Vector de medias mustrales () de la muestra de 53 individuos de la poblacin.


> xbarra<-colMeans(datos)
> xbarra
X1 X2 X3 X4
37.530189 6.590566 22.201887 23.116981

es la matriz var-cov muestral para la muestra de 53 individuos de la poblacin


> s<-var(datos)
> s
X1 X2 X3 X4
X1 1459.50946 35.399713 793.06571 562.19332
X2 35.39971 1.660102 18.54002 24.15997
X3 793.06571 18.540018 621.63327 314.94920
X4 562.19332 24.159971 314.94920 949.64567

Para calcular ()1 en R se usa la funcin solve


> Sinv<-solve(s)
> Sinv
X1 X2 X3 X4
X1 3.095222e-03 -0.032581472 -0.0029672607 -1.938555e-05
X2 -3.258147e-02 1.546104820 0.0067441869 -2.228288e-02
X3 -2.967261e-03 0.006744187 0.0052766585 -1.649505e-04
X4 -1.938555e-05 -0.022282877 -0.0001649505 1.686106e-03

i) Suponga que la poblacin de donde provienen los datos es normal 4-variada y que
la matriz de varianzas-covarianzas es desconocida.

un estimador adecuado para : es 1 y su distribucin es:


( ) = , () =


~ 4 (,)
Como es desconocidas se estimara, =

Finalmente como la poblacin es normal (pequeas) con desconocida un estadstico


de prueba es:

( 1)
02 = ( 0) ()1 ( 0) ~
,
Con n=53, p=4

> to2<-n*(t(xbarra))%*%Sinv%*%(xbarra)# Estadistico de prueba


> to2
[,1]
[1,] 2593.605

Finalmente 02 = 2593.605

Ahora:
( 1) (53 1)4
,, = = 10.87171
53 4 0.05,4,49

Como 02 = 2593.605 > 10.87171 entonces se rechaza la hiptesis nula es decir que con
una confianza del 95% hay evidencia muestral suficiente para sugerir que el vector de
medias de la poblacin 1 es diferente del vector cero.

ii) Suponga que el tamao de la muestra es grande y que la matriz de varianzas-


covarianzas es desconocida.

De manera similar:

Un estimador adecuado para : es 1 y su distribucin es:


( ) = , () =

Como n es grande por teorema del lmite central entonces:

~ 4 (,)

Como es desconocidas se estimara, =

Finalmente como la muestra es grande y desconocida un estadstico de prueba es:



02 = ( 0) ()1 ( 0) ~ 2

Con n=53, p=4

El estadstico de prueba se calcula usando las mismas estadsticas (, ) calculadas en el


literal anterior
> x02<-n*(t(xbarra))%*%Sinv%*%(xbarra)
> x02
[,1]
[1,] 2593.605

Entonces: 02 = 2593.605

2 , = 2 0.05,4 = 9.487729

Como 02 = 2593.605 > 9.487729 entonces se rechaza la hiptesis nula es decir que con
una confianza del 95% hay evidencia muestral suficiente para sugerir que el vector de
medias de la poblacin es diferente del vector cero.
UNIVERSIDAD NACIONAL DE COLOMBIA
SEDE MEDELLIN
Escuela de Estadstica

Punto del parcial 3

Introduccin al Anlisis Multivariado


Ral Alberto Prez

Gipsy Tatiana Naranjo Dueas


c.c 1016077759
Edgar Dario Monsalve Lugo
c.c 1116798069