Objetivo: El alumno encontrar intervalos de confianza para la media poblacional, a partir de muestras grandes o pequeas, estimar la diferencia entre las medias de dos poblaciones. La estadstica inferencial se define como la rama de la estadstica que proporciona tcnicas o procedimientos para analizar, interpretar y tomar decisiones sobre una poblacin, con base en la informacin que se obtiene de una muestra. La estimacin es un procedimiento de la estadstica inferencial mediante el cual se realizan clculos con los datos de una muestra para obtener valores o resultados que describan las caractersticas de la poblacin. El objetivo de la estimacin es obtener estadsticos(formulas, estadstico o estimador), para conocer de manera resumida las caractersticas ms relevantes de una poblacin. Ejemplos de la estimacin de la media poblacional m. Promedio de accidentes en la empresa para establecer planes y mtodos para prevenir. Departamento de cuentas de autoservicio-promedio de ingresos-abrir una nueva tienda. Aseguradora promedio de accidentes- para introducir un nuevo seguro y costo.
El estimado es el resultado que se obtiene al emplear datos de una muestra. Estimacin: puntual y por intervalos. La estimacin puntual es un procedimiento de la estadstica inferencial mediante el cual se realizan clculos con los datos de una muestra cuyo resultado es un valor numrico nico empleado para estimar el valor de un parmetro poblacional. Se utiliza en casos prcticos: Talla exacta de pantalones, peso de algn producto, etc. Desventajas: si la muestra no es representativa, el resultado de la estimacin ser equivocado, su resultado varia de muestra en muestra, no proporcionan una medida de referencia o un nivel de confianza en cuanto al resultado.
Estimacin por intervalos es un procedimiento de la estadstica inferencial mediante el cual se realizan clculos con los datos de una muestra cuyo resultado son los valores numricos que definen un rango, intervalo o conjunto numrico que servir para estimar el parmetro poblacional. De la muestra se obtienen los valores numricos que definen un rango donde se encuentra la media poblacional.
Se utiliza en prediccin de climas, tipo de cambio, etc.
Ventajas: No ofrece un valor nico, sino un rango; ms probabilidad de acertar al verdadero valor; ofrece el resultado un verdadero nivel de confianza que permite conocer en cuanto le podemos creer o tenerle confianza(intervalo de confianza); el nivel de confianza seala que tanta confianza le podemos tener o creer al resultado. Sed mide en % de confianza.
Estimacin de la media(muestras grandes) *Se utiliza en muestras compuestas por 30 o ms datos *Si se conoce la desviacin estndar poblacional *Se basa en el teorema del lmite central *Se puede utilizar para muestras chicas solo si, la distribucin es normal y se conozca el valor de la varianza o desviacin estndar poblacional.
nivel de confianza en %
gl = n-1
El intervalo se determina:
Para grandes:
Para pequeas:
Prueba de Hiptesis
Afirmacin relativa a un parmetro de la poblacin sujeta a verificacin. Es un procedimiento basado en evidencia de la muestra y la teora de la probabilidad para determinar si la hiptesis es una afirmacin razonable. Este procedimiento consta de cinco pasos:
Se acepta Ho o Se rechaza Ho
-1.96
0
Valor crtico
Ho: =x H1: x
Regin De Rechazo
a=0.05
Regin De Rechazo
a=0.05
Valor crtico 0
Escala de Z o t
Ejemplo: El gerente de control de calidad desea saber si el ltimo lote fabricado cumple la especificacin que dice que el peso promedio () de las cajas de cereal es de 300g; se sabe por experiencia que la desviacin estndar poblacional es de 15g. Para esto se toma una muestra aleatoria de 9 cajas de cereal, con los siguientes pesos: 295, 299, 301, 305, 298, 300, 301, 305 y 300g. Paso 1: Se establece la hiptesis nula Ho: = 300g Paso 2: Se le da el valor de 0.05 al nivel de significancia Paso 3: Se define el estadstico de prueba, para este caso que se conoce se utiliza el estadstico Z.
H1: 300g
Calculamos el estadstico:
Paso 4: La regla para tomar la decisin se basa en obtener el valor crtico, el cual se obtiene con el valor de y tomando en cuenta que es una prueba de dos colas o extremos. De tablas se tiene que z tiene un valor de 1.96.
-1.96 0
0.08
1.96
Escala de Z
Valor crtico
= 300
Valor crtico
Paso 5: Se comparan los puntos crticos y se toma la decisin de rechazar o aceptar la hiptesis nula, como el valor de la Z calculada esta dentro de la zona de aceptacin, es decir, dentro de los puntos crticos encontrados en tabla, se concluye que no existe evidencia que indique que el promedio del peso de las cajas de cereal sea diferente de 300g.
Ejemplo:
El gerente de desarrollo de nuevos productos esta interesado en saber si el contenido de shampoo en una nueva presentacin individual, es menor o igual a lo indicado en el marbete (5ml) , ya que si el contenido es menor que lo indicado, se considera como fraude al consumidor y la empresa puede ser demandada. Al realizar un muestreo de 9 sobres de shampoo, se observan los siguientes datos: 4.5, 5.0, 6.0, 5.5, 4.7, 5.8, 5.3, 5.9, y 5.2.
No se rechaza Ho
o Zona de Aceptacin
Regin De Rechazo
a=0.05
Paso 5: se toma una decisin Como el valor de tc esta dentro de la zona de aceptacin, se concluye que la empresa puede ser demandada.
Para comparar dos poblaciones generalmente se considera que ambas tienen la misma variabilidad; es decir, la amplitud de las distribuciones normales son semejantes; a esta propiedad se le conoce como Homoscedasticidad.
m1 m2
La poblacin
Muestra de 30 personas
Grupo I 10 personas
Grupo II 10 personas
*Se dice que la media muestral es un estimador de la media poblacional. *Un estimador es una formula o procedimiento estadstico que permite calcular un valor (aproximado) de un parmetro o caracterstica poblacional. m1=m2=m3 c1 =c2= c3
De una Va
Anlisis de varianza De dos Vas
De una Va
Anlisis de experimentos, se trata de optimizar recursos para obtener la mayor informacin til. Se utiliza: Desarrollo de nuevos productos Evaluacin de proveedores Optimizacin del proceso de produccin. Al diseo ms sencillo se le conoce como Anlisis de varianza de una va o factor. La variabilidad es analizada:
Variacin total
Se deben cumplir los siguientes supuestos: Aleatoriedad: Los elementos se asignan en forma aleatoria Independencia : No interfieren los resultados de un grupo en los de otro grupo. Normalidad: La variable de inters se distribuye conforme al modelo normal. Homoscedasticidad: Se refiere a que las varianzas de los grupos son semejantes
Para la evaluacin de la prueba de hiptesis se utilizara la distribucin F de Fisher, al igual que en la prueba de hiptesis se compara un estadstico con un valor de tablas. La regla de decisin:
n1+n2+n3-c=
SCDDT=
SCDDT n1+n2+n3-C
SUMA
n-1
SCD=
SCD Suma de cuadrados de las desviaciones VET Variabilidad entre tratamientos SCDDT Suma de los cuadrados dentro de los tratamientos G Media global Xi Media de los tratamientos n Nmero de datos c Nmero de columnas
Un analista financiero desea comparar el rendimiento mensual promedio de tres carteras de inversin , mismas que estn conformadas por instrumentos financieros provenientes de distintos sectores de la economa. Para tal propsito obtiene una muestra de cada una de las tres opciones: la muestra de la primera cartera consta de cinco instrumentos distintos procedentes de bancos comerciales; la segunda muestra de cartera esta constituida por cinco instrumentos de renta variable que provienen de tiendas al mayoreo; finalmente, la muestra de la tercera cartera de inversin esta formada por cinco acciones que proceden de empresas que pertenecen a la industria de la construccin: Cartera 1 5.4 3.40 7.20 5.50 6.50 Cartera 2 4.60 4.55 5.50 6.35 5.55 Cartera 3 6.35 5.50 3.50 4.50 6.30
n1+n2+n3-c= 5+5+5-3=12
SCDDT= 16.343
SUMA
n1-1 15-1=14
SCD= 16.6793333
De dos vas
En el anlisis de varianza de dos vas o factores se considera para el estudio la presencia de dos variables independientes cualitativas: por un lado se tienen las distintas columnas (o tratamientos) y por el otro los distintos renglones (o bloques ) de la tabla. Tomando el ejemplo anterior, se tomara una segunda variable que esta relacionada con las filas o renglones. La variable que se tomar ser el riesgo. El riesgo tomara diferentes valores para cada cartera. Como los riesgos son diferentes se les asigna un valor o calificacin. Dicha calificacin ser de 1 a 5 siendo el valor de 1 el de mayor riesgo y el 5 el de menor riesgo. De lo anterior se concluye que la suma de los cuadrados de las desviaciones (SCD) ser:
m b
BLOQUE
Cartera 1
Cartera 2
Cartera 3
Media Xj
1 2
3 4 5 Suma Media Xi
5.4 3.40
7.20 5.50 6.50 5.6
4.60 4.55
5.50 6.35 5.55 5.31
6.35 5.50
3.50 4.50 6.30 5.23
5.45 4.4833
5.4 5.45 6.1167 5.38
VEB/ b-1
VARIACIN ENTRE LOS TRATAMIENTOS VARIACIN DENTRO DE LOS TRATAMIENTOS b-1= 5-1=4 VEB= 3.926 VEB/ b-1= 0.9815
SCDDT n-b-C+1 0.63235886
n-b-c+1= 15-5-3+1=8
SCDDT= 12.417
SUMA
n-C 15-3=12
SCD= 16.6793333
El valor de la F de tablas para 4 grados de libertad en el numerador, 8 grados de libertad en el denominador y con un nivel de significancia de 0.05 es igual a 3.84. Como 0.6543 < 3.84, se acepta la Ho. Significa que el rendimiento mensual promedio de las acciones delos distintos bloques es el mismo, independientemente que stos tengan una calificacin de riesgo diferente para cada caso.
Anlisis de Correlacin
Es el estudio de la relacin entre variables. Grupo de tcnicas para medir la asociacin entre variables. Es dar a conocer el grado de asociacin entre variables (x,y). El objetivo es analizar el comportamiento lineal entre dos variables para observar si existe relacin entre ellas. Se crea un modelo que puede ser usado en diferentes procesos, para prediccin, control u optimizacin. El primer paso a seguir es trazar un diagrama de dispersin, el cual es una representacin grafica de dos variables, dnde se define la variable independiente (x) y la variable dependiente(y); los datos se representan en forma de puntos. Estos diagramas son particularmente valiosos para descubrir la presencia de relaciones no lineales, que no se detectan cuando se calculan las medias numricas de la correlacin lineal. En seguida se muestran los patrones de comportamiento importantes que deben conocerse para examinar una relacin:
r = - 1.00
r = + 1.00
Coeficiente de correlacin r
Describe la fuerza de la relacin entre dos conjuntos de variables y sus caractersticas son: 1) Muestra la direccin y fuerza de relacin lineal entre dos variables. 2) Vara de -1 a +1 3) Un valor 0 indica que no existe relacin 4) Un valor cercano a +1 indica una asociacin directa o positiva entre las variables 5) Un valor cercano a -1 indica una asociacin inversa o negativa entre las variables
No hay Correlacin
- 1.00
+ 1.00
Ejemplo: Se seleccionan al azar cinco automviles de un sitio de alquiler. Cada auto se pesa y despus se conduce durante 100 km para determinar el rendimiento del kilometraje recorrido por litro. Los resultados son:
Automvil
Peso (kg)
Km/lt
1
2 3 4 5
750
420 550 1000 680
10.0
17.2 15.0 9.0 8.0
X (peso)
Automvil
1 2 3 4 5 S
Peso (kg)
750 420 550 1000 680
Km/ lt
10.0 17.2 15.0 9.0 8.0
X-X
Y-Y
(X-X)(Y-Y)
Media
El Coeficiente de Determinacin
Proporcin de la variacin total en la variable dependiente Y que se explica o contabiliza, por la variacin en la variable dependiente X.
r2
Prueba de la Importancia del Coeficiente de Correlacin
Otro estadstico importante es el valor t de student, que se usa para probar la hiptesis nula de que la pendiente de la ecuacin de regresin para la poblacin es cero.
tc = t calculada
Con n-2 grados de libertad y por la forma en que se formula la conjetura (hiptesis) se sabe que la prueba es de dos extremos o dos colas. Cabe mencionar que en esta prueba tambin se pueden tener pruebas de un extremo o una cola.
Mtodo de mnimos cuadrados para ajustar una lnea de regresin Este es un procedimiento matemtico para encontrar la ecuacin de la lnea recta que minimiza la suma de los cuadrados de las distancias entre la lnea y los puntos, medidas en la direccin vertical(y). La curva de aproximacin a una serie de datos puntuales que mejor ajusta es la de mnimos cuadrados. Se encuentran estimaciones de estos parmetros a partir de datos muestrales y se determina la lnea recta que mejor ajusta a este conjunto de puntos, llamada recta de regresin muestral. y=a+bx Donde: a = valor estimado de la ordenada al origen y de la poblacin b = valor estimado de la pendiente de la recta poblacional y = valor pronosticado de la variable dependiente (Y prima) x = variable independiente
*
*
x
y=a+bx
Los estadsticos a y b se calculan con las siguientes formulas: Pendiente de la recta de regresin b= r Sy Sx r Sy Sx Y X Interseccin con el eje Y a = Y - bX
es el coeficiente de correlacin es la desviacin estndar de Y (la variable dependiente) es la desviacin estndar de X (la variable independiente) es la media de Y es la media de X
x 5 3 6 3 4 4 6 8 y 13 15 7 12 13 11 9 5
Datos
16 14 12 10 8 6
y
4
2 0 0 2 4 6 8 10
x 5 3 6
y 13 15 7
3
4 4 6 8 Promedio Desv. Std 4.875 1.727
12
13 11 9 5 10.63 3.378
-1.88
-0.88 -0.88 1.125 3.125
1.375
2.375 0.375 -1.63 -5.63
3.516
0.766 0.766 1.266 9.766 20.88
1.891
5.641 0.141 2.641 31.64 79.88
-2.57813
-2.07813 -0.32813 -1.82813 -17.5781 -36.375
r=
1
-0.891
r2=
0.794
Ho : r 0
2
= 0.05 5 Se rechaza la Ho por lo tanto si existe una correlacin entre las variables.
tc=
-4.8
-2.447 -4.8 0
2.447
Escala de t
Valor crtico
Valor crtico
Se obtiene la ecuacin
y=a+bx
Prueba de Hiptesis 1 Ho : r = 0 Ho : r 0 2
= 0.05 5
Se rechaza la Ho por lo tanto si existe una correlacin entre las variables.
Calculando a y b
b=
-1.74
= 19.119 - 1.74 x
y
16
14
12
10
Axis Title
y Linear (y)
0 0 1 2 3 4 Axis Title 5 6 7 8 9
El residual es la desviacin vertical de la y observada a partir de la recta de regresin muestral que es conocida. Un residual es la diferencia entre un valor real y y el valor y pronosticado por la ecuacin de regresin muestral. La siguiente ecuacin se usa para calcular un residual; e= y- y Donde:
e= residual y= valor real de y y= valor estimado de la variable dependiente al usar la ecuacin de regresin muestral.
El residual es diferente al trmino de error del modelo e, que es la desviacin vertical de y a partir de la recta de regresin poblacional, por tanto, este error
se desconoce.
El error estndar estimacin simple es la medida de la variabilidad o dispersin de los valores de y observados en la muestra, alrededor de la recta de regresin.
Se mide la diferencia entre los valores pronosticados por la ecuacin de regresin y los valores de y reales. Esto se puede visualizar en la frmula: Syx = S( Y )2 n-2
Donde: Syx= error estndar de estimacin Y= valores muestrales de y = valores de y calculados con la ecuacin de regresin n= tamao de la muestra
Pruebas no paramtricas
En los temas anteriores se presentaron pruebas de hiptesis. Se realizaron pruebas para medias poblacionales, los tamaos de las muestras se clasificaron en pequeas y grandes, se analizaron pruebas para una sola poblacin y las pruebas que comparaban dos poblaciones o ms. Todas estas pruebas presentaron una caracterstica comn: necesitaban de ciertos supuestos respecto a la poblacin. t y F requeran de que la poblacin estuviese distribuida normalmente. (Llamadas pruebas paramtricas). Se tienen otras pruebas que no dependen de un solo tipo de distribucin o de valores de parmetros especficos. Estas pruebas se denominan pruebas no paramtricas(libres de distribucin). Las pruebas no paramtricas son procedimientos estadsticos que pueden utilizarse para contrastar hiptesis cuando no son posibles los supuestos con respecto a los parmetros o a las distribuciones normales.
Distribucin chi-cuadrado c2 c2 es toda una familia de distribuciones. Existe una distribucin chi-cuadrado para cada grado de libertad. En la medida que se incrementa el numero de grados de libertad, la distribucin chi-cuadrado se vuelve menos sesgada.
Prueba de Bondad de Ajuste Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma de distribucin particular planteada como hiptesis. Si el ajuste es razonablemente cercano, puede concluirse que existe la forma de distribucin planteada como hiptesis. De la misma manera que con todas las pruebas estadsticas de esta naturaleza, los datos muestrales se toman de la poblacin y estos constituyen la base de los hallazgos. La prueba chi-cuadrado determina si las observaciones muestrales se ajustan a las expectativas.
Prueba chi-cuadrado
La sumatoria va desde i=1 hasta K
En donde fo = es la frecuencia de los eventos observados en los datos muestrales fe = es la frecuencia de los eventos esperados si la hiptesis nula es correcta K = es el numero de categoras o clases
El numerador mide la diferencia entre las frecuencias de los eventos observados y las frecuencias de los eventos esperados al cuadrado. Cuando estas diferencias son grandes, haciendo que chi-cuadrado se incremente, debera rechazarse la hiptesis nula.
Ejemplo
El director de mercadeo de una empresa tiene la responsabilidad de controlar el nivel de existencias para cuatro tipos de botes vendidos por su firma . En el pasado ha ordenado nuevos botes bajo la premisa de que los cuatro tipos de botes son igualmente populares y la demanda de cada uno es la misma. Sin embargo, recientemente las existencias se han vuelto mas difciles de controlar y el director considera que debera probar su hiptesis respecto a una demanda uniforme. Sus hiptesis son: Ho: La demanda es uniforme para los cuatro tipos de botes Ha: La demanda no es uniforme para los cuatro tipos de botes Se selecciona una muestra de n=48 botes vendidos durante los ltimos meses.
Tipo de bote Pirates`revenge Ventas observadas 15 Ventas esperadas 12
11 10
12 48
12 12
12 48
Se calcula chi-cuadrado c2= (15-12)2 /12+ (11-12)2/12 + (10-12)2/12 + (12-12)2/12=1.17 K-1= 3 grados de libertad, con estos datos obtenemos chi-cuadrado de tablas c2=7.815
Graficando se tiene:
F(c2)
0.05
Zona de no rechazo Zona de rechazo
1.17
7.815
c2
Estadstica no paramtrica Se encarga de obtener inferencias en poblaciones donde los parmetros no son conocidos, y/o no se sabe el comportamiento que presenta la distribucin. La inferencia consiste en plantear hiptesis con respecto a la medida de tendencia central (la mediana Md). La ventaja es la simplicidad en el calculo de las misma,
Prueba de Signo
Se aplica a una o dos muestra. Se aplica cuando no se puede inferir o suponer acerca de la media poblacional. Se desconoce la desviacin estndar. Se llama as por el uso de signos + y -. Las puntuaciones individuales o pares de datos no necesariamente tienen que venir de la misma poblacin. Se plantean la hiptesis nula y la alterna Ho: Md0=Md Ha: Md0=Md
Md: es el valor de la mediana poblacional conocida o supuesta Md0 :es el valor de la mediana hipottica, igual o diferente de la mediana poblacional conocida.
Pasos: 1. Asignar un signo + a las puntuaciones que se encuentra por encima de la mediana hipottica. 2. Asignar un signo - a las puntuaciones que se encuentren por debajo de la mediana hipottica. 3. Si el valor de la puntuacin es igual al de la mediana hipottica se coloca un cero, y este valor se elimina del tamao de la muestra. 4. Como existe la misma probabilidad de que se presente un signo + o un signo - y los ensayos son independientes, se utiliza la distribucin de probabilidad binomial para decidir si se acepta o se rechaza la hiptesis nula. Para aplicar la distribucin de probabilidad binomial:
La probabilidad de xito y fracaso (p y q) son iguales, es decir, 0.5. El nmero de ensayos (n) es igual al tamao de la muestra disminuida por las puntuaciones que fueron igual a cero Distribucin de probabilidad binomial
P(x)=(nCx)( px )( q n-x)
H0 se acepta si:
P(x)
H0 se rechaza si P(x)<
Ejemplo 1 La siguiente tabla indica la distribucin de una muestra aleatoria acerca del contenido neto en gramos de 15 botes de cera para automvil.
198 204.6 199.6 201 199.4 192.4 198.5 205 206.6 194.8 200.8 197.8 196.6 196 203.2
Con la prueba del signo probar la hiptesis nula Md=196 gramos contra la hiptesis alterna de Md>196 gramos, con un nivel de significancia =0.01
198 204.6 199.6 201 199.4 192.4 198.5 205 206.6 194.8 200.8 197.8 196.6 196 203.2
P(12,13,14)=0.006511
Como P(0.006511)<0.01 se rechaza la hiptesis nula, por lo que se acepta Md>196
Prueba del signo para dos muestras Se utiliza para establecer diferencias entre dos tratamientos, o determinar si uno es mejor que otro. Se plantea la hiptesis: Ho: Md1=Md2 Ha: Md1=Md2
Las comparaciones se hacen en relacin con los datos de la muestra 1 (x1) Pasos:
1. Si x1 es mayor a x2 se coloca un signo + 2. Si x1 es menor a x2 se coloca un signo 3. Si los valores x1 y x2 son iguales, se coloca un cero y ese par de puntuaciones se desaparece del tamao de la muestra. 4. Se utiliza la distribucin de probabilidad binomial
H0 se acepta si: 2P(x) H0 se rechaza si 2P(x)<
Ejemplo: La siguiente tabla se refiere a los defectos en las unidades producidas por 10 trabadores, empleando un sistema antiguo de produccin y un sistema de produccin innovador. Utilizando una prueba del signo para dos muestras y un nivel de significancia =0.05 probar H0: Md1=Md2 contra H1: Md1 > Md2 Trab. Ant. Nvo. 1 4.5 3.6 2 7.3 6.0 3 4.6 4.4 4 12.4 11.9 5 3.3 3.5 6 5.7 5.1 7 8.3 7.7 8 3.4 2.9 9 2.6 2.4 10 1.7 1.1
SOLUCIN
.
x1 x2
4.5 3.6
7.3 6.0
4.6 4.4
12.4 11.9
3.3 3.5
5.7 5.1
8.3 7.7
3.4 2.9
2.6 2.4
1.7 1.1
x1-x2
P(x)=9,10 P(9)=(10C x9) (0.59) (0.51)= 0.0098 P(10)=(10C10) (O.510) (0.50)= 0.0010
PRUEBA H DE KRUSKAL - WALLIS En la prueba de Kruskal Wallis las muestras son independientes, es decir, los grupos, tratamientos o muestras no estn relacionados entre s. La prueba H se puede aplicar a tres o ms muestras ; es la prueba del anlisis de varianza no paramtrico, que nos permite decidir si k muestras independientes vienen de poblaciones distintas. El tamao de las muestras puede ser distinto o igual. Pasos: 1. La hiptesis nula, H0, establece que las muestras proceden de la misma poblacin, o de poblaciones con medias iguales. H0: m1=m2=m3=.=mn. 2. La hiptesis alterna H1, las diferencias entre las muestras se debe a que no proceden de la misma poblacin o de poblaciones con medias iguales. H1:m1m2m3.mn 3. Considerando todas las muestras como un solo grupo, se asigna el rango al lado de cada una de las puntuaciones, comenzando con un valor de 1 para la ms pequea. 4. Sealar con un asterisco, a rangos empatados. 5. Obtener la sumatoria de los rangos correspondientes a cada muestra. Utilizar las siguientes frmulas y decidir si se acepta o rechaza la hiptesis nula.
H=
12 N(N+1)
Ri i=1 ni
--3(N+1)
Donde: N=es el nmero total de observaciones. Ri=suma del rango de la muestra i ni=nmero de observaciones de la muestra i El valor que se obtiene de H es contrastado con el valor de X2a,gl (ji-cuadrado) grado de libertad gl=k-1; donde k representa el nmero de tratamientos o muestras. Si existen rangos empatados: El valor que se obtiene de HC es contrastado con el valor de X2a,gl (ji-cuadrado)
FRMULA 2
HC=
j
H.
En donde:
Se tomaron muestras del precio de las acciones de 4 de las empresas ms importantes del pas. Los precios estn cotizados en dlares. Utilizando la prueba de Kruskal-Wallis y un nivel de significancia de 5%, probar que estas pruebas proceden de poblaciones con medianas idnticas.
A 1.19 1.05 1.14 1.25 1.29 Rango A B 1.08 1.23 1.26 1.10 1.18 1.14 Rango B C 0.98 1.19 1.08 0.93 1.23 1.18 Rango C D 1.12 1.14 1.31 1.12 1.19 Rango D
SOLUCIN
=68
Datos: RA=68 RB=70.5 RC=51.5 RD=62 N=22 k =4
=70.5
=51.1
=62
nA =5 tA =2 nB =6 tA =4 nc =6 tA =4 nD =5 tA =4 gl =k-1=4-1=3
H=
12 . 22(22+1)
-3(22+1)=1.2929
HC < X2 0.05,3 se acepta H0 1.3159 < 7.81 se acepta HO, a un nivel e significancia de 5% los precios de las acciones de las 4 empresas tienen medianas idnticas. Es decir, no existe variacin en el precio mediano de las acciones de las 4 empresas.
VEB/ b-1
VARIACIN ENTRE LOS TRATAMIENTOS VARIACIN DENTRO DE LOS TRATAMIENTOS b-1= VEB= VEB/ b-1=
SCDDT n-b-C+1
n-b-c+1=
SCDDT=
SCDDT N-b-C+1
SUMA
n-C
SCD=
n1+n2+n3-c=
SCDDT=
SCDDT n1+n2+n3-C
SUMA
n-1
SCD=