Anda di halaman 1dari 81

Unidad 1 Estimacin

Objetivo: El alumno encontrar intervalos de confianza para la media poblacional, a partir de muestras grandes o pequeas, estimar la diferencia entre las medias de dos poblaciones. La estadstica inferencial se define como la rama de la estadstica que proporciona tcnicas o procedimientos para analizar, interpretar y tomar decisiones sobre una poblacin, con base en la informacin que se obtiene de una muestra. La estimacin es un procedimiento de la estadstica inferencial mediante el cual se realizan clculos con los datos de una muestra para obtener valores o resultados que describan las caractersticas de la poblacin. El objetivo de la estimacin es obtener estadsticos(formulas, estadstico o estimador), para conocer de manera resumida las caractersticas ms relevantes de una poblacin. Ejemplos de la estimacin de la media poblacional m. Promedio de accidentes en la empresa para establecer planes y mtodos para prevenir. Departamento de cuentas de autoservicio-promedio de ingresos-abrir una nueva tienda. Aseguradora promedio de accidentes- para introducir un nuevo seguro y costo.

El estimado es el resultado que se obtiene al emplear datos de una muestra. Estimacin: puntual y por intervalos. La estimacin puntual es un procedimiento de la estadstica inferencial mediante el cual se realizan clculos con los datos de una muestra cuyo resultado es un valor numrico nico empleado para estimar el valor de un parmetro poblacional. Se utiliza en casos prcticos: Talla exacta de pantalones, peso de algn producto, etc. Desventajas: si la muestra no es representativa, el resultado de la estimacin ser equivocado, su resultado varia de muestra en muestra, no proporcionan una medida de referencia o un nivel de confianza en cuanto al resultado.

Estimacin por intervalos es un procedimiento de la estadstica inferencial mediante el cual se realizan clculos con los datos de una muestra cuyo resultado son los valores numricos que definen un rango, intervalo o conjunto numrico que servir para estimar el parmetro poblacional. De la muestra se obtienen los valores numricos que definen un rango donde se encuentra la media poblacional.
Se utiliza en prediccin de climas, tipo de cambio, etc.

Ventajas: No ofrece un valor nico, sino un rango; ms probabilidad de acertar al verdadero valor; ofrece el resultado un verdadero nivel de confianza que permite conocer en cuanto le podemos creer o tenerle confianza(intervalo de confianza); el nivel de confianza seala que tanta confianza le podemos tener o creer al resultado. Sed mide en % de confianza.
Estimacin de la media(muestras grandes) *Se utiliza en muestras compuestas por 30 o ms datos *Si se conoce la desviacin estndar poblacional *Se basa en el teorema del lmite central *Se puede utilizar para muestras chicas solo si, la distribucin es normal y se conozca el valor de la varianza o desviacin estndar poblacional.

Si no se conoce la desviacin estndar poblacional, pero se conoce la muestral

error estndar de la media muestral

valor de Z situado bajo la curva normal estndar


media de la muestra nivel de significancia

nivel de confianza en %

90% 95% 98% 99%

1.645 1.96 2.326 2.576

Estimacin para muestras pequeas


Para n<30 Se desconoce la s Se considera una distribucin normal Se deben considerar los grados de libertad para calcular el estadstico t, los cuales se calculan con :

gl = n-1
El intervalo se determina:

Para calcular el valor de t se debe utilizar la tabla de t de student

Estimacin de la diferencia entre dos medias poblacionales


Para casos en que se estima la diferencia entre dos medias , con la finalidad de comparar dos poblaciones . Si ambas cotas son negativas se dice que el promedio de la poblacin dos es mayor, si son positivas el promedio de la poblacin uno es mayor.. Tambin se consideran muestras grandes y pequeas y las formulas para su clculo son:

Para grandes:

Para pequeas:

Prueba de Hiptesis
Afirmacin relativa a un parmetro de la poblacin sujeta a verificacin. Es un procedimiento basado en evidencia de la muestra y la teora de la probabilidad para determinar si la hiptesis es una afirmacin razonable. Este procedimiento consta de cinco pasos:

Paso 1: Se establece la hiptesis nula (Ho) y la alterna(Ha)

Paso 2: Se selecciona un nivel de significancia

Paso 3: Se identifica el estadstico de la prueba

Paso 4: Se formulo una regla para tomar decisiones.

Paso 5: Se toma una muestra; se llega a una decisin

Se acepta Ho o Se rechaza Ho

Prueba de dos colas o extremos

No se rechaza Ho Regin De Rechazo 0.025 o Zona de Aceptacin

Regin De Rechazo 0.025

-1.96

0
Valor crtico

Escala de Z o t Valor crtico 1.96

Ho: =x H1: x

Prueba de una cola o extremo:

No se rechaza Ho o Zona de Aceptacin

Regin De Rechazo

a=0.05

Ho: x H1: >x

Escala de Z o t Valor crtico

Prueba de una cola o extremo:

Regin De Rechazo

No se rechaza Ho o Zona de Aceptacin

a=0.05

Valor crtico 0

Escala de Z o t

Ho: x H1: <x

Ejemplo: El gerente de control de calidad desea saber si el ltimo lote fabricado cumple la especificacin que dice que el peso promedio () de las cajas de cereal es de 300g; se sabe por experiencia que la desviacin estndar poblacional es de 15g. Para esto se toma una muestra aleatoria de 9 cajas de cereal, con los siguientes pesos: 295, 299, 301, 305, 298, 300, 301, 305 y 300g. Paso 1: Se establece la hiptesis nula Ho: = 300g Paso 2: Se le da el valor de 0.05 al nivel de significancia Paso 3: Se define el estadstico de prueba, para este caso que se conoce se utiliza el estadstico Z.

H1: 300g

Se obtiene primero la media muestral con los datos presentados:

Calculamos el estadstico:

Paso 4: La regla para tomar la decisin se basa en obtener el valor crtico, el cual se obtiene con el valor de y tomando en cuenta que es una prueba de dos colas o extremos. De tablas se tiene que z tiene un valor de 1.96.

No se rechaza Ho Regin De Rechazo 0.025 o Zona de Aceptacin

Regin De Rechazo 0.025

-1.96 0

0.08

1.96

Escala de Z

Valor crtico

= 300

Valor crtico

Paso 5: Se comparan los puntos crticos y se toma la decisin de rechazar o aceptar la hiptesis nula, como el valor de la Z calculada esta dentro de la zona de aceptacin, es decir, dentro de los puntos crticos encontrados en tabla, se concluye que no existe evidencia que indique que el promedio del peso de las cajas de cereal sea diferente de 300g.

Ejemplo:
El gerente de desarrollo de nuevos productos esta interesado en saber si el contenido de shampoo en una nueva presentacin individual, es menor o igual a lo indicado en el marbete (5ml) , ya que si el contenido es menor que lo indicado, se considera como fraude al consumidor y la empresa puede ser demandada. Al realizar un muestreo de 9 sobres de shampoo, se observan los siguientes datos: 4.5, 5.0, 6.0, 5.5, 4.7, 5.8, 5.3, 5.9, y 5.2.

Paso 1: Establecer la hiptesis nula y alterna

Paso 2: Definir el nivel de error

Paso 3: Modelo probabilstico


Como no se conoce la desviacin estndar poblacional y se desea inferir sobre el promedio, la distribucin usada ser la t-student Y se calcula el estadstico

Paso 4: Se establece las regiones de rechazo

Prueba de una cola o extremo:

No se rechaza Ho
o Zona de Aceptacin

Regin De Rechazo

a=0.05

Ho: x H1: >x

Escala de Z o t Valor crtico

Paso 5: se toma una decisin Como el valor de tc esta dentro de la zona de aceptacin, se concluye que la empresa puede ser demandada.

Prueba de Hiptesis para comparar dos poblaciones independientes.


El objetivo de la prueba consiste en determinar si las medias 1 y 2 son estadsticamente diferentes . Cuando se conoce la en ambas poblaciones y bajo el supuesto de Homoscedasticidad se utilizara como estadstico de prueba Zc.

Para comparar dos poblaciones generalmente se considera que ambas tienen la misma variabilidad; es decir, la amplitud de las distribuciones normales son semejantes; a esta propiedad se le conoce como Homoscedasticidad.

m1 m2

Anlisis de varianza (ANOVA o ANADEVA)


*Analiza la varianza de una respuesta en dos o mas conjuntos de datos *Mtodo matemtico creado para probar la hiptesis de que las medias aritmticas de dos o mas grupos son iguales. *Su objetivo es identificar variables independientes importantes en un estudio estadstico y determinar como interactan y afectan la respuesta. *A las variables se les conoce tambin como vas o factores. * No obstante que el anlisis de varianza permite obtener una conclusin que se refiere a la poblacin, este procedimiento se lleva a cabo a partir de la informacin contenida en una muestra.

La poblacin

Muestra de 30 personas

Grupo I 10 personas

Grupo II 10 personas

Grupo III 10 personas

*Se dice que la media muestral es un estimador de la media poblacional. *Un estimador es una formula o procedimiento estadstico que permite calcular un valor (aproximado) de un parmetro o caracterstica poblacional. m1=m2=m3 c1 =c2= c3

De una Va
Anlisis de varianza De dos Vas

De una Va
Anlisis de experimentos, se trata de optimizar recursos para obtener la mayor informacin til. Se utiliza: Desarrollo de nuevos productos Evaluacin de proveedores Optimizacin del proceso de produccin. Al diseo ms sencillo se le conoce como Anlisis de varianza de una va o factor. La variabilidad es analizada:

Variacin total

Variacin entre grupos

Variacin intra grupos

Se deben cumplir los siguientes supuestos: Aleatoriedad: Los elementos se asignan en forma aleatoria Independencia : No interfieren los resultados de un grupo en los de otro grupo. Normalidad: La variable de inters se distribuye conforme al modelo normal. Homoscedasticidad: Se refiere a que las varianzas de los grupos son semejantes

Se realiza una prueba de hiptesis:

Para la evaluacin de la prueba de hiptesis se utilizara la distribucin F de Fisher, al igual que en la prueba de hiptesis se compara un estadstico con un valor de tablas. La regla de decisin:

TABLA DE ANOVA UNA VA


VARIACIN GRADOS DE LIBERTAD SUMA DE CUADRADOS VALORES MEDIOS FC VET/ C-1 VARIACIN ENTRE LOS TRATAMIENTOS VARIACIN DENTRO DE LOS TRATAMIENTOS C-1= VET= VET/ C-1=
SCDDT n1+n2+n3-C

n1+n2+n3-c=

SCDDT=

SCDDT n1+n2+n3-C

SUMA

n-1

SCD=

SCD Suma de cuadrados de las desviaciones VET Variabilidad entre tratamientos SCDDT Suma de los cuadrados dentro de los tratamientos G Media global Xi Media de los tratamientos n Nmero de datos c Nmero de columnas

Un analista financiero desea comparar el rendimiento mensual promedio de tres carteras de inversin , mismas que estn conformadas por instrumentos financieros provenientes de distintos sectores de la economa. Para tal propsito obtiene una muestra de cada una de las tres opciones: la muestra de la primera cartera consta de cinco instrumentos distintos procedentes de bancos comerciales; la segunda muestra de cartera esta constituida por cinco instrumentos de renta variable que provienen de tiendas al mayoreo; finalmente, la muestra de la tercera cartera de inversin esta formada por cinco acciones que proceden de empresas que pertenecen a la industria de la construccin: Cartera 1 5.4 3.40 7.20 5.50 6.50 Cartera 2 4.60 4.55 5.50 6.35 5.55 Cartera 3 6.35 5.50 3.50 4.50 6.30

Cartera 1 1 2 3 4 5 Suma Media 5.4 3.40 7.20 5.50 6.50

Cartera 2 4.60 4.55 5.50 6.35 5.55

Cartera 3 6.35 5.50 3.50 4.50 6.30

TABLA DE ANOVA UNA VA


VARIACIN GRADOS DE LIBERTAD SUMA DE CUADRADOS VALORES MEDIOS FC VET/ C-1 VARIACIN ENTRE LOS TRATAMIENTOS VARIACIN DENTRO DE LOS TRATAMIENTOS C-1= 3-1=2 VET= 0.33633333 VET/ C-1= 0.16816667
SCDDT n1+n2+n3-C 0.12347794

n1+n2+n3-c= 5+5+5-3=12

SCDDT= 16.343

SCDDT n1+n2+n3-C 1.36191667

SUMA

n1-1 15-1=14

SCD= 16.6793333

De dos vas
En el anlisis de varianza de dos vas o factores se considera para el estudio la presencia de dos variables independientes cualitativas: por un lado se tienen las distintas columnas (o tratamientos) y por el otro los distintos renglones (o bloques ) de la tabla. Tomando el ejemplo anterior, se tomara una segunda variable que esta relacionada con las filas o renglones. La variable que se tomar ser el riesgo. El riesgo tomara diferentes valores para cada cartera. Como los riesgos son diferentes se les asigna un valor o calificacin. Dicha calificacin ser de 1 a 5 siendo el valor de 1 el de mayor riesgo y el 5 el de menor riesgo. De lo anterior se concluye que la suma de los cuadrados de las desviaciones (SCD) ser:

Siendo el VEB la variacin entre bloques, el cual se calcula como:

m b

es el nmero de elementos de cada bloque el nmero de renglones

BLOQUE

Cartera 1

Cartera 2

Cartera 3

Media Xj

1 2
3 4 5 Suma Media Xi

5.4 3.40
7.20 5.50 6.50 5.6

4.60 4.55
5.50 6.35 5.55 5.31

6.35 5.50
3.50 4.50 6.30 5.23

5.45 4.4833
5.4 5.45 6.1167 5.38

TABLA DE ANOVA DOS VAS


VARIACIN GRADOS DE LIBERTAD SUMA DE CUADRADO S VALORES MEDIOS FC

VEB/ b-1
VARIACIN ENTRE LOS TRATAMIENTOS VARIACIN DENTRO DE LOS TRATAMIENTOS b-1= 5-1=4 VEB= 3.926 VEB/ b-1= 0.9815
SCDDT n-b-C+1 0.63235886

n-b-c+1= 15-5-3+1=8

SCDDT= 12.417

SCDDT N-b-C+1 0.9815

SUMA

n-C 15-3=12

SCD= 16.6793333

El valor de la F de tablas para 4 grados de libertad en el numerador, 8 grados de libertad en el denominador y con un nivel de significancia de 0.05 es igual a 3.84. Como 0.6543 < 3.84, se acepta la Ho. Significa que el rendimiento mensual promedio de las acciones delos distintos bloques es el mismo, independientemente que stos tengan una calificacin de riesgo diferente para cada caso.

Anlisis de Correlacin
Es el estudio de la relacin entre variables. Grupo de tcnicas para medir la asociacin entre variables. Es dar a conocer el grado de asociacin entre variables (x,y). El objetivo es analizar el comportamiento lineal entre dos variables para observar si existe relacin entre ellas. Se crea un modelo que puede ser usado en diferentes procesos, para prediccin, control u optimizacin. El primer paso a seguir es trazar un diagrama de dispersin, el cual es una representacin grafica de dos variables, dnde se define la variable independiente (x) y la variable dependiente(y); los datos se representan en forma de puntos. Estos diagramas son particularmente valiosos para descubrir la presencia de relaciones no lineales, que no se detectan cuando se calculan las medias numricas de la correlacin lineal. En seguida se muestran los patrones de comportamiento importantes que deben conocerse para examinar una relacin:

Correlacin negativa perfecta

Correlacin positiva perfecta

r = - 1.00

r = + 1.00

Recta con pendiente negativa

Recta con pendiente positiva

Coeficiente de correlacin r
Describe la fuerza de la relacin entre dos conjuntos de variables y sus caractersticas son: 1) Muestra la direccin y fuerza de relacin lineal entre dos variables. 2) Vara de -1 a +1 3) Un valor 0 indica que no existe relacin 4) Un valor cercano a +1 indica una asociacin directa o positiva entre las variables 5) Un valor cercano a -1 indica una asociacin inversa o negativa entre las variables

Correlacin negativa perfecta

No hay Correlacin

Correlacin positiva perfecta

Correlacin negativa fuerte

Correlacin Correlacin negativa dbil negativa moderada

Correlacin Correlacin positiva Correlacin positiva fuerte positiva dbil moderada

- 1.00

- 0.50 Correlacin negativa

+ 0.50 Correlacin positiva

+ 1.00

Ejemplo: Se seleccionan al azar cinco automviles de un sitio de alquiler. Cada auto se pesa y despus se conduce durante 100 km para determinar el rendimiento del kilometraje recorrido por litro. Los resultados son:

Automvil

Peso (kg)

Km/lt

1
2 3 4 5

750
420 550 1000 680

10.0
17.2 15.0 9.0 8.0

Se desarrolla el diagrama de dispersin:

Y(km/lt) 20 15 10 5 0 200 400 600 800 1000

X (peso)

Se deben calcular las medias de X y Y, las desviaciones estndar Sx y Sy.

Automvil
1 2 3 4 5 S

Peso (kg)
750 420 550 1000 680

Km/ lt
10.0 17.2 15.0 9.0 8.0

X-X

Y-Y

(X-X)(Y-Y)

Media

El Coeficiente de Determinacin
Proporcin de la variacin total en la variable dependiente Y que se explica o contabiliza, por la variacin en la variable dependiente X.

r2
Prueba de la Importancia del Coeficiente de Correlacin
Otro estadstico importante es el valor t de student, que se usa para probar la hiptesis nula de que la pendiente de la ecuacin de regresin para la poblacin es cero.

tc = t calculada

Rho representa la correlacin en la poblacin

Con n-2 grados de libertad y por la forma en que se formula la conjetura (hiptesis) se sabe que la prueba es de dos extremos o dos colas. Cabe mencionar que en esta prueba tambin se pueden tener pruebas de un extremo o una cola.

Mtodo de mnimos cuadrados para ajustar una lnea de regresin Este es un procedimiento matemtico para encontrar la ecuacin de la lnea recta que minimiza la suma de los cuadrados de las distancias entre la lnea y los puntos, medidas en la direccin vertical(y). La curva de aproximacin a una serie de datos puntuales que mejor ajusta es la de mnimos cuadrados. Se encuentran estimaciones de estos parmetros a partir de datos muestrales y se determina la lnea recta que mejor ajusta a este conjunto de puntos, llamada recta de regresin muestral. y=a+bx Donde: a = valor estimado de la ordenada al origen y de la poblacin b = valor estimado de la pendiente de la recta poblacional y = valor pronosticado de la variable dependiente (Y prima) x = variable independiente

*
*
x

y=a+bx

Los estadsticos a y b se calculan con las siguientes formulas: Pendiente de la recta de regresin b= r Sy Sx r Sy Sx Y X Interseccin con el eje Y a = Y - bX

es el coeficiente de correlacin es la desviacin estndar de Y (la variable dependiente) es la desviacin estndar de X (la variable independiente) es la media de Y es la media de X

Ejercicio de la pagina 475, No. 14

x 5 3 6 3 4 4 6 8 y 13 15 7 12 13 11 9 5

Datos
16 14 12 10 8 6
y

4
2 0 0 2 4 6 8 10

x 5 3 6

y 13 15 7

x-x 0.125 -1.88 1.125

y-y 2.375 4.375 -3.63

(x-x)2 0.016 3.516 1.266

(y-y)2 5.641 19.14 13.14

(x-x)(y-y) 0.296875 -8.20313 -4.07813

3
4 4 6 8 Promedio Desv. Std 4.875 1.727

12
13 11 9 5 10.63 3.378

-1.88
-0.88 -0.88 1.125 3.125

1.375
2.375 0.375 -1.63 -5.63

3.516
0.766 0.766 1.266 9.766 20.88

1.891
5.641 0.141 2.641 31.64 79.88

-2.57813
-2.07813 -0.32813 -1.82813 -17.5781 -36.375

r=
1

-0.891

Correlacin negativa fuerte

r2=

0.794

Prueba de Hiptesis Ho : r = 0 4tt= 2.447

Ho : r 0
2

Regla de decisin Ho se acepta si -2.447 < tc < 2.447

= 0.05 5 Se rechaza la Ho por lo tanto si existe una correlacin entre las variables.

tc=

-4.8

No se rechaza Ho Regin De Rechazo 0.025 o Zona de Aceptacin

Regin De Rechazo 0.025

-2.447 -4.8 0

2.447

Escala de t

Valor crtico

Valor crtico

Se obtiene la ecuacin

y=a+bx

Prueba de Hiptesis 1 Ho : r = 0 Ho : r 0 2

tt= 2.447 Regla de decisin Ho se acepta si -2.447 < tc < 2.447

= 0.05 5
Se rechaza la Ho por lo tanto si existe una correlacin entre las variables.

tc= -4.8 19.1197 a= 6

Calculando a y b

b=

-1.74

= 19.119 - 1.74 x

y
16

14

y = -1.7425x + 19.12 R = 0.7935

12

10

Axis Title

y Linear (y)

0 0 1 2 3 4 Axis Title 5 6 7 8 9

El residual es la desviacin vertical de la y observada a partir de la recta de regresin muestral que es conocida. Un residual es la diferencia entre un valor real y y el valor y pronosticado por la ecuacin de regresin muestral. La siguiente ecuacin se usa para calcular un residual; e= y- y Donde:

e= residual y= valor real de y y= valor estimado de la variable dependiente al usar la ecuacin de regresin muestral.
El residual es diferente al trmino de error del modelo e, que es la desviacin vertical de y a partir de la recta de regresin poblacional, por tanto, este error

se desconoce.

ERROR ESTNDAR DE ESTIMACIN

El error estndar estimacin simple es la medida de la variabilidad o dispersin de los valores de y observados en la muestra, alrededor de la recta de regresin.
Se mide la diferencia entre los valores pronosticados por la ecuacin de regresin y los valores de y reales. Esto se puede visualizar en la frmula: Syx = S( Y )2 n-2

Donde: Syx= error estndar de estimacin Y= valores muestrales de y = valores de y calculados con la ecuacin de regresin n= tamao de la muestra

Pruebas no paramtricas
En los temas anteriores se presentaron pruebas de hiptesis. Se realizaron pruebas para medias poblacionales, los tamaos de las muestras se clasificaron en pequeas y grandes, se analizaron pruebas para una sola poblacin y las pruebas que comparaban dos poblaciones o ms. Todas estas pruebas presentaron una caracterstica comn: necesitaban de ciertos supuestos respecto a la poblacin. t y F requeran de que la poblacin estuviese distribuida normalmente. (Llamadas pruebas paramtricas). Se tienen otras pruebas que no dependen de un solo tipo de distribucin o de valores de parmetros especficos. Estas pruebas se denominan pruebas no paramtricas(libres de distribucin). Las pruebas no paramtricas son procedimientos estadsticos que pueden utilizarse para contrastar hiptesis cuando no son posibles los supuestos con respecto a los parmetros o a las distribuciones normales.

Distribucin chi-cuadrado c2 c2 es toda una familia de distribuciones. Existe una distribucin chi-cuadrado para cada grado de libertad. En la medida que se incrementa el numero de grados de libertad, la distribucin chi-cuadrado se vuelve menos sesgada.

Prueba de Bondad de Ajuste Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma de distribucin particular planteada como hiptesis. Si el ajuste es razonablemente cercano, puede concluirse que existe la forma de distribucin planteada como hiptesis. De la misma manera que con todas las pruebas estadsticas de esta naturaleza, los datos muestrales se toman de la poblacin y estos constituyen la base de los hallazgos. La prueba chi-cuadrado determina si las observaciones muestrales se ajustan a las expectativas.

Prueba chi-cuadrado
La sumatoria va desde i=1 hasta K

c2= S[(fo-fe)2 / fe]

En donde fo = es la frecuencia de los eventos observados en los datos muestrales fe = es la frecuencia de los eventos esperados si la hiptesis nula es correcta K = es el numero de categoras o clases

La prueba tiene K-1 grados de libertad.

El numerador mide la diferencia entre las frecuencias de los eventos observados y las frecuencias de los eventos esperados al cuadrado. Cuando estas diferencias son grandes, haciendo que chi-cuadrado se incremente, debera rechazarse la hiptesis nula.

Ejemplo

El director de mercadeo de una empresa tiene la responsabilidad de controlar el nivel de existencias para cuatro tipos de botes vendidos por su firma . En el pasado ha ordenado nuevos botes bajo la premisa de que los cuatro tipos de botes son igualmente populares y la demanda de cada uno es la misma. Sin embargo, recientemente las existencias se han vuelto mas difciles de controlar y el director considera que debera probar su hiptesis respecto a una demanda uniforme. Sus hiptesis son: Ho: La demanda es uniforme para los cuatro tipos de botes Ha: La demanda no es uniforme para los cuatro tipos de botes Se selecciona una muestra de n=48 botes vendidos durante los ltimos meses.
Tipo de bote Pirates`revenge Ventas observadas 15 Ventas esperadas 12

Jolly roger Bluebieards treasure


Ahab`s quest

11 10
12 48

12 12
12 48

Considere un nivel de significancia del 5%.

Se calcula chi-cuadrado c2= (15-12)2 /12+ (11-12)2/12 + (10-12)2/12 + (12-12)2/12=1.17 K-1= 3 grados de libertad, con estos datos obtenemos chi-cuadrado de tablas c2=7.815

Graficando se tiene:
F(c2)

0.05
Zona de no rechazo Zona de rechazo

1.17

7.815

c2

Estadstica no paramtrica Se encarga de obtener inferencias en poblaciones donde los parmetros no son conocidos, y/o no se sabe el comportamiento que presenta la distribucin. La inferencia consiste en plantear hiptesis con respecto a la medida de tendencia central (la mediana Md). La ventaja es la simplicidad en el calculo de las misma,

Prueba de Signo
Se aplica a una o dos muestra. Se aplica cuando no se puede inferir o suponer acerca de la media poblacional. Se desconoce la desviacin estndar. Se llama as por el uso de signos + y -. Las puntuaciones individuales o pares de datos no necesariamente tienen que venir de la misma poblacin. Se plantean la hiptesis nula y la alterna Ho: Md0=Md Ha: Md0=Md

Md: es el valor de la mediana poblacional conocida o supuesta Md0 :es el valor de la mediana hipottica, igual o diferente de la mediana poblacional conocida.

Pasos: 1. Asignar un signo + a las puntuaciones que se encuentra por encima de la mediana hipottica. 2. Asignar un signo - a las puntuaciones que se encuentren por debajo de la mediana hipottica. 3. Si el valor de la puntuacin es igual al de la mediana hipottica se coloca un cero, y este valor se elimina del tamao de la muestra. 4. Como existe la misma probabilidad de que se presente un signo + o un signo - y los ensayos son independientes, se utiliza la distribucin de probabilidad binomial para decidir si se acepta o se rechaza la hiptesis nula. Para aplicar la distribucin de probabilidad binomial:
La probabilidad de xito y fracaso (p y q) son iguales, es decir, 0.5. El nmero de ensayos (n) es igual al tamao de la muestra disminuida por las puntuaciones que fueron igual a cero Distribucin de probabilidad binomial

P(x)=(nCx)( px )( q n-x)

H0 se acepta si:
P(x)

H0 se rechaza si P(x)<
Ejemplo 1 La siguiente tabla indica la distribucin de una muestra aleatoria acerca del contenido neto en gramos de 15 botes de cera para automvil.
198 204.6 199.6 201 199.4 192.4 198.5 205 206.6 194.8 200.8 197.8 196.6 196 203.2

Con la prueba del signo probar la hiptesis nula Md=196 gramos contra la hiptesis alterna de Md>196 gramos, con un nivel de significancia =0.01
198 204.6 199.6 201 199.4 192.4 198.5 205 206.6 194.8 200.8 197.8 196.6 196 203.2

Aplicacin de la distribucin de probabilidad binomial:


Datos: Se elimina el valor que result igual a Md; n=15-1=14 n=14 p=0.5 q=0.5 El signo + es el que aparece mayor nmero de veces:12 P(x)=12,13,14 P(12)=(14C12) (0.512)(0.52)=0.0056 P(13)=(14C13)(0.513)(0.51)=0.00085 P(14)=(14C14)(0.514)(0.50)=0.000061

P(12,13,14)=0.006511
Como P(0.006511)<0.01 se rechaza la hiptesis nula, por lo que se acepta Md>196

Prueba del signo para dos muestras Se utiliza para establecer diferencias entre dos tratamientos, o determinar si uno es mejor que otro. Se plantea la hiptesis: Ho: Md1=Md2 Ha: Md1=Md2

Las comparaciones se hacen en relacin con los datos de la muestra 1 (x1) Pasos:

1. Si x1 es mayor a x2 se coloca un signo + 2. Si x1 es menor a x2 se coloca un signo 3. Si los valores x1 y x2 son iguales, se coloca un cero y ese par de puntuaciones se desaparece del tamao de la muestra. 4. Se utiliza la distribucin de probabilidad binomial
H0 se acepta si: 2P(x) H0 se rechaza si 2P(x)<

Ejemplo: La siguiente tabla se refiere a los defectos en las unidades producidas por 10 trabadores, empleando un sistema antiguo de produccin y un sistema de produccin innovador. Utilizando una prueba del signo para dos muestras y un nivel de significancia =0.05 probar H0: Md1=Md2 contra H1: Md1 > Md2 Trab. Ant. Nvo. 1 4.5 3.6 2 7.3 6.0 3 4.6 4.4 4 12.4 11.9 5 3.3 3.5 6 5.7 5.1 7 8.3 7.7 8 3.4 2.9 9 2.6 2.4 10 1.7 1.1

SOLUCIN
.

x1 x2

4.5 3.6

7.3 6.0

4.6 4.4

12.4 11.9

3.3 3.5

5.7 5.1

8.3 7.7

3.4 2.9

2.6 2.4

1.7 1.1

x1-x2

Datos: n=10 p=0.5 q=0.5

P(x)=9,10 P(9)=(10C x9) (0.59) (0.51)= 0.0098 P(10)=(10C10) (O.510) (0.50)= 0.0010

2[P(9,10)]= 2( 0.0108)= 0.0216


Como P(0.0216)<0.05 se rechaza H0: por lo tanto se acepta que el
nmero de defectos en las unidades producidas es menor con el sistema nuevo.

PRUEBA H DE KRUSKAL - WALLIS En la prueba de Kruskal Wallis las muestras son independientes, es decir, los grupos, tratamientos o muestras no estn relacionados entre s. La prueba H se puede aplicar a tres o ms muestras ; es la prueba del anlisis de varianza no paramtrico, que nos permite decidir si k muestras independientes vienen de poblaciones distintas. El tamao de las muestras puede ser distinto o igual. Pasos: 1. La hiptesis nula, H0, establece que las muestras proceden de la misma poblacin, o de poblaciones con medias iguales. H0: m1=m2=m3=.=mn. 2. La hiptesis alterna H1, las diferencias entre las muestras se debe a que no proceden de la misma poblacin o de poblaciones con medias iguales. H1:m1m2m3.mn 3. Considerando todas las muestras como un solo grupo, se asigna el rango al lado de cada una de las puntuaciones, comenzando con un valor de 1 para la ms pequea. 4. Sealar con un asterisco, a rangos empatados. 5. Obtener la sumatoria de los rangos correspondientes a cada muestra. Utilizar las siguientes frmulas y decidir si se acepta o rechaza la hiptesis nula.

Con esta frmula obtenemos la variacin entre los tratamientos.


j

H=

12 N(N+1)

Ri i=1 ni

--3(N+1)

Donde: N=es el nmero total de observaciones. Ri=suma del rango de la muestra i ni=nmero de observaciones de la muestra i El valor que se obtiene de H es contrastado con el valor de X2a,gl (ji-cuadrado) grado de libertad gl=k-1; donde k representa el nmero de tratamientos o muestras. Si existen rangos empatados: El valor que se obtiene de HC es contrastado con el valor de X2a,gl (ji-cuadrado)

FRMULA 2

HC=
j

H.

(t3i - ti) . 1 -i=1 3 (N -N)

En donde:

ti= nmero de rangos empatados en la muestra i


N=nmero total de observaciones H=resultado de la frmula 1 Si H O HC X2 a, gl se acepta H0 si H o HC > X2 a, gl se rechaza H0

Se tomaron muestras del precio de las acciones de 4 de las empresas ms importantes del pas. Los precios estn cotizados en dlares. Utilizando la prueba de Kruskal-Wallis y un nivel de significancia de 5%, probar que estas pruebas proceden de poblaciones con medianas idnticas.
A 1.19 1.05 1.14 1.25 1.29 Rango A B 1.08 1.23 1.26 1.10 1.18 1.14 Rango B C 0.98 1.19 1.08 0.93 1.23 1.18 Rango C D 1.12 1.14 1.31 1.12 1.19 Rango D

SOLUCIN

A 1.19 1.05 1.14 1.25 1.29

Rango A 15* 3 10* 19 21

B 1.08 1.23 1.26 1.10 1.18 1.14

Rango B 4.5* 17.5* 20 6 12.5* 10*

C 0.98 1.19 1.08 0.93 1.23 1.18

Rango C 2 15* 4.5* 1 16.5* 12.5*

D 1.12 1.14 1.31 1.12 1.19

Rango D 7.5* 10* 22 7.5* 15*

=68
Datos: RA=68 RB=70.5 RC=51.5 RD=62 N=22 k =4

=70.5

=51.1

=62

nA =5 tA =2 nB =6 tA =4 nc =6 tA =4 nD =5 tA =4 gl =k-1=4-1=3

H=

12 . 22(22+1)

682 + 70.52 + 51.12 + 622 5 6 6 5

-3(22+1)=1.2929

Como existen rangos empatados se calcula HC 1.2929 H= (23-2)+(43-4)+(43-4)+(43-4) 1(223-22) . =1.3159

HC < X2 0.05,3 se acepta H0 1.3159 < 7.81 se acepta HO, a un nivel e significancia de 5% los precios de las acciones de las 4 empresas tienen medianas idnticas. Es decir, no existe variacin en el precio mediano de las acciones de las 4 empresas.

TABLA DE ANOVA DOS VAS


VARIACIN GRADOS DE LIBERTAD SUMA DE CUADRADO S VALORES MEDIOS FC

VEB/ b-1
VARIACIN ENTRE LOS TRATAMIENTOS VARIACIN DENTRO DE LOS TRATAMIENTOS b-1= VEB= VEB/ b-1=
SCDDT n-b-C+1

n-b-c+1=

SCDDT=

SCDDT N-b-C+1

SUMA

n-C

SCD=

TABLA DE ANOVA UNA VA


VARIACIN GRADOS DE LIBERTAD SUMA DE CUADRADOS VALORES MEDIOS FC VET/ C-1 VARIACIN ENTRE LOS TRATAMIENTOS VARIACIN DENTRO DE LOS TRATAMIENTOS C-1= VET= VET/ C-1=
SCDDT n1+n2+n3-C

n1+n2+n3-c=

SCDDT=

SCDDT n1+n2+n3-C

SUMA

n-1

SCD=

Anda mungkin juga menyukai