2019-V
Índice
I. INTRODUCCIÓN ............................................................................................................................ 3
V. CONCLUSIONES ............................................................................................................................ 7
Las pruebas paramétricas son una herramienta estadística que se utiliza para el análisis de
los factores de la población. Esta muestra debe cumplir ciertos requisitos como el tamaño, ya
que mientras más grande sea, más exacto será el cálculo.
Las pruebas estadísticas paramétricas son aquellas que se utilizan para analizar
datos numéricos (escalas de intervalos o razones).
Busca estimar los parámetros de una población en base a una muestra.
Las pruebas paramétricas son una herramienta útil para múltiples situaciones, cálculo e
interpretaciones.
La gráfica de la distribución normal tiene la forma de una campana, por este motivo también
es conocida como la campana de Gauss. Sus características son las siguientes:
Es una distribución simétrica.
Es asintótica, es decir sus extremos nunca tocan el eje horizontal, cuyos valores
tienden a infinito.
En el centro de la curva se encuentran la media, la mediana y la moda.
El área total bajo la curva representa el 100% de los casos.
Los elementos centrales del modelo son la media y la varianza.
Esta distribución es un modelo matemático que permite determinar probabilidades de
ocurrencia para distintos valores de la variable. Así, para determinar la probabilidad de
encontrar un valor de la variable que sea igual o inferior a un cierto valor xi, conociendo el
promedio y la varianza de un conjunto de datos, se debe reemplazar estos valores (media,
varianza y xi) en la fórmula matemática del modelo. El cálculo resulta bastante complejo, pero,
afortunadamente, existen tablas estandarizadas que permiten eludir este procedimiento. En el
gráfico, el área sombreada corresponde a la probabilidad de encontrar un valor de la variable
que sea igual o inferior a un valor dado. Esa probabilidad es la que aprenderemos a
determinar usando una tabla estandarizada.
La tabla de la distribución normal presenta los valores de probabilidad para una variable
estándar Z, con media igual a 0 y varianza igual a 1. Para usar la tabla, siempre debemo
s estandarizar la variable por medio de la expresión:
𝑥−𝜇
𝑍=
𝜎
∑(𝑥𝑖 − 𝑥̅ )
𝜎2 =
𝑛−1
Se basan en supuestos teóricos válidos, así las mediciones de las observaciones, tienen
procedimientos de gran potencia-eficiencia para evitar error del tipo I
B. Prueba T de Student-Welch
El test de Welch es uno de los test más utilizados en estadística para utilizada para com
parar las observaciones de 2 grupos. Realizar un test de Welch en R para comparar dos
muestras normales con varianzas diferentes es extraordinariamente sencillo a partir del
uso de la interfaz gráfica R Commander.
Donde:
El ANOVA, pues, es una prueba semejante a las pruebas “t” y “z” en cuanto a la práctica, pero
la comparación entre grupos no se basa en las diferencias entre las medias, sino en la
varianza de la variable numérica “y” o variable dependiente en cada grupo (nivel) de la
variable categórica “x” o variable independiente.
Si las diferencias entre las varianzas de cada grupo (fuente de variación inter) son mayores
que las intragrupales (fuente de variación intra), seguramente se reportarán diferencias
estadísticamente significativas entre los grupos que no son debidas al azar.
Así, mientras en las pruebas de significación para dos grupos obtenemos valores empíricos “t”
y “z” en el ANOVA la cifra estadística obtenida se denomina razón F de Snedecor. Al ser F el
resultado de dividir la media cuadrática inter entre la media cuadrática intra cuanto mayor sea
el dividendo mayor, por tanto, será el cociente y mayor, por ende, la probabilidad de que
existan diferencias estadísticamente significativas.
Cabe preguntarse entonces, porque cuando existen más de dos grupos en vez de utilizar el
ANOVA, aparentemente no sería más lógico e intuitivo comparar todas las posibles
combinaciones tomadas de dos en dos. Supongamos, en este sentido, que un educador está
interesado en denotar la posible superioridad de un programa de técnicas de estudio sobre
otros dos programas. Para ello implementa cada programa en un grupo diferente. En este
caso la variable independiente sería programa de técnicas de estudio con tres niveles: A, B y
C, mientras la dependiente el rendimiento escolar en Historia.
Donde:
1. Entre las ciudades de Estados Unidos con una población de más de 250,000 habitantes, la
media del tiempo de viaje de ida al trabajo es de 24.3 minutos. El tiempo de viaje más
largo pertenece a la ciudad de Nueva York, donde el tiempo medio es de 38.3 minutos.
Suponga que la distribución de los tiempos de viaje en la ciudad de Nueva York tiene una
distribución de probabilidad normal y la desviación estándar es de 7.5 minutos.
z=
35 – 38.3
=
−3.3
= −0.44 = 0.3300
7.5 7.5
30 – 38.3 − 8.3
z= 7.5
= 7.5
= −1.11 =
0.1335
30 – 38.3 −8.3
z= 7.5
= 7.5
= −1.11 =
0.1335
Planteamiento de Hipótesis.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Cálculo de ln.
Para este cálculo utilizamos una tabla logarítmica de base 10 (logaritmos comunes)
N = 28
K=2
(n - 1) = 26
2 (n - 1) = 1396.33
ln2 (n - 1) = 103
Entonces tenemos ya los cálculos requeridos para poder aplicar la prueba X2 Bartlett.
gl = K - 1 = 2 -1 = 1
Decisión.
Interpretación.
Existe homogeneidad de las varianzas, es decir, aún cuando los valores de error
estadístico difieren entre sí, el procedimiento señala que es un efecto aleatorio y existe
gran probabilidad de que la fuente o fuentes de variación sean las mismas.
3. La USPHARMER construye grandes cosechadoras, para que una cosechadora
este debidamente balanceada cuando opera, en uno de sus costados se instala
ra una palanca de 25lb.La máquina que produce estas placas se haya ajustada
para dar placas que promedian25lb. La distribución de palancas producidas es
normal, pero el supervisor del taller está preocupado porque las maquinas está f
uera de ajuste y están produciendo placas que no promedian 25lb.Para probar p
reocupación a lazar se seleccionaran 20 de las placas producidas el día anterior
y las pesan. En la siguiente tabla se muestran los pesos obtenidos:
510.6
𝑥̅ = = 25.53
20
S2 = (22.6 – 25)2 + (22.2 – 25 )2 + (23.2 – 25)2 + (27.4 –
25)2 + (24.5 – 25 )2 +( 27 – 25)2 +(26.2 – 25)2 + ( 25.8 – 25)2 +( 26.6 – 25)2 +
(25.3 – 25)2 +(30.4 – 25)2 + (28.1 – 25)2 +(23.1 – 25)2 + (28.6 – 25)2 + (26.9
– 25)2 + (24.2 – 25)2 + (23.5 – 25)2 + (24.9 – 25)2 + (26.1 – 25)2 + (23.6 –
25)2
19
96.6
𝑆2 =
19
𝑆 2 = √5.08
𝑆 = 2.25
𝑋𝑖 − 𝑥̅
𝑆2 = = 2.25
𝑛−1
2.25
𝑆𝑋 = = 0.50
√20
𝑥− 𝑥̅ 25.53−25
𝑡= = = 1.06
𝑆𝑥 0.5
Gráfica de distribución
T. df=25
0,4
0,3
Densidad
0,2
0,1
0,025 0,025
0,0
-2,06 0 2,06
X
4. Una muestra aleatoria de 10 focos del ciclo medio de vida es de 4600 hrs con una
desviación estándar muestral de 250hrs.
El ciclo medio de vida y la desviación estándar de una muestra del tamaño de 8 focos de otra
marca son 4000 hrs y desviación estándar muestral 200hrs. Se supone que el ciclo de vida de
ambas marcas tiene una distribución normal.
Construya el intervalo de confianza del 90% para estimar la diferencia entre el ciclo medio de
vida entre las dos marcas de focos.
𝑛1 = 10
𝑥̅ = 4600hrs
S= 250hrs
𝑛2 = 8
𝑥̅ = 4000 ℎ𝑟𝑠
𝑆 = 200ℎ𝑟𝑠
Gráfica de distribución
T. df=16
0,4
0,3
Densidad
0,2
0,1
0,025 0,025
0,0
-2,12 0 2,12
X
𝑔𝑙 = 𝑛1 + 𝑛2 − 2
gl= 10 + 8 – 2 = 16
1 - .90= .10
0.10
= 0.05
2
𝐼𝑐𝛼 = (𝑥̅ 1 − 𝑥̅ 2) ± 𝑡𝜎𝑥̅ 1 − 𝑥̅ 2
2
(9)2502 + (7)2002
𝜎 =
10 + 8 − 2
(9)62500 + (7)40000
𝜎2 =
16
562500 + 280000
𝜎2 =
16
842500
𝜎2 =
16
Gráfica de distribución
T. df=16
0,4
0,3
Densidad
0,2
0,1
0,025 0,025
0,0
-2,12 0 2,12
X
𝜎 2 = 52656.25 = 229.469
𝑆12 𝑆22
𝑆𝑥̅1 − 𝑥̅2 = √ +
𝑛1 𝑛2
52656 52656
𝑆𝑥̅1 − 𝑥̅2 = √ +
10 8
H0: p ≥ 0,35
frente a la alternative
27
𝑝= = 0.26
105
𝑞 = 1 − 𝑝 = 0.74
Gráficamente tenemos:
Para los datos del ejemplo se tiene que los tamaños muestrales son: n1 = 7 y
n2 = 10. Las medias y las desviaciones típicas para los dos grupos son:
donde x1i indica los valores de la variable Rta para el grupo 1 y x2i
indica los valores de la variable Rta para el grupo 2.
Que bajo la hipótesis nula sigue una distribución t-Student con grados de
libertad gl = (n1 - 1) + (n2 – 1) = (n1 + n2 – 2) = 15, que tiene asociado un
p-valor de 0.9412.
Planteamiento de hipótesis
𝐻0 : 𝑥𝑚1 = 𝑥𝑚2 = 𝑥𝑚3 𝑜 𝑡𝑎𝑚𝑏𝑖𝑒𝑛 𝜎 2 𝑀 = 0
𝐻0 : 𝑥𝑚1 ≠ 𝑥𝑚2 ≠ 𝑥𝑚3 𝑜 𝑡𝑎𝑚𝑏𝑖𝑒𝑛 𝜎 2 𝑀 ≠ 0
Las características de la situación planteada (comparación de tres grupos con una sola
variable independiente) aconsejan la utilización del ANOVA, aunque su uso esté
condicionado al cumplimiento de determinados supuestos paramétricos.
(83)2
𝐶= = 459.266
15
- Suma de cuadrados total
SCt = 525 – 459,266 = 65,73
- Suma de cuadrados entre
SCe = [(17)²/5 + (25)²/5 + (41)²/5] - 459,266 = 59,73
- Suma de cuadrados intra
SCi = 65,73 – 59,73 = 6
- Valor de la razón F
F = 29,85 / 0,5 = 59,73
- Asociación de la magnitud del ANOVA
Tratar de determinar la varianza explicada por el modelo, es decir, en qué
porcentaje el rendimiento en inglés está determinado por el uso de una u otra
metodología de enseñanza se utiliza el coeficiente de asociación η y su
correlato para determinar el porcentaje de varianza η².
𝑆𝐶𝑒 59.73
𝑛 = √𝑆𝐶𝑡 =√65.73 = 0.95
𝑆𝐶𝑒 59.73
𝑛2 = =
𝑆𝐶𝑡 65.73
= 0.9 ∗ 100 = 90%
Interpretación y decisión
Aunque todos los valores calculados son importantes, el valor decisivo para interpretar
un ANOVA desarrollado manualmente es la razón F. Dicho valor es el estadístico
empírico o teórico que hay que comparar con una razón F crítica o tabular. Esta
segunda razón viene determinada por los grados de libertad entre e intra y el valor alf a
que se asuma. Los grados de libertad entre e intra actúan como numerador y
denominador respectivamente, de tal forma que el proceso de búsqueda y
comparación entre razones F es, para el caso que nos ocupa, el siguiente:
Conclusión
Evidentemente Femp. > Fcrít., motivo por el cual se acepta H1; ello implica que se
reportan diferencias estadísticamente significativas entre los tres tipos de
metodologías de enseñanza del inglés. En este sentido, la observación de los
resultados obtenidos a nivel de medias resulta elocuente, ya que aquellos alumnos
instruidos con la metodología 3 (M3) han alcanzado un rendimiento académico en
ingles muy superior a los instruidos mediante las metodologías M2 Y M3.
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos obtendrán
el mismo grado de dulzor? O por el contrario ¿Hay algún método superior a los
demás?
SOLUCION
Comenzamos calculando los totales y los cuadrados de los totales divididos por el
número de observaciones:
¿Qué conclusiones pueden sacarse acerca de las cuatro texturas de las galletas,
con un nivel de significación del 5%?
SOLUCION
Prueba de hipótesis
HO: Las texturas de las galletas son las mismas
Ha: Al menos una de las texturas es distintas
Comenzamos calculando los totales y los cuadrados de los totales divididos por el
número de observaciones:
Conclusión
T1 T2 T3 T4
1 3 3 4 4 14
2 2 4 4 4 14
3 4 4 2 3 13
4 2 1 4 4 11
5 4 1 2 3 10
6 2 4 1 4 11
7 3 2 4 4 13
8 1 2 3 4 10
9 2 4 3 3 12
10 3 2 1 4 10
Total 26 27 28 37 118
Solución:
Prueba de hipótesis
HO: Los tratamientos ensayados confieren el mismo sabor a las sopas
Ha: Al menos uno de ellos confiere un mejor sabor a las sopas
1182
𝐹𝐶 = = 348.10
4𝑥10
SCtratamientos:
SCJueces:
142 + 142 + 132 + 112 + 102 + 112 + 132 + 102 + 122 + 102
− 348.10 = 5.90
4
SCTotales:
32 + 22 + ⋯ +42 +32 +42 − 348.10 = 45.90
CONCLUSIÓN:
FC < FTab por lo tanto se acepta la HO, esto significa que:
Existe suficiente evidencia estadística, a un nivel de significancia del 5% para afirmar
que los tratamientos ensayados al Mandi confieren el mismo sabor a las sopas, por lo
que se recomienda optar por el tratamiento T 1 por emplear menos sal y menor tiempo
de ahumado.
12. Se presentaron 5 muestras de galletas de chocolate usando diferentes niveles
de adicion de saborizantes, las muestras fueron presentadas a 6 jueces para
que realicen el ordenamiento de las muestras de menor a mayor intensidad. Las
respuestas de los jueces fueron:
JUECES JUECES
T1 T2 T3 T4 T5
1 3 2 5 4 1
2 2 3 4 5 1
3 3 4 5 2 1
4 1 2 5 4 3
5 3 2 4 5 1
6 3 1 5 4 2
SOLUCIÓN:
I. Prueba de hipótesis :
02
𝐹𝐶 = =0
5+6
02 + 02 + 02 + 02 + 02
𝑆𝐶𝑗𝑢𝑒𝑐𝑒𝑠 = −0=0
5
Existe evidencia estadística a un α=5% para afirmar que el sabor de una de las
galletas es diferente.
Prueba tuckey:
TRATAMIENTOS T1 T2 T3 T4 T5
MEDIAS 0.94 0.553 -0.27 -0.36 -0.85
ERROR ESTANDAR
0.318 0.5
𝐸=( ) = 0.2302
6
D.M.S= E (RES)
D.M.S = 0.976
Comparando las diferencias entre las medias, las que sean mayores se consideran
significativas:
T5 T4 T3 T2 T1
T5 X X
T4 X x
T3 x
T2
T1
Silvente, M. J. (2011). Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA
en SPSS. Caso práctico. REIRE, 18.