Anda di halaman 1dari 25

TRABAJO FINAL

GUÍA PARA TRABAJO AUTÓNOMO FINAL

Nombre: Rafael Rodríguez Morán Paralelo: 5


OBJETIVO ESPECÍFICO

Aplicar los conceptos básicos aprendidos .

1. Demuestre que:

[Sugerencia: Observe que

, puesto que

2. Demuestre que [Sugerencia: El resultado es consecuencia del Teorema

mostrado más abajo y del hecho de que ]

Teorema

Sea . Entonces, la estadística


3. Verifique que

4. El estimador de máxima verosimilitud de la media de una distribución normal es la media de la

muestra, | . Considere el modelo . Demuestre que el estimador de mínimos

cuadrados de también es . [Sugerencia: Minimice con respecto a ]


De la última expresión, se sabe que el segundo miembro es igual a cero, por lo tanto, se tiene que

Dividimos para n

5. Considere el par de ecuaciones simultáneas lineales:

Deduzca las fórmulas para las estimaciones de mínimos cuadrados de y


6. Como parte de un estudio sobre la rapidez de combustión de grafito artificial en un flujo de aire
húmedo, se llevó a cabo un experimento con miras a investigar la difusividad del oxígeno a
través de una mezcla de vapor de agua ( Combustion and Flame, vol. 50, 1983). Se prepararon
muestras de mezclas de nitrógeno y oxígeno con una fracción molar de aguar de 0.017 a nueve
temperaturas distintas, y se midió la difusividad del oxígeno en cada una. Los datos se producen
en la siguiente tabla.

Temperatura (x) Difusividad de oxígeno (y)


1000 1.69
1100 1.99
1200 2.31
1300 2.65
1400 3.01
1500 3.39
1600 3.79
1700 4.21
1800 4.64
a. Grafique los puntos de datos en un diagrama de dispersión
b. Ajuste un modelo lineal simple que relacione la difusividad media del oxígeno, , con la

temperatura, . Interprete las estimaciones de los parámetros del modelo.

c. Calcule y

d. Calcule
S=0.06

e. ¿Los datos proporcionan pruebas suficientes que indiquen que la difusividad del oxígeno
tiene a aumentar cuando aumenta la temperatura? Pruebe con

7. Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la corrosión.
En Corrosion Science (Septiembre de 1993) se informó de la resistividad de una aleación amorfa
de hierro, boro y silicio después de la cristalización. Se recocieron cinco especímenes de la
aleación a 700ºC, cada uno durante un intervalo de tiempo distinto. Después se midió el
potencial de pasivación-una medida de la resistividad de la aleación cristalizada- para cada
espécimen. Los datos experimentales son los siguientes.

Tiempo de recocido x , minutos Potencial de pasivación y,


mV
10 -408
20 -400
45 -392
90 -379
120 -385

a. Construya un diagrama de dispersión para los datos.

b. Suponiendo que la mejor forma de describir la relación entre las variables es con una línea
recta, utilice el método de mínimos cuadrados para estimar la ordenada al origen y la
pendiente de la línea.

c. Trace la línea de mínimos cuadrados sobre el diagrama de dispersión.


d. Según la línea de mínimos cuadrados, ¿Cuál es el potencial de pasivación esperado, y,
cuando el tiempo de recocido es de x = 30minutos?

= -33,96

8. Explique por qué

Tiene una distribución normal con media 0 y varianza 1

9. Se puede demostrar que las estimaciones de mínimos cuadrados, y , son independientes

(en un sentido probabilístico) de . Utilice este hecho, junto al teorema presentado en el


ejercicio 2 y el resultado del ejercicio 8, para demostrar que:
Sea . Entonces, la estadística

Tiene una distribución ji cuadrada con grados de libertad.

10. La Comisión Federal de Comunicaciones (FCC) de Estados Unidos especifica que las
emisiones electromagnéticas radiadas por dispositivos digitales se deben medir en un sitio de
prueba de campo abierto. A fin de verificar la aceptabilidad de n sitio de prueba es preciso
evaluar la atenuación del sitio (es decir la perdida de transmisión desde la entrada de un dipolo
de media honda hasta la salida de otro cuando ambos dipolos se colocan sobre el plano de
tierra). Un estudio realizado en un sitio de prueba en Fort Collins, Colorado, produjo los
siguientes datos de atenuación del sitio (en decibeles) y frecuencia de transmisión (en MHz) para
dipolos a una distancia de 3 metros.

Frecuencia de Transmisión x, Atenuación del sitio y,


MHz dBL

50 11.5
100 15.8
200 18.2
300 22.6
400 26.2
500 27.1
600 29.5
700 30.7
800 31.3
900 32.6
1000 34.9
a. Elabore un diagrama de dispersión para os datos. ¿Es evidente una relación lineal entre x y
y?
b. Encuentre la línea de mínimos cuadrados que relaciona la atenuación del sitio y con la
frecuencia de transmisión.
c. Trace la línea de mínimos cuadrados sobre el diagrama de dispersión para verificar sus
cálculos.
d. Interprete los valores de y
e. Establezca un intervalo de predicción de 90% para la atenuación de sitio de dipolos con un
frecuencia de transmisión de 350 MHz
f. Establezca un intervalo de predicción de 90% para la atenuación de sitio media de todos los
conjuntos de dipolos con un frecuencia de transmisión de 350 MHz
g. Compare los tamaños de los intervalos de los inicios e y f y comente al respecto
h. ¿Se podría reducir el tamaño de cualquiera de los intervalos, o de ambos, aumentando el
tamaño de la muestra? Explique

11. En el estado de Nueva York, la roya común del maíz es una enfermedad importante del elote
dulce. Aunque los fungicidas son efectivos para controlar la roya del maíz, el momento de la
aplicación es crucial. Los investigadores han establecido un umbral de acción para iniciar las
aplicaciones de fungicidas con base en una ecuación de regresión que relaciona la incidencia de
la roya del maíz con la severidad de la enfermedad ( Phytopathology, vol 80, 1990). En cierto
campo, se recabaron datos de más de 100 plantas de híbrido de elote dulce llamado Jubilee.
Para cada planta, se midió la incidencia como el porcentaje de hojas infectadas (x), y la
severidad, como el logaritmo (base 10) del número medio de infecciones por hoja (y). Un análisis
de regresión lineal simple de los datos produjo los siguientes resultados:

a. Interprete el valor de

b. Interprete el valor de

c. Interprete el valor de

d. Calcule el valor de e interprete su resultado

e. Utilice el resultado del inciso d para probar la utilidad del modelo. Use . (Suponga

12. Verifique que:

a.

b.
a)

b)

13. Explique por qué el intervalo de confianza para el valor medio de con un valor específico de .

Digamos , se hace más ancho conforme se aleja de . ¿Qué implicaciones tiene este

fenómeno para la estimación y la predicción?


Evidentemente existe un factor que influye en la amplitud de un intervalo pero que no es
susceptible de ser modificado por el investigador, este factor es la varianza, a mayor varianza
tendremos más variabilidad relativa por lo que el intervalo será mayor (más amplio).

El investigador puede modificar el tamaño muestral, a mayor tamaño muestral el intervalo se


hace más preciso y por tanto menos amplio. Es lógico dado que a mayor información (muestra)
más precisión en la estimación.

El investigador puede, también, modificar el nivel de confianza, a mayor nivel de confianza,


mayor amplitud del intervalo y viceversa; lógico si pensamos que para "confiar" más en lo que
hemos estimado hemos de ser necesariamente menos preciso luego el intervalo(amplitud)
aumenta.

14. Suponga que desea predecir algún valor futuro de cuando empleando la ecuación de

predicción + . El error de predicción será la diferencia entre el valor real de y el

valor predicho, , es decir,

a. Explique por qué el error de predicción tiene una distribución normal.

b. Calcule el valor esperado y la varianza del error de predicción.


15. Se ha utilizado con éxito un sistema automatizado para calificar grandes cantidades de
programas para computadora escritos por estudiantes de la McMaster University de Ontario,
Canadá, llamado AUTOMARK, el que toma en cuenta tanto de corrección como el estilo de
programación al calificar las tareas de los estudiantes. A fin de evaluar la efectividad del mismo
automatizado, se usó AUTOMARK para calificar las tareas, escritas en FORTRAN77, de un
grupo de 33 estudiantes. Estas calificaciones se compararon después con las calificaciones
asignadas por el profesor. Los resultados se muestra en la tabla.

Calificación Calificación del Calificación Calificación del


AUTOMARK (x) Profesor (y) AUTOMARK (x) Profesor (y)
12.2 10 17.8 17
10.6 11 18.0 17
15.1 12 18.2 17
16.2 12 18.4 17
16.6 12 18.6 17
16.6 13 19.0 17
17.2 14 19.3 17
17.6 14 19.5 17
18.2 14 19.7 17
16.5 15 18.6 18
17.2 15 19.0 18
18.2 15 19.2 18
15.1 16 10.4 18
17.2 16 19.6 18
17.5 16 20.1 18
18.6 16 19.2 19
18.8 16

a. Obtenga la ecuación de predicción de mínimos cuadrados para el modelo de línea recta que
relaciona la calificación del profesor con la calificación de AUTOMARK

La ecuación de regresión es:

Y = 11,39 + 0,2516 X

Modelo:
R-cuad.
S R-cuad. (ajustado)

2,23932 9,27% 6,34%

Anova:

Fuente GL SC MC F P

Regresión 1 15,883 15,8826 3,17 0,085


Error 31 155,451 5,0145
Total 32 171,333

Gráficas de residuos para CALIFICACION PROFESOR(Y)


Gráfica de probabilidad normal vs. ajustes
99 5,0

90 2,5
Porcentaje

Residuo

50 0,0

10 -2,5

1 -5,0
-5,0 -2,5 0,0 2,5 5,0 14 15 16
Residuo Valor ajustado

Histograma vs. orden


5,0

8
2,5
Frecuencia

6
Residuo

0,0
4

-2,5
2

0 -5,0
-4 -2 0 2 4 1 5 10 15 20 25 30
Residuo Orden de observación

b. ¿Hay pruebas suficientes que indiquen que el modelo resulta útil para predecir Y? Pruebe con
Gráfica de probabilidad de RESID2
Normal
99
Media -5,38290E-16
Desv.Est. 2,204
N 33
95 KS 0,115
Valor p >0,150
90

80

70
Porcentaje

60
50
40
30

20

10

1
-5,0 -2,5 0,0 2,5 5,0
RESID2

Realizando nuestro análisis:

Respecto al programa minitab 18:

KS= =0,115

Respecto a la tabla K-S

Con un nivel de significancia=α=10% y n=33

KST= = 0,20771

Analizando nuestro Dn y Dα

Dn < Dα

0,115< 0,20771

No Rechazo

CONCLUIMOS: Hay pruebas suficientes que indiquen que el modelo resulta útil para predecir Y
16. “En el análisis de los sistemas de transporte urbanos es importante poder estimar el
tiempo de viaje esperado entre dos puntos.” Cook y Russell ( Transportation Research ,
junio de 1980) recolectaron datos sobre los tiempos y distancias de viaje entre dos
puntos de la ciudad de Tulsa para dos tipos de vehículos: camiones grandes de
compactación de desperdicios y automóviles de pasajeros. Se realizó un análisis de
regresión lineal simple de ambos conjuntos de datos (y=tiempo de viaje urbano en
minutos, x=distancia entre los puntos en millas) con los resultados que se muestran en
la tabla.

Automóviles de pasajeros Camiones

a. ¿Hay pruebas suficientes que indiquen que la distancia entre dos puntos tienen una relación
lineal con el tiempo de viaje urbano de automóviles de pasajeros entre esos puntos? Pruebe con

R2 es equivalente al cuadrado del coeficiente de Pearson el cual inica el grado de relación lineal
entre las variables estudiadas, entonces el coeficiente de Pearson para el tiempo y la distancia
recorrida por automóviles de pasajeros es: 0.82, al ser cercano a uno se deduce que la relación
el linealmente positiva.

b. ¿Hay pruebas suficientes que indiquen que la distancia entre dos puntos tienen una relación
lineal con el tiempo de viaje urbano de camiones entre esos puntos? Pruebe con
R2 es equivalente al cuadrado del coeficiente de Pearson el cual inica el grado de relación lineal
entre las variables estudiadas, entonces el coeficiente de Pearson para el tiempo y la distancia
recorrida por automóviles de pasajeros es: 0.87, al ser cercano a uno se deduce que la relación
el linealmente positiva.

c. Interprete el valor de para las dos ecuaciones de predicción.


El coeficiente determina la calidad del modelo para replicar los resultados, es decir para
extrapolar o interpolar, y la proporción de variación de los resultados que puede explicarse por el
modelo.

d. Estime el tiempo de viaje urbano medio para todos los automóviles de pasajeros que recorren
una distancia de 3 millas por las autopistas de Tulsa.

Reemplazando el tiempo es: 8.29 min


e. Prediga el tiempo de viaje urbano para un camión en particular que recorre una distancia de 5
millas por las autopistas de Tusla

Reemplazando el tiempo es: 21,15 min

f. Explique cómo se podría vincular una medida de confiabilidad a las inferencias hechas en los
incisos d y e.

Basado en el valor de r2 se puede determinar la proporción de variación de los


resultados que puede explicarse por el modelo.

17. A temperaturas cercanas al cero absoluto (273 grados Celsius bajo cero), el helio
adquiere características que desafían muchas leyes de la física convencional. Se
realizó un experimento con helio en forma sólida a diversas temperaturas cercanas al
cero absoluto. El helio sólido se coloca en un refrigerador de dilución junto con una
sustancia sólida impura y se registra la proporción (en peso) de la impureza que
atraviesa el helio sólido. (Este fenómeno de sólidos que pasan directamente a través
de sólidos se conoce como formación de túneles cuánticos), Los datos se presentan en
la tabla.

Proporción de impureza que atraviesa el Temperatura °C (x)


helio (y)

0.315 -262
0.202 -265
0.204 -256
0.620 -267
0.715 -270
0.935 -272
0.957 -272
0.906 -272
0.985 -273
0.987 -273
a. Construya un diagrama de dispersión para los datos.
b. Encuentra la línea de mínimos cuadrados para los datos y trácela sobre el diagrama de
dispersión

c. Defina en el contexto de este problema


Se define como la pendiente de la recta, en este caso es la variación de la Proporción de
impureza que atraviesa el helio con respecto a la variación de la temperatura en el mismo
intervalo.

d. Pruebe la hipótesis de que la temperatura no contribuye con información a predicción


de la proporción de impureza que atraviesa el helio cuando se utiliza un modelo lineal. Saque las
conclusiones apropiadas

Existe alta correlacion lineal negativa, sin embargo el valor de p es menor a 0.05, por
tanto no se puede asumir normalidad en el error calculado, esto hace que la
temperatura no contribuye con información a predicción de la proporción de impureza
que atraviesa el helio cuando se utiliza un modelo lineal aun 95% de confianza.

e. Calcule el coeficiente de correlación para los datos dados

f. Calcule el coeficiente de determinación para el modelo lineal que construye en el inciso b.


Interprete su resultado
g. Establezca un intervalo de predicción de 99% para la proporción de impureza que atraviesa el
helio cuando la temperatura se fija en -270°C

h. Estime la proporción media de impureza que atraviesa el helio cuando la temperatura se fija en
-270°C. Utilice un intervalo de confianza de 99%
De la ecuación de la recta se obtiene:
proporción media de impureza que atraviesa el helio: 14415.422

18. En silvicultura, el diámetro de un árbol a la altura del pecho (que se mide con mucha facilidad)
sirve para predecir la altura del árbol (medición muy difícil de realizar). Los silvicultores que
trabajan en el bosque boreal de la Columbia Británica realizaron una serie de ensayos de
espaciamiento con objeto de predecir las alturas de varias especies de árboles. Los datos de la
siguiente tabla son los diámetros a la altura del pecho (en centímetros) y las alturas (en metros)
de una muestra de 36 abetos blancos del norte.

Diámetro a la altura Altura en m (y) Diámetro a la altura Altura en m (y)


del pecho en cm (x) del pecho en cm (x)

18.9 20.0 16.6 18.8


15.5 16.8 15.5 16.9
19.4 20.2 13.7 16.3
20.0 20.0 27.5 21.4
29.8 20.2 20.3 19.2
19.8 18.0 22.9 19.8
20.3 17.8 14.1 18.5
20.0 19.2 10.1 12.1
22.0 22.3 5.8 8.0
23.6 18.9 20.7 17.4
14.8 13.3 17.8 18.4
22.7 20.6 11.4 17.3
18.5 19.0 14.4 16.6
21.5 19.2 13.4 12.9
14.8 16.1 17.8 17.5
17.7 19.9 20.7 19.4
21.0 20.4 13.3 15.5
15.9 17.6 22.9 19.2

a. Elabore un diagrama de dispersión con los datos

b. Suponiendo que la mejor forma de describir la relación entre las variables es con una
línea recta , utilice el método de mínimos cuadrados para estimar la ordenada al origen
y la pendiente de la línea

c. Trace la línea de mínimos cuadrados sobre el diagrama de dispersión


19. El electroencefalograma (EEG) es un dispositivo empleado para medir las ondas cerebrales. Los
neurólogos han observado que la frecuencia máxima de EEG en niños normales aumenta con la
edad. En un estudio en Science (vol. 215, 1982), se pidió a 287 niños normales con edades
entre 2 y 16 años sostener un peso de 65 gramos en la palma de su mano estirada durante un
tiempo breve pero no especificado. Los datos se agruparon según la edad de los niños y se
calculó la frecuencia máxima media para cada grupo de edades. Los datos aparecen en la
siguiente tabla.

Edad en años (x) Frecuencia máxima media de EEG en hertz


(y)
2 5.33
3 5.75
4 5.80
5 5.60
6 6.00
7 5.78
8 5.90
9 6.23
10 7.28
11 7.06
12 7.60
13 7.45
14 8.23
15 8.50
16 9.38

a. Elabore un diagrama de dispersión para los datos. Después de examinar el diagrama, ¿cree
usted que X y Y estén correlacionados? Si hay correlación, ¿es positiva o negativa?
b. Calcule el coeficiente de correlación de r e interprete su valor

Este valor expresa que no existe relacion lineal entre los datos.

20. La exposición pasiva al humo de tabaco en el ambiente se ha asociado a la supresión del


crecimiento y un incremento en la frecuencia de infecciones de las vías respiratorias en niños
normales. ¿Esta asociación es más pronunciada en niños que padecen fibrosis cística? Con el
fin de contestar esta pregunta, se estudiaron 43 niños (18 niñas y 25 niños) que asistieron a un
campamento de verano de dos semanas para pacientes con fibrosis cística. Entre las diversas
variables que se midieron estuvieron el percentil de peso del niño (y) y el número de cigarrillos
fumados por día en el hogar del niño (x).
a. Para las 18 niñas, el coeficiente de correlación entre X y Y se informó que era de -0.5. Interprete
este resultado
Existe correlación media negativa, es decir que si hubiera una recta seria inversamente
proporcional.
b. Refiérase al inciso a. El valor p para probar que la hipótesis nula donde p es igual a 0 vs la
hipótesis alterna donde p sea diferente de 0 se informó como p=0.03. Interprete este resultado
El valor de p debe ser mayor a 0.05 para que se cumpla en supuesto de normalidad ya que el p
calculado en este caso es: 0.03, se rechaza la hipótesis nula.
c. Para los 25 niños, el coeficiente de correlación entre Y y X se informó como r=-0.12. Interprete
este resultado.
No existe relación lineal o esta es muy baja para las variables, en este caso peso del niño y
número de cigarrillos fumados por día.
21. Se realizó un estudio para modelar el desempeño térmico de los tubos con aletas integrales
empleados en las industrias de refrigeración y de proceso (Journal of Heat Transfer, agosto de
1990). En el experimento se utilizaron 24 tubos con aletas integrales de fabricación especial, con
aletas rectangulares hechas de cobre. Se liberó vapor hacia abajo en cada tubo y se midió el
coeficiente de transferencia de calor del lado del vapor (con base en el área superficial exterior
del tubo). La variable dependiente en este estudio es la tasa de promoción de la transferencia de
calor Y, definida como el cociente entre el coeficiente del lado del vapor del tubo con aletas y el
coeficiente del lado del vapor de un tubo liso, evaluados a la misma temperatura. En teoría, la
transferencia calor está relacionada con el área de la parte superior del tubo que no está
“inundada” por la condensación del vapor. Los datos de la tabla son los valores de proporción de
área no inundada (x) y promoción de la transferencia de calor (y) registrados para los 24 tubos
con aletas integrales.

Proporción de área no inundada (x) Promoción de la transferencia de calor (y)

1.93 4.4
1.95 5.3
1.78 4.5
1.64 4.5
1.54 3.7
1.32 2.8
2.12 6.1
1.88 4.9
1.70 4.9
1.58 4.1
2.47 7.0
2.37 6.7
2.00 5.2
1.77 4.7
1.62 4.2
2.77 6.0
2.47 5.8
2.24 5.2
1.32 3.5
1.26 3.2
1.21 2.9
2.26 5.3
2.04 5.1
1.88 4.6

a. Determine la línea de mínimos cuadrados que relaciona la promoción de la transferencia de calor


con la proporción de área no inundada

Ecuación de regresión

Y = 0,213 + 2,426 X

b. Grafique los puntos de datos y trace la línea de mínimos cuadrados como verificación de sus
cálculos
Gráfica de probabilidad de AJUSTES
Normal
99
Media 4,775
Desv.Est. 1,006
N 24
95 KS 0,078
Valor p >0,150
90

80

70
Porcentaje

60
50
40
30

20

10

1
2 3 4 5 6 7
AJUSTES

ERROR CUADRATICO MEDIO Yi Ymedia RESULTADO


E1 Y1 Ῡ 4,89631944
E2 Y2 Ῡ 4,94484721
E3 Y3 Ῡ 4,53236113
E4 Y4 Ῡ 4,1926667
E5 Y5 Ῡ 3,95002783
E6 Y6 Ῡ 3,4162223
E7 Y7 Ῡ 5,3573333
E8 Y8 Ῡ 4,775
E9 Y9 Ῡ 4,33825003
E10 Y10 Ῡ 4,04708338
E11 Y11 Ῡ 6,20656936
E12 Y12 Ῡ 5,96393049
E13 Y13 Ῡ 5,06616665
E14 Y14 Ῡ 4,50809724
E15 Y15 Ῡ 4,14413893
E16 Y16 Ῡ 6,93448599
E17 Y17 Ῡ 6,20656936
E18 Y18 Ῡ 5,64849995
E19 Y19 Ῡ 3,4162223
E20 Y20 Ῡ 3,27063898
E21 Y21 Ῡ 3,14931954
E22 Y22 Ῡ 5,69702772
E23 Y23 Ῡ 5,1632222
E24 Y24 Ῡ 4,775

c. Interprete los valores de y

Anda mungkin juga menyukai