Anda di halaman 1dari 12

Estadística I

Integrantes:
- Michael Alexis Iza Ayo
- Juan Sebastián Méndez Rodríguez
- Marlon Rodrigo Nuñez Mejia
- Alex Patricio Pacheco Oña

Regresión Polinómica de Segundo Grado

 Consiste en otra alternativa, para ajustar polinomios a los datos. Necesitamos


ajustar a un polinomio de segundo grado ó cuadrático:

y  a0  a1 x  a 2 x 2  e

 La suma de los cuadrados de los residuos es:


n
Sr   ( yi  a0  a1 xi  a 2 xi ) 2
2

i 1

 Derivamos Sr con respecto a a0:

 2 ( yi  a0  a1 x1  a2 xi )
2

 Luego con respecto a a1:

 2 xi ( yi  a0  a1 x1  a2 xi )
2

 Por último con respecto a a2:


 2 xi ( yi  a0  a1 xi  a2 xi )
2 2

 Igualamos a 0, y reordenamos:
(n)a0  ( xi )a1  ( xi )a2   yi
2

( xi )a0  ( xi )a1  ( xi )a2   xi yi


2 3

( xi )a0  ( xi )a1  ( xi )a2   xi yi


2 3 4 2

n Hasta i  1

 Tenemos un sistemas de ecuaciones, con 3 incógnitas (a 0,a1,a2), entonces se


puede extender un polinomio de m-ésimo grado como sigue:

y  a0  a1 x  a2 x 2  ...... am x m  e

 El error estándar se calcula de la siguiente manera:


sr
sy / x 
n  (m  1)
Ejemplo 1
A partir de los datos de la tabla que se presenta a continuación, ajustar un polinomio
de segundo grado, utilizando regresión polinomial.

Xi Yi

0 2.1

1 7.7

2 13.6

3 27.2

4 40.9

5 61.1

Para el caso que nos ocupa;


m = 2 (el grado del polinomio que necesitamos)
n = 6 (la cantidad de datos)

Y el conjunto general de ecuaciones queda instanciado de la siguiente manera:

𝑎0 𝑛 + 𝑎1 𝛴 𝑥𝑖 + 𝑎2 𝛴 𝑥𝑖2 = 𝛴 𝑦𝑖

𝑎0 𝛴 𝑥𝑖 + 𝑎1 𝛴 𝑥𝑖2 + 𝑎2 𝛴 𝑥𝑖3 = 𝛴 𝑥𝑖 𝑦𝑖

𝑎0 𝛴 𝑥𝑖2 + 𝑎1 𝛴 𝑥𝑖3 + 𝑎2 𝛴 𝑥𝑖4 = 𝛴 𝑥𝑖2 𝑦𝑖


Xi Yi Xi2 Xi3 Xi4 XiYi Xi2Yi

0 2.1 0 0 0 0 0

1 7.7 1 1 1 7.7 7.7

2 13.6 4 8 16 27.2 54.4

3 27.2 9 27 81 81.6 244.8

4 40.9 16 64 256 163.6 654.4

5 61.1 25 125 625 305.5 1527.5

𝛴𝑿𝒊 𝛴𝒀𝒊 𝛴𝑿𝒊𝟐 𝛴𝑿𝒊𝟑 𝛴𝑿𝒊𝟒 𝛴𝑿𝒊𝒀𝒊 𝛴𝑿𝒊𝟐 𝒀𝒊

15 152.6 55 225 979 585.6 2488.8

Por lo tanto, las ecuaciones lineales simultáneas son:

6 𝑎0 + 15 𝑎1 + 55 𝑎2 = 152.6

15 𝑎0 + 55 𝑎1 + 225 𝑎2 = 585.6

55 𝑎0 + 225 𝑎1 + 979 𝑎2 = 2488.8

Resolviendo este sistema con alguna técnica como la eliminación gaussiana, se


obtiene:

𝑎0 = 2.47857

𝑎1 = 2.35929

𝑎2 = 1.86071
El polinomio es:

1.86071 𝑥 2 + 2.35929 𝑥 + 2.47857

Debemos calcular Sr y St.

Sr ---> Nos servirá para calcular el error estándar de aproximación basado en la


regresión polinomial.

St ---> Nos servirá para calcular el coeficiente de determinación.

Xtrazo 2.5000

Ytrazo 25.4333

𝑎0 = 2.47857 𝑎1 = 2.35929 𝑎2 = 1.86071

(Yi - Ytrazo)2 (Yi - ao - a1 Xi - a2 Xi2)2

544.444 0.14332

314.4711 1.00286

140.0278 1.08158

3.1211 0.80491

239.2178 0.61951

1272.1111 0.09439
St Sr

2513.3933 3.74657

𝑆𝑟 3.74657
𝑆𝑦/𝑥 = √𝑛 − (𝑚 + 1) 𝑆𝑦/𝑥 = √ 𝑆𝑦/𝑥 = 1.1175
6−3

𝑆𝑡 2513.3933
𝑆𝑦 = √𝑛 − 1 𝑆𝑦 = √ 𝑆𝑦 = 22.4205
5

𝑆𝑡 − 𝑆𝑟 2513.3933 − 3.74657
𝑟2 = = = 0.99851
𝑆𝑡 2513.3933

El resultado indica que el 99.851% de la incertidumbre


original se ha explicado mediante el modelo.
Ejemplo 2
Se realiza una prueba de frenado de un automóvil nuevo, midiendo la distancia de
parada de acuerdo a la rapidez del vehículo al momento de aplicar los frenos,
obteniéndose los siguientes resultados:

RAPIDEZ DISTANCIA
Km/h Metros
35 16
50 26
65 41
80 62
95 88
110 119

En base a los datos anteriores:


a) Construya un diagrama de dispersión
b) Efectúe la estimación del modelo cuadrático
c) Determine el grado de ajuste e interprételo
d) Elabore el análisis de varianza y discútalo
e) Si el vehículo viaja a 100 km/h, en qué distancia se detiene?
f) Pruebe la hipótesis que b=1 con un 99% de confianza
g) Calcule intervalo de confianza al 95% para a y b
h) Efectúe la estimación del modelo, el andeva y obtenga el coeficiente de determinación
por medio de matrices.

a) Diagrama de Dispersión
b) Estimadores del modelo

i) Tabla de Datos:

x y x2 x3 x4 xy x2y y2
35 16 1,225 42,875 1,500,625 560 19,600 256
50 26 2,500 125,000 6,250,000 1,300 65,000 676
65 41 4,225 274,625 17,850,625 2,665 173,225 1,681
80 62 6,400 512,000 40,960,000 4,960 396,800 3,844
95 88 9,025 857,375 81,450,625 8,360 794,200 7,744
110 119 12,100 1,331,000 146,410,000 13,090 1,439,900 14,161
Σ=435 Σ=352 Σ=35,475 Σ=3,142,875 Σ=294,421,875 Σ=30,935 Σ=2,888,725 Σ=28,362

ii) Estimadores del modelo

[30935−(435)(352)/6]∗[294421875−(35475)2/6]− [2888725−(35475)(352)/6]∗[3142875−(35475)(435)/6]
𝑏= [35475−(435)2/6]∗[294421875−(35475)2 /6]−[3142875−(35475)(435)/6]2
=-
0.3394

[35475−(435)2 /6]∗[2888725−(35475)(352)/6]− [3142875−(35475)(435)/6]∗[30935−(435)(352)/6]


𝑐= [35475−(435)2 /6]∗[294421875−(35475)2 /6]−[3142875−(35475)(435)/6]2
=0.01182

352−(−0.3394)(435)−(0.01182)(35475)
𝑎= =13.3587
6

Ecuación Final:
𝑌𝑖 = 13.3587 − 0.3394𝑥𝑖 + 0.01182𝑥𝑖 2

c) Grado de ajuste del modelo


El coeficiente de determinación se calcula así:

−0.3394∗(30935−(435)(352)/6)+0.01182∗(2888725−(35475)(352)/6)
𝑟2 = =0.999
28362−(352)2 /6

Se puede concluir que el grado de ajuste del modelo es alto (casi perfecto!), por lo que
el modelo es confiable para hacer predicciones.

d) Análisis de varianza del modelo

i) Suma de cuadrados de regresión:

−0.3394 ∗ (30935 − (435)(352)/6) + 0.01182 ∗ (2888725 − (35475)(352)/6)


= 7711.2119
ii) Suma de cuadrados Total

(352)2
28362 − = 7711.3333
6

iii) Suma de cuadrados del error:


7711.3333-7711.2119=0.12143

iv) Grados de libertad de regresión=2

v) Grados de libertad totales= 6-1=5

vi) Grados de libertad del error=6-3=3

vii) Cuadrado medio de regresión= 7711.2119/2=3855.5069

viii) Cuadrado medio del error= 0.1243/3=0.04048

ix) F Calculada=3855.5069/0.04048=95256.147

x) F Tabulada (2,3,0.01)=30.82

xi) Tabla de Andeva:

Fuente de Grados de Suma de cuadrados Cuadrado F F


Variación libertad medio calculada tabulada
Regresión 2 7711.2119 3855.60595 95256.14 30.82**
Error 3 0.12143 0.04048
Total 5 7711.33333

Debido a que F calculada es mayor que F tabulada, se rechaza la Ho y se acepta la Ha,


con lo cual se concluye que el modelo sí explica el fenómeno en estudio y que los
resultados obtenidos no se deben a la casualidad.

e) Si el vehículo viaja a 100 km/h, en qué distancia se detiene?

Para esto, simplemente se utiliza la ecuación anteriormente encontrada por


estimación, sustituyendo el valor de x por 100

𝑦 = 13.3587 − 0.3394(100) + 0.01182(100)2 = 97.618

f) Pruebe la hipótesis de que b=1 con un 99% de confianza


Inicialmente se plantea Ho: b=1 y su alterna Ha: b≠1
A continuación se obtiene el error standard de b:

√0.04048 ∗ 0.01137 = 0.02145


El valor de t de student de calcula de la siguiente manera:

1 − (−0.3394)
2𝑡 = = 62.442
0.02145

El valor de t se obtiene en la tabla de t de student, con 6-3 grados de libertad y (1-


.99)/2=0.005 de α, siendo el valor igual a 5.840

Finalmente, dado que t calculada es mayor que la tabulada, se concluye al 99% que el
coeficiente b no es igual a 1.

g) Calcule intervalos de confianza al 95% para a y b


El valor de t de student al 95% (α/2=0.05/2=0.025) con 3 grados de libertad es=
3.182
Intervalo de confianza para b:

−0.3394 ± 3.182 ∗ √0.04048 ∗ 0.01137 = −0.3394 ± 0.06826

El intervalo final será entonces el siguiente: -0.40766<B<-0.27114

Intervalo de confianza para a:

13.3587 ± 3.182 ∗ √0.04048 ∗ 12.6973 = 13.3587 ± 2.2812

El intervalo final para a sería: 11.0775<A<15.6399

i) Ajuste del modelo y análisis de varianza mediante matrices:

Matriz x:
1 35 1225
1 50 2500
1 65 4225
1 80 6400
1 95 9025
1 110 12100

Matriz x transpuesta ( x´ )
1 1 1 1 1 1
35 50 65 80 95 110
1225 2500 4225 6400 9025 12100
Vector y:

16
26
41
62
88
119

Producto x´x:

6 435 35475
435 35475 3142875
35475 3142875 294421875

Matriz inversa de x´x:


12.6973 -0.3713 0.002433
-0.3713 0.01137 -0.00007671
0.002433 -0.00007671 0.0000005291

Producto x ´ y

352
30935
2888725

Producto Final b=(x´x)-1* (x ´ y)

13.3587
-0.3394
0.01182

Análisis de varianza

ym=352/6=58.666

Suma de cuadrados de regresión= b´x´y-nym2=

352
[13.3587 − 0.3394 ∗ 0.01182] ∗ [ 30935 ] − 6(58.666)2 = 7711.2119
2888725
Suma de cuadrados total= y´y- nym2=

352
[13.3587 − 0.3394 ∗ 0.01182] ∗ [ 30935 ] − 6(58.666)2 = 7711.2119
2888725

Suma de cuadrados del error : 7711.3333-7711.2119=0.12143

Grados de libertad de regresion=2

Grados de libertad totales= 6-1=5

Grados de libertad del error=6-3=3

Cuadrado medio de regresión= 7711.2119/2=3855.5069

Cuadrado medio del error= 0.1243/3=0.04048

F Calculada=3855.5069/0.04048=95256.147

F Tabulada (2,3,0.01)=30.82

Análisis de Varianza Final:

Fuente de Grados de Suma de cuadrados Cuadrado F F


Variación libertad medio calculada tabulada
Regresión 2 7711.2119 3855.60595 95256.14 30.82**
Error 3 0.12143 0.04048
Total 5 7711.33333
Anexo:

Ejercicio en c++ que nos permite calcular la fórmula de la regresión polinomial


dando cualesquiera puntos.

Regrecion Polinomial de Segundo Grado.exe

Bibliografia:

- http://www.unjbg.edu.pe/coin2/pdf/c&d_9_art_16.pdf
- http://es.slideshare.net/ValeriaRuiz92/ajuste-de-curvas-metodo-de-
jacobi?next_slideshow=1
- https://nolorodriguez.wordpress.com/2014/05/02/regresion-polinomial/