Anda di halaman 1dari 3

Análisis de regresión con R con conjuntos de datos de archivos

 Los datos son digitados en Excel y guardados como “texto (delimitado por tabulaciones)”, con el
nombre “Datos” en escritorio. Al abrir el programa R ir al Menú ”Archivo”, hacer clic en “Cambiar
dir..”, en la ventana que aparece seleccionar “Escritorio” y dar clic en aceptar. Luego ejecutar:

#Lee el archivo Datos (cambiar el nombre de acuerdo a los datos


data <- readXL("E:/ /prácticas/practica 1_1.xlsx", rownames=FALSE, header=TRUE,
na="", sheet="ej1", stringsAsFactors=TRUE)

data=read.table("practica 1_1.csv",header=TRUE)
data

De los datos obtenemos la matriz con los valores de la variable respuesta

#Matriz de Variable Dependiente (ver en que columna esta Y)


Y<-matrix(data [,1])
Y
Se asigna a n el número de observaciones tomando el tamaño de la matriz Y, en este caso es 40.
#Número de observaciones
n<-length(Y)
n

Se obtiene la matriz x donde cada columna corresponde a una variable regresora.

#Matriz donde las columnas son las Variables Regresoras (ubicar donde está x
x<-as.matrix(data[,-1])
x
Se crea la matriz de unos y luego se combina está con la matriz x para crear la matriz de diseño X.

#Matriz de unos
con<-as.matrix(rep(1,n))
con
#Matriz de Diseño
X<-cbind(con, x)
X

SE ASIGNA A P EL NÚMERO DE PARÁMETROS EN EL MODELO TOMANDO EL NÚMERO


DE COLUMNAS DE LA MATRIZ DE DISEÑO X, EN ESTE CASO ES 5.

#Número de parâmetros (da el número de columnas)


p=dim(X)[2]
p
SE CALCULA LA MATRIZ C QUE ES A MATRIZ INVERSA DE X’X, QUE NOS AYUDARÁ
EN EL CALCULO DE LOS ERRORES TIPICOS.

#Matriz Inversa de X'X


C=solve(t(X)%*%X)
C

SE CALCULAN LOS PARÁMETROS ESTIMADOS.

#Betas Estimados
Beta_Est<-C%*%t(X)%*%Y
Beta_Est

SE CALCULAN RESPUESTAS ESTIMADAS


#Respuesta media estimada
Y_est<-X%*%Beta_Est
Y_est

ESTIMACIÓN POR INTERVALOS

# Calcula varianza estimada del error


SCE=t(Y)%*%Y-t(Beta_Est)%*%t(X)%*%Y
SCE
Se<-sqrt(SCE/(n-p))
Se

CONSTRUCCIÓN DE LA TABLA ANOVA


Para la construcción de la tabla ANOVA se calculará primero la Sumas de Cuadrados.

#SUMA DE CUADRADOS
#SCR Suma de Cuadrados de la Regresión
SCR<-t(Beta_Est)%*%t(X)%*%Y-(sum(Y)^2)/n
SCR

#SCE Suma de Cuadrados de los Errores


SCE=t(Y)%*%Y-t(Beta_Est)%*%t(X)%*%Y
SCE

#SCT Suma de Cuadrados Total


SCT=SCR+SCE
SCT

Se asigna al vector Gl los grados de libertad de la Regresión, el Error y Total.

#Grados de Libertad
Gl=c(p-1,n-p,n-1)
Gl

Se calculan los cuadrados medios de la regresion, el error y total

#CUADRADOS MEDIOS
#CMR Cuadrado medio de la regresion
CMR=SCR/(p-1)
CMR
#CME Cuadrado medio del Error
CME=SCE/(n-p)
CME