Anda di halaman 1dari 18

STATGRAPHICS Rev.

4/25/2007

Regresin Poisson
Resumen
El procedimiento Regresin Poisson est diseado para ajustar un modelo de regresin en el
cual la variable dependiente Y consiste de conteos. El modelo de regresin ajustado relaciona Y
con una o ms variables predictoras X, que pueden ser cuantitativas o categricas. El
procedimiento ajusta un modelo usando mxima verosimilitud o mnimos cuadrados ponderados.
La seleccin de variables por pasos es una opcin. Se realizan pruebas de razn de verosimilitud
para probar la significancia de los coeficientes del modelo. El modelo ajustado puede graficarse
y generarse predicciones a partir del mismo. Se identifican y grafican residuos atpicos.

StatFolio de Ejemplo: Poisson reg.sgp


Datos de Ejemplo:
El archivo mines.sf6 contiene un grupo de datos tomados de Myers (1990) que describen el
nmero de lesiones que ocurren en los campos de carbn en West Virginia. Los datos consisten
de n = 44 observaciones de diferentes minas. A continuacin se muestra una porcin de los
datos:
Fractures
(fracturas)
2
1
0
4
1
2
0
0
4
4

Thickness
(grosor)
50
230
125
75
70
65
65
350
350
160

Extraction
(extraccin)
70
65
70
65
65
70
60
60
90
80

Height
(altura)
52
42
45
68
53
46
62
54
54
38

Years
(aos)
1
6
1
0.5
0.5
3
1
0.5
0.5
0

La variable dependiente es Fractures (fracturas), que tabula el nmero de lesiones en cada mina.
Las otras 4 columnas son variables predictoras potenciales que cuantifican diversos atributos de
cada mina.

2006 by StatPoint, Inc.

Regresin Poisson - 1

STATGRAPHICS Rev. 4/25/2007

Ingreso de Datos
La caja de dilogo del ingreso de datos solicita informacin sobre las variables de entrada:

Variable Dependiente: variable numrica que contiene los n valores de la variable


dependiente yi. Y debe consistir de conteos enteros no negativos.

(Tamaos de Muestra): tamao de muestra opcional ti correspondiente a cada cuenta. Si no


se especifica, todos los ti se igualan a 1.

Factores Cuantitativos: columnas numricas que contienen los valores de cualesquiera


factores cuantitativos a ser incluidos en el modelo.

Factores Categricos: columnas numricas o no numricas que contienen los niveles de


cualesquiera factores a ser incluidos en el modelo.

Seleccin: seleccin de un subgrupo de datos.

2006 by StatPoint, Inc.

Regresin Poisson - 2

STATGRAPHICS Rev. 4/25/2007

Modelo Estadstico
El modelo estadstico asumido para los datos es que los valores de la variable dependiente Y
siguen una distribucin Poisson de la forma
p(Yi ) =

e iti (i t i )
Yi !

(1)

donde i es el parmetro de la tasa Poisson en los valores de las variables predictoras


correspondientes a la i-sima observacin. Se supone adems que la tasa se relaciona con las
variables predictoras a travs de una funcin de enlace log-lineal de la forma
log( ) = 0 + 1 X 1 + 2 X 2 + ... + k X k

(2)

Resumen del Anlisis


El Resumen del Anlisis presenta una tabla que muestra el modelo estimado y las pruebas de
significancia para los coeficientes del modelo. A continuacin se muestra una salida tpica:
Regresin de Poisson - Fractures
Variable dependiente: Fractures
Factores:
Thickness
Extraction
Height
Years
Modelo Estimado de Regresin (Mxima Verosimilitud)
Error
Razn de Momios
Parmetro
Estimado
Estandar
Estimada
CONSTANTE
-3.59309
1.02567
Thickness
-0.00140659
0.000835807
0.998594
Extraction
0.0623458
0.012286
1.06433
Height
-0.00208034
0.00506612
0.997922
Years
-0.0308135
0.0162647
0.969656
Anlisis de Desviacin
Fuente
Desviacin Gl Valor-P
Modelo
37.1277
4
0.0000
Residuo
37.856
39 0.5220
Total (corr.)
74.9837
43
Porcentaje de desviacin explicado por el modelo = 49.5143
Porcentaje ajustado = 36.1781
Pruebas de Razn de Verosimilitud
Factor
Chi-Cuadrada Gl
Thickness
3.16654
1
Extraction 31.9511
1
Height
0.174671
1
Years
3.89444
1
Anlisis de Residuos
Estimacin
n
44
CME
4.15055
MAE
0.986136
MAPE
ME
-0.0604684
MPE

Valor-P
0.0752
0.0000
0.6760
0.0484

Validacin

2006 by StatPoint, Inc.

Regresin Poisson - 3

STATGRAPHICS Rev. 4/25/2007


La salida incluye:

Resumen de los Datos: un resumen de los datos que fueron ingresados.

Modelo Estimado de Regresin: estimaciones de los coeficientes del modelo de regresin,


con errores estndar y las Razones de Momios. Las razones de momios se calculan a partir de
los coeficientes del modelo j por medio de

( )

razn de momios = exp j

(3)

La razn de momios representa el incremento porcentual en el momio de los eventos por


unidad de incremento en X.

Anlisis de Desviacin: descomposicin de la desviacin de los datos en un componente


explicado (Modelo) y un componente no explicado (Residuo). La Desviacin compara la
funcin de verosimilitud de un modelo con el valor ms grande que puede alcanzar la
funcin de verosimilitud, de tal forma que un modelo perfecto tendra una desviacin igual a
0. Hay tres renglones en la tabla:
1. Total (corr.) la desviacin de un modelo que contiene nicamente un trmino
constante, (0).
2. Residuo la desviacin que queda despus de haber ajustado el modelo.
3. Modelo la reduccin en la desviacin debida a las variables predictoras,
(1,2,,k|0), igual a la diferencia entre los otros dos componentes.
El Valor de P para el Modelo prueba si el aadir las variables predictoras reduce
significativamente la desviacin comparada con un modelo que contiene slo un trmino
constante. Un Valor de P pequeo (menor de 0.05 si se trabaja con un nivel de significancia
del 5%) indica que el modelo ha reducido significativamente la desviacin y es as til para
predecir a Y. El Valor de P para el trmino Residuo prueba si hay una falta de ajuste
significativa, i.e., si puede haber un modelo mejor. Un Valor de P pequeo indica que una
desviacin significativa queda an en los residuos, as que puede haber un mejor modelo.

Porcentaje de Desviacin el porcentaje de desviacin explicada por el modelo, calculada


por medio de
R2 =

( 1 , 2 ,..., k | 0 )
( 0 )

(4)

Es similar a una estadstica R cuadrada en regresin mltiple, en que va de 0% a 100%.


Tambin se calcula una desviacin ajustada con
2
Radj
=

( 1 , 2 ,..., k | 0 ) 2 p
( 0 )

2006 by StatPoint, Inc.

(5)
Regresin Poisson - 4

STATGRAPHICS Rev. 4/25/2007


donde p es igual al nmero de coeficientes en el modelo ajustado, incluyendo al trmino
constante. Es semejante a la estadstica R-cuadrada ajustada en que compensa el nmero de
variables en el modelo.

Pruebas de Razn de Verosimilitud una prueba de significancia para cada efecto en el


modelo ajustado. Estas pruebas comparan la funcin de verosimilitud del modelo completo
con la del modelo en el cual slo el efecto indicado ha sido removido. Valores de P pequeos
indican que el modelo ha mejorado significativamente por el efecto correspondiente.

Anlisis de Residuos si un subgrupo de filas en la hoja de datos ha sido excluido del


anlisis usando el campo Seleccionar en la caja de dilogo de ingreso de datos, el modelo
ajustado se usa para hacer predicciones de los valores de Y para estas filas. Esta tabla muestra
estadsticas sobre los errores de prediccin, definidos por
ei = y i i t i

(6)

Se incluyen el cuadrado medio del error (CME), el error absoluto medio (MAEA), el error
porcentual absoluto medio (MAPE), el error medio (ME), y el error porcentual medio (MPE).
Estas estadsticas de validacin pueden ser comparadas con las estadsticas del modelo
ajustado para determinar qu tan bien el modelo predice las observaciones fuera de los datos
usados para ajustarlo.
El modelo ajustado para los datos del ejemplo es

= exp( 3.593 0.001407Thickness + 0.06235Extraction 0.002080 Height 0.03081Years)


La regresin explica alrededor del 49.5% de la desviacin de un modelo con slo una constante.
El valor de P para un par de variables est por arriba 0.05, indicando que podran ser removidos
razonablemente del modelo.

2006 by StatPoint, Inc.

Regresin Poisson - 5

STATGRAPHICS Rev. 4/25/2007

Opciones de Anlisis

Modelo: orden del modelo a ser ajustado. Los modelos de primer orden incluyen solo efectos
principales. Los modelos de segundo orden incluyen efectos cuadrticos para los factores
cuantitativos e interacciones de dos factores entre todas las variables.

Incluir Constante: Si no se marca esta opcin, el trmino constante 0 ser omitido del
modelo.

Ajustar: especifica si todas las variables independientes especificadas en caja de dilogo del
ingreso de datos deben ser incluidas en el modelo final, o si se debe aplicar una seleccin por
pasos de las variables. La seleccin por pasos intenta encontrar un modelo parsimonioso que
contenga slo variables significativas estadsticamente. Un ajuste por Seleccin Hacia
Adelante comienza sin variables en el modelo. Un ajuste por Seleccin Hacia Atrs comienza
con todas las variables en el modelo.

P-para-Introducir - En un ajuste por pasos, las variables entrarn al modelo en un paso


dado si sus valores de P son menores o iguales al valor especificado de P-para-Introducir.

P-para-Eliminar - En un ajuste por pasos, las variables sern removidas del modelo en un
paso dado si sus valores de P son mayores que el valor especificado de P-para-Eliminar.

Pasos Max.: mximo nmero de pasos permitidos cuando se lleva a cabo un ajuste por
pasos.

Mostrar: si se muestran los resultados en cada paso cuando se lleva a cabo un ajuste por
pasos.

Excluir: Presione este botn para excluir efectos del modelo. Se mostrar una caja de
dilogo:

2006 by StatPoint, Inc.

Regresin Poisson - 6

STATGRAPHICS Rev. 4/25/2007

Haga doble clic sobre un efecto para moverlo del campo Incluir al campo Excluir o para
regresarlo.

Ejemplo: Ajuste por Pasos hacia Atrs de un Modelo de Segundo Orden


Para encontrar un predictor parsimonioso pero til para el nmero de Fractures (fracturas), se
consider un modelo de segundo orden. Este modelo agrega trminos adicionales que involucran
efectos cuadrticos tales como Thickness2 (grosor2) e interacciones entre cada par de variables,
representadas por productos cruzados tales como Thickness*Extraction (grosor*extraccin). Para
evitar que el modelo tuviera muchos trminos no significativos, se emple un enfoque por pasos.
Dos enfoques de ese tipo estn disponibles:

Seleccin hacia adelante Comienza con un modelo con slo un trmino constante
y mete una variable a la vez con base en su significancia estadstica si entrara al
modelo actual. En cada paso, el algoritmo pone en el modelo la variable que tendra
la mayor significancia estadstica si entrara. Siempre que la variable ms significativa
tenga un valor de P menor o igual al especificado en la caja de dilogo Opciones del
Anlisis, ser introducida al modelo. Cuando ninguna variable tenga un valor de P lo
suficientemente pequeo, se detiene la seleccin de variables. Adems, las variables
introducidas al modelo al principio del procedimiento pueden ser removidas despus
si su valor de P cae dentro del criterio P-para-Eliminar.

Seleccin hacia atrs Comienza con un modelo con todas las variables
especificadas en la caja de dilogo del ingreso de datos y quita una variable a la vez
con base en su significancia estadstica en el modelo actual. En cada paso, el
algoritmo saca del modelo la variable que es la menos significativa estadsticamente.
Si la variable menos significativa tiene un valor de P mayor al especificado en la caja
de dilogo Opciones del Anlisis, ser removida del modelo. Cuando todas las
variables restantes tengan valores pequeos de P, se detiene el procedimiento.
Adems, las variables removidas del modelo al principio del procedimiento pueden
ser reintroducidas despus si su valor de P alcanza el criterio P-para-Introducir.

2006 by StatPoint, Inc.

Regresin Poisson - 7

STATGRAPHICS Rev. 4/25/2007

2006 by StatPoint, Inc.

Regresin Poisson - 8

STATGRAPHICS Rev. 4/25/2007


La salida a continuacin muestra el resultado de un ajuste por pasos hacia atrs:
Seleccin de factores por etapas
Mtodo: seleccin hacia atrs
P-para-introducir: 0.05
P-para-eliminar: 0.05
Paso 0:
14 factores en el modelo. 29 g.l. para el error.
Porcentaje de desviacin explicada = 68.75%

Porcentaje ajustado = 28.74%

Paso 1:
Eliminando factor Years with P-para-eliminar = 0.931068
13 factores en el modelo. 30 g.l. para el error.
Porcentaje de desviacin explicada = 68.74% Porcentaje ajustado = 31.40%
Paso 2:
Eliminando factor Height*Height with P-para-eliminar = 0.667761
12 factores en el modelo. 31 g.l. para el error.
Porcentaje de desviacin explicada = 68.49% Porcentaje ajustado = 33.82%
Paso 3:
Eliminando factor Thickness*Thickness with P-para-eliminar = 0.785169
11 factores en el modelo. 32 g.l. para el error.
Porcentaje de desviacin explicada = 68.39% Porcentaje ajustado = 36.39%
Paso 4:
Eliminando factor Thickness*Years with P-para-eliminar = 0.847819
10 factores en el modelo. 33 g.l. para el error.
Porcentaje de desviacin explicada = 68.35% Porcentaje ajustado = 39.01%
Paso 5:
Eliminando factor Extraction*Years with P-para-eliminar = 0.688459
9 factores en el modelo. 34 g.l. para el error.
Porcentaje de desviacin explicada = 68.13% Porcentaje ajustado = 41.46%
Paso 6:
Eliminando factor Height with P-para-eliminar = 0.529659
8 factores en el modelo. 35 g.l. para el error.
Porcentaje de desviacin explicada = 67.60% Porcentaje ajustado = 43.60%
Paso 7:
Eliminando factor Extraction*Height with P-para-eliminar = 0.957829
7 factores en el modelo. 36 g.l. para el error.
Porcentaje de desviacin explicada = 67.60% Porcentaje ajustado = 46.26%
Paso 8:
Eliminando factor Years*Years with P-para-eliminar = 0.402248
6 factores en el modelo. 37 g.l. para el error.
Porcentaje de desviacin explicada = 66.66% Porcentaje ajustado = 47.99%
Paso 9:
Eliminando factor Thickness*Height with P-para-eliminar = 0.39377
5 factores en el modelo. 38 g.l. para el error.
Porcentaje de desviacin explicada = 65.69% Porcentaje ajustado = 49.69%
Paso 10:
Eliminando factor Height*Years with P-para-eliminar = 0.0852434
4 factores en el modelo. 39 g.l. para el error.
Porcentaje de desviacin explicada = 61.74% Porcentaje ajustado = 48.41%
Modelo final seleccionado.

El algoritmo comenz con 14 efectos. Despus de 10 pasos, el nmero de efectos in el modelo se


ha reducido a 4. A continuacin de muestra un resumen del modelo final:
2006 by StatPoint, Inc.
Regresin Poisson - 9

STATGRAPHICS Rev. 4/25/2007


Regresin de Poisson - Fractures
Variable dependiente: Fractures
Factores:
Thickness
Extraction
Height
Years
Modelo Estimado de Regresin (Mxima Verosimilitud)
Error
Parmetro
Estimado
Estandar
CONSTANTE
-30.0347
10.7768
Thickness
-0.02653
0.0119429
Extraction
0.796051
0.278408
Thickness*Extraction
0.000294308
0.000136244
Extraction^2
-0.00501156
0.0017943
Anlisis de Desviacin
Fuente
Desviacin
Modelo
46.2986
Residuo
28.6851
Total (corr.)
74.9837

Gl
4
39
43

Razn de Momios
Estimada
0.973819
2.21677
1.00029
0.995001

Valor-P
0.0000
0.8874

Porcentaje de desviacin explicado por el modelo = 61.7449


Porcentaje ajustado = 48.4087
Pruebas de Razn de Verosimilitud
Factor
Chi-Cuadrada
Thickness
5.68063
Extraction
9.76634
Thickness*Extraction
5.23687
Extraction^2
9.15297

Gl
1
1
1
1

Valor-P
0.0172
0.0018
0.0221
0.0025

El modelo final involucra slo 2 variables: Thickness y Extraction. Contiene efectos principales
para ambas variables, una interaccin entre las 2 variables, y un efecto cuadrtico para
Extraction. El porcentaje de desviacin explicada por el modelo ha aumentado a
aproximadamente 61.7%.

Grfica del Modelo Ajustado


La Grfica del Modelo Ajustado muestra la tasa media estimada ( X ) versus cualquier variable
predictora, manteniendo constantes las otras variables.

2006 by StatPoint, Inc.

Regresin Poisson - 10

STATGRAPHICS Rev. 4/25/2007


Grfica del Modelo Ajustado
con intervalos de confianza del 95.0%
5
Extraction=75.9318
Height=56.6364
Years=7.15909

Fractures

4
3
2
1
0
0

200

400
600
Thickness

800

1000

Se incluyen en el grfico los lmites de confianza para (X).

Opciones de Ventana

Factor: selecciona el factor a graficar en el eje horizontal.

Bajo y Alto: especifica el rango de valores para el factor seleccionado.

2006 by StatPoint, Inc.

Regresin Poisson - 11

STATGRAPHICS Rev. 4/25/2007


Mantener: valores en los que se mantendrn fijos los factores no seleccionados.

Nivel de Confianza: porcentaje usado para los lmites de confianza. Poner en 0 para omitir
los lmites.

Siguiente y Atrs: usado para mostrar otros factores cuando hay presentes ms de 16.

La tasa estimada de fracturas disminuye de una alta de casi 4.5 a una baja de casi 0 conforme el
grosor (Thickness) de la mina aumenta, en Extraction = 75, Height = 50, y Years = 7.

Observados Versus Predichos


El grfico Observados versus Predichos muestra los valores observados de Y en el eje vertical y
los valores medios predichos i t i en el eje horizontal.
Grfica de Fractures
5

observado

4
3
2
1
0
0

predicho

Si el modelo ajusta bien, los puntos deben estar esparcidos aleatoriamente alrededor de la lnea
diagonal.

Predicciones
El modelo de regresin ajustado puede usarse para predecir el resultado de nuevas muestras
cuyas variables predictoras son dadas. Por ejemplo, suponga que se desea una prediccin para
una mina con Thickness = 100, Extraction = 70, Height = 50, y Years = 10. Se puede agregar una
nueva columna a la hoja de datos con estos valores para las variables predictoras, pero se dejara
en blanco la entrada para Fractures. Entonces la ventana Predicciones presentara:
Predicciones para Fractures
Observado
Fila
45

Ajustado
1.24396

LC Inferior 95.0%
para Prediccin
0.846319

LC Superior 95.0%
para Prediccin
1.82844

La tabla muestra el valor ajustado i t i , junto con intervalos de confianza aproximados del 95%.

2006 by StatPoint, Inc.

Regresin Poisson - 12

STATGRAPHICS Rev. 4/25/2007


Opciones de Ventana

Mostrar: muestra Todos los Valores (predicciones para todas las filas en la hoja de datos), o
Slo Pronsticos (predicciones para las filas con valores faltantes para Y).

Nivel de Confianza: porcentaje usado para los intervalos de confianza.

Intervalos de Confianza
La ventana Intervalos de Confianza muestra el error de estimacin potencial asociado con cada
coeficiente en el modelo, as como para las razones de tasas.
Intervalos de confianza del 95.0% para los estimados de los coeficientes
Error
Parmetro
Estimado
Estndar
Lmite Inferior
Lmite Superior
CONSTANTE
-3.59309
1.02567
-5.60336
-1.58282
Thickness
-0.00140659
0.000835807
-0.00304474
0.000231567
Extraction
0.0623458
0.012286
0.0382655
0.086426
Height
-0.00208034
0.00506612
-0.0120098
0.00784909
Years
-0.0308135
0.0162647
-0.0626918
0.00106482
Intervalos de confianza del 95.0% para la razn de tasas
Parmetro Estimado
Lmite Inferior
Lmite Superior
Thickness
0.998594
0.99696
1.00023
Extraction 1.06433
1.03901
1.09027
Height
0.997922
0.988062
1.00788
Years
0.969656
0.939233
1.00107

Opciones de Ventana

Nivel de Confianza: nivel porcentual para los intervalos de confianza.

2006 by StatPoint, Inc.

Regresin Poisson - 13

STATGRAPHICS Rev. 4/25/2007

Matriz de Correlacin
La Matriz de Correlacin muestra estimaciones de la correlacin entre los coeficientes
estimados.
Matriz de correlacin para los coeficientes estimados
CONSTANTE
Thickness
Extraction
Height
Years

CONSTANTE
1.0000
0.1136
-0.9574
-0.3001
0.1207

Thickness
0.1136
1.0000
-0.1719
-0.1968
-0.0934

Extraction
-0.9574
-0.1719
1.0000
0.0674
-0.1758

Height
-0.3001
-0.1968
0.0674
1.0000
-0.1201

Years
0.1207
-0.0934
-0.1758
-0.1201
1.0000

Esta tabla puede ser til para determinar que tan bien se han separado unos de otros los efectos
de las variables independientes.

Residuos Atpicos
Una vez que el modelo ha sido ajustado, es til estudiar los residuos para determinar si existe
algn valor atpico que debiera ser removido de los datos. La ventana Residuos Atpicos lista
todas las observaciones que tienen residuos grandes atpicos.
Residuos Atpicos para
Y
Fila Y
Predicha
4
4.0 1.21777
29
5.0 1.58135

Fractures
Residuo
2.78223
3.41865

Residuo
Pearson
2.52
2.72

Residuo de
Desviacin
1.99
2.16

La tabla muestra:

Fila el nmero de fila en la hoja de datos.

Y el valor observado de Y.

Y Predicha el valor ajustado i t i .

Residuo la diferencia entre los valores observado y predico, definido por


ei = y i i t i

(7)

Residuo de Pearson un residuo estandarizado en el cual cada residuo es divido entre


una estimacin de su error estndar:

ri =

ei
t

(8)

i i

Residuo de Desviacin un residuo que mide la contribucin de cada observacin a la


desviacin de los residuos:

2006 by StatPoint, Inc.

Regresin Poisson - 14

STATGRAPHICS Rev. 4/25/2007

y
d i = sgn(ri ) 2 y i ln i
t

ii

y i + i t i

(9)

La suma de los residuos de desviacin cuadrados es igual a la desviacin en el rengln de


Residuos en la tabla del anlisis de desviacin.
La tabla incluye todas las filas para las cuales el valor absoluto del residual de Pearson es mayor
que 2.0. El presente ejemplo muestra 2 residuos que exceden 2.5, ninguno de los cuales excede
de 3.0.

Grficas de Residuos
Al igual que con todos los modelos estadsticos, es una buena prctica examinar los residuos. El
procedimiento Regresin Poisson incluye varios tipos de grficas de residuos, dependiendo de
las Opciones de Ventana.
Diagrama de Dispersin versus Valor Predicho
Este grfico es til para visualizar si la variabilidad de los residuos es constante o depende de las
variables predictoras.
Grfica de Residuos

Residuos de desviacin

2.8
1.8
0.8
-0.2
-1.2
-2.2
0

2
3
predicho Fractures

Autocorrelaciones entre Residuos


Este grfico calcula la autocorrelacin entre residuos como una funcin del nmero de filas entre
ellos en la hoja de datos.

2006 by StatPoint, Inc.

Regresin Poisson - 15

STATGRAPHICS Rev. 4/25/2007


Autocorrelaciones Residuales para Fractures
1

autocorrelacin

0.6
0.2
-0.2
-0.6
-1
0

6
retraso

10

12

Esto slo es relevante si los datos se colectaron secuencialmente. Cualquier barra extendindose
ms all de los lmites de probabilidad indicara dependencia significativa entre residuos
separados por el retraso indicado.
Opciones de Ventana

Graficar: el tipo de residuos a graficar:

1. Residuos los valores observados menos los ajustados.


2. Residuos Pearson los residuos divididos entre sus errores estndar estimados.
3. Residuos de Desviacin residuos escalados de tal forma que la suma de sus
cuadrados es igual a la desviacin de los residuos.
2006 by StatPoint, Inc.

Regresin Poisson - 16

STATGRAPHICS Rev. 4/25/2007


Tipo: el tipo del grfico a crear. Se usa un Diagrama de Dispersin para probar curvatura. Se
emplea una Grfica de Probabilidad Normal para determinar si los residuos del modelo
provienen de una distribucin normal (no se espera normalidad en este procedimiento). Se
usa una Funcin de Autocorrelacin para probar dependencia entre residuos consecutivos.

Graficar versus: para un Diagrama de Dispersin, la cantidad a graficar en el eje horizontal.

Nmero de Retrasos: para una Funcin de Autocorrelacin, el mximo nmero de retrasos.


Para grupos pequeos de datos, el nmero de retrasos graficados puede ser menor que este
valor.

Nivel de Confianza: para una Funcin de Autocorrelacin, el nivel usado para crear los
lmites de probabilidad.

Puntos Influyentes
Cuando se ajusta un modelo de regresin, no todas las observaciones tienen la misma influencia
en la estimacin de los parmetros del modelo ajustado. Aquellos con valores atpicos de las
variables independientes tienden a tener mayor influencia que los otros. La ventana Puntos
Influyentes presenta cualquier observacin que tenga gran influencia en el modelo ajustado:
Puntos Influyentes para Fractures
Fila Leverage
25
0.437161
30
0.367098
Leverage promedio de un solo punto = 0.113636

La tabla muestra todos las observaciones con leverage alto. El punto leverage es una estadstica
que mide cun distante est una observacin de la media de las n observaciones en el espacio de
las variables independientes. Entre ms grande el leverage, mayor el impacto del punto en los
valore ajustados y . Los puntos son colocados en la lista si el leverage es mayor de tres veces el
de un punto promedio

La observacin con el punto leverage mayor en los datos de la muestra es la fila #25, aunque es
slo alrededor de 4 veces el punto leverage promedio.

Salvar Resultados
Se pueden salvar en la hoja de datos los siguientes resultados:
1. Valores Predichos los valores ajustados i t i correspondientes a cada fila de la hoja de
datos.
2. Lmites Inferiores los lmites inferiores de confianza para i t i .
3. Lmites Superiores los lmites superiores de confianza para t .
i i

4.
5.
6.
7.

Residuos los residuos ordinarios.


Residuos Pearson los residuos estandarizados de Pearson.
Residuos de Desviacin los residuos de desviacin.
Leverages los puntos niveladores para cada fila.

2006 by StatPoint, Inc.

Regresin Poisson - 17

STATGRAPHICS Rev. 4/25/2007

Clculos
Sea i = la tasa estimada en los valores de las variables predictoras en la fila i.
Funcin de Verosimilitud
n

L=

[i t i ]y

i =1

exp( i t i )
yi !

(10)

Desviacin

( ) =

i =1

L( )
y
y i i exp( y i )
yi !

(11)

Punto Leverage

hi = diag X i( X WX ) X i wi

h=

p
n

2006 by StatPoint, Inc.

(12)
(13)

Regresin Poisson - 18

Anda mungkin juga menyukai