Anda di halaman 1dari 17

IN5602 Marketing II

Estrategias de Modelacin

Marcel Goic
mgoic@dii.uchile.cl

1
Aprendizajes Preliminares
Existen infinitos modelos y por tanto es imposible
determinar cul es mejor modelo.

Para definir un buen modelo de regresin debemos


balancear complejidad con capacidad explicativa.

Conocimiento del negocio.


Exploracin ex-ante
Cmo se relacionan las variables
Qu variables tienen mayor dispersin
Qu variables se mantienen relativamente constantes.
Evaluacin ex-post

3
Arte vs. Procedimiento
Desafortunadamente no existe un mecanismo general para
determinar cul es el mejor modelo.

Aunque hay mecanismos automticos para seleccionar


variables, muchas veces los modelos resultantes no hacen
sentido o que ignoran variables que nos relevantes para las
decisiones.

Premisa: Usar conocimientos previos del ambiente y


exploracin de los datos para definir una lista de modelos
candidatos y usar mtricas de ajuste/prediccin para
seleccionar el modelo final.

4
1. Elegir nivel de agregacin
Consideremos ventas de una producto en una sala de
supermercado. Por hora, da, semana, mes, ao.

Otros ejemplos: Por SKU o por marca; por cadena o por


sala, etc.

El problema de gestin puede imponer restricciones


al nivel de agregacin mnimo.
Sensibilidad al precio vs. Programacin reposicin.

Trade-off principal.
Agregar: Ms fcil, menos precisin.

5
Ejemplo
Venta Semanal Venta Mensual
60000 140000

120000
50000

100000
40000

80000

30000

60000

20000
40000

10000
20000

0 0
44 64 84 104 124 144 0 5 10 15 20 25 30

6
Ejemplo
Venta Diaria Acumulada Diferencia Venta Diaria
1600000 50000

40000
1400000

30000
1200000

20000
1000000
10000

800000
0
44 64 84 104 124 144
600000 -10000

-20000
400000

-30000
200000

-40000
0
44 64 84 104 124 144 -50000

7
2. Descomposicin en mltiples regresiones

Descomposicin por ndices


En general preferir nica regresin.
Excepcin. Complejidad computacional,
En general LR muy fcil de estimar.
Modelos ms complejos podran justificarse.

Descomposicin por componentes latentes.


A veces la variable dependiente puede descomponerse
naturalmente.
Ventas = nmero de compras x nmero de unidades por
compra
Considerar el cero como caso especial (e.g probabilidad de
comprar y cantidades compradas condicional en que compra).

8
9
3. Transformacin de Variables

Queremos que el modelo sea interpretable y haga


sentido con la intuicin.
Ejemplo modelo doble log.

Dados los alcances de la metodologa, buscaremos


principalmente mejorar la bondad del ajuste.

10
Transformacin de Variables

11
4. Seleccin de Variables
Automtica
Stepwise regression: Mecanismos iterativos de
agregacin/eliminacin de variables basados en
algn criterio de bondad de ajuste.
Forward: Se van agregando variables
Backward: Se van eliminando variables.
Mtodos de Penalizacin: Minimizar el error ms una
penalizacin por incluir parmetros.

Ridge Regression min yi 0 j xij j2
i j j


LASSO min yi 0 j xij j
i j j

12
4. Seleccin de Variables
Manual
Las implementaciones de seleccin automtica son
tpicamente secuenciales y por tanto no exploran todas
las alternativas.
Los resultados de seleccin automticos pueden generar
conjuntos poco intuitivos y difciles de interpretar.
Muchas veces nos conformaremos con listar un conjunto
limitado de modelos que hagan sentido (5-20) y elegir ex-
post en funcin de la calidad del modelo.

Una alternativa es usar enfoques hbridos: usar exploracin


para elaborar una lista de un par de decenas de variables y
seleccionar asistidos por mtodos automticos.

13
5. Seleccin de ndices
Ya hemos visto que hay discrecionalidad en la eleccin
de ndices.

Como regla sencilla, pediremos que se cumplan tres


condiciones para considerar indexar un parmetro

Que el problema de gestin requiera hacer la


distincin.
Que la variable dependiente tenga
comportamientos diferentes para cada ndice.
Que tengamos suficientes datos para estimar
confiablemente los parmetros desagregados.

14
ndices y Variables Binarias

Todo indice puede escribirse usando una variable


binaria.

Anotar con indices es ms compacto y los preferiremos


a las variables binarias (solo notacin!)

15
6. Uso de Jerarquas
Una jerarqua aparece cuando un parmetro del
modelo aparece como una funcin de otros
parmetros.

Mantener controlado el nmero de variables

yijt ij xijt i j xijt

Vincularlo con informacin de otro nivel

yijt ij xijt 0 z j xijt

16
Ejemplo Jerarquas
Buscamos estudiar la elasticidad de la demanda con respecto al precio
para mltiples productos i en mltiples salas s.

Un modelo elasticidades independientes para cada sala producto


puede ser muy poco robusto y poco accionable. Una alternativa es
proponer que las elasticidades por ejemplo dependen de un efecto fijo
de la categora, y caractersticas de la sala (e.g. tamao de la sala e
ingreso promedio de los habitantes a 200m a la redonda). As si dic=1 si
producto i pertenece a la categora c, entonces.

ln qist is is ln pist ist

is cd ic 1SIZEs 2 INCOME
c

ln qist is cd ic ln pist 1SIZEs ln pist 2 INCOMEs ln pist ist


c

17
IN5602 Marketing II

Estrategias de Modelacin

Marcel Goic
mgoic@dii.uchile.cl

18

Anda mungkin juga menyukai