En
Economa de empresa (pp.166-220)(766p.)(4a ed). (C26262)
Estimacin de la demanda
La siluaci11
A Jennifer Harrah se le asign la tarea de desarrollar y probar
un modelo estadstico que ayudara a explicar la demanda del
consumidor de bebidas gaseosas. Jennifer trabajaba para una
importante compaa de investigacin de mercados que tena
F o o D s
una reputacin mundial por su trabajo en el sector de la economa, particularmente en el mercado de bienes de consumo de
alta rotacin. Su empresa justamente ha sido contratada por Global Foods
In c . para llevar a cabo un estudio preliminar dentro del mercado de bebidas
gaseosas.
Como consumidora regular de bebidas gaseosas, Jennifer a menudo se
preguntaba qu afectaba la demanda de las personas por estas bebidas. Adems, haba hecho un estudio de caso acerca de Global Foods en la licenciatura y estuvo buscando trabajo en la misma compaa de la que recordaba un
estudio muy interesante en ese momento. En este estudio, Global Foods era
retratada como el ejemplo clsico de una gran compaa multinacional que
enfrent mrgenes de utilidad y de demanda en declive para sus productos
debido a la madurez de los mercados en los que aqullos se vendan. Su clase lleg a la conclusin de que la mejor forma en que esta compaa podra
energizarse consista en entrar a los mercados en que el crecimiento tanto en
ventas unitarias como en mrgenes de utilidad fuera muy alto, al tiempo que
tambin en relacin con los alimentos, se tratara de su negocio principal.
Sin embargo, Jennifer se sorprendi de que la compaa eligiera bebidas
gaseosas como su nueva lnea de producto. Su clase haba decidido que las
comidas congeladas gourmet para microondas eran las candidatas lgicas
para los esfuerzos de expansin de la empresa.
G L 0 8 A L
(Contina)
INTRODU
CIN
Captulo 5 Estimacin de
demanda
167
Existen muchas formas en las que los investigadores de mercado buscan la "verdad" del
comportamiento del consumidor. Ellos podran usar el enfoque directo de una encuesta
al consumidor, ya sea cara a cara (por ejemplo, deteniendo a la gente en los centros comerciales) o por telfono. Quiz alguno de ustedes ha sido alguna vez participante en este tipo
de recoleccin de datos.
Otro mtodo directo utilizado por los investigadores de mercado es el grupo de enfoque. Se les pide a los consumidores que asistan a una reunin grupal conducida por un
investigador, y se hacen varias preguntas relacionadas con los bienes y servicios de una
compaa. Los representantes de una compaa pueden estar presentes o pueden elegir
observar los procedimientos detrs de un espejo de doble vista. El problema principal con
tales mtodos es que los consumidores muchas veces pueden no ser realistas acerca de la
forma en cmo actuaran en verdaderas situaciones de mercado.
Para obtener una visin ms precisa del comportamiento "verdadero" de los consumidores, las empresas de investigacin de mercado, como ACNielsen, tambin recaban
datos mediante la participacin de la gente en paneles de estudios de consumo. A los voluntarios en esta actividad se les proporciona un escner, que les permite registrar todas
sus compras mediante la lectura de cdigos de barras de cada artculo que compran en
tiendas de venta al detalle. Los participantes en la encuesta transmiten entonces los datos
escaneados a la empresa de investigacin de mercado regularmente, va un mdem especial instalado en los telfonos de sus hogares.
La tecnologa est haciendo posible que las compaas acumulen, almacenen y procesen grandes cantidades de datos acerca del comportamiento del consumidor. Primero se
recaban los datos con la ayuda de la tecnologa del escner (lectores de cdigo de barras y
terminales de punto de venta [Point of sale terminals, POS]) que se utiliza en los mostradores de las cajas de salida en tiendas y supermercados tanto en Estados Unidos como en
Europa Occidental. En muchas otras partes del mundo, hay personal de investigacin de
mercado que realiza "auditoras" in situ para recolectar los datos de las compras del consumidor. Sin embargo, eventualmente se espera que muchos pases, particularmente los
llamados "grandes mercados emergentes", utilicen la tecnologa del escner.
Recientemente ACNielsen fue adquirida por VNU, la compaa holandesa que se
mencion en el captulo 1 en la seccin" Aplicacin internacional". Una visita al sitio Web
de la compaa (www.acnielsen.com) 1 proporcionar a los lectores una buena idea de las
clases de productos y servicios que las compaas de investigacin de mercado brindan a
sus clientes, la mayora de los cuales son grandes compaas de alimentos, bebidas y
otros tipos de bienes de consumo empacados de alta rotacin. Este sitio tambin contiene
artculos tiles acerca de temas actuales en el marketing de consumo, tales como intercambios B2B, administracin de categoras y marketing global.
Las compaas tales como NCR se especializan en proveer capacidad de almacenamiento que se mide en "terabits" o billones de bits de informacin. IBM desarroll recientemente una tecnologa de almacenamiento que permite que todos los contenidos de la
Librera del Congreso de EUA sean almacenados en un dispositivo aproximadamente del
tamao de la cabeza de un alfiler. Wal-Mart ha construido un almacn de informacin a
partir de cada una de las compras de sus clientes en cada una de sus tiendas cada da del
ao. La cantidad de datos incluidos en este almacn de informacin ocupa, se asegura, el
segundo lugar despus de los almacenados por el gobierno de EUA. Todos estos desarrollos permiten a los analistas estadsticos extraer un conjunto de datos mucho ms rico
para estimar la demanda de consumo.
1En
el momento que revisamos su sitio Web (8 de febrero, 2002), haba una interesante historia en su pgina principal acerca de la donacin por parte de la compaa de un panel de herramientas de escner al
Sam W. Walton College of Business en la University of Arkansas para "permitir a los estudiantes aprender a partir de las mismas herramientas e informacin utilizadas por los vendedores al detalle y fabricantes en la industria de bienes de consumo empacados".
168
Economa de empresa
El procedimiento comnmente empleado por los economistas para estimar la demanda de consumo es.el anlisis de regresin. Adems de su aplicacin en la estimacin
de la demanda, se usa para estimar las funciones de produccin y de costo (vea captulos
7 y 8). Tambin se utiliza en estudios de macroeconoma del consumo, inversin, comercio
internacional y tasas de inters. La seccin que sigue es una versin concisa de los contenidos del captulo completo, en la que se explica brevemente qu es el anlisis de regresin,
cmo interpretar sus resultados y cmo aplicar stos a las decisiones directivas. Una presentacin ms detallada del anlisis de regresin en la toma de decisiones empresariales
sigue al resumen. Sin embargo, para un anlisis ms detallado de este tema, se recomienda
consultar libros de estadstica o econometra.
RE
de
embargo, podra argumentarse que el clima afecta la demanda va su impacto sobre "el gusto y las
preferencias" de los consumidores.
169
Tabla
.1
UNIVERSIDAD
1
2
3
4
S
6
7
8
9
10
11
12
13
14
1S
16
17
18
19
20
21
22
23
24
2S
26
27
28
29
30
10
12
13
14
9
8
4
3
1S
12
13
14
12
10
10
12
11
12
10
8
9
10
11
12
13
10
9
8
8
5
Y =Cantidad
X1 = Precio de la pizza
X2 = Costo de la colegiatura
X3 = Precio de las bebidas gaseosas
x4 = Ubicacin
170
Economa de empresa
100
100
90
9S
110
12S
12S
1SO
80
80
90
100
100
110
12S
110
1SO
100
150
1SO
1SO
12S
125
100
7S
100
110
12S
1SO
1SO
14
16
8
7
11
S
12
10
18
12
6
S
12
10
14
1S
16
12
12
10
13
15
16
17
10
12
6
10
8
10
100
9S
110
90
100
100
125
1SO
100
90
80
7S
100
12S
130
80
90
9S
100
90
95
100
9S
100
100
110
12S
90
80
95
1
1
1
1
o
o
1
o
1
1
1
1
1
o
o
1
o
1
o
o
o
1
1
o
1
1
o
o
o
o
producto complementario, una bebida gaseosa, se seleccionaron para este estudio. Pero
algunas veces el investigador quiz tenga que usar algo de creatividad para encontrar las
variables que representan factores tales como el ingreso y gustos y preferencias. Debido a
la dificultad de encontrar el ingreso promedio de los estudiantes (o de sus familiares) que
asisten a una universidad en particular, el costo de la colegiatura se us como una variable sustituta. La variable nula o simulada de ubicacin se incluy para averiguar si la demanda de pizza se ve afectada por el nmero de sustitutos disponibles para la pizza. La
suposicin detrs de esto es que las universidades en reas urbanas pueden tener alrededor
ms establecimientos de comida entre los cuales escoger y esto puede afectar de manera
adversa la demanda de pizza por parte de los estudiantes.
Al utilizar estos datos, entonces expresamos la ecuacin de regresin que ser estimada de la siguiente forma lineal aditiva:
Y'"' a+ b1 X1 + b2 X2 + b3 X3 + b4 X4
donde Y
a=
xl
X2 =
X; =
X4 =
171
Mediante la funcin de regresin en Excel, obtuvimos las siguientes estimaciones para nuestra ecuacin de regresin de demanda de pizza.
y ::o.
= 0.717
+ 138X2
estndar
--
la
y= 1.64
172
Economa de empresa
recordar, estaba medido en centavos. Por lo tanto, de acuerdo con nuestras estimaciones
de regresin, un incremento de 100 centavos (o $1.00) dar como resultado una disminucin en la cantidad demandada de pizza de 8.8 (100 X 0.088)~1Un incremento en el costo
de colegiatura de una unidad (en este caso$ 1,000) da como resultado un incremento en
la cantidad demandada de pizza de 0.138. Estos cambios y los asociados con las modificaciones en el precio de las bebidas gaseosas y en la ubicacin del campus universitario
son sustanciales o intrascendentes?
Los investigadores que constantemente estiman la demanda para un bien o servicio
en particular tendrn una idea exacta de si las magnitudes de los coeficientes estimados en
un estudio especfico son altas o bajas en relacin con sus otros trabajos. Pero si no existen
otros estudios disponibles para comparar, entonces los investigadores pueden al menos
usar las elasticidades de la demanda con el fin de calibrar el impacto relativo que las variables explicativas tienen en la cantidad demandada.
A partir de nuestra explicacin de elasticidad en el captulo 4, usted puede ver que
los resultados del anlisis de regresin son ideales para la estimacin de la elasticida9pu~. Recuerde que la frmula para calcular la elasticidad punto es
:::.:
dO
dX
"--~
X
~
-~--
donde Q = cantidad demandada y X = cualquier variable que afecte Q (por ejemplo, precio o ingreso). En el caso de nuestra demanda estimada de pizza, supongamos que las variables explicativas tienen los siguientes valores:
Precio de pizza (X1) = 100 ($1.00)
Costo anual de la colegiatura universitaria (X2) = 14 ($14,000)
Precio de una bebida gaseosa (X3) = 110 ($1.10)
Ubicacin del campus (X4) =rea urbana (X4 = 1)
Entonces, al insertar estos valores dentro de la ecuacin estimada resulta
Y= 26.67 0.088 {100) + 0.138 (14) 0.076 (110) 0.544 (1)
10.898 o 11 (redondeado a la fraccin ms cercana)
Para calcular las elasticidades punto para cada una de las variables considerando los
valores precedentes, simplemente insertamos los nmeros apropiados dentro de la frmula de elasticidad. La derivada parcial de Y respecto de los cambios en cada una de las
variables (oY/oX) es simplemente el coeficiente estimado de cada una de las variables.
Elasticidad
100
. ---o.o88 x To.ae~i
0.076 x
'=
---o.so7
14
0.767
Con estas estimaciones, podemos decir que la demanda para pizza es algo inelstica
en el precio y que hay algn grado de elasticidad precio cruzada entre las bebidas gaseosas y la pizza. A juzgar por el coeficiente ms bien bajo de 0.177, el costo de la colegiatura
no parece tener un gran impacto en la demanda de pizza.
173
de
acin
Nuestros resultados de regresin estn basados en una muestra de universidades estadounidenses. Cmo confiar que estos resultados reflejan en verdad a la poblacin de los
estudiantes de licenciatura? La prueba bsica de la significancia estadstica de cada uno
de los coeficientes estimados de regresin se llama prueba-t. Esencialmente, esta prueba
se lleva a cabo mediante el cmputo del valor-t o estadstica-t para cada uno de los coeficientes estimados. Esto se hace mediante la divisin del coeficiente estimado entre su
error estndar.3 Esto es:
t ........
x2
x4
la siguiente ecuacin, el pequeo "sombrero" (acento circunflejo) sobre bes una notacin comnmente
utilizada en el anlisis estadstico para denotar un valor estimado a partir de una muestra de datos.
4Se recuerda al lector que sta es slo una descripcin breve de la prueba-t. Para mayores detalles, vea la
explicacin completa ms adelante en este captulo.
3En
174
Economa de empresa
En nuestra regresin de pizza, R2 = 0.717, esto significa que cerca del72% de la variacin en la demanda de pizza por los estudiantes de licenciatura puede explicarse por la
variacin en el precio de la pizza, el costo de la colegiatura, el precio de una bebida gaseosa y la ubicacin del campus. Como se ver ms adelante en este captulo, R2 se incrementa al agregar ms variables independientes a la ecuacin de regresin. Por ello, muchos
analistas prefieren utilizar la medicin que se ajuste al nmero de variables independientes utilizadas de tal forma que las ecuaciones con nmeros diferentes de variables independientes puedan compararse de una manera ms precisa. Esta medicin alternativa se
denomina R2 ajustada. As, resulta que la R2 ajustada para esta ecuacin es 0.67. Otra
prueba, llamada prueba-F, se utiliza muchas veces en conjuncin con la R2 Los lectores
interesados podrn remitirse a "La prueba-F", ms adelante en este captulo para una
explicacin de esta prueba.
Repaso
lisis
de resu
Ahora revisaremos todos los pasos clave explicados hasta ahora en el anlisis de regresin de una ecuacin de demanda mediante la siguiente ecuacin:
Q "' 70 ., 10P l- 4Px
+ 501
( ':'
v)
errores
n
m ados
entre
de
demanda
175
(tambin en centavos)
25
representa $25,000)
10(100)
+ 4(120) . 50(25)
!.
Q .:. 800
Ahora usamos la frmula para la elasticidad punto a fin de obtener los coeficientes
de elasticidad. Recuerde que
E
8Q
::::::
" ox a
... 6
E
25
::-.::50
800
.: : . 1.56
Determinacin
de 2" como una aproximacin al nivel .05 de significancia, podemos decir que P y Px son
estadsticamente significativas debido a que sus valores t son mayores que 2 (por ejemplo, 3.3 y 2, respectivamente). I no es estadsticamente significativa al nivel .05 debido a
que su valor t es slo 1.67.
Como una consideracin adicional, observamos que R2 de .47 indica que el47% de la
variacin en la cantidad puede explicarse por las variaciones en las tres variables independientes P, Px e I. Aunque sta no es en realidad una indicacin de significancia estadstica, muestra el poder explicativo de la ecuacin de regresin. Para datos de corte
transversal, este nivel R2 se interpreta como moderadamente alto.
Economa de empresa
pueden ayudar a los directivos a tomar buenas decisiones. En nuestro ejemplo de pizza,
los resultados indican que el precio de la pizza y el precio de su producto complementario,la bebida gaseosa, son factores clave que influyen en la demanda de pizza. Sus coeficientes de elasticidad son menores que 1 y ambos coeficientes de las variables aprobaron
la prueba-t. Qu significa esto para quienes estn en el negocio de la pizza? Primero, esto significa que ellos pueden esperar que las disminuciones en el precio conduzcan hacia
disminuciones en el ingreso, al permanecer otros factores constantes. Por lo tanto, probablemente no desearn tratar de bajar el precio en un esfuerzo por incrementar las ventas.
Pero tratarn de bajar el precio de las bebidas gaseosas, con la anticipacin de que el precio
ms bajo en las bebidas gaseosas atraer a la gente a comprar pizzas.
En el anlisis estadstico muchas veces resulta tan importante encontrar qu es lo que
no pasa la prueba-t como encontrar lo que s la pasa. En nuestro ejemplo, aprendimos que el
costo de la colegiatura y la ubicacin no tenan impactos estadsticamente significativos
en la demanda de pizza. Ms an, las magnitudes de sus coeficientes eran relativamente
pequeas. Para los directores de las cadenas nacionales tales como Pizza Hut o Domino's,
esto indicara que ellos no tendran que estar muy preocupados acerca del tipo de universidad (privada o pblica) o de su ubicacin (urbana o rural) al decidir dnde abrir
franquicias de pizza.
Esperamos que este resumen sea suficiente para aquellos profesores y lectores que
simplemente quieren una idea general de cmo se emplea el anlisis de regresin en el
anlisis de negocios y en la toma de decisiones. Para una explicacin ms detallada, habr que continuar con el resto del captulo.
A.NLISIS DE REGRESIN
El propsito bsico del anlisis de regresin es el de estimar la relacin cuantitativa entre
variables. El primer paso en este procedimiento estadstico es el de especificar el modelo
de regresin (tambin llamado ecuacin de regresin). El segundo consiste en obtener
datos acerca de las variables especificadas en el modelo. El tercero es el de estimar el
impacto cuantitativo que cada una de las variables independientes tiene en la variable
dependiente. El cuarto paso es el de probar la significancia estadstica de los resultados de
regresin. Finalmente, los resultados del anlisis de regresin resultan tiles como material de apoyo en la elaboracin de polticas y en la toma de decisiones de negocios.
El anlisis de regresin implica dos tipos bsicos de variables: la variable dependiente y las variables independientes. Estas ltimas se conocen tambin como variables explicativas. Como indica su nombre, la variable dependiente es aquella cuyo valor depende
del valor de alguna otra variable o variables. La variable dependiente es el foco central de
cualquier estudio de regresin y es la variable que los investigadores tratan de explicar y
predecir. En anlisis de regresin de la demanda, la variable dependiente es la cantidad
demandada de un bien o servicio en particular. Si slo una variable independiente se emplea en el anlisis, usamos el trmino regresin simple. Si est implicada ms de una variable
independiente, usamos el trmino regresin mltiple. Como usted esperara, las variables independientes ms comnmente empleadas en el anlisis de regresin de la demanda son el
precio, precios de productos relacionados, gustos y preferencias, ingreso y nmero de compradores. Para propsitos de explicacin e ilustracin, es mucho ms fcil enfocamos en la
regresin simple. Despus de que el modelo de regresin simple haya sido desarrollado y
explicado, presentaremos el modelo de regresin mltiple.
Captulo 5 Estimacin de la demanda
177
donde Y=
X . .oc:
(5.1)
v<:~rinble
depenclienle
independiente
a = interseccin
=: pendiente
u :e
aleatorio
Advierta que el anlisis de regresin busca la mejor relacin lineal entre la variable dependiente y la variable independiente.s As, a denota la interseccin de la lnea y b la pendiente de la lnea. Observe que otro trmino, u, se incluye en la expresin formal del modelo
de regresin. Generalmente se le conoce como trmino "aleatorio" o de "error". Aunque su
valor no es realmente una parte del impacto estimado de X en Y, su inclusin en la ecuacin
formal de regresin es esencial. Para entender por qu, haremos una breve digresin acerca
de la diferencia entre modelos deterministas y modelos probabilsticos en el anlisis estadstico.
Suponga que usted desea desarrollar un modelo simple del consumo de gasolina de
su carro, con la cantidad de gasolina utilizada como la variable dependiente y el nmero
de millas viajadas como la variable independiente. Si usted supiera el nmero de millas
por galn que su carro es capaz de obtener, cuantificar esta relacin sera cuestin de simple
aritmtica. Por ejemplo, si el millaje de gasolina de su auto es de 20 millas por galn y usted
recorri 100 millas, su consumo sera de 5 galones de gasolina. Esta relacin puede generalizarse como Y = 0.05X. La figura 5.1a muestra la relacin determinstica entre X y Y.
Ahora suponga que usted decide medir la relacin entre millas recorridas y gasolina
consumida mediante el registro de esta informacin para 5 viajes separados, cada uno 100
millas ms largo que el anterior, empezando con un viaje de 100 millas. Como usted puede
imaginar, la cantidad real de gasolina consumida relativa a las millas viajadas no conformara exactamente lo que se predice en el modelo determinstico. Suponga que los datos
almacenados reales son los mostrados en la figura 5.1b. Como usted puede observar, la
esquematizacin de cada millaje de viaje junto con el consumo de gasolina en realidad
da como resultado puntos dispersos en lugar de un camino de puntos a lo largo de una
lnea recta. Esto implica que otros factores adems de las millas recorridas (condiciones
climticas, patrones de trnsito y hbitos de manejo) afectan el consumo de gasolina.
Nuestro modelo de millaje de gasolina debe, por tanto, reformularse como Y = 0.05X + u,
donde el valor de u es responsable de la desviacin de los puntos de una lnea recta que
representa Y = 0.05X. La variable u representa los factores diferentes a la variable independiente que pueden afectar el valor de la variable dependiente.
Asumimos en teora estadstica que este factor u tiene un impacto aleatorio ms
que un impacto sistemtico en la variable dependiente. En teora estadstica, los eventos aleatoriamente ocurridos se describen en trminos de la probabilidad de su ocurrencia.
5La
aplicacin de la regresin a los problemas econmicos generalmente supone una relacin lineal entre
la variable dependiente y la(s) variable(s) independiente(s). De hecho, el trmino anlisis de regresin lineal se utiliza muchas veces en los estudios econmicos. Existen tcnicas ms avanzadas de regresin no
lineal. Sin embargo, como se muestra ms adelante, los economistas frecuentemente transforman relaciones no lineales en ecuaciones adecuadas para el anlisis de regresin lineal.
178
Economa de empresa
Y (galones)
Y (galones)
y= 0.05X
y= 0.05X +u
25
25
20
20
15
15
10
10
(a)
(b)
Figura 5.1
Modelo de consumo de gasolina
De aqu que el trmino probabilstico se utilice para describir una ecuacin que contiene el
elemento aleatorio u. Usted ver por qu es importante entender la naturaleza de un modelo probabilstico cuando lleguemos a la seccin donde se estudia la significancia estadstica de los resultados de regresin.
(5.2)
Captulo 5 Estimacin de la demanda
179
X
~)
X
(b)
Figura 5.2
Representaciones lineales de grficas de dispersin
X = variable independiente
a = intercepcin de lnea con eje Y
lJ = pendiente de la lrH:'a
La intercepcin y la pendiente generalmente se denominan como parmetros o coeficientes de la ecuacin de regresin.
La figura 5.2 muestra una grfica de dispersin de datos hipotticos para Y y X. Como se indica en la parte a de esta figura, en la grfica de dispersin podra dibujarse cualquier nmero de lneas para representar la relacin entre Y y X. En el anlisis de regresin
la forma ms comn de estimar la relacin se llama mtodo de los mnimos cuadrados
ordinarios (MCO).* En esencia, este mtodo requiere dibujar una lnea a travs de la dispersin de puntos, de tal forma que la suma de las desviaciones cuadradas de cada uno de los
puntos respecto a la lnea sea minimizada. Los mnimos cuadrados se muestran en la figura
5.2b. Una ilustracin del mtodo de los mnimos cuadrados se presenta en la figura 5.3.
La estimacin real de la lnea de regresin es una cuestin relativamente simple, dada la disponibilidad de computadoras y paquetes de software. Muchas calculadoras de
mano contienen programas o teclas de funciones especiales para estimar las ecuaciones
de regresin simple. Sin embargo, cuando se utiliza ms de una variable independiente
(anlisis de regresin mltiple), se requiere del poder de procesamiento de una computadora. En cualquier caso, quienes deseen revisar las frmulas para la estimacin de
ecuaciones, as como las derivaciones matemticas de estas frmulas, pueden consultar
un texto de estadstica o econometra. Mediante el mtodo de los mnimos cuadrados,
llegamos a la lnea de regresin que se indica en la figura 5.2b.
Aunque el mtodo de mnimos cuadrados proporciona una buena representacin lineal de la dispersin de puntos, existe claramente una diferencia en el ajuste de las lneas de
N.T. En ingls, Method of Ordinary Least Squares (OLS).
180
Economa de empresa
Figura 5.3
Minimizacin de la suma de
las desviaciones cuadradas
mnimos cuadrados mostradas en las figuras 5.4a y b. Una simple observacin indica que la
figura 5.4b representa un mejor ajuste de la lnea de regresin a travs de la dispersin de
puntos. Esto se debe obviamente a la naturaleza de la dispersin de los puntos y no a la forma en que se construyeron estas lneas. Ambas lneas de regresin fueron dibujadas de forma
que se cumpla el criterio de los mnimos cuadrados. Por tanto, sera til contar con alguna
medicin de qu tan bien una lnea de regresin se ajusta a la dispersin de puntos.
Figura 5.4
Lneas de regresin con diferentes ajustes a travs de los puntos de dispersin
y
(a)
(b)
181
Co
FICI N
D DETE MINACIN:
UNA MEDIDA D L PODER EXPLICATIVO
DE LA CUACIN D
REGRESIN
STIMADA 6
Para explicar el significado del coeficiente de determinacin, necesitamos introducir algunos conceptos y notaciones utilizados en los textos de estadstica y econometra. Siempre que se presentan los resultados de regresin basados en datos muestrales, se coloca
un "sombrero" (acento circunflejo) sobre los valores estimados:
(5.3)
El sombrero sobre Y, a y b significa que sus valores son estimados mediante el empleo de un conjunto de datos muestrales. Un mtodo razonable para medir qu tan bien
esta ecuacin de regresin estimada determina el valor de Y dado el valor de X, es comparar los valores de Y con los valores reales de Y tomados en la muestra.
La grfica de dispersin que aparece en la figura 5.5 ayudar a explicar este enfoque.
La ecuacin (5.3) representa la lnea de regresin estimada a travs de la dispersin de puntos. Tomemos uno de estos puntos, el punto A, para propsitos de ilustracin. Usted puede
ver que la desviacin de este punto respecto a la lnea de regresin se indica por la distancia
entre A y B en la figura 5.5. Si acumulramos las desviaciones cuadradas de cada uno de los
puntos de la lnea de regresin, obtendramos la suma ms pequea posible, debido a que
se utiliz el mtodo de mnimos cuadrados para estimar la lnea de regresin. As, en la
evaluacin del ajuste de esta lnea de regresin para la grfica de dispersin de los datos
reales, necesitamos algn estndar de comparacin.
Figura 5.5
Desviaciones
explicadas y no
explicadas
6Esta
182
Economa de empresa
Suponga que se le pide predecir la cantidad de pizza demandada por los consumidores sin la ayuda de una ecuacin de regresin. No sera razonable utilizar el valor medio
(esto es, el promedio aritmtico) de la cantidad demandada como el valor pronosticado? Los
tericos estadsticos, de hecho, utilizan el valor medio de la variable dependiente (Y) como
la base para la comparacin de la "bondad del ajuste" de la lnea de regresin respecto
a la dispersin de los puntos reales de informacin. En efecto, esta medicin particular
responde a la pregunta: qu tanto resulta mejor utilizar la lnea de regresin para predecir el valor de Y en comparacin con el simple uso de la media de Y?
En la figura 5.5,la media de Y (Y) se indica mediante la lnea punteada. La desviacin
de lnea de regresin del valor medio de Y se indica por la distancia entre los puntos B y
C. Observe que la lnea de regresin siempre pasa a travs del punto que representa la
media de X y la media de Y.7 Esto se indica por el punto Den la figura 5.5. Por lo tanto,
observamos en la figura 5.5 que la desviacin de un valor muestra! de Y a partir de su media
puede dividirse en dos componentes separados: AB y BC. Ms formalmente, podemos
afirmar lo siguiente:
'""' Desviacin
de la muestra
AB '''
(Y,. - Y) ''
Desviacin no explicada de
Y,. respecto a \/
que ste puede explicarse por la lnea de regresin. ABes la porcin "inexplicada" de la
desviacin total, debido a que su valor difiere del valor estimado mediante la lnea de
regresin. Si la ruptura entre los componentes explicados e inexplicados se midiera para
cada observacin, y los valores resultantes se elevaran al cuadrado (para compensar por
desviaciones negativas y positivas) y despus se sumaran, llegaramos a las siguientes
relaciones:
STC = l( Y;
YV
::::=
SCR =, 2.:{ Y
Y) 2
= Suma de cuadrados de
SCE '"~(Y
1
YV
1
Suma total
cuadrados
(suma
las desviaciones cuadradas de los valores muestrales
de Y respecto a la media)
regresin
(suma de las desviaciones cuadradas de los valores estimados
respecto a !a media)
Las abreviaciones STC, SCR y SCE se utilizan comnmente en los libros de econometra para estas relaciones, as que aqu los utilizaremos en referencia a los componentes totales, explicados y no explicados, respectivamente, de la variacin de los valores de la
muestra respecto a su media. Para resumir podemos decir simplemente que STC = SCR +
SCE. A partir de estas relaciones, podemos construir una medicin del poder explicativo
de la ecuacin de regresin.
7para la prueba de por qu siempre es ste el caso cuando el mtodo de los mnimos cuadrados se utiliza,
consulte un texto de estadstica o de econometra.
183
R2 =O
(Y= y)
R2 = 1
(a)
(b)
Figura 5.6
El coeficiente de determinacin
La medicin del poder explicativo de la ecuacin de regresin que se utiliza ms comnmente se llama coeficiente de determinacin. El smbolo utilizado para esta medicin
es R2 Definimos esta medicin de la forma siguiente:
SCR
STC
SCE
1 - --------STC
{5.4)
Si SCR es igual a STC, esto significa que la desviacin total de Y respecto a su media
muestra! puede ser explicada por la ecuacin. Esto tambin implica que R2 es igual a 1.
Otra forma de ver esta situacin es buscar la expresin alternativa de R2, 1-SCE/STC. Si
la lnea de regresin explica la desviacin total de Y respecto a su media, no habra suma
de cuadrados de error (SCE = 0). Esto significa que SCE/STC =O, y por tanto R2 = l.
La figura 5.6a ilustra una situacin en la que R2 = l. Usted puede ver en esta figura que
R2 = 1 significa que cada punto en la grfica de dispersin descansa sobre la lnea de
regresin.
En el otro extremo, si la lnea de regresin no explica ninguna variacin de Y a partir
de su media, R2 asume el valor de O. Como se ve a partir de la frmula, R2 =O significa
que SCR/STC = O. Mediante la frmula alternativa para R2, vemos que esto significa que
SCE=STC (es decir, SCE/STC = 1). Tal caso podra indicar que el valor medio de Y es justamente tan til como la lnea de regresin de mnimos cuadrados en la prediccin del valor de Y (esto es, Y= Y). La figura 5.6b ilustra este caso.
En realidad, R2 asumir algn valor entre los dos valores extremos de Oy l. Claramente, cuanto ms cercano est R2 a la unidad, mayor ser el poder explicativo de la ecuacin
de regresin. Por ejemplo, un R2 de 0.93 indica un muy buen ajuste de la lnea de regresin a la dispersin de puntos (vea la figura 5.7a). Esta estadstica indica que un 93% de la
variacin en Y respecto a su media puede explicarse por la ecuacin de regresin. Un R2
cercano a Oindica una ecuacin de regresin con muy poco poder explicativo. Por ejemplo,
184
Economa de empresa
Figura 5.7
Indicador del ajuste de la lnea de regresin
185
donde k
Hasta aqut hemos estudiado el anlisis de regresin en relacin con lo que se denomina
estadstica descriptiva. Los datos se renen con base en dos variables, una dependiente y la
otra independiente; una lnea se ajusta a travs de la dispersin de puntos que representan los valores de las dos variables; y se desarrolla una medicin de qu tan bien se ajusta la
lnea a la dispersin. Pero para evaluar la utilidad de los resultados del anlisis de regresin en la toma de decisiones de negocios, necesitamos entrar al mbito de la estadstica
inferencia[.
Un investigador que busca cierta informacin acerca de alguna poblacin intentar
obtener datos de la poblacin entera o de alguna muestra de la poblacin. En todos los
casos se emplea una muestra de la poblacin debido al costo prohibitivo de obtener informacin de la poblacin entera. Ms an, en muchos casos es simplemente imposible
obtener los datos de la poblacin entera. Pero si se utiliza una muestra en vez de la poblacin total, el investigador debe evaluar el grado en que los resultados de esta muestra
reflejan a la poblacin. En otras palabras, se vuelve necesario hacer inferencias acerca de la
poblacin con base en lo que se conoce acerca de la muestra, y hacer un juicio acerca de
qu tan buenas son estas inferencias.
Suponga que estamos llevando a cabo un estudio de la demanda de la pizza en un
plantel universitario con una poblacin de 4,500 estudiantes. Las variables en estudio son
el ingreso y la cantidad promedio de rebanadas de pizza demandadas al mes. Suponga
adems que somos capaces de obtener informacin de la poblacin completa de estudiantes. Esto se ilustra en la tabla 5.2, donde los consumidores se han dividido en 10 grupos
de acuerdo con el ingreso semanal despus de descontar impuestos, comenzando con
$100 a la semana e incrementndose en intervalos de $20 hasta $280. El nmero promedio
de rebanadas de pizza compradas al mes se indica en la matriz numrica. Para hacer esta
ilustracin tan simple como sea posible, suponemos que hay 450 estudiantes consumidores
en cada una de las 10 categoras de ingreso. Por ejemplo, si leemos hacia abajo en la columna de $100, vemos que 10 estudiantes (un dcimo de 100) compran un promedio de 10 rebanadas de pizza al mes, 30 estudiantes (un dcimo de 300) compran un promedio de 10.5
rebanadas de pizza al mes, y as sucesivamente. (Note la flecha vertical en la tabla 5.2.)
Al leer a travs de cada flecha observamos el nmero de rebanadas de pizza demandadas
186
Economa de empresa
Tabla 5.2
Nmero de rebanadas de pizza consumidas al mes, por ingreso semanal
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
$100
$120
$140
$160
$180
$200
$220
$240
$260
$280
100
10.0
10.5
10.8
11.2
11.5
11.8
12.2
12.5
13.0
11.5
12.0
12.3
12.7
13.0
13.3
13.7
14.0
14.3
13.0
13.5
13.8
14.2
14.5
14.8
14.5
15.0
15.3
15.7
16.0
16.3
16.7
17.0
17.5
16.0
16.5
16.8
17.2
17.5
17.8
18.2
18.5
19.0
17.5
18.0
18.3
18.7
19.0
19.3
19.0
19.5
19.8
20.2
20.5
20.8
21.2
21.5
22.0
20.5
21.0
21.3
21.7
22.0
22.3
22.0
22.5
22.8
23.2
23.5
23.8
24.2
24.5
25.0
23.5
24.0
24.3
24.7
300
600
800
900
800
600
300
100
4,500
15.2
15.5
16.0
19.7
20.0
20.5
22.7
23.0
23.5
25.0
25.3
25.7
26.0
26.5
para las nueve categoras de frecuencia. (Note la flecha horizontal en la tabla 5.2.) Observamos que el nmero de rebanadas de pizza demandadas se incrementa al aumentar el
ingreso semanalmente. Por ejemplo, en la segunda fila, frecuencia 300, vemos que los 30
individuos (un dcimo de 300), que tienen un ingreso promedio semanal de $100 compran
10.5 rebanadas de pizza al mes; los 30 que ganan un promedio de $120 al mes compran 12
rebanadas de pizza al mes, y as sucesivamente. El nmero promedio de rebanadas que
se presenta ms frecuentemente para cada categora de ingreso se observa al leer a travs
de la fila indicada por la frecuencia de 900. Como se observa, esta lnea tambin representa el nmero promedio de rebanadas de pizza para cada categora de ingreso.
La figura 5.8 muestra la distribucin de aquellos consumidores que ganan $200 semanalmente. El conjunto completo de datos en la tabla 5.2 se ilustra en la figura 5.9. Observe
f
100
80
60
40
20
Rebanadas/
mes
Figura 5.8
Demanda de
pizza:distribucin de los
consumidores que ganan
$200 por semana
187
Y(Rebanadas de pizza/mes)
Y= 4+0.075X
200
Figura .9
Distribuciones de frecuencia combinada para la demanda de pizza
que suponemos que hay una distribucin normal y continua para cada nivel de ingreso.
Cada distribucin tiene un valor esperado o media diferente, pero todas tienen la misma
varianza.
Para los datos de tal poblacin la lnea de regresin sera
Y= 4 + 0.075X
(5.5)
188
Economa de empresa
f(Y)
f(Y)
Y=a + bX
(Y= 4 + 0.075X)
+ bX
Y=a
(b < b)
. .
___ .. ---------
f(Y)
f(Y)
--------------
160
200
240
Y= a+ fx
--- ... ---~-
280
(b <O)
(e)
=igura 5.1 O
.nea de regresin de la poblacin y tres lneas de regresin de la muestra
189
La prueba utilizada para establecer, con un cierto grado de certidumbre, que los coeficientes de regresin estimados a partir de los datos muestrales verdaderamente reflejan a la
poblacin, se denomina prueba de significancia estadstica. Debido a que esta prueba implica
lo que se conoce como valores-t, se le denomina comnmente prueba-t.
Nuestra explicacin de esta prueba comienza con un repaso del trmino de error, u, presentado al principio de este captulo. En teora estadstica, se supone que este trmino se
distribuye aleatoriamente alrededor de la lnea de regresin de poblacin en una forma normal, con su media como el valor de Y dado el valor de X y con alguna cantidad de varianza. 8
Como se ilustra en la figura 5.10, un ejemplo aleatorio tomado de la poblacin puede
producir resultados de regresin que son muy diferentes de una lnea de regresin ajustada
a travs de la poblacin. Si repetidamente seleccionramos una muestra aleatoria de un
tamao determinado a partir de esta poblacin y estimramos una lnea de regresin para
cada una de estas muestras, generaramos un gran nmero de lneas de regresin muestra! (vea la figura 5.11). Cada una de estas lneas de regresin muestra! tiene sus propios
coeficientes de intercepcin y de pendiente, ay b. En teora estadstica, se puede mostrar
que si el trmino de error de la poblacin est distribuido normalmente alrededor de su
lnea de regresin con alguna varianza constante (aD, entonces el repetir el muestreo producir una distribucin de coeficientes de regresin estimados, ay b, que estn normalmente
distribuidos con una media o un valor esperado igual a los coeficientes de regresin de la poblacin,
y con una varianza igual a un nmero relacionado con la varianza del trmino de error en alguna
forma sistemtica. Las ecuaciones siguientes expresan este enunciado de una forma notacional. Debido a que estamos interesados primordialmente en los coeficientes de la pendiente,
debemos enfocar nuestra atencin en b. Sin embargo, las mismas afirmaciones se pueden
hacer acerca del trmino de interseccin, a.
b)
(5.6)
(5.7)
La ecuacin (5.6) es muy sencilla. Expresa que la media o el valor esperado del coeficiente estimado bes igual a b, el coeficiente de regresin verdadero (pero desconocido) para la
poblacin completa. La ecuacin (5.7) afirma que la varianza de la distribucin de los coeficientes de regresin estimados de un muestreo repetido de la poblacin es igual a la varianza del trmino de error de la poblacin, u, dividido entre la suma de las desviaciones cuadradas de cada valor observado de X respecto a la media de X. La verbalizacin de la ecuacin
(5.7) es ms bien molesta pero se hace para estar seguros. Pero lo importante es tener en
mente que necesitamos conocer la varianza de la distribucin de los estimadores muestrales
bpara determinar la probabilidad de ocurrencia de cualquier valor de ben particular.
Debido a que la informacin acerca de la varianza de los trminos de error de la poblacin es generalmente desconocida, recurrimos al uso de un estimador de la varianza de
la poblacin. En teora estadstica, es posible mostrar que un estimador sin sesgo de la vaque la distribucin normal es la curva simtrica y con forma de campana usada con frecuencia
en estadstica. Como tal, se puede definir mediante dos valores, su media y su varianza (o desviacin
estndar, la raz cuadrada de la varianza). Cuanto ms grande sea la varianza, ms "dispersa" ser la
distribucin normal.
8Recuerde
190
em
Yz= az + bzX----r--~.,-.:;;._-,r----- Y
1 = 1 + bX
Figura 5.11
Lneas de regresin
producidas por muestreo
repetido
rianza de la distribucin de trminos de error ( fr~) es igual a la suma de los residuos cuadra-
dos de cada uno de los puntos de la muestra respecto a la lnea de regresin estimada, dividida entre el tamao de la muestra menos 2 (esto es, n - 2). Los residuales son las diferencias entre los
':alares reales de Y y los estimados a partir de la ecuacin de regresin (esto es, Y menos
Y). Expresado en forma notacional,
A su vez, el estimador sin sesgo de la varianza del estimador muestra! b (a~) es igual
al estimador de la varianza de los trminos de error divididos entre la suma de las
desviaciones cuadradas de cada valor observado de X respecto a la media de X. En
forma notacional,
191
Yde la
muestra
Figura 5.1
X
H0 :b:::::Q
H1."bc;ic:Q
'
192
Economa de empresa
P(b)
P(t)
E(b) = b
t=O
(a)
t=2
(b)
Figura 5.1
La distribucin-t
una distribucin normal de los coeficientes b estimados con su punto medio que designa la
media o el valor esperado. El eje vertical de la grfica mide la probabilidad de ocurrencia de
los diferentes valores de b estimados. Obviamente, la media o valor esperado de b tiene la
mayor probabilidad de ocurrir. Suponga que el coeficiente estimado de la muestra bes el que
se indica en el punto A en la figura 5.13a. Cul es la probabilidad de que tal punto ocurra?
Para encontrar la respuesta a esta pregunta, estandarizamos las diferencias entre cualquier
punto en la distribucin y su valor esperado. Esto se hace mediante la siguiente ecuacin:
+
t .....
. .
(5.8)
Este valor muestra a cuntas unidades-t alejadas del valor esperado se encuentra el
coeficiente estimado b. Para interpretar este valor-t, necesitamos saber el nmero de grados
de libertad (d.f., del ingls degrees offreedom) implicados en este caso. Para cualquier muestra determinada, d.f. se define como n - k -1 , donde n, k y 1 representan el tamao de la
muestra, el nmero de variables independientes y el trmino de interseccin, respectivamente. Por ejemplo, en una ecuacin de regresin con una muestra de 62 observaciones, habra 60 grados de libertad. La probabilidad de ocurrencia del valor A (convertida en 2 unidades) se puede encontrar ahora con la ayuda de una tabla-t, como se muestra en la tabla
CA en el apndice C al final del texto. En esta tabla vemos que para 60 d.f., la probabilidad
de que t tenga un valor de 1.671 o ms es aproximadamente del 5%. (Vea columna para
"una-cola, a = 0.05".) Por lo tanto, la probabilidad de que t tenga un valor de 2 o ms ser claramente menor que 5%.
Despus de encontrar el valor-t del coeficiente estimado de regresin b, el investigador debe decidir entonces si rechazar la hiptesis nula de que no existe relacin entre X y
Y en la poblacin. El procedimiento estndar es establecer lo que se llama el valor-t crtico
basado en un punto predeterminado de la distribucin-t. Generalmente este punto se establece en un nivel de significancia de 0.05. Podemos entonces ir a la tabla-t para encontrar
el valor crtico de t correspondiente a este nivel de significancia. Por ejemplo, la tabla mues-
193
-2
+2
Figura 5.14
Valores-t crticos para la
prueba de dos colas, nivel
de 5% de significancia, 60
grados de libertad
traque para 60 grados de libertad, el rango entre 2.0 y -2.0 incluye aproximadamente el
95% de los valores de t. Otra forma de decir esto es que la oportunidad de obtener un valor-t mayor que 2.0 o menor que -2.0 es de aproximadamente 5% o menos. La figura 5.14
ilustra el nivel 0.05 de significancia en una distribucin t con 60 grados de libertad. Observe que los valores de t son mayores o menores que el valor-t crtico que est situado en las
dos terminales o "colas" de distribucin.
La conclusin anterior nos ayuda a entender la racionalidad de la "regla de 2" empleada muchas veces por los economistas en su evaluacin de la prueba-t. Esta regla afirma
que la hiptesis nula de que b =O puede rechazarse si el valor-tes menor o igual a -2 o
mayor o igual a 2. Al utilizar el valor absoluto de t, podemos afirmar que la hiptesis nula
se rechaza si
La implicacin de esta regla emprica es que el nivel de significancia 0.05 se est utilizando para seleccionar el valor-t crtico. Como se observa en la tabla-t al nivel de 0.05 de
significancia, 2 sirve como una aproximacin til del valor-t crtico para 20 grados de libertad y superior.
194
Economa de empresa
por conveniencia. Si las frecuencias relativas son las mismas, no debe importar si se utilizan 45 o 4,500 cuadrados en este ejercicio.)
Coloque los 45 cuadrados en un sobre. Despus seleccione un cuadrado para cada
categora de ingreso. Asegrese de regresar el cuadrado al sobre despus de cada seleccin. Al hacer esto, usted est generando una muestra aleatoria de 10 observaciones,
una para cada categora de ingreso. Debido a que el nmero 5 ocurre ms frecuentemente
(9 veces en este ejercicio y 900 veces en una poblacin hipottica de estudiantes consumidores) es claro que la probabilidad de sacar este nmero del sobre es la mayor. De hecho,
cada vez que se selecciona un cuadrado, hay una probabilidad del 20% (9 145) de que el
nmero 5 sea seleccionado. Entonces combine el nmero sacado con su categora de ingreso para determinar el consumo correspondiente de pizza.
Suponga que uno de estos ejercicios produce la siguiente tabla de nmeros. Como referencia al ejercicio, el nmero que fue sacado del sobre se incluye entre parntesis junto
con las cantidades demandas de pizza.
CANTIDAD PROMEDIO DE REBANADAS
DE PIZZA DEMANDADA
INGRESO SEMANAL
10.0 (1)
$100
13.0 (5)
120
15.2 (7)
140
16.0 (5)
160
16.0 (1)
180
18.7 (4)
200
21.2 (7)
220
22.3 (6)
240
22.0 (1)
260
26.0 (8)
280
3.27 l- 0.078X
(0.86) (0.004)
(5.9)
Ahora llevaremos a cabo una prueba-t para la significancia del coeficiente de muestra
estimado, b. Recuerde que las hiptesis nula y alternativa se pueden expresar de la siguiente forma:
Ho . b -O
Claramente, nuestro coeficiente muestral bde 0.078 es mayor que cero. Por tanto, debemos determinar la probabilidad de encontrar tal valor muestra! a partir de una poblacin
cuyo valor verdadero es en realidad cero. Empezamos mediante la sustraccin del cero (el
valor de poblacin hipottico de b) de 0.078 (el valor estimado a partir de lamuestra, b), y
despus dividimos esta diferencia entre el error estndar de b. Por convencin, el error estndar de un coeficiente de regresin estimado se presenta entre parntesis debajo del
coeficiente. Como se observa en la ecuacin (5.9), el valor estndar debes 0.004, y el error
estndar de la interseccin es 0.86. Este procedimiento se resume aqu.
195
y
(Rebanadas 1
Mes)
25 r-
20 r-
15 r-
5 rAl
_1
Figura .1
Grfica de dispersin de
los datos de muestra para
el experimento de la pizza
t . ..:
(5.10)
t= 1
:f'
0.73
196
Economa de empresa
0.078 ""
t :::.: . .
0.004
Suponga que probamos esta hiptesis mediante una prueba de dos colas con un nivel
de 0.05 de significancia. Si regresamos nuevamente a la tabla-t en el apndice, encontramos un valor-t crtico de 2.306 para una regresin con 8 grados de libertad. Dado que el
valor-t de 1.25 no es mayor que 2.306, no podemos rechazar la hiptesis nula. Nuev;:unente, esto no significa que podamos decir ahora que el coeficiente de poblacin es en realidad 0.073. Sin embargo, esta falla en pasar la prueba-t significa que no podemos decir con
un alto grado de certidumbre que el valor de la poblacin no es de 0.073. Hasta que estudios futuros indiquen otra cosa, los investigadores quiz quieran asumir la hiptesis en
funcionamiento de que el coeficiente desconocido de poblacin est alrededor de 0.073.
La distribucin-t y
una
Al utilizar el
anlisis de regresin para la investigacin econmica y de negocios, el patrn para todas
las hiptesis nulas es afirmar que no existe relacin entre una variable particular independiente y la variable dependiente (por ejemplo, b = O). Sin embargo, los investigadores por
lo general hacen una eleccin en cuanto a si la hiptesis alternativa afirma que la variable
independiente simplemente tiene algn impacto en la variable dependiente (una prueba
de dos colas) o si indica un impacto positivo o negativo (una prueba de una cola). En la
evaluacin de la relacin entre ingreso y cantidad demandada de pizza, nuestra hiptesis alternativa fue que los cambios en el ingreso tenan un efecto en la cantidad demandada de pizza; no se estableci si este efecto era positivo o negativo. Si tuviramos una razn a priori para creer que el efecto del ingreso en la cantidad demandada era positivo o
negativo, se reflejara en la hiptesis alternativa. Por ejemplo, si establecemos la hiptesis
de que la pizza es un bien "normal",la hiptesis alternativa sera que los cambios en el ingreso tienen una relacin directa con los cambios en la cantidad demandada. Si establecemos la hiptesis de que la pizza es un bien "inferior", la hiptesis alternativa afirmara una
relacin inversa entre las dos variables. Mediante la notacin que hemos desarrollado:
Si se formula la hiptesis de que la pizza es un "bien normal" (el coeficiente
de la variable de ingreso es positivo), entonces
H0 : lJ :sO
H:
b.> O
Ei
Si se establece la hiptesis de que pizza es un "bien inferior" (el coeficiente de
la variable de ingreso es negativo), entonces
H0 : b::;:: O
H:b<~O
a
H0 : b =O
H:b?O
d
197
muy extenso de la prueba-t, as que resultar til resumir cada uno de los pasos implicados en la ejecucin de esta prueba.
Paso 1: Formule la hiptesis.
Por ejemplo, "la p~zza es un bien normal". (En otras palabras, se hace la hiptesis de
que el ingreso tiene una relacin directa con la demanda de pizza.)
Paso 2: Reformule la hiptesis en trminos adecuados para la prueba estadstica.
Con respecto a la hiptesis antecedente acerca del ingreso y la pizza,
o
: b.> o
:b
::~:
Paso 3: Establezca un nivel crtico de rechazo y encuentre el valor-t que corresponda a este nivel.
Por ejemplo, para una prueba de una cola, el nivel de significancia de 0.05 y 8 grados
de libertad (el nmero que asumimos para el anlisis de pizza), t* = 1.86. Por tanto, si
la estadstica-t es mayor que 1.86, podemos rechazar la hiptesis nula al nivel 0.05 de
significancia.
Paso 4: Encuentre la estadstica-t mediante la transformacin de la diferencia
entre el estimado b y su valor hipottico, O.
Por ejemplo, suponga que un coeficiente estimado es 2.5 y que el error estndar del
coeficiente es 1.3. Entonces
t
2.5-
oo:
1.92
ANLISIS D
a+ b1
198
Economa de empresa
una
(5.11)
(nnH.:ro promedio
U onzas de bebida
(en centavos)
plantel est ubicndo en una concentrada
urbana, Ode otra forma)
Suponga, como lo hicimos en la seccin de apertura de este captulo, que el anlisis
de regresin de datos de corte transversal de 30 universidades produce la siguiente relacin
estimada entre la cantidad demandada de pizza y nuestra seleccin de variables independientes:
+ 0.1
(0.018)
R2 . 0.7'17
R2 0.67
(0.087)
- 0.544)(1
(0.020)
(0.884)
(5.12)
F 15.8 n
Error
de Y. 1
Captulo 5 Estimacin de
demanda
199
+ 0.1
(1
(5.13)
cornpleta ms cercana)
-----X
ax
X
Y
Ahora usaremos esta frmula para calcular las diferentes elasticidades de demanda:
1
Elasticidad precio: -0.088 x -10.898
99
-0.807
14
110
10.898
0.767
La ecuacin tiene una R2 ajustada de 0.67. Esto significa que el67% de la variacin en
la variable dependiente se puede explicar por las variaciones en la variable independiente. Una vez ms, slo quienes estn familiarizados con este tipo de negocios podrn evaluar realmente el poder explicativo de esa ecuacin estimada. Sin embargo, 0.67 es una R2
mayor que la que se encuentra en la mayor parte de los estudios empricos de demanda
del consumidor que utilizan datos de corte transversal.
Para llevar a cabo la prueba-t, primero dividimos los errores estndar (citados entre
parntesis) entre sus respectivos coeficientes y comparamos estas razones-t con los valores apropiados en la tabla C.4 del apndice C. Al nivel de 0.05 de significancia, la prueba
de dos colas, podemos ver que el valor-t crtico de 25 grados de libertad es 2.06. Mediante este nivel crtico vemos que las variables x1, que indica el precio de la pizza, y x3, que
indica el precio de las bebidas gaseosas, son estadsticamente significativas.
En cuanto a las implicaciones para las polticas de estos hallazgos de regresin, suponga que usted es un empresario que est considerando abrir una cadena de pizzeras
en universidades a lo largo del pas. La inelasticidad precio de la pizza implica que usted
debe tratar de utilizar la publicidad y promocin en lugar de las reducciones en el precio
como medio de impulsar las ventas. Adems, la significancia estadstica del coeficiente
de la variable del precio le dara una gran seguridad en cuanto a que no debe tratar de
reducir el precio. Aunque el coeficiente de costo de la colegiatura no prob ser estadsticamente significativo, la relativamente baja elasticidad de la demanda del costo de la colegiatura lo llevar a la conclusin de que sus pizzeras no deben estar confinadas en algn
tipo particular de instituciones de educacin superior. Con base justamente en la elasticidad precio cruzada entre los precios de las bebidas gaseosas y la demanda de pizza, una
vez que las pizzeras se establezcan, usted quiz considere reducir el precio de las bebidas
como forma de impulsar la demanda de pizza.
200
Economa de empresa
Existe otra prueba de significancia estadstica, llamada la prueba-F, que se emplea comnmente en el anlisis de regresin. Esta prueba mide la significancia estadstica de
la ecuacin de regresin completa en lugar de la de cada coeficiente individual (como la
prueba-t). Anteriormente, afirmamos que R2 es la medida del poder explicativo del modelo de regresin. En efecto, la estadstica- F es una prueba de la significancia estadstica
de R2 La hiptesis nula de la prueba-F se expresa como sigue:
o
donde k es igual al nmero de variables independientes en la ecuacin de regresin.
Si la hiptesis nula es verdadera, virtualmente no existe ninguna relacin entre la variable dependiente y las k variables independientes para la poblacin, y cualquiera que
sea el valor de R2 (esto es, la proporcin de la variacin en Y explicada por X), es ms probablemente un resultado casual del proceso de muestreo.
El valor-F se define como
1)
201
Otra forma de ver la tendencia general de una ecuacin de regresin a pasar la prueba-Fes reconocer que los modelos de regresin que no pasen el examen deben de hecho
ser inferiores. En cualquier caso, aun si la estadstica-F indica la significancia estadstica
general del modelo de regresin, ah existe an la necesidad de someter cada variable independiente a un examen individual. Para ese propsito, confiamos en la prueba-t.
EMPL O D L AN Ll
REGRESiN PARA
LA DEMANDA
iS DE
ONOS ICAR
donde Q
:::e:
P=
l :;;;
CP ::::
Phd
Si asumimos que P = 100, I = 5, GP = 30 y Phd =125, nuestro pronstico para la cantidad de pizza demandada para el ao prximo ser de 300 (millones de rebanadas). Sin
embargo, cuando el anlisis de regresin se utiliza para el pronstico, debe tenerse el mismo cuidado que se tuvo al evaluar la significancia estadstica de los coeficientes de regresin individual. Esto se debe a que el pronstico est basado en una muestra de datos. Para tomar en cuenta que el valor de pronstico de 300 est basado en una muestra y es
por tanto sujeto a un error de muestreo, utilizamos una medida llamada error estndar
del estimado (EEE). Este trmino se incluye como una parte regular del ejemplar impreso de computadora de cualquier programa de software de regresin. De hecho, se puede mostrar que el error estndar del coeficiente (EE 6) se deriva en realidad del EEE de la
ecuacin de regresin.
De acuerdo con la teora estadstica, podemos esperar que el valor verdadero (pero
desconocido) de Y est dentro de un rango determinado por el valor estimado, ms o
menos el producto del error estndar del estimado y el valor-t apropiado. En forma
notacional,
Y:::::tn-k
EEE
Economa de empresa
pizza es 300 + 2.074 (25) o un rango de 248.15 a 351.85.10 Hay que tener precaucin cuando
se desarrolla un rango d~ pronstico para la variable dependiente de la ecuacin de regresin
estimada. La teora estadstica muestra que conforme los valores dados de las variables independientes (precio, ingreso, precio de productos relacionados) se alejan de sus valores
promedio, el rango de pronstico se ampla para cualquier nivel determinado de confianza.
TEMAS ADICIONAL
N
LA ESPECIFICACI N
EL
MODELO DE R GRESIN
203
Ingreso
ra 5.1
Efecto de la variable nula
Esto nos da la segunda curva de la demanda mostrada en la figura 5.16. En efecto, el cambio en X4 ha originado que la curva original se desplace hacia abajo.
El mtodo de mnimos cuadrados encuentra la mejor relacin lineal entre las variables
dependientes e independientes. Sin embargo, en ciertos casos, la teora econmica, la experiencia, o la simple observacin de la grfica de dispersin puede llevar a los investigadores a sospechar que la relacin entre las variables dependientes e independientes es no
lineal. Por ejemplo, suponga que los datos de ingreso (X) y de demanda para comidas en
restaurantes (Q 0 ) para una muestra de hogares produce el diagrama de dispersin que se
presenta en la figura 5.17a. Como podr ver, la dispersin implica una relacin no lineal
entre el ingreso y la demanda para comidas en restaurantes. Tales representaciones no
lineales son an adecuadas para la estimacin mediante el uso del anlisis de regresin lineal. Por ejemplo, podramos especificar un modelo de regresin polinomial en el que el
trmino independiente, X, se eleve tanto al segundo como al primer grado. La figura
5.17b ilustra esta opcin. Tambin podramos especificar nuestra ecuacin de regresin en
trminos de una funcin de potencia. La figura 5.17c ilustra esta posibilidad. En cualquier
caso, la idea es la de usar el mtodo de mnimos cuadrados para estimar los coeficientes
de las ecuaciones. Las pruebas y estadsticas comunes (prueba-t, prueba-F, R2) se emplean an.en la evaluacin de los resultados de regresin.
Cuando utilizamos la funcin de potencia, primero aplicamos una transformacin logartmica a la especificacin original. Por ejemplo, dejemos que la ecuacin original sea
como sigue:
una
en un restauranlc:
204
come
Qo
X(Ingreso)
(a)
X (Ingreso)
X (Ingreso)
(b)
,.gura
(e)
. 1""'"~
.,
elaciones no lineales
o.:.:..
loga
+.
b logX
Para desarrollar un anlisis de regresin de este tipo de datos no lineales, primero encontramos los logaritmos de cada uno de los valores de Y y X en la muestra de datos.
Entonces hacemos la regresin de logY con logX mediante el mtodo de los mnimos
cuadrados. Una forma en que se puede evaluar la ecuacin de regresin transformada es la
de comparar su R2 con el de la ecuacin lineal simple (esto es, Q 0 =a + bX). Si el R2 de
la ecuacin exponencial transformada es mayor que el de la expresin lineal simple, parecer que el modelo no lineal ofrece una mejor explicacin para la varianza de Q0 .
El uso de la ecuacin logartmica lineal en el anlisis de regresin es particularmente
adecuado para los economistas, debido a que para cambios relativamente pequeos en X,
205
PRO LEMA
EN
DEL ANLISIS D
IN
Una exposicin plena de los problemas que pueden surgir en la regresin est ms all de
las pretensiones de este captulo y este texto. Como se mencion al comienzo del presente captulo, existen textos y cursos completos, desde introductorios hasta avanzados, dedicados al estudio del anlisis de regresin. No obstante, debemos citar y explicar brevemente algunos de estos problemas para que los lectores que no estn familiarizados con
este tema adquieran una apreciacin de los retos reales que aguardan a quienes desean
aplicar el anlisis de regresin a la investigacin econmica y de negocios.
problema de identificacin
El problema de identificacin representa tal vez el mayor reto para quienes utilizan el
anlisis de regresin para estimar la demanda de un bien o servicio en particular. A fin de
explicar este problema, retornemos a nuestro ejemplo de las pizzas. Suponga que tenemos datos de series de tiempo relacionados con el consumo per cpita de pizza y con el
precio de pizza durante un periodo de 20 aos. La grfica de dispersin de esta informacin se presenta en la figura 5.18a. Observe que la dispersin tiende a tener una pendiente hacia arriba y que la estimacin de regresin de los mnimos cuadrados reflejara este
patrn de relacin. Esto significa que los consumidores de pizza se comportan irracionalmente y demandan ms pizza a precios ms altos? El sentido comn evitara esta conclusin, pero entonces por qu el coeficiente positivo de la variable de precio en la ecuacin
de la demanda? El lector alerta afirmara que lo que hemos identificado como una ecuacin de la demanda es probablemente alguna clase de ecuacin de la oferta o quiz, el resultado del movimiento tanto en la oferta como en la demanda durante los pasados 20
aos. Como se advierte en la figura 5.18b, si la oferta permaneci constante durante los
pasados 20 aos mientras la demanda se desplaz hacia arriba (debido a cambios en factores tales como el ingreso, nmero de compradores, gustos y preferencias durante este
periodo),la ecuacin de regresin sera realmente un reflejo de la curva de la oferta Or Si
la oferta se increment pero la dem~nda se increment ms que la oferta, entonces la estimacin de regresin sera realmente un reflejo de la interseccin de varias curvas O y D
en la figura 5.18c. La figura 5.18d muestra otra posibilidad. En este caso, la oferta se desplaza ms que la demanda, de manera que la lnea de regresin estimada tiene pendiente
hacia abajo y es ms parecida a lo que esperaramos de una curva de la demanda. No obstante, esta curva de la demanda estimada es ms plana que las curvas de demanda verdaderas, que se desplazan en forma gradual hacia la derecha con el paso de los aos. Por
tanto, el estimador de la regresin de la relacin entre el precio y la cantidad demandada
U Para una explicacin del significado de los coeficientes en una ecuacin de regresin lineal logartmica,
vea el anlisis de matemticas bsicas de la funcin de Cobb-Douglas en el captulo 7.
206
Economa de empresa
Precio
Precio
(a)
(b)
Qo
Qo
o3
X
.
D2
,
D2
Dl
Precio
Precio
(e)
(d)
Figura 5.18
El problema de identificacin
estara sesgado en el sentido de que podra indicar una elasticidad precio mucho mayor
de la que en realidad existe en la poblacin de consumidores de pizza.
Existen tcnicas de estimacin avanzadas, tales como los mtodos de mnimos cuadrados
de dos etapas y mnimos cuadrados indirectos, que ayudan al investigador a tratar con muestras
en las que los desplazamientos simultneos de la oferta y la demanda tienen lugar. Esencialmente, estas tcnicas implican la consideracin simultnea de las ecuaciones de la
oferta y la demanda con el uso de una sola ecuacin de regresin. La descripcin de estas
tcnicas est fuera del alcance de este texto. Pero el punto principal a recordar es que si la
identificacin del problema no se reconoce y se trata por el investigador, el mtodo de los
mnimos cuadrados ordinarios dar como resultado estimaciones sesgadas de los coeficientes de regresin.
Captulo 5 Estimacin de la demanda
207
Autocorrelacin
La autocorrelacin es un problema que se encuentra generalmente cuando se utilizan datos
de series de tiempo. Por esta razn con frecuencia se denomina correlacin serial. Utilicemos
el caso de la regresin simple, que implica slo la variable dependiente Y y una variable
independiente, X. Esencialmente, la autocorrelacin ocurre cuando la variable Y se relaciona
12El coeficiente de correlacin es un medicin del grado de asociacin entre dos variables. Esta medicin,
denotada como r, vara de un valor de -1 (correlacin negativa perfecta) a 1 (correlacin positiva perfecta).
208
Economa de empresa
(a)
Tiempo
(b)
Figura 5.19
Autocorrelacin
con la variable X de acuerdo con cierto patrn. Por ejemplo, en la figura 5.19a, la grfica
de dispersin revela que al incrementarse X (presumiblemente durante el tiempo), el valor Y se desva de la lnea de regresin de una forma muy sistemtica. En otras palabras,
el trmino residual, o la diferencia entre el valor observado de Y y el valor estimado de Y
dado X(Y) se alterna entre un valor positivo y negativo de aproximadamente la misma
magnitud a travs del rango de los valores X. De hecho, si graficramos estos residuos
por separado, tendran el patrn mostrado en la figura 5.19b.
Una posible causa de autocorrelacin es que existen efectos en Y que no explican las
variables incluidas en la ecuacin de regresin. Tambin puede deberse a que la relacin
verdadera entre Y y la(s) variable(s) independiente(s) es no lineal. Pero sin importar la razn, si se presenta la autocorrelacin en el anlisis de regresin, se crea un problema para
la validez de la prueba-t. Dicho de forma simple, la autocorrelacin tiende a incrementar la
probabilidad de que la hiptesis nula sea rechazada. Esto se debe a que la autocorrelacin
da un sesgo hacia abajo al error estndar del coeficiente estimado de regresin (EE;). Al
recordar que el valor-t se define como (b - b) /EE;, podemos ver que un EE; ms pequeo
tender a incrementar la magnitud del valor-t, al permanecer constantes otros factores. Por
tanto, en la presencia de autocorrelacin, los investigadores pueden declarar que ciertas
variables independientes tienen un impacto estadsticamente significativo en la variable
dependiente cuando de hecho no lo tienen. Desde el punto de vista de las polticas, suponga que el coeficiente estimado de la variable de publicidad en un modelo de regresin
de demanda pas la prueba-t cuando no tena que hacerlo realmente. Una empresa entonces quiz incrementara los gastos en publicidad cuando de hecho debera buscar
otras formas de expandir la demanda (a travs de promociones, canales de distribucin
alternativos o acciones sobre precios).
Puede resultar difcil identificar la autocorrelacin mediante la simple observacin
del patrn de los residuos de una ecuacin de regresin. Una prueba estndar para identificar la presencia de este problema es la prueba de Durbin-Watson. La estadstica de DurbinCaptulo 5 Estimacin de la demanda
209
Watson (DW) se calcula rutinariamente en los paquetes de software de regresin y se presenta automticamente en el ejemplar impreso de la computadora. Como en el caso de la
prueba-t y de la prueba-F, existe un tabla de Durbin-Watson que lista los valores crticos
de esta estadstica para un nivel dado de significancia (generalmente el nivel 0.05). Hemos incluido dicha tabla en el apndice en la parte final de este texto (vea tabla C.5). Como
regla emprica, si la estadstica DW est alrededor de 2, hay mucha probabilidad de que no
se presente autocorrelacin en los datos. Pero si la estadstica DW indica la presencia de
autocorrelacin, existen ciertas cosas que un investigador puede hacer para corregir el
problema. Esto incluye la transformacin de los datos en un orden diferente de magnitud
o la introduccin de datos adelantados o rezagados en las series de tiempo.
L~,
\~
Es algo difcil obtener los resultados reales de regresin en la demanda del consumidor
por parte de compaas tales como ACNielsen e IRI, o de grupos de investigacin de mercado de los principales fabricantes de bienes de consumo. Sabemos que la regresin es
una herramienta til para estos investigadores, pero desafortunadamente, todos sus estudios estn patentados. Los lectores deben estar seguros de que muchos de estos estudios
reales utilizan especificaciones de ecuaciones de regresin similares a las presentadas en
este captulo. Sin embargo, muchos estudios llevados a cabo por investigadores acadmicos estn disponibles para el pblico en general. Hemos seleccionado dos de tales estudios, principalmente debido a que dan a los lectores un ejemplo del comportamiento del
consumidor fuera de Estados Unidos.13
Pan y cereales
Carne
Pescado
Leche, productos lcteos y huevos
Frutas, vegetales y papas
Grasas y aceites
Los resultados revelaron que los cambios en la demanda de la comida (en trminos
de caloras consumidas) no depende:n slo del ingreso y de los precios actuales, sino tambin de los valores rezagados de estas variables. Los consumidores de alimentos en Espaa no ajustan inmediatamente sus gastos cuando los ingresos o precios cambian. Ms
bien parecen mostrar un cierto nivel de inercia.
De las seis categoras, slo la carne se considera un bien "superior", con una elasticidad ingreso de 1.54. Entre los otros cinco grupos, slo las frutas y vegetales tienen una
elasticidad ingreso cercana a la unidad (.9), mientras que la elasticidad de grasas y aceites
es la ms baja, con .35. En trminos de elasticidades precio propias, la carne muestra el
13Tambin
210
Economa de empresa
coeficiente ms alto de -.8. Todas las dems son tambin negativas; todas tienen resultados en la prueba-t que son siginificativamente diferentes a cero. La mayora de las elasticidades cruzadas son muy bajas y no son estadsticamente significativas, lo que indica
que no hay una gran posibilidad de sustitucin entre estos productos. Existen pocas excepciones, la ms importante es el pescado y la carne, cuyos resultados en la prueba-t son
significativos. La R2 para la ecuacin es relativamente alta, .63.14
= ao + a, pt + a2 yt
+ a3Ht
+ a4Xt + er
donde C1 =
P1 =
Y1 =
H1 =
xi
Adems, se estimaron las funciones separadas de demanda para cigarros nacionales e importados. Las ecuaciones utilizadas en estos clculos fueron similares a las de arriba, a excepcin de un trmino que se aadi a cada ecuacin. En la ecuacin de demanda
interna de cigarros, se incluy el precio de cigarros importados para medir la elasticidad
precio cruzada. En la ecuacin para cigarros importados, se incluy el precio de los cigarros nacionales. Se utilizaron dos mediciones de informacin de salud:
l. Participacin de mercado para cigarros de bajo alquitrn
2. Etiquetas con advertencias claramente expresadas adoptadas en 1992. Una variable
nula de Ohasta 1991 y de ah en adelante se emple 1
211
Cuando los cigarros nacionales e importados se consideraron por separado, los resultados fueron similares. Las elasticidades precio cruzadas en ambas ecuaciones fueron positivas, indicando que los cigarros nacionales e importados eran sustitutos. Los coeficientes de determinacin para los distintos modelos fueron muy satisfactorios; fueron
aproximadamente de .91 para el total de las ecuaciones, y .71 y .88 para las ecuaciones en
las que los cigarros nacionales e importados se estudiaron por separado. 15
La solucin
a
A L
d<') bebidas
donde O '''' consumo anual per
ING = ingreso anual per cpita
TEMP ::::o
re promedo anual
Los resultados del anlisis de computadora se presentan en la tabla 5.4.
La temperatura tuvo un impacto considerable as como estadsticamente significativo en el consumo de bebidas gaseosas. Cada grado adicional de temperatura anual promedio dio como resultado un incremento en el consumo per cpita
*Los autores debatieron acerca de si usar datos artificialmente creados para demostrar todos los
temas presentados en este captulo o usar datos reales, lo cual limitara la aplicacin del anlisis de regresin. Se eligi la ltima opcin debido a que en las situaciones reales de negocios, la
falta de buenos datos es mucho ms limitante que el conocimiento del anlisis estadstico o que
el poder de la computacin disponible para manejar los nmeros. Las cifras del consumo de
bebidas gaseosas del estudio de la National Bottler's Gazette aparecieron originalmente en un libro de texto de investigacin de mercado que est agotado. Desafortunadamente, este texto no
cit la fecha en que se obtuvieron las cifras.
(Contina)
15Chee-Ruey
Hsieh, Teh-Wei Hu y Chien-Fu Jeff Lin, "The Demand for Cigarettes in Taiwan: Domestic
vs. Imported Cigarettes", Contemporary Economic Policy, abrill999, pp. 223-234.
212
Economa de empresa
Tabla 5
Consumo de bebidas gaseosas, temperatura e ingreso por estado
CONSUMO DE BEBIDAS
ESTADO
Alabama
Arizona
Arkansas
California
Colorado
Connecticut
Delaware
Florida
Georgia
Idaho
Illinois
Indiana
Iowa
Kansas
Kentucky
Louisiana
Maine
Maryland
Massachusetts
Michigan
Minnesota
Mississippi
Missouri
Montana
Nebraska
Nevada
New Hampshire
NewJersey
NewMexico
NewYork
North Carolina
North Dakota
Ohio
Oklahoma
Oregon
Pennsylvania
Rhode Island
South Carolina
South Dakota
Tennessee
Texas
Utah
Vermont
Virginia
Washington
West Virginia
Wisconsin
Wyoming
Capitulo 5 Estimacin
200
150
237
135
121
118
217
242
295
85
114
184
104
143
230
269
111
217
114
108
108
248
203
77
97
166
177
143
157
111
330
63
165
184
68
121
138
237
95
236
222
100
64
270
77
144
97
102
la demanda
TEMPERATURA
op
MEDIA
$13
17
11
25
19
27
28
18
14
16
24
20
16
17
13
15
16
21
22
21
18
10
19
19
16
24
18
24
15
25
13
14
22
16
19
20
20
12
13
13
17
16
16
16
20
15
19
19
66
62
63
56
52
50
52
72
64
46
52
52
50
56
56
69
41
54
47
47
41
65
57
44
49
48
35
54
56
48
59
39
51
82
51
50
50
65
45
60
69
50
44
58
49
55
46
46
213
de bebidas gaseosas de 4.7 botellas. Mediante la "regla de 2", podemos ver que el valor-tde
5. 70 es claramente significativo. El coeficiente estimado de la variable de ingreso es interesante. Primero, su valor negativo indica que una bebida gaseosa es un producto "inferior".
Los niveles ms altos de ingreso redundan en un consumo ms bajo per cpita, y un ingreso
ms bajo implica un consumo ms alto. Sin embargo, el valor-t de -1.2 est por debajo del
valor-t crtico. Por lo tanto, el ingreso no puede considerarse como un determinante estadsticamente significativo del consumo de bebidas gaseosas. La R2 ajustada de 0.46 indica
que aproximadamente la mitad de la variacin en el consumo de bebidas gaseosas puede
explicarse por la variacin en el ingreso per cpita y la temperatura anual promedio. Esto es
lo que se esperaba, considerando el hecho de que se utilizan datos de corte transversal y
de que slo dos variables independientes se incorporaron en la ecuacin. No obstante, el
valor-F de 21.37 indica que la R 2 es estadsticamente significativa, porque el valor crtico de
F al nivel de 0.05 con 2 y 45 grados de libertad es de 3.20.
Jennifer quiso incluir el precio en su modelo de regresin. Desafortunadamente, no
hubo datos de series de tiempo disponibles para el precio. Haba algunos datos de corte
transversal sobre los precios promedio en diferentes regiones del pas, pero estos datos no
fueron adecuados para el anlisis de regresin, debido a que los precios fueron bsicamente los mismos para todas las regiones. El anlisis de regresin requiere una variacin en los
valores de las variables independientes. De otra forma, no hay grfica de dispersin a la
cual ajustar la lnea de regresin.
Tabla 5.4
Resultado del anlisis de regresin de Excel
ESTADSTICAS DE REGRESIN
Rmltiple
Rcuadrada
R cuadrada ajustada
Error estndar
Observaciones
0.697953501
0.487139089
0.464345271
49.71283142
48
.ANOVA
--------Regresin
Residual
Total
DF
SS
MS
2
45
47
105633.7976
111211.4524
216845.25
52816.9
2471.366
SIGNIFICANCIA F
21.371544
2.98532E-07
-------------------------------------
95%
95%
COEFICIENTES
ESTNDAR
ESTADSTICA T
VALORP
MS BAJO
MS ALTO
-54.841134
-2.20457538
4.719982058
63.45499732
1.825233618
0.828234444
-0.864252
-1.207832
5.698848
0.3920329
0.2334217
8.722E-07
-182.6460536
-5.880784437
3.05183233
72.96379
1.471634
6.388132
ERROR
------------------- -----------------------------------Interseccin
X Variable 1
X Variable 2
214
Economa de empresa
RESUMEN
----------------------------------------------------------------------------~~~
Este captulo ha presentado una introduccin al anlisis de regresin, el mtodo ms
comnmente utilizado por los economistas para la estimacin de demanda de bienes y
servicios. En realidad, el material de este captulo es slo una pequea parte de la econometra, que es la aplicacin del anlisis estadstico multivariable a la teora econmica. La
importancia primordial de este captulo es que ayuda a comprender cmo se aplican las
tcnicas del anlisis de regresin a los negocios interesados en saber ms acerca de los aspectos cuantitativos de la demanda de sus productos. Los lectores deben apreciar el reto de
aplicar el anlisis de regresin y otras tcnicas estadsticas a los problemas de negocios
debido a la dificultad de obtener datos confiables y precisos.
El proceso de aplicacin del anlisis de regresin para la estimacin de la demanda
se resume en los siguientes pasos:
1. Especificacin del modelo de regresin de la demanda.
2. Recoleccin de datos relevantes.
3. Estimacin de la ecuacin de regresin.
4. Anlisis y evaluacin de los resultados de regresin (prueba-t, prueba-F, R2) y ajuste
o correccin de cualquier problema estadstico (multicolinealidad, autocorrelacin,
forma funcional incorrecta).
5. Evaluacin de los hallazgos de regresin para su uso en la toma de decisiones de
polticas.
En un curso formal de econometra, el mayor nfasis se pone en los pasos 1, 3 y 4 (los
mayores aspectos tcnicos de este tipo en el anlisis estadstico). En negocios, los pasos ms importantes son el2 y 5. Las computadoras poderosas y los paquetes sofisticados
de software estn actualmente disponibles para cualquiera a un costo tan razonable que se
ha vuelto elemental aplicar el anlisis de regresin en la estimacin de la demanda o en
cualquier otro aspecto de la investigacin de negocios. El verdadero reto es obtener buenos
datos y aplicar juiciosamente los resultados del anlisis de regresin al proceso de toma
de decisiones. En estas dos reas del anlisis de regresin, ningn libro de texto o curso
pueden tomar el lugar de la experiencia.
CONCEPTOS IMPORTANTES
\.nlisis de regresin: Una tcnica estadstica para
encontrar la mejor relacin entre la variable dependiente y las variables independientes seleccionadas.
Si slo se utiliza una variable independiente, esta
tcnica se denomina regresin simple. Si se emplea
ms de una variable independiente, se llama regresin
215
PREGUNTAS
--------------------------------------------------------------------------------~~~
1. Explique la diferencia entre los datos de series
la demanda para bienes de consumo durables
de tiempo y los datos de corte transversal.
Proporcione ejemplos de cada tipo de datos.
2. Habr alguna diferencia en el conjunto de variables utilizadas en el modelo de regresin de
216
Economa de empresa
PROBLEMAS
-------------------------------------------------------------~A~~~~
l. En los primeros aos de la dcada de los noventa, la industria de la electrnica de
consumo tena altas esperanzas para el xito de un tipo de reproductor de discos
compactos que despliega programas sofisticados de audio y video en un equipo
de televisin. El precio inicial de este producto, que permitira a los usuarios recorrer programas que van de las obras completas de William Shakespeare a un libro
de cocina con ms de 450 recetas con fotografas a color y sonorizacin, se fij en
aproximadamente $1,000.
a. Suponga que se le pidi que llevara a cabo una investigacin de mercado para
este producto. Es posible usar el anlisis de regresin para un producto como ste,
que nunca antes ha estado en el mercado? Si lo cree as, qu tendra que hacer
para llevar a cabo esta investigacin?
b. Al acumularse datos acerca de las ventas de este producto, sugiera los tipos de
variables que podran incluirse en el anlisis de regresin de la demanda para
este nuevo tipo de reproductor de CD.
c. Qu le dice la actual popularidad de las computadoras multimedia personales,
los juegos de video y los asistentes personales digitales, acerca de las dificultades de usar la regresin (o en este caso, cualquier otra tcnica cuantitativa) para
pronosticar la demanda de un producto?
2. Una de las tareas ms difciles en el anlisis de regresin es la de obtener datos
adecuados para los estudios cuanttativos de esta clase. Suponga que est tratando
de estimar la demanda para los muebles del hogar. Sugiera las clases de variables que
conviene usar para representar los siguientes factores, que se cree afectan la demanda de cualquier producto. Sea tan especfico como sea posible acerca de cmo van a
medirse dichas variables. Anticipa usted cualquier dificultad para obtener tales
datos? Explique.
Capitulo 5 Estimacin de la
217
DETERMINANTES DE
EN EL ANUSIS DE REGRESIN
---------------------------------Precio
Gustos y preferencias
Precio de productos relacionados
Ingreso
Costo o disponibilidad de crdito
Nmero de compradores
Expectativas futuras
Otros factores posibles
PRECIO
CANTIDAD
Ene.
Feb.
Mar.
Abril
Mayo
12,500
15
12,200
17
11,900
16
12,000
18
11,800
20
Junio
12,500
18
Julio
Agosto
Sept.
Oct.
Nov.
11,700
22
12,100
15
11,400
22
11,400
25
11,200
24
Dic.
11,000
30
Ene.
Feb.
10,800
25
10,000
28
b. Qu otros factores adems del precio deben incluirse en esta ecuacin? Usted
prev alguna dificultad en la obtencin de datos adicionales o en su incorporacin dentro del anlisis de regresin?
4. El fabricante de una marca lder de comida de bajas caloras para microondas estim
la siguiente ecuacin de demanda para su producto mediante el uso de datos de 26
supermercados alrededor del pas para el mes de abril:
O
218
.c.::
Economa de empresa
(6.2)
R2
"'
0.55
.c.::.
(2.5)
26
(0.09)
(0.21)
F = 4.88
+15,000
(5,234)
R2
"'"'
(1.29)
0.68
(175)
(0.12)
EEE = 786
(0.17)
+ 0.2Pc
(0.13)
F = 21.25
=--=
o:-:::
=8,000
a. Calcule las elasticidades para cada una de las variables. Sobre esta base, discuta
el impacto relativo de cada variable en la demanda. Qu implicaciones tienen
estos resultados para el marketing de la empresa y las polticas de fijacin de
precios?
b. Lleve a cabo una prueba-t para la significancia estadstica de cada variable. En
cada caso, exprese si se requiere la prueba de una o de dos colas. Qu diferencia
hay en los resultados, si es que hay alguna, en el uso de la prueba de una cola o
de dos colas?
c. Suponga que un administrador que evala estos resultados sugiere que las tasas
de inters y el desempeo de la computadora (tpicamente medidos en millones
de instrucciones por segundo, MIPS) son determinantes importantes de la demanda de estaciones de trabajo y por lo tanto deben incluirse en el estudio. Cmo respondera a esta sugerencia? Explique.
Captulo 5 Estimacin de la demanda
219
6. Deck & Blacker es un fabricante de aparatos pequeos de cociria. Su economista estima la siguiente demanda para hornos tostadores mediante los datos reunidos en 16
trimestres de los diez distribuidores ms importantes de venta al detalle de su producto. Este tipo de muestra, que implica el uso de datos de corte transversal y de series de tiempo, se denomina muestra mancomunada o agrupada. Sobre la base de esta
muestra mancomunada de 160 observaciones, el economista estim la siguiente
ecuacin:
Q
1. 1P + 1
(0.9)
!-
(0.6)
17)
(0.1
f.:c.c
Q . caridad demandada, en
P = precio, en dlares:::
gastos en publicidad, en miles = 20
1 e::: ingreso promedo de hogares; en miles = 31
H =: nmero total de ventas residenciales, c~n miles:;::; 10
P, ::. precio
competidor lder, en
=50
A
()9:')
/(i
p1.'
!
Asuma que cada coeficiente es estadsticamente significativo (es decir, que pas la
prueba-t). Con base en la informacin dada, conteste las siguientes preguntas:
a. Comente la posibilidad de sustitucin entre los carros de lujo estadounidenses y
europeos, y entre los carros de lujo europeos y japoneses. Explique algunas de
las posibles razones para los resultados en la ecuacin.
b. Comente acerca del coeficiente para la variable de ingreso. Era ste el resultado
que usted esperaba? Explique.
c. Comente acerca del coeficiente de la variable del precio del auto europeo. Es lo
que usted esperara? Explique.
220
Economa de empresa