Anda di halaman 1dari 157

Grado en Ingeniera Informatica

Estadstica

Curso 2011/2012

Dpto. Estadstica e I.O.


Universidad de Granada

Tema 1. Estadstica Descriptiva Unidimensional

Introducci
on: Conceptos b
asicos

TEMA 1. ESTADISTICA DESCRIPTIVA


UNIDIMENSIONAL

INTRODUCCION:
CONCEPTOS BASICOS
La observaci
on de fen
omenos que acontecen en la vida real permiten establecer una
clasificaci
on de los mismos:
Fen
omeno determinista: Un fen
omeno es determinista si al repetirlo en identicas
condiciones se obtiene el mismo resultado.
Fen
omeno aleatorio: Un fen
omeno es aleatorio si al repetirlo en an
alogas
condiciones puede presentar resultados diferentes.
La estadstica se ocupa principalmente de los fen
omenos aleatorios, encontr
andose
ante un conjunto de observaciones que presentan una variabilidad difcil de explicar y que
requieren un tratamiento especial (tratamiento estadstico) para poder efectuar
conclusiones. Por lo tanto, la estadstica es una rama de las matem
aticas que trata de la
recopilaci
on, el an
alisis, la interpretaci
on y la representaci
on de una gran cantidad de
datos numericos.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

2 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Introducci
on: Conceptos b
asicos

Las etapas de un estudio estadstico son las siguientes:

1. Recogida de datos

Estadstica descriptiva
2. Ordenaci
on, tabulaci
on y gr
aficos

3. Descripci
on de caractersticas
o
Inferencia estadstica
4. An
alisis formal
Definici
on
Se denomina poblaci
on al conjunto objeto de estudio, es decir, cualquier conjunto de
unidades con ciertas caractersticas comunes, sobre las que se desea informaci
on.
Definici
on
Cada uno de los elementos de la poblaci
on se denomina unidad estadstica o individuo.
La poblaci
on puede ser finita o infinita, seg
un que los elementos que la formen se
presenten en n
umero finito o infinito.
Definici
on
Se denomina muestra a un subconjunto representativo de la poblaci
on.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

3 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Introducci
on: Conceptos b
asicos

Definici
on
Se llaman caracteres a las propiedades que se desean observar en los elementos de la
poblaci
on y que han de tener todos y cada uno de ellos.
En un estudio particular pueden considerarse una sola caracterstica o varias a la vez.

Definici
on
Las modalidades son cada una de las formas en que puede presentarse un car
acter.
Para estar bien definidas deben cumplir dos requisitos: exhaustividad e
incompatibilidad.
Modalidades exhaustivas: Se dice que las modalidades de un car
acter son exhaustivas si
cubren todas las posibles formas en que este se manifiesta.
Modalidades incompatibles: Se dice que las modalidades de un car
acter son
incompatibles cuando cada individuo solo puede presentar una de las
modalidades.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

4 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Introducci
on: Conceptos b
asicos

Clasificaci
on de caracteres seg
un las modalidades:
Cuantitativos: Un car
acter es cuantitativo cuando sus modalidades son medibles
numericamente. Los caracteres cuantitativos se denominan tambien
variables estadsticas. Se subdividen en dos grupos:
Variables estadsticas discretas: Son aquellas que tienen un n
umero
finito o infinito numerable de modalidades. Las modalidades son
valores aislados.
Variables estadsticas continuas: El n
umero de modalidades es no
numerable. Las posibles modalidades son todos los valores de un
intervalo.
Cualitativos: Un car
acter es cualitativo cuando sus modalidades no son medibles
numericamente. Un car
acter cualitativo recibe tambien el nombre de
atributo.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

5 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Distribuci
on de frecuencias

DE FRECUENCIAS
DISTRIBUCION
Definici
on
La distribuci
on de frecuencias de una variable estadstica es el conjunto de valores
ordenados de la variable con sus frecuencias correspondientes.

Formalmente se representa por el conjunto de pares ordenados.


Variable cualitativa
{(Mi ; ni )}ki=1
o
{(Mi ; fi )}ki=1

Variable cuantitativa
Discreta
Continua
{(xi ; ni )}ki=1 {(Ii ; ni )}ki=1
o
o
{(xi ; fi )}ki=1
{(Ii ; fi )}ki=1

Mi : cada una de las modalidades de una variable cualitativa.


xi : cada uno de los valores numericos que puede tomar una variable estadstica
discreta.
Ii : cada uno de los intervalos que constituyen las modalidades de una variable
estadstica continua, considerando que Ii = (ei1 ; ei ], siendo ei1 y ei los extremos
inferior y superior, respectivamente, del intervalo.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

6 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Distribuci
on de frecuencias

Se considera un car
acter X con k modalidades, x1 , x2 , . . . , xk . Las frecuencias
asociadas a la modalidad xi son:
Definici
on
Frecuencia absoluta (ni ): N
umero de individuos de la poblaci
on que presentan dicha
modalidad, es decir, el n
umero de veces que se repite. Como las modalidades deben ser
incompatibles y exhaustivas se verifica que
N=

k
X

ni

i=1

siendo N el n
umero total de observaciones.
Definici
on
Frecuencia relativa (fi ): Proporci
on de individuos de la poblaci
on que presentan dicha
k
X
fi = 1
modalidad. Es decir, fi = nNi . Se verifica que
i=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

7 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Distribuci
on de frecuencias

Definici
on
Frecuencia absoluta acumulada (Ni ): N
umero de individuos que presentan un valor de la
variable menor o igual que el considerado, por lo tanto, es la suma de las frecuencias
absolutas hasta la i-esima modalidad,
Ni = n1 + n2 + ... + ni =

i
X

nj Nk = N =

j=1

k
X

ni

i=1

Definici
on
Frecuencia relativa acumulada (Fi ): Proporci
on de individuos de la poblaci
on que
presentan un valor de la variable menor o igual que el considerado, por lo tanto, es la
suma de las frecuencias relativas hasta la i-esima modalidad,
Fi = f1 + f2 + ... + fi =

i
X
j=1

Tambien puede calcularse como Fi =

(Dpto. Estadstica)

f j Fk = 1 =

k
X

fi

i=1

Ni
N

Estadstica

Curso 2011/2012

8 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Tablas de frecuencias

TABLA DE FRECUENCIAS DE UNA VARIABLE ESTADISTICA DISCRETA


Se considera una variable estadstica discreta, X, que toma los valores x1 , . . . ,
xi , . . . , xk . La tabla estadstica con los tipos de frecuencias estudiados se construye de la
siguiente forma:
xi
x1
x2
..
.
xi
..
.
xk
Total

(Dpto. Estadstica)

ni
n1
n2
..
.
ni
..
.
nk
N

Ni
N1
N2
..
.
Ni
..
.
Nk = N

Estadstica

fi
f1
f2
..
.
fi
..
.
fk
1

Fi
F1
F2
..
.
Fi
..
.
Fk = 1

Curso 2011/2012

9 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Tablas de frecuencias

TABLA DE FRECUENCIAS DE UNA VARIABLE ESTADISTICA CONTINUA


En las variables de tipo continuo se agrupan los valores de la variable en intervalos o
clases que se denotan como Ii = (ei1 , ei ]
Cada clase est
a representada por su punto medio, que recibe el nombre de marca de
clase, y se denota por xi , por lo tanto, se obtiene como
xi =

ei1 + ei
2

Se define amplitud del intervalo a la diferencia entre los extremos del intervalo,
ai = ei ei1
Los intervalos de una poblaci
on pueden elegirse de igual o distinta amplitud.
El n
umero de intervalos, k, a utilizar no est
a determinado de forma fija y por tanto, se
usa un k que permita trabajar c
omodamente y represente bien la estructura de los datos.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

10 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Tablas de frecuencias

La tabla de frecuencias correspondiente a las variables estadsticas de tipo continuo con


las frecuencias estudiadas es la siguiente:
Ii = (ei1 , ei ]
(e0 , e1 ]
..
.
(ei1 , ei ]
..
.
(ek1 , ek ]
Total

(Dpto. Estadstica)

xi
x1
..
.
xi
..
.
xk

ni
n1
..
.
ni
..
.
nk
N

Ni
N1
..
.
Ni
..
.
Nk = N
1

Estadstica

fi
f1
..
.
fi
..
.
fk

Fi
F1
..
.
Fi
..
.
Fk = 1

ai
a1
..
.
ai
..
.
ak

Curso 2011/2012

11 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Representaciones gr
aficas

La representaci
on gr
afica tiene por objeto proporcionar una sntesis visual de la
distribuci
on de frecuencias, haciendo resaltar detalles que no resultan f
acilmente
perceptibles directamente en la tabla estadstica.

REPRESENTACIONES GRAFICAS
DE VARIABLES ESTADISTICAS DISCRETAS
Diagrama de barras: Sobre un sistema cartesiano se
representan en el eje de abscisas los valores de la variable
y sobre cada uno de estos valores se levantan barras de
altura igual a su frecuencia absoluta o a su frecuencia
relativa.
Polgono de frecuencias: Es la lnea que se obtiene
uniendo con segmentos, en el diagrama de barras, los
puntos medios de los extremos superiores de las barras
recibe el nombre de polgono de frecuencias.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

12 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Representaciones gr
aficas

REPRESENTACIONES GRAFICAS
DE VARIABLES ESTADISTICAS
CONTINUAS
Histograma: El histograma se construye representando
los intervalos en el eje de abscisas y la densidad de
frecuencia en el eje de ordenadas. Se dibujan rect
angulos
de base la amplitud ai y de altura la densidad de
fi
ni
o hi = .
frecuencia, hi , siendo hi =
ai
ai
Polgono de frecuencias: Es la lnea que se obtiene
uniendo con segmentos, los puntos medios de los
extremos superiores de los rect
angulos que forman el
histograma.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

13 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Representaciones gr
aficas

REPRESENTACIONES GRAFICAS
DE VARIABLES ESTADISTICAS
CUALITATIVAS
Diagrama de barras: En unos ejes cartesianos se
representan sobre el eje de abscisas las distintas
modalidades del car
acter y sobre el eje de ordenadas los
valores de las frecuencias absolutas. A continuaci
on, en
el eje de abscisas se levantan rect
angulos de base
constante y de altura proporcional a la frecuencia
absoluta correspondiente.
Gr
afico de sectores: En esta representaci
on un crculo se
divide en tantos sectores circulares como modalidades
tenga el car
acter, teniendo cada sector el
area
proporcional a la frecuencia absoluta correspondiente.
Los grados de cada sector se obtienen resolviendo la
i o
proporci
on nNi = 360
o

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

14 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Representaciones gr
aficas

OTRAS REPRESENTACIONES GRAFICAS:


DIAGRAMA DE TALLOS Y HOJAS
Se traza una lnea vertical. Todas las cifras menos la u
ltima se escriben a la izquierda
de la lnea (forman el tallo). La u
ltima cifra se escribe a la derecha (forma la hoja).
Cada tallo define una clase y se escribe s
olo una vez. El n
umero de hojas representa la
frecuencia de dicha clase.
Las hojas se ordenan en cada una de las ramas. De esta manera los propios datos dan
una idea visual de la zona con mayor frecuencia de observaciones. Si se gira el gr
afico
90o , se obtiene el histograma cl
asico. Cuando se obtienen tallos con ramas muy largas,
es conveniente dividir cada tallo en dos.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

15 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

CENTRAL
MEDIDAS DE POSICION
Definici
on
Las medidas de posici
on tratan de resumir y sintetizar el conjunto de datos mediante un
valor numerico.
Si este valor numerico se sit
ua hacia el centro de la distribuci
on se habla, entonces, de
medidas de posici
on central. Las principales medidas de posici
on central son: la media,
la mediana y la moda. Se estudiar
an tambien otras medidas de posici
on no central
llamadas cuantiles. En cada medida se distingue para su c
alculo entre los casos discreto
y continuo.
Definici
on
Media aritmetica: Sea una variable X, con valores x1 , x2 , . . . , xk y frecuencias absolutas
n1 , n2 , . . . , nk . Entonces, se define la media, y se denota por x
, como la suma
ponderada de los valores de la variable por sus frecuencias.
- Caso discreto: x
=

Pk

i=1

xi fi =

1
N

Pk

i=1

xi ni siendo N el n
umero total de

observaciones.
- Caso continuo: En este caso los intervalos se representan por su marca de clase,
definiendose la media de forma an
aloga al caso de variable estadstica discreta.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

16 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

Definici
on
Mediana: Se define la mediana y se denota por Me, como aquel valor de la variable
estadstica que divide en dos conjuntos iguales a los valores de la variable supuestos
ordenados de forma ascendente seg
un el car
acter.
- Caso discreto:
1
Si no existe un valor xi con Fi = 0.5, entonces la mediana es el primer valor
de la variable tal que Fi > 0.5
2
Si existe un valor xi con Fi = 0.5, entonces la mediana ser
a la media
aritmetica de los valores xi y xi+1 , es decir,
Me =

xi + xi+1
2

- Caso continuo:
1
Si existe alg
un intervalo Ii , tal que Fi = 0.5, entonces M e = ei
2
Si no existe un intervalo Ii , tal que Fi = 0.5, se selecciona el primer intervalo
en el que Fi > 0.5. A este intervalo se le denomina intervalo mediano, se
denota por IM e . El valor exacto de la mediana se obtiene aplicando al
intervalo mediano la siguiente f
ormula:
M e = ei1 +
(Dpto. Estadstica)

Estadstica

0.5 Fi1
ai
fi
Curso 2011/2012

17 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

Definici
on
Moda: Se define la moda y se nota por Mo, como el valor m
as frecuente de la
distribuci
on, o lo que es lo mismo, el que m
as se repite.
La moda puede no ser u
nica (m
as de una modalidad tienen igual frecuencia m
axima) o
incluso no existir (cuando todos las modalidades de la variable tengan igual frecuencia).
- Caso discreto: En este caso, la moda es el valor de la variable que corresponde a la
m
axima frecuencia absoluta.
M o = xi tal que ni = maxj nj
- Caso continuo: En primer lugar, se elige el intervalo modal, IM o = (ei1 , ei ], que es
aquel que tenga m
axima altura o densidad de frecuencia hi = max hj . El valor
j

exacto de la moda se obtiene aplicando al intervalo modal la siguiente f


ormula:
M o = ei1 +

(Dpto. Estadstica)

(hi hi1 )
ai
(hi hi1 ) + (hi hi+1 )

Estadstica

Curso 2011/2012

18 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

OTRAS MEDIDAS DE POSICION.


CUANTILES
Sea X una variable estadstica y sea un n
umero real tal que 0 < < 1. En general,
un cuantil de orden de la variable X, divide a la poblaci
on en dos partes, de tal
manera que una proporci
on de la poblaci
on es menor que dicho valor y el resto mayor.
Definici
on
Cuartiles: Son tres valores que distribuyen la serie de datos, ordenada de forma creciente,
en cuatro tramos iguales, en los que cada uno de ellos contiene el 25% de las
observaciones. Se denotan por Q1 , Q2 y Q3 .
Definici
on
Deciles: Son nueve valores que distribuyen la serie de datos, ordenada de forma
creciente, en diez tramos iguales, en los que cada uno de ellos contiene el 10% de las
observaciones. Se denotan por: D1 , D2 , . . . , D9 .
Definici
on
Percentiles: Son noventa y nueve valores que distribuyen la serie de datos, ordenada de
forma creciente, en cien tramos iguales, en los que cada uno de ellos contiene el 1% de
las observaciones. Se denotan por: P1 , P2 , . . . , P99 .
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

19 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

C
alculo de un cuantil
Para calcular un cuantil C() se razona de manera an
aloga al c
alculo de la mediana.
- Caso discreto:
1

Si no existe un valor xi con Fi = , entonces el cuantil de orden es el


primer valor de la variable tal que Fi > .
Si existe un valor de la variable xi que verifique Fi = , entonces el cuantil de
orden ser
a
xi + xi+1
C() =
2

- Caso continuo:
1
2

Si existe alg
un intervalo Ii , tal que Fi = , entonces C() = ei
Si no existe un intervalo Ii , tal que Fi = , se selecciona el primer intervalo en
el Fi > . Dicho intervalo contiene el cuantil y para determinar el valor exacto
se utiliza la interpolaci
on con la siguiente f
ormula:
C() = ei1 +

(Dpto. Estadstica)

Estadstica

Fi1
ai
fi

Curso 2011/2012

20 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

MEDIDAS DE DISPERSION
Las medidas de dispersi
on informan de lo pr
oximas o alejadas que est
an las
observaciones entre s o en relaci
on con un valor de referencia que normalmente es una
medida de centralizaci
on. De esta forma, se pueden considerar las medidas de tendencia
central como muy representativas del conjunto, poco representativas, o en algunos casos,
nada representativas, dependiendo de los valores adoptados por las medidas de
dispersi
on.
Se considera la variable estadstica X que toma los valores x1 , x2 , . . . , xk (con variable
estadstica continua se consideran las marcas de clase de los intervalos) y frecuencias
n1 , n2 , . . . , nk .
Definici
on
Rango o recorrido: Es la medida de dispersi
on m
as simple y se calcula como la diferencia
entre el valor m
aximo y el mnimo de la variable.
R = max {xi } min {xi }
i=1,...,k

(Dpto. Estadstica)

i=1,...,k

Estadstica

Curso 2011/2012

21 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

Definici
on
Recorrido Intercuartlico: Es la diferencia entre el tercer y primer cuartil. Presenta la
ventaja de que elimina el efecto distorsionante de los valores extremos.
RIQ = Q3 Q1
Definici
on
Varianza: Se define la varianza y se denota por 2 , como la media aritmetica de los
cuadrados de las desviaciones entre los valores de la variable estadstica y la media
aritmetica.
k
k
X
1 X
2 =
(xi x
)2 f i =
(xi x
)2 ni
N
i=1
i=1
La varianza siempre ser
a mayor o igual que cero. Mientras m
as se aproxime a cero,
m
as concentrados est
an los valores en torno a la media. Por el contrario, mientras mayor
sea la varianza, m
as dispersos est
an. El inconveniente que presenta es que no est
a
acotada superiormente, por lo que cuando los valores son grandes no se tiene una clara
interpretaci
on.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

22 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

C
alculo simplificado de la varianza (Teorema de K
onig)
Se obtiene una expresi
on m
as simple y sencilla para calcular la varianza
2 =

k
X
i=1

x2i fi x
2 =

k
1 X 2
xi ni x
2
N i=1

Definici
on
Desviaci
on Tpica: La varianza es una medida de dispersi
on que viene dada en unidades
al cuadrado. Para mantener la misma unidad de medida de las observaciones, se define
la desviaci
on tpica, y se denota por , como la raz cuadrada positiva de la varianza,
v
v
v
u k
u
u
k
k
uX
u
u1 X
X
1
2
2
t
t
=
(xi x
) fi =
(xi x
) ni = t
x2i ni x
2
N i=1
N i=1
i=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

23 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

Definici
on
Coeficiente de variaci
on de Pearson: Se define el coeficiente de variaci
on de Pearson de
una variable estadstica X, y se denota por CVx , como el cociente entre la desviaci
on
tpica y la media aritmetica,
x
CVx =
x

Se utiliza para comparar la dispersi


on de dos o m
as distribuciones en las que las
variables vienen expresadas en unidades distintas ya que es una medida de dispersi
on
relativa sin dimensi
on, invariante respecto a cambios de escala. Presenta la ventaja de
utilizar toda la informaci
on que suministra la distribuci
on.
El coeficiente de variaci
on representa el n
umero de veces que la desviaci
on tpica
contiene a la media aritmetica, por tanto, cuanto mayor sea el coeficiente de variaci
on
significa que mayor n
umero de veces contiene la desviaci
on tpica a la media aritmetica y
entonces la media aritmetica es menos representativa.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

24 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

MEDIDAS DE FORMA: MEDIDAS DE SIMETRIA


Para medir la asimetra de una distribuci
on se utiliza el coeficiente de asimetra de
Fisher, que viene dado por
3
1 = 3

1 X
(xi x
)3 ni = m3 3m1 m2 + 2m31 . Es invariante frente a cambios
N i=1
de origen y escala.

donde 3 =

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

25 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

Interpretaci
on (medida de simetra):
Cuando la distribuci
on es simetrica existe la misma
concentraci
on de valores a la derecha y a la izquierda de
la media. En este caso la suma de los valores menos la
media al cubo ser
a nula por lo que 1 = 0. Adem
as
x
= M e = M o.
Si 1 > 0, se tiene una distribuci
on asimetrica a la
derecha o positiva y se caracteriza porque su
representaci
on gr
afica presenta cola a la derecha. En
este caso M o M e x
.

Si 1 < 0, se tiene una distribuci


on asimetrica a la
izquierda o negativa y se caracteriza porque su
representaci
on gr
afica presenta cola a la izquierda. En
este caso x
M e M o.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

26 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

MEDIDAS DE FORMA: MEDIDAS DE APUNTAMIENTO O CURTOSIS


Las medidas de apuntamiento o curtosis permiten analizar el grado de concentraci
on
que presentan los valores alrededor de la zona central de la distribuci
on.
Para medir la curtosis de una distribuci
on se utiliza el coeficiente de curtosis de Fisher,
que viene dado por
4
2 = 4 3

1 X
(xi x
)4 ni = m4 4m1 m3 + 6m21 m2 3m41 . Es invariante frente a
N i=1
cambios de origen y escala.

donde 4 =

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

27 / 157

Tema 1. Estadstica Descriptiva Unidimensional

Caractersticas de variables estadsticas

Interpretaci
on:
Si 2 = 0, la distribuci
on se denomina mesoc
urtica. Presenta un grado de
concentraci
on medio alrededor de los valores centrales de la variable.
Si 2 > 0, la distribuci
on es m
as apuntada que la distribuci
on normal, y se
denomina leptoc
urtica. Presenta un elevado grado de concentraci
on alrededor de
los valores centrales de la variable.
Si 2 < 0, la distribuci
on es menos apuntada que la distribuci
on normal, y se
denomina platic
urtica. Presenta un reducido grado de concentraci
on alrededor de
los valores centrales de la variable.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

28 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias bidimensional

TEMA 2. ESTADISTICA DESCRIPTIVA


BIDIMENSIONAL

INTRODUCCION
Se considera que se realiza el estudio de dos caracteres simult
aneamente, X e Y ,
sobre cada uno de los N individuos que integran la poblaci
on. La variable que representa
el estudio conjunto de esos dos caracteres se denota por (X, Y ) y recibe el nombre de
variable estadstica bidimensional.
Se denotan x1 , . . . , xi , . . . , xk , las k modalidades del car
acter X e y1 , . . . , yj , . . . , yp ,
las p modalidades del car
acter Y . Por lo tanto, a cada individuo de la poblaci
on le
corresponden un par de valores (xi , yj ).
DE FRECUENCIAS BIDIMENSIONAL
DISTRIBUCION
Definici
on
Se llama frecuencia absoluta del par (xi , yj ), y se denota por nij , al n
umero de individuos
de la poblaci
on que presentan simult
aneamente el valor xi de X y el valor yj de Y .
P
P
La distribuci
on de frecuencias absoluta bidimensional verifica ki=1 pj=1 nij = N ya
que las modalidades de cada uno de los caracteres deben ser incompatibles y
exhaustivas, siendo N el n
umero total de observaciones.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

29 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias bidimensional

Definici
on
Se llama frecuencia relativa del par (xi , yj ), y se denota por fij , a la proporci
on de
individuos de la poblaci
on que presentan simult
aneamente el valor xi de X y el valor yj
de Y ,
nij
fij =
N
Pk Pp
Se verifica que i=1 j=1 fij = 1
Definici
on
Se define la distribuci
on de frecuencias bidimensional como el conjunto de valores de la
variable bidimensional con sus respectivas frecuencias absolutas o relativas. A cada valor
de la variable, que ser
a de la forma (xi , yj ), se le hace corresponder su frecuencia
absoluta (nij ) o relativa (fij ) que se representa por:
{(xi , yj ; nij )} o {(xi , yj ; fij )}

(Dpto. Estadstica)

Estadstica

i = 1, . . . , k; j = 1, . . . , p

Curso 2011/2012

30 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias bidimensional

Los datos se pueden disponer en una tabla de doble entrada, de manera que en la
primera columna aparezcan las k modalidades correspondientes a la variable X y en la
primera fila las p modalidades correspondientes a la variable Y . En cada intersecci
on se
coloca la frecuencia correspondiente al cruce de las dos modalidades.
X\Y
(e0 , e1 ]
x1
..
.
(ei1 , ei ]
xi
..
.
(ek1 , ek ]
xk
n.j

(e00 , e01 ]
y1

(e0j1 , e0j ]
yj

(e0p1 , e0p ]
yp

ni

n11

n1j

n1p

n1

..
.

..
.

..
.

..
.

..
.

..
.

ni1

nij

nip

ni

..
.

..
.

..
.

..
.

..
.

..
.

nk1

nkj

nkp

nk

n1

nj

np

El primer subndice (i), representa a la fila, y el segundo subndice (j) a la columna.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

31 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias bidimensional

La frecuencia absoluta ni representa el n


umero de veces que se ha observado el valor
xi de X independientemente del valor presentado por Y y, por tanto, se obtiene como la
suma de todas las frecuencias absolutas correspondientes a la fila i-esima, es decir,
ni = ni1 + ni2 + . . . + nij + . . . + nip =

p
X

nij

(i fijo)

j=1

La frecuencia absoluta nj representa el n


umero de veces que se ha observado el valor
yj de Y independientemente del valor presentado por X y, por tanto, se obtiene como la
suma de todas las frecuencias absolutas correspondientes a la columna j-esima, es decir,

nj = n1j + n2j + . . . + nij + . . . + nkj =

k
X

nij

(j fijo)

i=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

32 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias bidimensional

Si se divide cada casilla de la tabla anterior por el total de los elementos de la


poblaci
on N , se obtiene la tabla que contiene las frecuencias relativas fij ,
correspondientes a los distintos pares (xi , yj ).
X\Y

(e00 , e01 ]
y1

(e0j1 , e0j ]
yj

(e0p1 , e0p ]
yp

fi

(e0 , e1 ]
x1

f11

f1j

f1p

f1

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

(ei1 , ei ]
xi

fi1

fij

fip

fi

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

.
.
.

fk1

fkj

fkp

fk

f1

fj

fp

(ek1 , ek ]
xk
f.j

La u
P
ltima columna est
a formada por las frecuencias relativas fi , donde
fi = pj=1 fij . La u
ltima fila est
a formada por las frecuencias relativas fj donde
Pk
fP
fij y en
que la suma
j =
Pi=1
Pla
Pq de todas las frecuencias relativas vale la unidad
p
q
p
stica es de tipo
i=1
j=1 fij =
i=1 fi =
j=1 fj = 1. Cuando la variable estad
continuo, se suelen incluir adem
as las marcas de clase, amplitud y densidad de frecuencia.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

33 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias marginal

DE FRECUENCIAS MARGINAL
DISTRIBUCION
La distribuci
on marginal de X, que
expresa c
omo se distribuye la variable X
independientemente de los valores
presentados por la variable Y , se obtiene
tomando en la tabla de doble entrada, la
primera y u
ltima columnas.
X
x1
..
.
xi
..
.
xk
Total

La distribuci
on marginal de Y , que
expresa c
omo se distribuye la variable Y
independientemente de los valores
presentados por la variable X, se obtiene
tomando en la tabla de doble entrada, la
primera y u
ltima filas.

ni
n1
..
.
ni
..
.
nk
N

Y
y1
..
.
yj
..
.
yp
Total

nj
n1
..
.
nj
..
.
np
N

Las frecuencias relativas de las distribuciones marginales se obtienen dividiendo las


frecuencias absolutas entre el n
umero total de observaciones. Es decir, la frecuencia
n
relativa de xi ser
a fi = nNi y la frecuencia relativa de yj ser
a fj = Nj .
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

34 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias marginal

Caractersticas de las distribuciones marginales


Las distribuciones marginales son distribuciones unidimensionales, y por tanto, se
pueden calcular para ellas todas las medidas descriptivas. Por ejemplo, las medias y
varianzas son:
- Media marginal de X:

1
x
=

k
X

N i=1

xi ni =

k
X

xi fi

i=1

- Varianza marginal de X:
k
k
k
X
1 X
1 X
2
2
2
2
2
x =
xi x

xi ni x

ni =
xi x

fi =
N i=1
N i=1
i=1

- Media marginal de Y :

1
y
=

p
X

N j=1

yj nj =

p
X

yj fj

j=1

- Varianza marginal de Y :
p 
p 
p
2
2
X
1 X
1 X
2
2
2
y =
yj y

nj =
yj y

fj =
yj nj y

N j=1
N
j=1
j=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

35 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias marginal

Covarianza
Se considera como una medida de la variabilidad conjunta de las variables X e Y . Su
expresi
on es la siguiente

xy =

p
p
k
k
1 XX
1 XX
(xi x
)(yj y)nij =
xi yj nij x
y
N i=1 j=1
N i=1 j=1

El signo de la covarianza indica el sentido en el que varan conjuntamente las dos


variables
Si xy > 0, entonces las variables varan en el mismo sentido.
Si xy < 0, entonces las variables varan en sentidos opuestos.
Si xy = 0, entonces no existe relaci
on lineal entre las variables, lo que no significa
que sean independientes, pueden tener otro tipo de relaci
on.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

36 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias condicionada

DE FRECNCUENCIAS CONDICIONADA
DISTRIBUCION
Las distribuciones condicionadas son distribuciones unidimensionales obtenidas a partir
de las bidimensionales, manteniendo fijo un valor o varios en una de las variables y
considerando los valores que toma la otra con sus respectivas frecuencias.
La distribuci
on condicionada de X
respecto de Y = yj (X|Y = yj ) se obtiene a
partir de la tabla bidimensional, tomando la
primera columna de los valores de la variable
X y la columna j-esima (correspondiente al
valor yj ) de frecuencias absolutas.
X|Y = yj
x1
.
.
.
xi
.
.
.
xk
Total

(Dpto. Estadstica)

La distribuci
on condicionada de Y
respecto de X = xi (Y |X = xi ) se obtiene
a partir de la tabla bidimensional, tomando
la primera fila de los valores de la variable Y
y la fila i-esima (correspondiente al valor xi )
de frecuencias absolutas.
Y |X = xi
y1

ni|j
n1j
.
.
.
nij

.
.
.
yj
.
.
.
yp
Total

.
.
.
nkj
nj

Estadstica

nj|i
ni1
.
.
.
nij
.
.
.
nip
ni

Curso 2011/2012

37 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Distribuci
on de frecuencias condicionada

Las frecuencias relativas de las distribuciones condicionadas se obtienen dividiendo las


frecuencias absolutas entre el n
umero total de observaciones que cumplen la condici
on
requerida, que en los casos anteriores son, respectivamente, nj y ni . Es decir, la
n
f
frecuencia relativa de xi |Y = yj ser
a fi|j = nij
= fij
, y la frecuencia relativa de
j
j
yj |X = xi ser
a fj|i =

nij
ni

fij
fi

Caractersticas de las distribuciones condicionadas


- Media condicionada de X|Y = yj :

1
x
|Y =y

k
X

nj i=1

xi nij =

k
X

xi fij

i=1

- Varianza condicionada de X|Y = yj :


2
2
k 
k 
X
1 X
2
xi x
|Y =y
nij =
xi x
|Y =y
fij
X|Y =y =
j
j
j
nj i=1
i=1

- Media condicionada de Y |X = xi :

p
p
X
1 X
y
|X=x =
yj nij =
yj fij
i
ni j=1
j=1

- Varianza condicionada de Y |X = xi :
2
Y |X=x =
i

(Dpto. Estadstica)

p 
p 
2
2
X
X
yj y
|X=x
nij =
yj y
|X=x
fij
i
i
j=1

ni j=1

Estadstica

Curso 2011/2012

38 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Diagrama de dispersi
on o nube de puntos
Cuando los caracteres que forman la distribuci
on bidimensional son, ambos,
cuantitativos sus valores son pares de n
umeros reales de la forma (xi , yj ) y se pueden
representar ordenados sobre un sistema de ejes cartesianos, con lo que se obtiene un
conjunto de puntos sobre el plano. A este conjunto de puntos se le denomina diagrama
de dispersi
on o nube de puntos y es la representaci
on gr
afica m
as importante asociada a
una distribuci
on bidimensional.
Hay que tener en cuenta que como el par (xi , yj ) tiene una frecuencia nij , que en
muchos casos ser
a mayor que 1, entonces se representa el par con un punto en el que se
indica la frecuencia que corresponde a ese par. En ocasiones tambien se puede
representar utilizando distintos tama
nos de puntos.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

39 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Independencia. Condici
on necesaria y suficiente.
La condici
on necesaria y suficiente para que X e Y sean independientes es que la
frecuencia relativa conjunta sea igual al producto de las frecuencias marginales.
fij = fi fj

i = 1, . . . , k,

j = 1, . . . , p

Si no se verifica esa igualdad para alg


un (i, j), se dice que las variables son
dependientes estadsticamente. Tambien se puede comprobar la condici
on anterior en
terminos de las frecuencias absolutas
nij =

ni nj
N

Se concluye diciendo que si los dos caracteres son independientes entre s se verifica
que tanto las filas como las columnas de la tabla de doble entrada son proporcionales
entre s.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

40 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

La independencia y la dependencia funcional son dos casos extremos de la relaci


on
entre las variables, cuando esta no existe o es total. Generalmente cuando se estudian
conjuntamente dos variables surgen los casos intermedios.
Cuando existe una dependencia estadstica entre variables, el objetivo es encontrar una
medida de la relaci
on entre ambas. Se trata de buscar un modelo o funci
on matem
atica
que recoja esta relaci
on y adem
as una medida de la aproximaci
on de dicha funci
on a los
datos reales. Por tanto, en el estudio de la dependencia estadstica de dos variables hay
que resolver dos problemas:
1

Determinar el grado de relaci


on o dependencia entre las variables.

Encontrar un modelo aproximado de la dependencia.

La correlaci
on se encarga de solucionar el primer problema cuantificando esta
dependencia mediante el c
alculo del coeficiente de correlaci
on.
La regresi
on estudia desde el punto de vista estadstico la relaci
on entre variables
proporcionando un modelo de dicha relaci
on. El modelo consiste en una funci
on
matem
atica cuya forma se aproxima a los datos observados. La funci
on encontrada
permitir
a obtener los valores aproximados de una de las variables a partir de los valores
prefijados de las otras.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

41 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Concepto de regresi
on
Definici
on
Dadas dos variables estadsticas X e Y , se busca una funci
on f que permita expresar los
valores de Y en funci
on de los valores de los de X (o viceversa)
Y = f (X).
Gr
aficamente esto equivale a encontrar una curva que aunque no pase por todos los
puntos del diagrama de dispersi
on este lo m
as pr
oxima posible de dichos puntos. Por
tanto, interesar
a medir el grado de ajuste entre la funci
on te
orica y la nube de puntos. El
principal objetivo de este ajuste es el de realizar predicciones.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

42 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Definici
on
Se llama variable dependiente (Y ), a la variable que se pretende predecir, y como su
nombre indica, depende de los valores que toma otra variable.
Definici
on
Se denomina variable independiente (X), a la variable que se usa para predecir los
valores de la variable dependiente.
Cuando solo se utiliza una variable independiente, la regresi
on se denomina simple.
Cuando intervienen varias variables independientes la regresi
on se denomina m
ultiple.
El criterio que se adoptar
a para elegir el mejor ajuste es el criterio de mnimos
cuadrados, mediante el cual se pretende hacer mnima la media de la diferencia al
cuadrado, entre los valores observados y los valores que da la funci
on ajustada, que se
denominan valores ajustados y se denotan por yi , obteniendose como
yi = f (xi )
Las diferencias entre los valores observados y los ajustados se denominan residuos, y se
denotan por eij , por lo tanto,
eij = yj yi
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

43 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

En definitiva, se trata de minimizar la media de los residuos al cuadrado, por lo que la


funci
on a minimizar es
=

p
k X
X
i=1 j=1

e2ij fij =

p
p
k
k
1 XX 2
1 XX
eij nij =
(yj yi )2 nij
N i=1 j=1
N i=1 j=1

Esta funci
on ser
a mnima cuando las derivadas parciales respecto a cada par
ametro
sean nulas. Calculando las derivadas parciales e igual
andolas a cero se obtiene un
sistema de ecuaciones denominado sistema de ecuaciones normales.
Dependiendo del tipo de funci
on que mejor ajuste a los datos, la regresi
on se
denomina de distinta forma. En el caso concreto en el que la funci
on a utilizar sea la
ecuaci
on de una recta, se denomina regresi
on lineal simple.
Se distingue entre dos rectas de regresi
on:
La recta de regresi
on de Y sobre X, se denota por Y /X, cuando la variable
independiente es X.
La recta de regresi
on de X sobre Y , se denota por X/Y , cuando la variable
independiente es Y .

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

44 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Recta de regresi
on Y /X
Se considera que la funci
on que mejor se ajusta a la nube de puntos es una recta, por
lo tanto,
f (X) = Y = a + bX
Se aplica el criterio de mnimos cuadrados para determinar el valor de a y de b,
par
ametros de la funci
on que son desconocidos. En este caso,
La variable Y es la variable dependiente.
La variable X es la variable independiente.
El coeficiente o par
ametro b representa la pendiente de la recta, con la siguiente
interpretaci
on:
Si b > 0, representa el incremento que se produce en Y al aumentar en una
unidad X.
Si b < 0, representa la disminuci
on que se produce en Y al aumentar en una
unidad X.
Si b = 0, Y no depende linealmente de X.
El coeficiente o par
ametro a representa el valor que toma Y cuando X = 0.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

45 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

La soluci
on que se obtiene de aplicar el criterio de mnimos cuadrados es:
b=

xy
x2

a = y b
x
Una de las aplicaciones de la recta de regresi
on de Y sobre X es predecir el valor que
tendr
a la variable Y conocido un valor de X, diferente a los utilizados para construir la
recta de regresi
on.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

46 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Recta de regresi
on X/Y
Se considera que la funci
on que mejor se ajusta a la nube de puntos es una recta, por
lo tanto,
f (Y ) = X = a0 + b0 Y
Se aplica el criterio de mnimos cuadrados para determinar el valor de a0 y de b0 .
La variable X es la variable dependiente.
La variable Y es la variable independiente.
El coeficiente o par
ametro b0 representa la pendiente de la recta, con la siguiente
interpretaci
on
Si b0 > 0, representa el incremento que se produce en X al aumentar en una
unidad Y .
Si b0 < 0, representa la disminuci
on que se produce en X al aumentar en una
unidad Y .
Si b0 = 0, X no depende linealmente de Y .
El coeficiente o par
ametro a0 representa el valor que toma X cuando Y = 0.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

47 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

El estudio de la regresi
on lineal es simetrico al anterior, solamente hay que cambiar el
papel de las variables. El criterio de mnimos cuadrados da como resultado las siguientes
soluciones
xy
b0 = 2
y
a0 = x
b0 y
Una de las aplicaciones de la recta de regresi
on de X sobre Y es predecir el valor que
tendr
a la variable X conocido un valor de la variable Y , diferente a los utilizados para
construir la recta de regresi
on.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

48 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Coeficiente de correlaci
on lineal de Pearson
Cuando los datos tienden a agruparse en torno a una lnea recta, se puede afirmar que
existe correlaci
on lineal entre las variables. Se distinguen dos casos:
Si la recta tiene pendiente positiva, la correlaci
on es directa, es decir, incrementos
positivos de una variable implican aumentos en la otra.
Si la recta tiene pendiente negativa, la correlaci
on es inversa o indirecta, es decir, al
aumentar una variable disminuye la otra.
El coeficiente de correlaci
on lineal de Pearson mide el grado de asociaci
on lineal
(correlaci
on lineal) entre las variables. Se denota por r y se define como
r=

xy
,
x y

1 r 1

El signo de r coincide con el de la covarianza, ya que las desviaciones tpicas siempre


son positivas.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

49 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Interpretaci
on:
r = 1: Existe una relaci
on lineal directa perfecta, por lo que todos los puntos de la
variable est
an sobre la recta de regresi
on.
r = 1: Existe una relaci
on lineal inversa perfecta, por lo que todos los puntos de
la variable est
an sobre la recta de regresi
on.
0 < r < 1 La relaci
on lineal ser
a m
as intensa (y directa) cuanto m
as se aproxime
a 1, y m
as debil a medida que se aproxime a 0.
1 < r < 0 La relaci
on lineal ser
a m
as intensa (e inversa) cuanto m
as se
aproxime a -1, y m
as debil a medida que se aproxime a 0.
r = 0 No existe relaci
on lineal entre las variables, lo que no implica que sean
independientes, pueden estar relacionadas pero no linealmente. Si X e Y son
independientes, entonces r = 0. El recproco no es cierto.
Puede comprobarse que
r 2 = b b0
ya que
r2 =

(Dpto. Estadstica)

2
xy
xy xy
=

= b b0
2
x y2
x
y

Estadstica

Curso 2011/2012

50 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Coeficiente de determinaci
on
Este termino mide el grado de ajuste entre la nube de puntos y la funci
on ajustada.
Esto lleva a usar los residuos para medir la dependencia, haciendo notar que la
dependencia estar
a ntimamente relacionada con la funci
on que se ajuste, ya que cada
una dar
a lugar a unos residuos distintos.
Considerando la regresi
on Y /X, el objetivo es explicar una variable Y a partir de una
variable X y esto conlleva explicar la variabilidad de Y . Si X e Y est
an relacionadas,
parte de esta variabilidad vendr
a expresada en funci
on de X y el resto depender
a de Y o
del azar, por lo que se distingue entre la variabilidad que explica la regresi
on (variabilidad
explicada por el modelo) y la variabilidad que no explica la regresi
on (tambien llamada
residual).
Variabilidad Y = Var.explicada por el modelo + Var.no explicada por el modelo

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

51 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

De esta descomposici
on de la variabilidad se obtiene el coeficiente de determinaci
on,
que se denota por R2
R2 =

2
2
exp
y2 res
2
=
= 1 res
,
y2
y2
y2

0 R2 1

Este coeficiente representa la proporci


on de la varianza de Y (variabilidad de la
variable) que es explicada por la regresi
on. De esta forma, R2 da una medida de la
bondad de ajuste, es decir, del grado de ajuste de la regresi
on a los datos.
Interpretaci
on:
2
R2 = 0 exp
= 0. El modelo no explica nada de la variable dependiente, es un
mal ajuste.
2
R2 = 1 exp
= y2 . Existe dependencia funcional exacta, todos los puntos
observados est
an sobre la funci
on de regresi
on obtenida, es decir, el modelo explica
completamente el comportamiento de la variable dependiente, el ajuste de los datos
al modelo es perfecto.

0 < R2 < 1. Valores cercanos a 1 indican un buen ajuste de los datos al modelo.
Valores cercanos a 0 indican un mal ajuste de los datos al modelo.
El objetivo de la regresi
on es la predicci
on de valores de la variable dependiente a
partir de valores conocidos de la variable independiente. Esta predicci
on ser
a fiable
siempre y cuando se tenga un buen ajuste.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

52 / 157

Tema 2. Estadstica Descriptiva Bidimensional

Regresi
on y correlaci
on

Cuando el modelo que se utiliza es el lineal, se verifica que


R2 = r 2
2
ya que en este caso se tiene que res
= y2 (1 r2 )

El coeficiente de correlaci
on de Pearson se utiliza como medida de bondad de ajuste
de la nube de puntos a la recta de regresi
on. El valor obtenido permite determinar la
posici
on relativa de la rectas de regresi
on:
1) Si r2 6= 1, las rectas se cortan en un solo punto, que tiene de coordenadas (
x, y).
2) Si r2 = 1, las rectas coinciden. En este caso, el ajuste ser
a perfecto.
3) Si r2 = 0, entonces no existe relaci
on lineal entre las variables.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

53 / 157

Tema 3. Teora de la Probabilidad

Introducci
on: Conceptos b
asicos

TEMA 3. TEORIA DE LA PROBABILIDAD

INTRODUCCION
El objetivo de la Estadstica Descriptiva es hacer una descripci
on sencilla de los datos
correspondientes a la muestra obtenida. Pero el objetivo fundamental de la Estadstica es
inferir las propiedades de la poblaci
on a partir de las propiedades de la muestra. Para
esto es necesario un puente de uni
on entre la poblaci
on y la muestra (modelos de
probabilidad).
Se dice que un experimento o prueba es una acci
on que se realiza con el prop
osito de
recoger alg
un tipo de observaci
on sobre los resultados.
Definici
on
Un experimento se denomina determinstico si, al repetir el experimento en identicas
condiciones, siempre presenta el mismo resultado. En estos fen
omenos es posible saber el
resultado final si se conocen el estado inicial y las condiciones de realizaci
on.
Definici
on
Un experimento es aleatorio cuando su resultado es impredecible, es decir, aunque el
experimento se repita de la misma forma y bajo identicas condiciones puede dar lugar a
diferentes resultados.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

54 / 157

Tema 3. Teora de la Probabilidad

Introducci
on: Conceptos b
asicos

CONCEPTOS BASICOS
Suceso elemental
Es cada uno de los posibles resultados que se obtienen al realizar el experimento, y
estos se consideran indivisibles.
Espacio muestral
Se denota por y se define como el conjunto formado por todos los posibles
resultados o sucesos elementales de un experimento aleatorio.
El espacio muestral puede ser:
Finito: Se sabe cuantos sucesos elementales lo componen.
Infinito numerable: Est
a compuesto por infinitos sucesos elementales que
corresponden con los n
umeros naturales.
Infinito no numerable: Est
a compuesto por infinitos sucesos elementales que
no se corresponden con los n
umeros naturales.
Suceso
Es cualquier resultado del experimento. Est
a compuesto por uno o m
as sucesos
elementales.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

55 / 157

Tema 3. Teora de la Probabilidad

Introducci
on: Conceptos b
asicos

Suceso seguro ()
Es el formado por todos los resultados posibles del experimento, es decir, el propio
espacio muestral .
Suceso imposible ()
Es aquel que no contiene ning
un resultado del experimento, es decir, el conjunto
vaco .
Suceso diferencia
Se denota por A B, y es otro suceso que contiene todos los sucesos elementales
de A que no son sucesos de B. Se tiene, por tanto, que A B = A A B.
Suceso complementario de un suceso
es el suceso que se realiza cuando no se verifica A.
Se denota por A,
Se dice que el suceso A implica el suceso B, y se denota A B, si siempre que se
verifica A, se verifica B.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

56 / 157

Tema 3. Teora de la Probabilidad

Introducci
on: Conceptos b
asicos

Operaciones con sucesos


Las operaciones con sucesos son las habituales entre conjuntos (uni
on, intersecci
on,
complementario, inclusi
on, etc).
1

Uni
on (A B)
Si A y B son dos sucesos, el suceso uni
on A B es el conjunto de todos los
sucesos elementales de A y los de B.

Intersecci
on (A B)
Si A y B son dos sucesos, el suceso intersecci
on A B es el formado por todos los
sucesos elementales que pertenecen simult
aneamente a A y B.

Diferencia (A B)
Suceso en el que se verifica que se cumple A pero no B.

Complementaci
on (A)

Dado un suceso A, se define el complementario de dicho suceso, como el formado


por todos los sucesos elementales del espacio muestral que no est
an en A.
Dos sucesos A y B se dicen incompatibles si al ocurrir uno no puede ocurrir el otro, es
decir A B = .

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

57 / 157

Tema 3. Teora de la Probabilidad

Propiedades

PROPIEDADES
Con las operaciones anteriores, puede demostrarse que se verifican las siguientes
propiedades.
=

Uni
on

Intersecci
on

=
AA

=
AA

Idempotente

AA = A

AA = A

Conmutativa

AB = BA

AB = BA

Asociativa

(A B) C = A (B C)

(A B) C = A (B C)

Distributiva

(A B) C = (A C) (B C)

(A B) C = (A C) (B C)

Leyes de Morgan

B
= AB
A

B
= AB
A

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

58 / 157

Tema 3. Teora de la Probabilidad

Propiedades

Algebra
de sucesos
Tanto si el fen
omeno o experimento aleatorio lleva asociado un espacio muestral
discreto o continuo, en la pr
actica se estar
a interesado en medir de alguna forma el grado
de ocurrencia de ciertos sucesos. El objetivo por consiguiente es asignar valores a los
sucesos, de modo que representen sus posibilidades de realizarse. Para poder definir o
asignar estos n
umeros a los sucesos es preciso dotar al conjunto de todos los sucesos de
una estructura de -
algebra.
Dado un experimento aleatorio y su espacio muestral asociado , un
algebra de
sucesos que se denota por A, es un conjunto formada por todos los sucesos de , que
verifica:
i) A.
ii) Si A A entonces A A.
iii) Si A1 , A2 , ... A entonces

Ai A.

i=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

59 / 157

Tema 3. Teora de la Probabilidad

Propiedades

Definici
on axiom
atica de probabilidad
La definici
on axiom
atica de probabilidad, debida a Kolmogorov, es general y se adapta
a un conjunto amplio de situaciones. Para poder dar dicha definici
on se necesita disponer
de un espacio muestral sobre el que este definida una -
algebra de sucesos, es decir, se
impone una cierta estructura al conjunto de sucesos.
Definici
on
Sea un espacio muestral y A un -
algebra de sucesos definida sobre . Se define una
probabilidad como una funci
on P : A R que verifica los siguientes axiomas
1

Si A A entonces P (A) 0.

P () = 1.

Si A1 , A2 , ... A, es cualquier sucesi


on infinita numerable!de sucesos

[
X
incompatibles, (Ai Aj = , i 6= j) entonces P
Ai =
P (Ai ).
i=1

(Dpto. Estadstica)

Estadstica

i=1

Curso 2011/2012

60 / 157

Tema 3. Teora de la Probabilidad

Propiedades

Consecuencias de los axiomas


1

P()=0. El recproco de la propiedad anterior no es cierto, es decir, si un suceso


tiene probabilidad nula no tiene que ser el suceso vaco.

El tercer axioma puede particularizarse para el caso de una colecci


on de sucesos
incompatibles finitos, es decir,
!
n
n
[
X
P
Ai =
P (Ai )
i=1

i=1

= 1 P (A).
Si A A entonces P (A)

Si A y B A y A B entonces P (A) P (B)

Si A A entonces P (A) 1

Si A y B A entonces P (B A) = P (B) P (A B)

Si A y B A y A B, entonces P (B A) = P (B) P (A)

Si A y B A entonces P (A B) = P (A) + P (B) P (A B)

Si A y B A entonces P (A B) P (A) + P (B)

10

Para n sucesos la desigualdad anterior se expresa como


P (A1 . . . An ) P (A1 ) + ... + P (An )
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

61 / 157

Tema 3. Teora de la Probabilidad

Probabilidad condicionada

PROBABILIDAD CONDICIONADA
Con este concepto se trata de registrar el cambio que experimenta la probabilidad de
un suceso si aumenta la informaci
on de que se dispone sobre el resultado del experimento.
Sea B un suceso con probabilidad no nula, dado otro suceso A, se define la
probabilidad de A condicionada a B, denotada por P (A|B), a la probabilidad de que
ocurra A supuesto que ha ocurrido B. Esta definici
on implica que la probabilidad
condicionada se puede calcular como el cociente,
P (A|B) =

P (A B)
P (B)

P (B|A) =

P (A B)
P (A)

Del mismo modo, se tiene que

De esta definici
on se puede deducir que
P (A B) = P (B)P (A|B) = P (A)P (B|A)
Se cumple que

P (A|B)
= 1 P (A|B)
(Dpto. Estadstica)

P (B|A)
= 1 P (B|A)

Estadstica

Curso 2011/2012

62 / 157

Tema 3. Teora de la Probabilidad

Independencia de sucesos

INDEPENDENCIA DE SUCESOS
Dados dos sucesos A y B, se dice que son independientes si la ocurrencia de uno de
ellos no afecta a la ocurrencia del otro, es decir, si se verifica que
P (A|B) = P (A)

P (B|A) = P (B)

de donde se deduce que


P (A|B) =

P (A B)
= P (A) P (A B) = P (A)P (B)
P (B)

P (B|A) =

P (A B)
= P (B) P (A B) = P (A)P (B)
P (A)

En otro caso se dice que los sucesos A y B son dependientes.


Una condici
on necesaria y suficiente de independencia de sucesos es considerar que dos
sucesos son independientes cuando verifiquen que
P (A B) = P (A)P (B) .

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

63 / 157

Tema 3. Teora de la Probabilidad

Independencia de sucesos

Independencia de m
as de dos sucesos
La probabilidad de la intersecci
on de m
as de dos sucesos viene dada por la expresi
on
P (A1 A2 . . . An ) = P (A1 )P (A2 |A1 )P (A3 |A1 A2 ) . . . P (An |A1 A2 . . . An1 )

Se dice que los sucesos A1 , A2 , . . . , An son independientes si para todo subconjunto


Ai1 , Ai2 , . . . , Ail de A1 , A2 , . . . , An , se verifica:
P (Ai1 Ai2 . . . Ail ) = P (Ai1 )P (Ai2 ) . . . P (Ail )
El concepto de independencia es bastante importante ya que muchos resultados de la
teora de la probabilidad se obtienen bajo dicha hip
otesis.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

64 / 157

Tema 3. Teora de la Probabilidad

Teorema de la probabilidad total y teorema de Bayes

TEOREMA DE LA PROBABILIDAD TOTAL


Dados n sucesos A1 , ..., An que forman una partici
on del espacio muestral, es decir,
n
[
La uni
on de los n sucesos forman el espacio muestral:
Ai =
i=1

Los n sucesos son incompatibles dos a dos: Ai Aj =

i 6= j

La probabilidad de cada uno de los n sucesos es positiva: P (Ai ) > 0

y dado un suceso cualquiera B , se verifica que


P (B) =

n
X

P (Ai )P (B|Ai )

i=1

TEOREMA DE BAYES
Dados n sucesos A1 , ..., An que forman una partici
on del espacio muestral, y dado un
suceso cualquiera B , se verifica que
P (Ai |B) =

P (Ai )P (B|Ai )
n
X
P (Aj )P (B|Aj )
j=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

65 / 157

Tema 3. Teora de la Probabilidad

Teorema de la probabilidad total y teorema de Bayes

El teorema de probabilidad total y el de Bayes van a ser especialmente u


tiles cuando
se den las siguientes circunstancias:
a) El experimento aleatorio se puede separar en dos etapas.
b) Es sencillo dar una partici
on de todo el espacio muestral mediante sucesos
A1 , . . . , An correspondientes a resultados de la primera etapa.
c) Son conocidas o f
acilmente calculables las probabilidades P (A1 ), . . . , P (An ).
d) Son conocidas o f
acilmente calculables las probabilidades P (B|A1 ), . . . , P (B|An ),
donde B es un suceso correspondiente a resultados de la segunda etapa.
Cuando se den estas circunstancias el teorema de probabilidad total ser
a muy u
til para
calcular P (B), y el teorema de Bayes ser
a muy conveniente para obtener P (Aj |B).

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

66 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Introducci
on

TEMA 4. CONCEPTOS BASICOS


DE VARIABLES
ALEATORIAS

INTRODUCCION
A cada uno de los posibles resultados de un experimento se le atribuye una posibilidad
de ocurrir que, siguiendo los axiomas de Kolmogorov, ser
a un n
umero comprendido entre
0 y 1.
Asociado al concepto de probabilidad est
a el concepto de variable aleatoria. Una
variable aleatoria (v.a.) representa el conjunto de valores que pueden observarse en un
fen
omeno aleatorio, valores que dependen del azar y sobre los cuales es posible establecer
una medida de probabilidad.
Definici
on
Sea (, A, P ) un espacio probabilstico donde es el espacio muestral, A la -algebra
definida sobre y P una funci
on de probabilidad. Una variable aleatoria X : R es
una funci
on que asigna a cada resultado del espacio muestral un n
umero real.
X:

(Dpto. Estadstica)

R
s X(s)
Estadstica

Curso 2011/2012

67 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Tipos de variables aleatorias

TIPOS DE VARIABLES ALEATORIAS


Las variables aleatorias se clasifican usualmente de acuerdo con el n
umero de valores
que pueden asumir distinguiendo entre v.a. discreta o continua:
Definici
on
Una v.a. X es discreta si el conjunto de valores que puede tomar la variable es contable.
Sus posibles valores constituyen un conjunto finito o infinito numerable.
Definici
on
Una v.a. X es continua si el conjunto de valores que puede tomar la variable es un
subconjunto de los n
umeros reales, es decir, sus valores consisten en uno o m
as
intervalos de la recta de n
umeros reales.
Definici
on
Se llama recorrido, y se denota por R, al espacio formado por todos los posibles valores
de la variable.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

68 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Variable aleatoria discreta

VARIABLE ALEATORIA DISCRETA


Una v.a. discreta est
a perfectamente definida cuando se conocen sus valores, es decir,
el recorrido, y las probabilidades asociadas a los valores.
Funci
on masa de probabilidad
Sea una v.a. discreta X que toma un n
umero finito de valores x1 , x2 , ..., xk . Se define
la funci
on masa de probabilidad de la v.a. X como una funci
on que asigna
probabilidades a los valores de la variable, es decir,
f:

R [0, 1]
xi 7 P [X = xi ] = pi ,

i = 1, 2, . . . , k

verificando las siguientes propiedades:


k
X

pi = 1

i=1

pi 0,

i = 1, . . . , k.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

69 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Variable aleatoria discreta

Funci
on de distribuci
on
Se define la funci
on de distribuci
on de la v.a. X, y se denota por F (x), como la
probabilidad de que la v.a. X tome un valor menor o igual que x.
F:

R [0, 1]
X
x 7 F (x) = P [X x] =
pi
xi x

Propiedades
1

F (+) = 1 y F () = 0

F (x) es una funci


on no decreciente, si xi < xj F (xi ) F (xj )

F es continua a la derecha.

P [xi < X xj ] = F (xj ) F (xi )

P [X > x] = 1 P [X x] = 1 F (x)

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

70 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Variable aleatoria discreta

Esperanza matem
atica
Se considera una v.a. discreta, X, que toma los valores {x1 , x2 , . . . , xk } con
probabilidades {p1 , p2 , . . . , pk }. Se define la esperanza matem
atica o media de la v.a.
X, y se representa por E[X], como
E[X] =

k
X

xi pi

i=1

Si se considera una funci


on real, g(X), de la v.a. X, entonces se define la esperanza
matem
atica de g(X) como
k
X
E[g(X)] =
g(xi )pi
i=1

Sean a, b y c, constantes, y X e Y variables aleatorias discretas, entonces:


1

E[c] = c

E[aX] = aE[X]

E[X + a] = E[X] + a

E[aX + b] = aE[X] + b

E[X + Y ] = E[X] + E[Y ]

Si g(X) y h(X) son dos funciones de la v.a. X, entonces


E[g(X) + h(X)] = E[g(X)] + E[h(X)]
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

71 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Variable aleatoria discreta

Varianza
2
Se define la varianza de una v.a. X discreta y se representa por V ar[X] o X
como
2
X

= V ar[X] = E[(X E[X]) ] = E[X ] E[X] =

k
X
i=1

x2i pi

k
X

!2
pi xi

i=1

Se define la desviaci
on tpica de la v.a. X, y se representa por X , como la raz
cuadrada positiva de la varianza.
Propiedades
Si a y b son constantes, V ar[aX + b] = a2 V ar[X]
Para cualquier k R, E[(X k)2 ] = 2 + (E[X] k)2
En la propiedad anterior, si se toma k = 0
V ar[X] = E[X 2 ] (E[X])2

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

72 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Variable aleatoria continua

VARIABLE ALEATORIA CONTINUA


Sea una v.a. continua X, que toma valores en el intervalo [a, b] R. Se dice que f (x)
es la funci
on de densidad de una v.a. continua si satisface las siguientes condiciones:
1

f (x) 0, x RX
Z +
f (x)dx = 1.

A partir de la funci
on de densidad, se calcula la probabilidad de un suceso relativo a
una v.a. de la siguiente forma:
Z xj
P [xi < X < xj ] =
f (x)dx
xi

Conviene resaltar que el valor de la funci


on de densidad, f (x), en un punto x, no es la
probabilidad de aparici
on de ese valor x, ya que:
Z x
P [X = x] =
f (t)dt = 0.
x

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

73 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Variable aleatoria continua

Funci
on de distribuci
on
Dada una v.a. continua X, recibe el nombre de funci
on de distribuci
on y se denota
por F (x), la funci
on definida por
Z x
F (x) = P [X x] =
f (t)dt x RX ,

es decir, el
area que encierra la funci
on de densidad en el intervalo (, x].
La funci
on de densidad y la funci
on de distribuci
on de una v.a. continua est
an
relacionadas mediante la siguiente expresi
on
f (x) =

dF (x)
.
dx

Propiedades
1

F (+) = 1 y F () = 0

La funci
on de distribuci
on es una funci
on no decreciente y continua a la derecha.

P [xi < X < xj ] = P [xi X < xj ] = P [xi < X xj ] = P [xi X xj ] =


Z xj
=
f (x)dx = F (xj ) F (xi )

P [X > x] = 1 F (x)

xi

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

74 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Variable aleatoria continua

Esperanza matem
atica
Sea X una v.a. continua con funci
on de densidad f (x). Se define la esperanza
matem
atica o media de la v.a. X, y se representa por E[X] o X como
Z +
E[X] = X =
xf (x)dx

Si se considera una funci


on real, g(X), de la v.a. X, se define la esperanza
matem
atica de g(X) como
Z
g(x)f (x)dx
E[g(X)] =

Propiedades
Sean a, b, constantes y X e Y variables aleatorias continuas:
1

E[aX] = aE[X]

E[X + a] = E[X] + a

E[aX + b] = aE[X] + b

E[X + Y ] = E[X] + E[Y ]


(Dpto. Estadstica)

Estadstica

Curso 2011/2012

75 / 157

Tema 4. Conceptos b
asicos de Variables Aleatorias

Variable aleatoria continua

Varianza
2
Se define la varianza de una v.a. X continua, y se representa por V ar[X] o X
, como
Z +
V ar[X] = E[(X E[X])2 ] =
(x E[X])2 f (x)dx

que tambien se puede expresar de la siguiente forma


V ar[X] = E[X 2 ] E[X]2 =

x2 f (x)dx

Z

2
xf (x)dx

Se define la desviaci
on tpica de la v.a. X, y se representa por X , como la raz
cuadrada positiva de la varianza.
Propiedades
Sean a, b, constantes y X una v.a.:
1

V ar[aX] = a2 V ar[X]

V ar[X + a] = V ar[X]

V ar[aX + b] = a2 V ar[X]

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

76 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on de Bernoulli

TEMA 5. MODELOS DE DISTRIBUCIONES DISCRETAS


Y CONTINUAS
DE BERNOULLI
DISTRIBUCION
Se aplica este modelo a cualquier situaci
on en la que se tiene un experimento que
produce s
olo dos resultados posibles incompatibles, a los que se denominan exito y
fracaso.
Se define la variable aleatoria discreta X que representa el resultado del experimento,
es decir, asigna un 1 al suceso exito con probabilidad p y un 0 al suceso fracaso con
probabilidad q = 1 p.

0, si ocurre el fracaso, con probabilidad q
X:
1, si ocurre el exito, con probabilidad p
Su funci
on masa de probabilidad es:
xi
0
1

(Dpto. Estadstica)

pi
1-p
p

Estadstica

Curso 2011/2012

77 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on de Bernoulli

Definici
on
Se dice entonces que la variable aleatoria X = resultado del experimento, sigue una
distribuci
on Bernoulli de par
ametro p y se denota como X
B(p).
Funci
on de distribuci
on

0,
q,
F (x) = P [X x] =

1,

si x < 0
si 0 x < 1
si x 1

Caractersticas
Esperanza
E[X] =

k
X

xi pi = 0 (1 p) + 1 p = p

i=1

Varianza
V ar[X] = E[X 2 ] (E[X])2 = p p2 = p(1 p)
donde E[X 2 ] =

k
X

x2i pi = 02 (1 p) + 12 p = p

i=1
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

78 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on Binomial

BINOMIAL
DISTRIBUCION
Se considera un experimento que se repite n veces de forma identica e independiente.
Los resultados de cada realizaci
on del experimento se clasifican en dos categoras, exito y
fracaso, como en el caso de la distribuci
on de Bernoulli.
Definici
on
Se dice que la variable aleatoria discreta que cuenta el n
umero de exitos en n
realizaciones del experimento, tiene una distribuci
on Binomial de par
ametros n y p, y se
denota como X
B(n, p).
El recorrido de esta variable aleatoria es RX = {0, 1, 2, 3, . . . , n}. La funci
on masa de
probabilidad viene dada por
P [X = k] =

(Dpto. Estadstica)

!
n k
p (1 p)nk
k

Estadstica

k = 0, . . . , n

Curso 2011/2012

79 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on Binomial

Funci
on de distribuci
on

0,


[x] 
X
n
F (x) = P [X x] =
pk (1 p)nk ,

k
k=0

1,

x<0
0x<n
xn

La funci
on masa de probabilidad y la funci
on de distribuci
on est
an tabuladas para
distintos valores de los par
ametros.
Caractersticas
Esperanza: E[X] = np
Varianza: V ar[X] = np(1 p)
Propiedad reproductiva: Sean X1 , X2 , . . . , Xm un conjunto de variables aleatorias
independientes con distribuci
on Binomial, Xi
B(ni , p). Entonces,
m
X

Xi

i=1

(Dpto. Estadstica)

m
X

!
ni , p

i=1

Estadstica

Curso 2011/2012

80 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on de Poisson

DE POISSON
DISTRIBUCION
Sea X una variable aleatoria que modeliza el fen
omeno aleatorio, No de veces que se
presenta un determinado hecho en un intervalo de tiempo, longitud o espacio fijado.
Tambien puede modelizar el n
umero de ocurrencias de un suceso con poca probabilidad
de ocurrir. Dicha variable se denomina de Poisson.
Definici
on
Sea X una variable aleatoria discreta que toma los valores 0, 1, 2, .... Se dice que X
tiene una distribuci
on de Poisson de par
ametro , y se denota como X
P(), ( > 0)
si
k
k = 0, 1, 2, . . .
P [X = k] = e
k!
El par
ametro de la distribuci
on () indica la esperanza de la variable aleatoria es decir,
el n
umero medio de ocurrencias del suceso considerado en el intervalo de tiempo,
longitud o espacio fijado.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

81 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on de Poisson

Funci
on de distribuci
on

0,
[x]
X
F (x) = P [X x] =
k

e ,

k!

x<0
x0

k=0

donde [x] es la parte entera de x.


La funci
on masa de probabilidad y la funci
on de distribuci
on est
an tabuladas para
distintos valores de los par
ametros.
Caractersticas
Esperanza: E[X] =
Varianza: V ar[X] =
Propiedad reproductiva: Sean X1 , X2 , . . . , Xm , un conjunto de variables aleatorias
independientes con distribuci
on de Poisson, Xi
P(i ). Entonces,
m
X

Xi

i=1

(Dpto. Estadstica)

m
X

!
i

i=1

Estadstica

Curso 2011/2012

82 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on Normal

NORMAL
DISTRIBUCION
Definici
on
Se dice que una variable aleatoria continua X sigue una distribuci
on Normal de
par
ametros y 2 ( R y 2 > 0), si su funci
on de densidad es


1
1
f (x) = exp 2 (x )2 , < x < +
2
2
donde es la media y 2 es la varianza. Se denota como X

N (, 2 ).

Funci
on de distribuci
on

F (x) = P [X x] =

(Dpto. Estadstica)

(t)2
1

e 22 dt,
2

Estadstica

< x < +

Curso 2011/2012

83 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on Normal

Caractersticas
Esperanza: E[X] =
Varianza: V ar[X] = 2
Propiedad reproductiva: Sean X1 , X2 , . . . , Xm , un conjunto de variables aleatorias
independientes con distribuci
on Normal, Xi
N (i , i2 ). Entonces,
!
m
m
m
X
X
X
2
Xi
N
i ,
i
i=1

i=1

i=1

Transformaci
on lineal: Si se considera una transformaci
on lineal de una v.a.
Normal, la nueva variable tiene tambien distribuci
on Normal
)
X
N (, 2 )
Y
N (a + b, a2 2 )
Y = aX + b
a, b R, a 6= 0
Combinaci
on lineal: La combinaci
on lineal de variables aleatorias Normales e
independientes tiene distribuci
on Normal:
X1 , X2 , ...Xn v.a.i.
Xi
N (i , i2 )
ai R,
(Dpto. Estadstica)

)
Y =

n
X
i=1

Estadstica

ai Xi

n
X
i=1

ai i ,

n
X

!
a2i i2

i=1

Curso 2011/2012

84 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on Normal

Tipificaci
on
La variable normal, Z, con = 0 y 2 = 1, se denomina distribuci
on Normal
Tipificada o Est
andar, N (0, 1), y su funci
on de distribuci
on est
a tabulada.
Para calcular probabilidades en el caso general para X
N (, 2 ), se transforma la
v.a. X en la variable tipificada Z. Por tanto, utilizando la propiedad de la
transformaci
on lineal, se pueden conocer las probabilidades correspondientes a cualquier
distribuci
on Normal realizando la siguiente transformaci
on

E[X]

E[Z] =
=0
X

Z=

Z
N (0, 1)
V ar[X]

V ar[Z] =
=1
2

De esta forma, para calcular probabilidades de una distribuci


on normal previamente se
tipifica:

P [a X b] = P

(Dpto. Estadstica)




a
X
b
a
b

=P
Z

Estadstica

Curso 2011/2012

85 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuci
on Normal

Nota Para calcular probabilidades de una v.a. con distribuci


on N (0, 1) se tiene en
cuenta que:
1

P [X a] = 1 P [X a]

P [a X b] = P [X b] P [X a]

P [X a] = P [X a] = 1 P [X a]

P [a X a] = P [X a] P [X a] = 2P [X a] 1

P [|X| a] = P [a X a] = 2P [X a] 1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

86 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Aproximaciones entre las distribuciones

APROXIMACIONES ENTRE LAS DISTRIBUCIONES

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

87 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Aproximaciones entre las distribuciones

Aproximaci
on de una Binomial por una Poisson
Sea X
B(n, p), de forma que n
yp
0. M
as concretamente, en el caso en
el que n 30 y p < 0.1 o np < 5, entonces se puede aproximar esta distribuci
on a una
distribuci
on de Poisson, es decir,
X

B(n, p) = X P( = n p)

Aproximaci
on de una Binomial por una Normal
Sea X
B(n, p), con el par
ametro n muy grande, concretamente n > 30 y adem
as
0.1 < p < 0.9, entonces la distribuci
on Binomial puede aproximarse a una distribuci
on
Normal con = np y 2 = npq, es decir,
X np
B(n, p) N (np, npq) = Z =
N (0, 1)
npq

Aproximaci
on de una Poisson por una Normal
Sea X
P() con 10, entonces la distribuci
on de Poisson puede aproximarse a
una distribuci
on con = y 2 = , es decir,
X
(Dpto. Estadstica)

P () N (, ) = Z =
Estadstica

N (0, 1)

Curso 2011/2012

88 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Aproximaciones entre las distribuciones

Correcci
on por continuidad
Cuando se aproxima la distribuci
on Binomial o Poisson a una distribuci
on Normal, se
est
a aproximando de una distribuci
on discreta por una continua. Para que la
aproximaci
on sea la m
as adecuada se utiliza la correcci
on por continuidad, que consiste
en sumar y restar 0.5 a cada valor discreto de la distribuci
on, es decir,
Calcular P [X = k] en una distribuci
on Binomial o Poisson, es equivalente a calcular
P [k 0.5 X k + 0.5] en una distribuci
on Normal.
Calcular P [X k] en una distribuci
on Binomial o Poisson, es equivalente a calcular
P [X k + 0.5] en una distribuci
on Normal.
Calcular P [X k] en una distribuci
on Binomial o Poisson, es equivalente a calcular
P [X k 0.5] en una distribuci
on Normal.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

89 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuciones asociadas a la ley normal

Distribuci
on Chi-cuadrado de Pearson
Definici
on
Sean Z1 , Z2 , ..., Zn variables aleatorias independientes e identicamente distribuidas seg
un
una N (0, 1). Se considera la variable aleatoria
X = Z12 + Z22 + ... + Zn2 ,
entonces se verifica que X tiene distribuci
on Chi-cuadrado con n grados de libertad y se
denota como,
X
2n
La funci
on de distribuci
on asociada est
a tabulada para distintos valores de n. Para el
uso de las tablas se considera que un punto (o valor crtico) 2n;p representa el valor de la
abscisa que tiene a la izquierda un
area igual a p en una distribuci
on 2n , es decir
P [2n 2n;p ] = p

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

90 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuciones asociadas a la ley normal

Distribuci
on t de Student
Definici
on
Sean Y y Z dos variables aleatorias independientes con Y
N (0, 1) y Z
2n . Se
Y

, que tiene distribuci


on t de Student con n grados de libertad.
define la v.a. T =
Z/n

Se denota como T

tn .

La funci
on de distribuci
on asociada est
a tabulada para distintos valores de n. Para el
uso de las tablas se considera que un punto (o valor crtico) tn;p representa el valor de la
abscisa que tiene a la izquierda un
area o probabilidad igual a p en una distribuci
on tn ,
es decir,
P [tn tn;p ] = p
En la tabla s
olo se encuentran valores positivos, por lo que es necesario utilizar las
relaciones que surgen de la simetra de la distribuci
on, es decir,
tn;p = tn;1p

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

91 / 157

Tema 5. Modelos de Distribuciones Discretas y Continuas

Distribuciones asociadas a la ley normal

Distribuci
on F de Snedecor
Definici
on
Se consideran dos variables aleatorias independientes Y y Z tales que Y
2n y
Y
/n
Z
2m . Sea F una variable aleatoria definida como F =
, entonces se dice que la
Z/m
variable aleatoria F sigue una distribuci
on F de Snedecor con n y m grados de libertad,
y se denota por Fn,m .
La funci
on de distribuci
on asociada est
a tabulada para distintos valores de n y m. Para
el uso de las tablas se considera que un punto (o valor crtico) Fn,m;p representa el valor
de la abscisa que tiene a la izquierda un
area igual a p en una distribuci
on Fn,m , es decir,
P [Fn,m Fn,m;p ] = p
En la tabla de probabilidades s
olo se encuentran algunos valores de p. Para calcular
probabilidades en el caso de que no se encuentre el valor p se utiliza la siguiente relaci
on
de inversi
on:
Fn,m;p =

(Dpto. Estadstica)

1
P [Fn,m x] = 1 P [Fm,n 1/x]
Fm,n;1p
Estadstica

Curso 2011/2012

92 / 157

Tema 6. Introducci
on a la Inferencia Estadstica

Conceptos generales

A LA INFERENCIA
TEMA 6. INTRODUCCION
ESTADISTICA
CONCEPTOS GENERALES
En la mayora de las situaciones el investigador se ve obligado a efectuar un estudio de
la poblaci
on, a traves de la informaci
on que se recoge en una parte de la misma, que se
supone representativa del total y que se denomina muestra. Esto se produce por el
exceso de coste que supondra o bien por la imposibilidad de acceder a todos ellos o
incluso porque el individuo se destruya al observarlo.
El objetivo que se persigue es obtener informaci
on de la muestra y a partir de esta
poder dar resultados para la poblaci
on, tratando de medir el riesgo que se asume al
atribuir propiedades de la poblaci
on a partir de lo que s
olo se conoce en una muestra.
Ser
a, por tanto, imprescindible que la muestra que se examina sea representativa del
total, por lo que su selecci
on requerir
a unos determinados requisitos que garanticen dicha
representatividad.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

93 / 157

Tema 6. Introducci
on a la Inferencia Estadstica

(Dpto. Estadstica)

Conceptos generales

Estadstica

Curso 2011/2012

94 / 157

Tema 6. Introducci
on a la Inferencia Estadstica

Distribuciones en el muestreo de poblaciones normales

Distribuci
on del estadstico media muestral
Sea P una poblaci
on y X una variable aleatoria asociada a dicha poblaci
on cuya
distribuci
on es Normal de media y varianza 2 .
Sean X1 , ..., Xn variables aleatorias independientes e identicamente distribuidas, que
representan n selecciones de una poblaci
on normal. Se define el estadstico
T =

S/ n

tn1

donde S es la raz cuadrada de la cuasivarianza muestral y se denomina cuasidesviaci


on
tpica muestral.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

95 / 157

Tema 6. Introducci
on a la Inferencia Estadstica

Distribuciones en el muestreo de poblaciones normales

Distribuci
on del estadstico varianza muestral
Sean X1 , ..., Xn variables aleatorias independientes e identicamente distribuidas, que
representan n selecciones de una poblaci
on normal. Entonces el estadstico
n
X

Y =

(Xi )2

i=1

2n

Distribuci
on del estadstico cuasivarianza muestral
Sean X1 , ..., Xn variables aleatorias independientes e identicamente distribuidas, que
representan n selecciones de una poblaci
on normal. Entonces
n
X

Xi X

i=1

(Dpto. Estadstica)

2
=

(n 1)S 2
2

Estadstica

2n1

Curso 2011/2012

96 / 157

Tema 6. Introducci
on a la Inferencia Estadstica

Distribuciones en el muestreo de poblaciones normales

Distribuci
on del estadstico proporci
on muestral
Se considera una v.a. X=no de exitos en n repeticiones de un experimento con
distribuci
on B(n, p) siendo p la proporci
on de exitos en la poblaci
on. La proporci
on de
exitos en la muestra se obtiene a partir del estadstico proporci
on muestral:
pb =

n
1X
Xi
n i=1

Cuando n es grande (n > 30), la distribuci


on Binomial se aproxima a una distribuci
on
Normal, por tanto,
X
B(n, p) N (np, npq)
Utilizando la propiedad de transformaci
on lineal de la distribuci
on Normal se tiene que
 pq 
pb N p,
n

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

97 / 157

Tema 6. Introducci
on a la Inferencia Estadstica

Distribuciones en el muestreo de poblaciones normales

Distribuci
on del estadstico diferencia de medias muestrales de dos poblaciones
normales independientes
Sean X e Y variables aleatorias independientes tales que:
X

2
N (X , X
),

N (Y , Y2 )

Se considera:
2
Una muestra aleatoria simple de tama
no nX de X, con X la media muestral y SX
la cuasivarianza muestral.

Una muestra aleatoria simple de tama


no nY de Y , con Y la media muestral y SY2
la cuasivarianza muestral.
En estas condiciones, se distinguen dos casos:
2
2
Caso A Varianzas poblacionales desconocidas pero supuestas iguales (X
= Y
)
El estadstico T , definido como:

T =

(Dpto. Estadstica)

(X Y ) (X Y )
q
SP n1X + n1Y

Estadstica

tnX +nY 2

Curso 2011/2012

98 / 157

Tema 6. Introducci
on a la Inferencia Estadstica

Distribuciones en el muestreo de poblaciones normales

Caso B Varianzas poblacionales desconocidas con nX , nY > 30


El estadstico Z, definido como:
Z=

(X Y ) (X Y )
q 2
S2
SX
+ nYY
nX

N (0, 1)

Distribuci
on del estadstico cociente de varianzas muestrales de dos poblaciones
Normales independientes
Sean las variables aleatorias X e Y independientes tales que:
X

2
N (X , X
),

N (Y , Y2 )

El estadstico definido como:


F =

(Dpto. Estadstica)

2
2
SX
/X
2
SY /Y2

FnX 1,nY 1

Estadstica

Curso 2011/2012

99 / 157

Tema 6. Introducci
on a la Inferencia Estadstica

Distribuciones en el muestreo de poblaciones normales

Distribuci
on del estadstico diferencia de proporciones muestrales
Sean las variables aleatorias X e Y independientes tales que:
X

B(nX , pX )

B(nY , pY ).

N (nY pY , nY pY qY )

Para nX y nY grandes se verifica:


X

N (nX pX , nX pX qX )

con qX = 1 pX y qY = 1 pY .
Se definen las proporciones muestrales como:
pbX =

X
nX

pbY =

Y
nY

Se define el estadstico diferencia de proporciones muestrales como:




pX q X
pY q Y
pbX pbY
N pX pY ,
+
nX
nY
y se verifica que:
Z=

(Dpto. Estadstica)

(b
pX pbY ) (pX pY )
q
pX qX
+ pYnYqY
nX
Estadstica

N (0, 1)

Curso 2011/2012

100 / 157

Tema 7. Estimaci
on de Par
ametros

Introducci
on

DE PARAMETROS

TEMA 7. ESTIMACION

INTRODUCCION
En este tema se aborda el problema de la estimaci
on estadstica, es decir, se est
a
interesado en conocer una determinada caracterstica y para ello se obtiene una
aproximaci
on de esta, o lo que es lo mismo, se obtiene una estimaci
on.
Hay diversas formas de aproximar una caracterstica desconocida, seg
un el objetivo
que se desee conseguir:
Si lo que se necesita es obtener un valor puntual de la caracterstica considerada, se
est
a ante un problema de estimaci
on puntual.
Si el objetivo es obtener conjuntos a los que pertenezca la caracterstica estudiada
con un determinado grado de credibilidad, se est
a ante un problema de estimaci
on
por intervalos de confianza.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

101 / 157

Tema 7. Estimaci
on de Par
ametros

Estimaci
on Puntual

PUNTUAL
ESTIMACION
Estimadores puntuales de los par
ametros de una distribuci
on normal
Sea una poblaci
on P de la que se extrae una muestra de tama
no n y X una v.a.
asociada a dicha poblaci
on cuya distribuci
on es N (, 2 ).
Estimador puntual de la media poblacional, :
Media muestral X =

n
1X
Xi
n i=1

Estimadores puntuales de la varianza poblacional, 2 :


Varianza muestral
b2 =

n
1X
(Xi X)2
n i=1

Cuasivarianza muestral S 2 =

n
1 X
(Xi X)2
n 1 i=1

siendo X la media muestral antes definida.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

102 / 157

Tema 7. Estimaci
on de Par
ametros

Estimaci
on Puntual

Estimador puntual de la proporci


on poblacional
Sea una poblaci
on P de N individuos de la que se extrae una muestra de tama
no n,
se estudia sobre ella un car
acter cualitativo.
Estimador puntual de la proporci
on poblacional, p:
Proporci
on muestral pb =

(Dpto. Estadstica)

n
1X
Xi
n i=1

Estadstica

Curso 2011/2012

103 / 157

Tema 7. Estimaci
on de Par
ametros

Estimaci
on por Intervalos de Confianza

POR INTERVALOS DE CONFIANZA


ESTIMACION
Un intervalo de confianza est
a formado por dos valores dentro de los cuales se afirma
que se encuentra el verdadero par
ametro con cierta confianza. Son unos lmites o
margen de variabilidad que se le da al valor estimado, para poder afirmar que el
verdadero valor del par
ametro est
a dentro de estos lmites.
Sea el par
ametro de interes. El nivel de confianza, 1 , indica la proporci
on de
veces que se acertara al afirmar que el par
ametro est
a dentro de esos lmites, al
seleccionar un conjunto amplio de muestras. El nivel , es la probabilidad de error, suele
ser fijada de antemano y se denomina nivel de significaci
on.
Para la construcci
on de intervalos de confianza, es necesario buscar una funci
on de la
muestra y del par
ametro, T (X1 , ..., Xn , ), cuya distribuci
on no dependa del par
ametro.
Se trata, por tanto, de calcular dos valores bI y bS que verifiquen
P [bI < T (X1 , ..., Xn , ) < bS ] = 1 ,
obteniendo un intervalo para T (X1 , ..., Xn , ). Despejando se obtiene el intervalo
buscado.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

104 / 157

Tema 7. Estimaci
on de Par
ametros

Estimaci
on por Intervalos de Confianza

Sea P una poblaci


on en la que se mide una variable aleatoria X con distribuci
on
N (, 2 ).

Intervalo de confianza para la media, , de una poblaci


on Normal

 

S
S
S
IC() = X tn1;1/2 ; X + tn1;1/2
= X tn1;1/2
n
n
n
Intervalo de confianza para la varianza poblacional, 2 , de una poblaci
on Normal
"
2

IC( ) =

(Dpto. Estadstica)

(n 1)S 2 (n 1)S 2
;
2n1;1/2 2n1;/2

Estadstica

Curso 2011/2012

105 / 157

Tema 7. Estimaci
on de Par
ametros

Estimaci
on por Intervalos de Confianza

2
Sean X
N (X , X
)eY
N (Y , Y2 ) dos v.a. independientes. Se extraen dos
muestras aleatorias de tama
nos nX y nY , respectivamente, ambas de forma
independiente.
Intervalo de confianza para la diferencia de medias poblacionales, X Y , de dos
poblaciones normales con varianzas desconocidas supuestas iguales

"
IC(X Y ) =

siendo Sp =

r


X Y tnX +nY 2;1/2 Sp

1
1
+
nX
nY

2 +(n 1)S 2
(nX 1)SX
Y
Y
nX +nY 2

Intervalo de confianza para la diferencia de medias poblacionales, X Y , de dos


poblaciones normales con varianzas desconocidas y nX , nY > 30

s


IC(X Y ) = X Y z1/2

(Dpto. Estadstica)

Estadstica

2
SX
SY2
+
nX
nY

Curso 2011/2012

106 / 157

Tema 7. Estimaci
on de Par
ametros

Estimaci
on por Intervalos de Confianza

2
2
Intervalo de confianza para el cociente de varianzas, X
/Y
, de dos poblaciones
normales


IC

2
X
Y2


=

1
FnX 1,nY 1;1/2

2
2
1
SX
SX
;
SY2 FnX 1,nY 1;/2 SY2

Intervalo de confianza para el par


ametro p de una distribuci
on binomial
Se considera una variable aleatoria X con distribuci
on B(n, p).
"

IC(p) = pb z1/2

pbqb
n

Intervalo de confianza para la diferencia de proporciones de dos distribuciones


binomiales con muestras grandes
consideran X
B(nx , pX ) e Y
B(ny , pY ). Como nX y nY grandes.
"

IC(pX pY ) = (b
pX pbY ) z1/2

(Dpto. Estadstica)

Estadstica

pbX qbX
pbY qbY
+
nX
nY

Curso 2011/2012

107 / 157

Tema 8. Contrastes de Hip


otesis

Conceptos b
asicos

TEMA 8. CONTRASTES DE HIPOTESIS

CONCEPTOS BASICOS
El contraste de hip
otesis constituye el tercer gran bloque de tecnicas dentro de la
Inferencia, junto con la estimaci
on puntual y la estimaci
on por intervalos de confianza.
El objetivo del contraste de hip
otesis es diferente del de la estimaci
on: ahora no
deseamos estimar razonablemente bien el valor de un par
ametro desconocido, sino que
tratamos de decidir si es sensato rechazar (o aceptar) la hip
otesis de que el valor de ese
par
ametro se sit
ua en una determinada regi
on del espacio parametrico .
En un proceso de contraste de hip
otesis se pueden considerar las siguientes etapas:
1

Se formula un hip
otesis sobre una determinada caracterstica de interes de la
poblaci
on bajo estudio (generalmente un par
ametro poblacional).

Se selecciona una muestra de la poblaci


on.

Se comprueba si los datos est


an o no de acuerdo con la hip
otesis que se plantea; si
no es as, se puede formular una nueva hip
otesis.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

108 / 157

Tema 8. Contrastes de Hip


otesis

Definici
on de contraste

DE CONTRASTE
DEFINICION
Tipos de contrastes
Contrastes parametricos: Se conoce la distribuci
on de la v.a. bajo estudio y se
establecen hip
otesis sobre los par
ametros de dicha distribuci
on.
Contrastes no parametricos: Se desconoce la distribuci
on de la v.a. considerada. Se
establecen hip
otesis acerca de alguna propiedad de la distribuci
on.
La primera hip
otesis que se plantea en un problema de contraste recibe el nombre de
hip
otesis nula: H0 . La hip
otesis complementaria a la hip
otesis nula recibe el nombre de
hip
otesis alternativa: H1 .
Definici
on
Un contraste de hip
otesis es una regla de decisi
on que lleva a aceptar o rechazar H0 . Se
especifica un conjunto C tal que si
(X1 , X2 , . . . , Xn ) C se rechaza H0
(X1 , X2 , . . . , Xn )
/ C se acepta H0
Al conjunto C se le denomina regi
on crtica o regi
on de rechazo. La regi
on crtica C
se especifica mediante un estadstico que se llama estadstico de contraste.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

109 / 157

Tema 8. Contrastes de Hip


otesis

Definici
on de contraste

Seg
un lo anterior, la regi
on crtica est
a formada por todos aquellos valores que toma el
estadstico de contraste que llevan a rechazar H0 (puntos crticos). La regi
on de
aceptaci
on estar
a entonces formada por aquellos valores que toma el estadstico de
contraste que llevan a aceptar H0 .
Pasos para la realizaci
on de un contraste de hip
otesis
1

Fijar la hip
otesis nula y la alternativa, que pueden ser:
H0 : = 0
H0 : 6= 0

H0 : 0
H0 : < 0

H 0 : 0
H0 : > 0

Buscar el estadstico adecuado para realizar el contraste.

Obtener la regi
on crtica.

Obtener el valor observado (valor experimental) del estadstico para la muestra


seleccionada.

Decidir entre aceptar o rechazar H0 , ya sea con el criterio de la Regi


on Crtica.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

110 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis param
etricos

Contrastes de hip
otesis sobre la media de una poblaci
on normal
Fijado un nivel de significaci
on, , se calcula el valor del estadstico
T =

S/ n

Contraste
H0
H1
H0
H1
H0
H1

(Dpto. Estadstica)

: = 0
: 6= 0
: 0
: < 0
: 0
: > 0

texp

tn1 texp =

0
X

S/ n

Regi
on crtica
Se rechaza H0 a nivel si
< tn1;1/2 o texp > tn1;1/2
texp < tn1;1
texp > tn1;1

Estadstica

Curso 2011/2012

111 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis param
etricos

Contrastes de hip
otesis sobre la varianza de una poblaci
on normal
Fijado un nivel de significaci
on, , se calcula el valor del estadstico
2 =

(n 1)S 2
2

Contraste
H0
H1
H0
H1
H0
H1

(Dpto. Estadstica)

: 2
: 2
: 2
: 2
: 2
: 2

= 02
6= 02
02
< 02
02
> 02

2exp

2n1 2exp =

(n 1)S 2
02

Regi
on crtica
Se rechaza H0 a nivel si
< 2n1;/2 o 2exp > 2n1;1/2
2exp < 2n1;
2exp > 2n1;1

Estadstica

Curso 2011/2012

112 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis param
etricos

Contrastes de hip
otesis sobre la proporci
on de una poblaci
on binomial
Fijado un nivel de significaci
on, , se calcula el valor del estadstico
pb p
Z= q

pb p0
N (0, 1) zexp = q

Contraste

Regi
on crtica
Se rechaza H0 a nivel si
zexp < z1/2 o zexp > z1/2

p(1p)
n

H0
H1
H0
H1
H0
H1

(Dpto. Estadstica)

: p = p0
: p 6= p0
: p p0
: p < p0
: p p0
: p > p0

p0 (1p0 )
n

zexp < z1
zexp > z1

Estadstica

Curso 2011/2012

113 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis param
etricos

Contrastes de hip
otesis sobre la diferencia de medias de dos poblaciones normales,
con varianzas desconocidas pero iguales
Fijado un nivel de significaci
on, , se calcula el valor del estadstico
T =

Y ) (x y )
(X
q
Sp n1x + n1y

Contraste
H0
H1
H0
H1
H0
H1

: x y
: x y
: x y
: x y
: x y
: x y

(Dpto. Estadstica)

= 0
6= 0
0
< 0
0
> 0

texp

tnx +ny 2 texp =

Y ) 0
(X
q
Sp n1x + n1y

Regi
on crtica
Se rechaza H0 a nivel si
< tnx +ny 2;1/2 o texp > tnx +ny 2;1/2
texp < tnx +ny 2;1
texp > tnx +ny 2;1

Estadstica

Curso 2011/2012

114 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis param
etricos

Contrastes de hip
otesis sobre la diferencia de medias de dos poblaciones normales,
con varianzas desconocidas y tama
nos de muestras grandes
Fijado un nivel de significaci
on, , se calcula el valor del estadstico
T =

Y ) (x y )
(X
r
2
Sx
nx

2
Sy
ny

Contraste
H0
H1
H0
H1
H0
H1

(Dpto. Estadstica)

: x y
: x y
: x y
: x y
: x y
: x y

N (0, 1) zexp =

= 0
6= 0
0
< 0
0
> 0

Y ) 0
(X
r
2
Sx
nx

2
Sy
ny

Regi
on crtica
Se rechaza H0 a nivel si
zexp < z1/2 o zexp > z1/2
zexp < z1
zexp > z1

Estadstica

Curso 2011/2012

115 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis param
etricos

Contrastes de hip
otesis sobre el cociente de las varianzas de dos poblaciones
normales
Fijado un nivel de significaci
on, , se calcula el valor del estadstico
F =
Contraste
H0 :
H1 :
H0 :
H1 :
H0 :
H1 :

2
x
2
y
2
x
2
y
2
x
2
y
2
x
2
y
2
x
2
y
2
x
2
y

=1

Sx2 /x2
Sy2 /y2

Fnx 1;ny 1 Fexp =

Sx2
Sy2

Regi
on crtica
Se rechaza H0 a nivel si
Fexp < Fny 1,nx 1;1/2 o Fexp > Fnx 1,ny 1;1/2

6= 1
1

Fexp < Fny 1,nx 1;1

<1
1

Fexp > Fnx 1,ny 1;1

>1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

116 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis param
etricos

Contrastes de hip
otesis sobre la diferencia de proporciones de dos poblaciones
binomiales
Fijado un nivel de significaci
on, , se calcula el valor del estadstico
(b
px pby ) (px py )
Z= q
p (1p )
px (1px )
+ y ny y
nx
Contraste
H0
H1
H0
H1
H0
H1

(Dpto. Estadstica)

: px p y
: px p y
: px p y
: px p y
: px p y
: px p y

= p0
6= p0
p0
< p0
p0
> p0

N (0, 1) zexp = q

(b
px pby ) p0
p
bx (1b
px )
nx

p
by (1b
py )
ny

Regi
on crtica
Se rechaza H0 a nivel si
zexp < z1/2 o zexp > z1/2
zexp < z1
zexp > z1

Estadstica

Curso 2011/2012

117 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis no param
etricos

Contraste de la bondad de ajuste (primer caso)


Vamos a observar una muestra aleatoria (X1 , . . . , Xn ) de una poblaci
on X con
distribuci
on desconocida y queremos ver si, a la vista de la muestra, es razonable admitir
que la distribuci
on de X viene dada por P (un determinado modelo de probabilidad); es
decir, queremos ver si los datos se ajustan bien a P . Por tanto, tenemos:
H0 : El modelo de probabilidad de X es P
H1 : El modelo de probabilidad de X no es P
Para contrastar H0 frente a H1 hacemos una partici
on (arbitraria) del espacio
muestral de la poblaci
on (posibles valores de X) en k clases A1 , . . . , Ak . Despues, para
cada Ai (i = 1, . . . , k) consideramos las siguientes frecuencias (absolutas):
Oi = frecuencia observada en Ai = n
umero de elementos de la muestra (x1 , . . . , xn ) que
se han situado en la clase Ai .
ei = frecuencia esperada en la clase Ai , si la hip
otesis nula es cierta = nP (Ai ).

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

118 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis no param
etricos

El estadstico que utilizaremos para llevar a cabo este contraste es:


n
X
(Oi ei )2
ei
i=1

que tiene, aproximadamente una distribuci


on 2k1 , si H0 es cierta.
Si la muestra procede de P , es de esperar que haya valores parecidos para Oi y ei y,
por tanto, este estadstico debera tomar valores pr
oximos a cero; en consecuencia,
rechazaremos la hip
otesis nula cuando los valores de este estadstico sean grandes y la
aceptaremos cuando sean peque
nos; la separaci
on entre valores grandes y peque
nos viene
dada por la elecci
on de un nivel de significaci
on ; en definitiva, tenemos:
Rechazamos la hip
otesis nula H0 : El modelo de probabilidad de X es P (al nivel de
significaci
on ) si:
k
X
(Oi ei )2
> 2k1;1
e
i
i=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

119 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis no param
etricos

Contraste de la bondad del ajuste (segundo caso)


El contraste de la bondad del ajuste se puede plantear tambien en una situaci
on algo
m
as general:
Observamos una muestra aleatoria (X1 , . . . , Xn ) de una poblaci
on X con distribuci
on
desconocida y queremos ver si, a la vista de la muestra, es razonable admitir que la
distribuci
on de X viene dada por alg
un modelo de la familia {P : } donde
= (1 , . . . , r ). Es decir, queremos ver si los datos se ajustan bien a un modelo de
probabilidad de la familia {P : }. Por tanto, tenemos:
H0 : El modelo de probabilidad de X es alg
un P de la familia indicada.
H1 : El modelo de probabilidad de X no es ning
un P de la familia indicada.
Para contrastar H0 frente a H1 hacemos nuevamente una partici
on (arbitraria) del
espacio muestral de la poblaci
on (posibles valores de X) en clases A1 , . . . , Ak , y
consideramos:
Oi = frecuencia observada en Ai .
ei = frecuencia esperada en la clase Ai , si la hip
otesis nula es cierta =
nP (Ai ) nP(Ai ).
(donde = (1 , . . . , r ) son estimaciones de m
axima verosimilitud).
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

120 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis no param
etricos

El estadstico que utilizaremos es:


n
X
(Oi ei )2
ei
i=1

que tiene, aproximadamente una distribuci


on 2k1r , si H0 es cierta.
Razonando de manera an
aloga a como se hizo en el primer caso, llegamos a la
siguiente regla para efectuar el contraste:
Rechazamos la hip
otesis nula H0 : El modelo de probabilidad de X es alg
un P de la
familia indicada (al nivel de significaci
on ) si:
k
X
(Oi ei )2
> 2k1r;1
ei
i=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

121 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis no param
etricos

Contraste de homogeneidad de poblaciones


Supongamos que disponemos de p muestras aleatorias tomadas independientemente
en p poblaciones:

(X11 , . . . , X1n1 )
............
n1 + . . . + np = n

(Xp1 , . . . , Xpnp )
sobre una caracterstica X com
un a todas ellas.
Queremos ver si, a la vista de las muestras obtenidas, es razonable admitir que todas
las poblaciones tienen una distribuci
on com
un; es decir, queremos ver si son poblaciones
homogeneas. Por tanto, tenemos:
H0 : Las p poblaciones tienen una distribuci
on com
un.
H1 : Las p poblaciones no tienen una distribuci
on com
un.
Para contrastar H0 frente a H1 hacemos una partici
on (arbitraria) del espacio
muestral com
un a las p poblaciones en k clases A1 , . . . , Ak . Despues, definimos para la
clase Ai (i = 1, . . . , k) y para la muestra de la poblaci
on j-esima (j = 1, . . . , p:
Oij = frecuencia observada en la clase Ai con la muestra j-esima.
eij = frecuencia esperada en la clase Ai con la muestra j-esima, si todas las poblaciones
tienen la distribuci
on com
un P = nj P( Ai ).
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

122 / 157

Tema 8. Contrastes de Hip


otesis

El estadstico utilizado es:

Contrastes de hip
otesis no param
etricos

p
k
X
X
(Oij eij )2
eij
j=1 i=1

que tiene, aproximadamente una distribuci


on 2(k1)(p1) cuando H0 es cierta.
De nuevo, podemos razonar diciendo que, si la hip
otesis nula es cierta, las frecuencias
observadas y esperadas ser
an parecidas y, por tanto, el estadstico anterior tomar
a
valores peque
nos (pr
oximos a cero); en definitiva, tenemos:
Rechazamos la hip
otesis nula H0 : Las p poblaciones tienen una distribuci
on com
un (al
nivel de significaci
on ) si:
p
k
X
X
(Oij eij )2
> 2(k1)(p1);1
eij
j=1 i=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

123 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis no param
etricos

Contraste de independencia
Supongamos que queremos estudiar si dos caractersticas X e Y de una poblaci
on
est
an relacionadas o no. Para hacer este estudio, obtenemos una muestra aleatoria de n
pares de valores de estas caractersticas:
((X1 , Y1 ), . . . , (Xn , Yn ))
Queremos ver si, a la vista de la muestra, tiene sentido admitir que X e Y son
independientes. Por tanto, tenemos:
H0 : X e Y son independientes.
H1 : X e Y no son independientes.
Tomamos una partici
on (arbitraria) del espacio muestral (correspondiente a los
posibles valores de X e Y ) en kp clases A1 B1 , . . . , Ai Bj , . . . , Ak Bp . Estas kp
clases corresponden a tomar las clases A1 , . . . , Ak para la caracterstica X, y las clases
B1 , . . . , Bp para la caracterstica Y .

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

124 / 157

Tema 8. Contrastes de Hip


otesis

Contrastes de hip
otesis no param
etricos

Llamamos:
Oij = frecuencia observada en la clase Ai Bj .
eij = frecuencia esperada en la clase Ai Bj , si la hip
otesis nula es cierta =
nP( Ai )P (Bj ).
El estadstico que utilizaremos para el contraste de independencia es:
p
k
X
X
(Oij eij )2
eij
j=1 i=1

que tiene, aproximadamente una distribuci


on 2(k1)(p1) cuando H0 es cierta.
Como se puede observar, el estadstico anterior coincide con el que utiliz
abamos para
el contraste de homogeneidad, aunque tiene un origen diferente. En definitiva, tenemos:
Rechazamos la hip
otesis nula H0 : X y Y son independientes (al nivel de significaci
on )
si:
p
k
X
X
(Oij eij )2
> 2(k1)(p1);1
eij
j=1 i=1

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

125 / 157

Tema 9. Optimizaci
on sin restricciones

Introducci
on: Conceptos previos

SIN RESTRICCIONES
TEMA 9. OPTIMIZACION

INTRODUCCION:
CONCEPTOS PREVIOS
Estudiaremos c
omo obtener una soluci
on o
ptima (si existe) o un extremo local para el
siguiente problema:
Max. (Min.)
s.a.

z = f (x1 , x2 , . . . , xn )
x
= (x1 , x2 , . . . , xn ), x
Rn

Las funciones c
oncavas y convexas representan un papel fundamental en la Teora de
la Optimizaci
on ya que pueden garantizarnos la globalidad de los o
ptimos locales. Por
ello vamos a iniciar este tema introduciendo el concepto de funci
on c
oncava y convexa
para, posteriormente, introducir condiciones que nos permitan reconocer si una funci
on
es c
oncava o convexa dependiendo de sus propiedades de diferenciabilidad.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

126 / 157

Tema 9. Optimizaci
on sin restricciones

Introducci
on: Conceptos previos

Definici
on
La matriz hessiana asociada a una funci
on f (
x) = (x1 , x2 , . . . , xn ) es una matriz
cuadrada, Hnn , tal que sus elementos son de la forma:
hij =

2z
xi xj

Definici
on
Denominamos hessiano al determinante asociado a la matriz hessiana. En R2 , el
hessiano es: H : R2 R
2z

2z


x1 x2
x21


H=

2z

2
z
x x

2
2 1

x2

Definici
on
El menor principal de orden i de una matriz Hnn es el determinante de cualquier matriz
i i que se obtiene al suprimir las n i filas y las n i columnas correspondientes de la
matriz.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

127 / 157

Tema 9. Optimizaci
on sin restricciones

Introducci
on: Conceptos previos

Teorema: Sea la funci


on f (
x) con derivadas parciales de segundo orden continuas para
cada punto de x
S (conjunto convexo de soluciones factibles). Entonces f (
x) es
convexa sobre S si y s
olo si, para cada x
S, todos los menores principales, Hi , son no
negativos.
Teorema: Sea la funci
on f (
x) con derivadas parciales de segundo orden continuas para
cada punto de x
S (conjunto convexo de soluciones factibles). Entonces f (
x) es
c
oncava sobre S si y s
olo si, para cada x
S, los menores principales, Hi , no nulos
tienen el signo que (1)i .

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

128 / 157

Tema 9. Optimizaci
on sin restricciones

Condiciones necesarias de
optimo local

CONDICIONES NECESARIAS DE OPTIMO


LOCAL
Supongamos que existen las primeras y las segundas derivadas parciales de f (
x) y que
son continuas en todos los puntos.
Una condici
on necesaria para que un punto sea un extremo local para el problema nos
la proporciona el teorema siguiente:
Teorema: Si x
= (
x1 , x
2 , . . . , x
n ) es un extremo local para el problema sin restricciones,
entonces
f (
x)
f (
x) =
= 0, i
xi

Para funciones diferenciables, la condici


on f (
x) = 0 es una condici
on necesaria para
que f tenga un o
ptimo local en el punto x
, que sin embargo no es una condici
on
suficiente, es decir, pueden existir puntos que anulando el gradiente no sean o
ptimos
locales de f .

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

129 / 157

Tema 9. Optimizaci
on sin restricciones

Condiciones necesarias de
optimo local

Definici
on
Un punto x
que satisfaga

f (
x)
xi

= 0 es un punto estacionario o crtico de la funci


on f (
x).

Teorema: Si Hi (
x) > 0, (i = 1, 2, . . . , n), entonces un punto estacionario ser
a un
mnimo local para el problema sin restricciones.
Teorema: Si Hi (
x) 6= 0, (i = 1, 2, . . . , n), y tiene el signo (1)i , entonces un punto
estacionario ser
a un m
aximo local para el problema sin restricciones.
Teorema: Si Hi (
x) 6= 0, (i = 1, 2, . . . , n), y no se dan ninguno de los casos anteriores,
f (
x) presenta un punto de inflexi
on o punto de silla en ese punto x
.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

130 / 157

Tema 9. Optimizaci
on sin restricciones

Condici
on suficiente de
optimo local

SUFICIENTE DE OPTIMO

CONDICION
LOCAL
Definici
on
Se denota por Q la forma cuadr
atica definida como sigue:
Q(h) =

n
X

hi hj Hij f (
x)

i,j=1

Proposici
on: Sean f C 2 y x
un punto crtico de f , se verifica que:
a) Si x
es un mnimo local de f , Q es semidefinida positiva o definida positiva.
b) Si x
es un m
aximo local de f , Q es semidefinida negativa o definida negativa.
Proposici
on: Sean f C 2 y x
un punto crtico de f , se verifica que:
a) Si Q es definida positiva, x
es un mnimo local de f .
b) Si Q es definida negativa, x
es un m
aximo local de f .
c) Si Q es indefinida, x
no es ni m
aximo ni mnimo local de f
Los puntos crticos de f que no son ni m
aximos ni mnimos locales, se denominan
puntos de silla.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

131 / 157

Tema 9. Optimizaci
on sin restricciones

Condici
on suficiente de
optimo local

Ejemplo: Obtener el extremo de f (


x) = x + 2y + yz x2 y 2 z 2 .
La condici
on necesaria para que exista extremo es:
f
= 1 2x = 0,
x

f
= z 2y = 0,
y

f
k

= 0, para k = x, y, z.

f
= 2 + y 2z = 0
z

Resolviendo el sistema anterior, obtenemos, para el extremo, el


estudio x
= (1/2, 2/3, 4/3).
Condici
on suficiente:
2

f
2f
2f
2
2
0
xy
xz
x
2f

2
2
f
f
2
H=
= 0
yz
yx
y 2
2f
2f
2f
0
1
zx

(Dpto. Estadstica)

zy

z 2

Estadstica

punto objeto de

0
1
2

Curso 2011/2012

132 / 157

Tema 9. Optimizaci
on sin restricciones

Condici
on suficiente de
optimo local

Estudio de los menores principales:


Orden 1:
|H11 | = 2 < 0 signo (1)1
Orden 2:


2
|H22 | =
0


0
= 4 > 0 signo (1)2
2

Orden 3:

2

|H33 | = 0
0

0
2
1

0
1
2




= 8 + 2 = 6 < 0 signo (1)3

Por tanto, tenemos el signo de (1)i . As pues, en el punto x


, tenemos un posible
m
aximo. Como el valor de los menores principales no depende del punto, en ese punto
tenemos un m
aximo global.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

133 / 157

Tema 9. Optimizaci
on sin restricciones

Condici
on suficiente de
optimo local

Ejemplo: Dada f (x, y) = x2 + xy + y 3 3x 2y + 1, por la condici


on necesaria de
extremo relativo, se tiene que:

2x + y 3 = 0
a = (5/4, 1/2); b = (5/3, 1/3)
x + 3y 2 2 = 0
Los puntos a y b verifican la condici
on necesaria de extremo. Veamos la condici
on
suficiente, para lo que se obtienen, a continuaci
on, las derivadas parciales segundas de f
en cada uno de los puntos que cumplen la condici
on necesaria de extremo,
! 
2
2

f
f
2 1
xy
x2
H=
=
2f
2f
1 6y
2
yx

las matrices hessianas que permiten utilizar la condici


on suficiente de extremo relativo en
los puntos a y b son:




2 1
2
1
H(a) =
; H(b) =
1 3
1 2
a es un mnimo local relativo ya que H1 = 2 > 0, H2 = 5 > 0 con lo que la forma
cuadr
atica asociada a este punto es definida positiva y b es un punto de silla al ser la
forma cuadr
atica asociada indefinida.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

134 / 157

Tema 10. Ooptimizaci


on con restricciones

Introducci
on

CON RESTRICCIONES
TEMA 10. OPTIMIZACION

INTRODUCCION
El objetivo principal de la Programaci
on Matem
atica es la resoluci
on de problemas del
tipo:
min{f (
x) : x
S},
(1)
donde S Rn y f : S R, y que debe leerse como encontrar (si existe) un elemento de
S donde la funci
on f alcance su mnimo valor. A cada elemento de S se le llama
soluci
on (o tambien soluci
on factible), a S se le llama regi
on factible y a f se le llama
funci
on objetivo. En tal sentido tambien afronta problemas de maximizaci
on, ya que
estos pueden reformularse como problemas de minimizaci
on:
max{f (
x) : x
S} = min{f (
x) : x
S}

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

135 / 157

Tema 10. Ooptimizaci


on con restricciones

Introducci
on

Los problemas del tipo (1) se llaman problemas de optimizaci


on, y plantean la
b
usqueda de una soluci
on factible x
de manera que f (
x ) sea lo menor posible. Tal
b
usqueda puede concluir con uno de los resultados siguientes:
problema no factible: cuando no existe ninguna soluci
on factible, es decir, S = y
en tal caso escribiremos min{f (
x) : x
S} = +;
problema no acotado: cuando existan soluciones que hagan descender infinitamente
a la funci
on objetivo, es decir, cuando para cualquier valor real M siempre existe un
x
S tal que f (
x) < M , y en tal caso escribiremos min{f (
x) : x
S} = ;
problema con
optimo: cuando exista un x
S tal que f (
x ) f (
x) para todo

x
S. En este caso, f (
x ) = min{f (
x) : x
S}, y x
recibe el nombre de soluci
on
o
ptima (global) siendo no necesariamente u
nica en S con esta propiedad. Un punto
0
0
x
se dice que es soluci
on o
ptima local cuando existe un  > 0 tal que f (
x ) f (
x)
0
para todo x
S con k
xx
k < , para alguna norma predefinida en el espacio Rn .

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

136 / 157

Tema 10. Ooptimizaci


on con restricciones

Introducci
on

Para determinar un modelo de programaci


on matem
atica hemos de especificar tres
conjuntos b
asicos de elementos:
Las variables principales del modelo, que son las variables para las que queremos
encontrar el mejor valor posible. Cuando trabajemos en general las variables
principales ser
an x1 , . . . , xn , es decir, salvo que convengamos otra cosa en un
momento dado, la letra n representar
a siempre el n
umero de variables principales de
un modelo. En casos concretos, en lugar de x1 , x2 , x3 podremos escribir tambien
x, y, z, o usar las letras que consideremos m
as apropiadas por cuestiones de claridad.
Las restricciones, que son las condiciones que hemos de imponer a las variables para
que una soluci
on sea admisible como tal. En general, consideraremos tres tipos de
restricciones: restricciones de menor o igual: g(
x) b, restricciones de mayor o
igual: g(
x) b y restricciones de igualdad: g(
x) = b, donde g : Rn R y b R.
Cuando trabajemos en general, las restricciones ser
an de la forma gi (
x) bi (o bien
o bien =), para i = 1, . . . , m, es decir, las funciones que determinan las
restricciones se llamar
an siempre gi , los terminos independientes se llamar
an
siempre bi y el n
umero de restricciones ser
a siempre m, salvo por la siguiente
excepci
on: las restricciones xi 0 se llaman condiciones de no negatividad, y en
algunos contextos conviene tratarlas separadamente.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

137 / 157

Tema 10. Ooptimizaci


on con restricciones

Introducci
on

La funci
on objetivo, que es la funci
on f : Rn R que queremos maximinar o
minimizar. Notemos que para determinar un modelo no s
olo hemos de especificar
una funci
on objetivo, sino tambien si hay que maximizarla o minimizarla. Cuando no
queremos especificar si buscamos el m
aximo o el mnimo, hablamos de optimizar la
funci
on objetivo. En un problema de maximizar, los o
ptimos de la funci
on objetivo
son sus m
aximos, mientras que en un problema de minimizar son sus mnimos.
Ejemplo
Max.
s.a.

x1 + x2
3x1 + 2x2 12
x1 + 2x2 10
x1 , x 2 0

Las variables principales son x1 y x2 , tiene cuatro restricciones:


3x1 + 2x2 12,

x1 + 2x2 10,

x1 0,

x2 0.

y la funci
on objetivo es f (x1 , x2 ) = x1 + x2 .

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

138 / 157

Tema 10. Ooptimizaci


on con restricciones

Introducci
on

Transformaciones de problemas
A veces es conveniente transformar un problema en otro equivalente en el sentido de
que a partir de la soluci
on o
ptima de uno puede calcularse f
acilmente la soluci
on
optima
del otro.
Cambio del objetivo. Un problema con objetivo Max. f (
x) es equivalente al problema
que tiene las mismas restricciones pero su objetivo es Min. f (
x). Del mismo modo
podemos transformar un problema de minimizar en otro de maximizar.
Eliminaci
on de una constante en la funci
on objetivo. Si la funci
on objetivo es de la forma
f (
x) + k y eliminamos la constante k, el problema que obtenemos tiene el mismo o
ptimo.
Cambio de una desigualdad. Una restricci
on de se transforma en una de
multiplicando sus dos miembros por 1, y viceversa.
Igualdad por desigualdades. Una restricci
on de igualdad puede sustituirse por las dos
restricciones que resultan de cambiar el = por un y un .
Desigualdades por igualdades. Tambien es posible transformar desigualdades en
igualdades introduciendo las llamadas variables de holgura. Es costumbre hacer la
transformaci
on de tal modo que las variables de holgura sean siempre no negativas. As,
para transformar una restricci
on de en una igualdad se le suma una variable de
holgura, mientras que si es de se le resta una variable de holgura.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

139 / 157

Tema 10. Ooptimizaci


on con restricciones

Introducci
on

Condiciones de signo. Una variable sometida a una condici


on x 0 puede convertirse en
una variable no negativa mediante el cambio x = x1 , de modo que x 0 se sustituye
por x1 0.
Una variable libre x se puede sustituir por variables no negativas mediante el cambio
x = x1 x2 , x1 0, x2 0.
En vista de estas transformaciones, cualquier problema de programaci
on matem
atica
puede transformarse en uno de la forma
Max.
s.a.

f (
x)
g(
x) b

Min.
s.a.

f (
x)
g(
x) b

o tambien

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

140 / 157

Tema 10. Ooptimizaci


on con restricciones

Problemas de optimizaci
on lineales

Hechos b
asicos de la programaci
on lineal
Hay dos formas especialmente importantes de presentar un problema lineal:
Forma can
onica de un problema lineal. Se llama as a la presentaci
on de un problema en
la que todas las variables son no negativas y las restricciones son de cuando el objetivo
es maximizar o de cuando el objetivo es minimizar.
Max.
s.a.

c1 x1 + + cn xn
a11 x1 + + a1n xn b1
.................................
am1 x1 + + amn xn bm
x1 , . . . , xn 0

Es conveniente escribir el problema en forma matricial, para lo cual llamamos


A = (aij ), b = (bi ), c = (cj ), con lo que la expresi
on anterior se reduce a
Max.
s.a.

ct x

A
x b
x
0

La matriz A se llama matriz tecnica del problema. El vector c es el vector de


coeficientes de la funci
on objetivo y b es el vector de terminos independientes.
(Dpto. Estadstica)

Estadstica

Curso 2011/2012

141 / 157

Tema 10. Ooptimizaci


on con restricciones

Problemas de optimizaci
on lineales

Forma est
andar de un problema lineal. Un problema lineal est
a en forma est
andar si todas
sus variables son no negativas y todas sus restricciones son de igualdad. Matricialmente,
la expresi
on de un problema en forma est
andar con objetivo de maximizar es
Max.
s.a.

ct x

A
x = b
x
0

Podemos pasar de un problema en forma can


onica a un problema en forma est
andar sin
m
as que introducir variables de holgura.
Clases de problema lineales. El esquema siguiente contiene todas las posibilidades con
que nos podemos encontrar sobre existencia de o
ptimos en un problema lineal:

infactible

soluci
on u
nica

acotado
Problema lineal
infinitas
soluciones
factible

no acotado

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

142 / 157

Tema 10. Ooptimizaci


on con restricciones

Resoluci
on gr
afica

GRAFICA

RESOLUCION
Si el problema de optimizaci
on contiene dos o tres variables se puede abordar su
resoluci
on por medio de la tecnica gr
afica o geometrica que se describe a continuaci
on
para el caso de dos variables y que se basa en el estudio de las curvas de nivel de la
funci
on. Como es natural esta tecnica tiene el inconveniente de que s
olo es aplicable al
caso de problemas con dos o tres variables.
La resoluci
on geometrica de un programa matem
atico con dos o tres variables consiste
en determinar por medio de una representaci
on gr
afica el o los puntos del conjunto
factible situados sobre la curva de menor y de mayor nivel, que dar
an lugar,
respectivamente, al mnimo y al m
aximo globales de la funci
on objetivo.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

143 / 157

Tema 10. Ooptimizaci


on con restricciones

Resoluci
on gr
afica

Las fases del proceso de soluci


on gr
afica son:
1

Dibujar un sistema de coordenadas cartesianas en que las variables de decisi


on
esten representadas por los ejes.

Dibujar en el sistema coordenado las restricciones del problema (incluyendo las de


no negatividad). La intersecci
on de todas las regiones determina la regi
on factible o
espacio de soluciones. Si esta regi
on es no vaca, ir a la fase siguiente. En otro
caso, no existe soluci
on que satisfaga (simult
aneamente) todas las restricciones y el
problema se dice infactible.

Determinar los puntos extremos (puntos que no est


an situados en segmentos de
lnea que unen otros dos puntos del conjunto convexo) del espacio de soluciones.
Evaluar la funci
on objetivo en esos puntos y aquel o aquellos que maximicen (o
minimicen) el objetivo, corresponden a las soluciones o
ptimas del problema.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

144 / 157

Tema 10. Ooptimizaci


on con restricciones

Resoluci
on gr
afica

El proceso para resolverlo gr


aficamente si la funci
on objetivo es lineal es el siguiente:
1

Comprobamos que la funci


on objetivo es lineal.

Representamos el conjunto de oportunidades.

Calculamos el gradiente de la funci


on objetivo y lo representamos gr
aficamente.

Representamos la curva de nivel f = 0 de la funci


on objetivo. Si la funci
on objetivo
es lineal ser
a siempre la recta perpendicular al vector gradiente.

Si la curva de nivel no pasara por el conjunto de oportunidades la movemos


paralelamente a s misma hasta que pase por S. As obtenemos otra curva de nivel
v
alida para alguna soluci
on factible.

Ahora recordamos que el gradiente de la funci


on objetivo indica hacia d
onde
aumenta la funci
on, mientras que la direcci
on contraria indica hacia d
onde
disminuye. Por lo tanto, si estamos maximizando desplazaremos la curva de nivel
paralelamente a s misma en la direcci
on del gradiente. El u
ltimo punto de S que
toquemos ser
a la soluci
on o
ptima. Si el problema es de minimizar hemos de
desplazar la curva de nivel en la direcci
on opuesta al gradiente para llegar al mnimo
de f .

Si el o
ptimo encontrado satura al menos dos restricciones, podemos calcular sus
coordenadas resolviendo el sistema de ecuaciones formado por ellas.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

145 / 157

Tema 10. Ooptimizaci


on con restricciones

Resoluci
on gr
afica

Como ejemplo consideramos una vez m


as el problema
Max.
s.a.

x1 + x2
3x1 + 2x2 12
x1 + 2x2 10
x1 , x 2 0

El proceso para resolverlo gr


aficamente es el siguiente:

Figure: Conjunto de oportunidades.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

146 / 157

Tema 10. Ooptimizaci


on con restricciones

Resoluci
on gr
afica

Comprobamos que la funci


on objetivo f (x, y) = x1 + x2 es lineal.

Representamos el conjunto de oportunidades.

Calculamos el gradiente de la funci


on objetivo f = (1, 1) y lo representamos
gr
aficamente.

Representamos la curva de nivel f = 0 de la funci


on objetivo.

La curva de nivel pasa por el conjunto de oportunidades.

El gradiente de la funci
on objetivo indica hacia d
onde aumenta la funci
on. Por lo
tanto, como estamos maximizando desplazaremos la curva de nivel paralelamente a
s misma en la direcci
on del gradiente. El u
ltimo punto de S que toquemos ser
a la
soluci
on
optima.

El o
ptimo encontrado satura al menos dos restricciones, podemos calcular sus
coordenadas resolviendo el sistema de ecuaciones formado por ellas.

Para determinar las coordenadas de la soluci


on o
ptima que hemos encontrado basta
observar en la figura que satura las restricciones x1 + 2x2 = 10 y 3x1 + 2x2 = 12. Al
resolver el sistema de ecuaciones obtenemos que (x1 , x2 ) = (1, 9/2) y la funci
on objetivo
toma el valor z = 5.5.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

147 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

METODO
SIMPLEX
El metodo smplex es un procedimiento de resoluci
on de programas lineales que
consiste en obtener sucesivas soluciones factibles b
asicas que vayan suponiendo una
mejora en el valor de la funci
on objetivo hasta llegar al o
ptimo. Simplifica enormemente
el proceso, a la vez que nos permite determinar si un problema es o no acotado, y si
tiene una o infinitas soluciones.
Dado un problema de programaci
on lineal, el metodo smplex consiste en partir de un
vertice de su conjunto de oportunidades, es decir, de una soluci
on factible b
asica, e ir
saltando sucesivamente de una a otra adyacente, de modo que la funci
on objetivo mejore
siempre (o, al menos, no empeore nunca). Cuando llegamos a una soluci
on desde la cual
no podemos saltar a otra contigua mejor, el proceso termina, ya sea porque hemos
encontrado el o
ptimo, ya sea porque hemos llegado a un extremo de una arista infinita a
traves de la cual la funci
on objetivo mejora indefinidamente (y el problema es no
acotado).

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

148 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

La tabla del smplex


La aplicaci
on del algoritmo del smplex consiste en ir encontrando en forma sucesiva
soluciones factibles b
asicas del programa, de tal forma que en cada repetici
on o iteraci
on
del proceso es necesario realizar un n
umero elevado de c
alculos que se simplifican
considerablemente utilizando la tabla del smplex que se describe a continuaci
on.
Se considera un programa de m
aximo dado en la forma est
andar
Max.
s.a.

ct x

A
x = b
x
0

con m restricciones de igualdad, n variables y tal que el rango de A es m. Se obtiene, en


primer lugar, una soluci
on factible b
asica o soluci
on inicial x
= (h1 , . . . , hm , 0, . . . , 0)t
con matrices asociadas B = (A1 , . . . , Am ) y N = (Am+1 , . . . , An ) y se dise
na la tabla
del smplex.
x1
...
xs
...
xm
z

x1
1
...
0
...
0
0

...
...
...
...
...
...
...

(Dpto. Estadstica)

xs
0
...
1
...
0
0

...
...
...
...
...
...
...

xm
0
...
0
...
1
0

xm+1
1m+1
...
sm+1
...
mm+1
zm+1 cm+1

Estadstica

...
...
...
...
...
...
...

xe
1e
...
se
...
me
ze ce

...
...
...
...
...
...
...

xn
1n
...
sn
...
mn
zn cn

Curso 2011/2012

T.I.
h1
...
hs
...
hm
z0

149 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

Observese que si la matriz B de partida es la identidad, los c


alculos se simplifican
mucho ya que entonces se tiene que
(h1 , . . . , hm )t = B 1b = b,
es decir, que la u
ltima columna de la tabla est
a formada por los terminos independientes
del sistema de restricciones. En este caso, las ij que aparecen en la tabla seran
simplemente las columnas de coeficientes de las variables no b
asicas que se tienen en el
sistema de restricciones. Recordemos que:
Bj = 1j B1 + + mj Bm ,

j = m + 1, . . . , n.

Adem
as, si cB =
0, como
zj cj = cB B 1 Bj cj = cB Bj cj = cj ,
los valores no nulos que aparecen en la fila objetivo de la tabla son los coeficientes de las
variables no b
asicas en la funci
on objetivo cambiados de signo.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

150 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

A partir de la tabla anterior, teniendo en cuenta los resultados obtenidos, se aplica el


siguiente test de optimalidad.
- Si zj cj 0 para todo j = m + 1, . . . , n, la soluci
on factible b
asica que
corresponde a esa tabla es la soluci
on del programa, pudiendo darse el caso de
soluciones m
ultiples si para alguna j se tiene que zj cj = 0.
- Si alguna diferencia zj cj es negativa y todas las ij correspondientes a alguna de
las diferencias positivas son negativas o nulas, entonces el programa no tiene
soluci
on m
axima factible.
- Si no se da ninguno de los casos anteriores, se pasa a otra tabla que proporciona
otra soluci
on factible b
asica que mejora el valor de la funci
on objetivo. Para ello se
selecciona un elemento de la tabla llamado pivote como se indica a continuaci
on.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

151 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

Se selecciona la columna que corresponda a la mayor de las diferencias anteriores de


entre las negativas (columna e de la variable que entra en la nueva soluci
on factible
b
asica) y la fila s (indica la variable que sale de la soluci
on) tal que


hs
hi
= min
: ie > 0 .
se
ie
El elemento pivote es el de la fila s y la columna e. La nueva tabla se construye
dividiendo por se los elementos de la fila pivote, con lo que el pivote pasa a valer uno, y
haciendo ceros en todos los elementos de la columna pivote (incluyendo la fila objetivo)
por aplicaci
on del metodo de Gauss. Por u
ltimo en esta nueva tabla se cambia la variable
xs por la xe y se repite el test de optimalidad. La iteraci
on de este proceso llevar
a a la
soluci
on del programa o a la conclusi
on de que el programa no tiene soluci
on.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

152 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

Tipos de soluciones
Seg
un esto, las posibilidades de que el smplex termine son:
1

Una variable no b
asica xj puede entrar pero ninguna puede salir. El problema es no
acotado.

Ninguna variable puede entrar.


Esto significa que la funci
on objetivo empeora (o se mantiene constante) nos
movamos hacia donde nos movamos, luego estamos en una soluci
on o
ptima. A su
vez, pueden darse los casos siguientes:
1

Todas las variables no b


asicas cumplen zj cj 6= 0.
La soluci
on es u
nica (soluci
on de vertice).
Hay alguna variable no b
asica xj con zj cj = 0.
Esto significa que si hicieramos entrar a esta variable pasaramos a otras
soluciones con el mismo valor de la funci
on objetivo, es decir, otras soluciones
o
ptimas. A su vez hay dos posibilidades:
1

Alguna variable b
asica xi puede salir.
Estamos en una soluci
on de arista.
Ninguna variable b
asica puede salir.
Estamos en una soluci
on de arista infinita.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

153 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

Ejemplo: Se considera el siguiente programa en forma can


onica:
Max.
s.a.

z = 3x1 + 5x2
x1 + 2x2 36
2x1 + x2 36
x1 , x2 0

Se introducen las variables de holgura x3 y x4 , con lo que se tiene el programa en la


forma est
andar:
Max. z = 3x1 + 5x2 + 0x3 + 0x4
s.a. x1 + 2x2 + x3 = 36
2x1 + x2 + x4 = 36
x1 , x 2 , x 3 , x 4 0

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

154 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

Las variables b
asicas son x3 y x4 para las que la matriz B es la identidad. La tabla
inicial del smplex es la siguiente:
x3
x4
zj cj

x1
1
2
-3

x2
2
1
-5

x3
1
0
0

x4
0
1
0

T.I.
36
36
0

La soluci
on factible b
asica inicial es x1 = 0, x2 = 0, x3 = 36 y x4 = 36 con valor cero
en la funci
on objetivo. Las variables b
asicas son x3 y x4 . Como hay valores negativos en
la fila objetivo y los elementos de las columnas correspondientes a estos valores son
positivos hay que buscar otra soluci
on factible b
asica, para lo que se selecciona el
elemento pivote. La columna pivote es la segunda que corresponde al mayor valor
negativo de los de la fila objetivo. La fila pivote es la primera ya que


36
36 36
= min
,
.
2
2 1
El pivote es el elemento (1, 2), la variable x2 entra como variable b
asica y sale la x3 .
Las operaciones para obtener la nueva tabla son Fp = F1 /2, F2 Fp y z + 5Fp , en
donde se denota por F las diferentes filas.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

155 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

Se obtiene as la siguiente tabla:


x2
x4
zj c j

x1
1/2
3/2
-1/2

x2
1
0
0

x3
1/2
-1/2
5/2

x4
0
1
0

T.I.
18
18
90

La soluci
on factible b
asica que corresponde a esta tabla es x1 = 0, x2 = 18, x3 = 0 y
x4 = 18. El valor correspondiente en la funci
on objetivo es 90 que mejora al anterior. Al
haber un valor negativo en la fila objetivo con la columna correspondiente a este valor
formada por n
umeros positivos se ha de buscar otra soluci
on factible b
asica y, por lo
tanto, otro pivote. La columna pivote es la primera que corresponde al u
nico valor
negativo en la fila objetivo. La fila pivote es la segunda, y el pivote es el elemento (2, 1).
La variable x1 entra como variable b
asica y sale la x4 . Las operaciones para obtener la
nueva tabla son Fp = 2F2 /3, F1 Fp /2 y z + Fp /2.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

156 / 157

Tema 10. Ooptimizaci


on con restricciones

M
etodo smplex

Se tiene as la siguiente tabla:


x2
x1
zj c j

x1
0
1
0

x2
1
0
0

x3
2/3
-1/3
7/3

x4
-1/3
2/3
1/3

T.I.
12
12
96

La soluci
on factible b
asica correspondiente a esta tabla es x1 = 12, x2 = 12, x3 = 0 y
x4 = 0. El valor correspondiente en la funci
on objetivo es 96 y esta es la soluci
on del
programa, ya que todos los elementos de la fila objetivo son mayores o iguales que cero.
Adem
as esta soluci
on es u
nica pues no hay elementos nulos en la fila objetivo en los
lugares de las variables no b
asicas de la tabla.

(Dpto. Estadstica)

Estadstica

Curso 2011/2012

157 / 157