Anda di halaman 1dari 167

Curso Estadstica

Profesor Marcelo Cuevas

Programa

Estadstica Descriptiva
Probabilidades
Variables aleatorias y modelos de probabilidades

Se describen datos, como se ubican y como se


comportan
Es poder determinar, cuantificar un resultado incierto
Los datos segn como se comporten tendrn un
modelo determinando

Estadstica Descriptiva
Introduccin:
Existe un mtodo cientfico en la investigacin, que nos introducir a
solucionar los problemas. Este mtodo consta de 5 etapas:
Observacin: lo primero es observar y tratar de explicar porque
sucede
Hiptesis: Luego de la observacin se plantean proposiciones con el
fin de determinar si son ciertas o no
Recoleccin y anlisis de informacin: Se recoge informacin
necesaria que pueda confirmar o refutar las hiptesis planteadas,
tambin puede darse que se decida tomar una muestra
representativa de la poblacin y su correspondiente anlisis, estudio.
Conclusin: A partir de la informacin recolectada podemos obtener
resultados sobre nuestro planteamiento que nos dirn su nuestra
hiptesis es verdadera o falsa.

La estadstica se aplica en los ptos 3 y 4. La conclusin


sobre la investigacin esta buena, lo que puede estar
malo es la muestra representativa. La estadstica nos
ensea a explicar la informacin

Estadsticas: Tiene como objetico obtener conclusiones
validas acerca del fenmeno en estudio. La MP de la
estadstica son los datos que pueden tener diferentes
caractersticas.
Definicin Variable: Es un conjunto de datos, es la
caracterstica que toma el fenmeno en estudio o la
unidad experimental que se estudia. (edad, sexo, nivel
socio-econmico)

De acuerdo a las caractersticas de las variables las podemos


clasificar en:
Categricas o Cualitativas: Son aquellas que representan
categora o clase excluyente ej: sexo, estado civil, etc.
Numricas o Cuantitativas: Estn representadas por nmeros
dentro de estas podemos clasificar en:
Discretas: es aquella cuyos valores posibles son finitos o
infinito numerable. Ej: finito: n alumnos regulares ao 1995.
Infinito numerable: n llamadas central telefnica en 3 min.
Los resultados se conocen cuando haya pasado el tiempo de
estudio
Continuas: cuando toma infinitos valores en intervalo
determinado Ej: edad: 18-19-20

Pueden darse varias edades en dicho


intervalo. El promedio de edad esta entre 19
y 20 aos (alguien puede tener 19 aos)
En el caso de las variables discretas no
pueden darse que hayan valores
intermedios Ej: n hermanos: 0 1 2 3
Nadie puede tener 2 hermanos, o tienen 2
i tienen 3.
De acuerdo a las caractersticas existen
variadas formas de medirlo (escalas).

VARIABLES
Categricas: son excluyentes
Escala nominal: no existe posibilidad de orden. Ej: Estado
civil, profesiones.
Escala ordinal: Existe ordenacin. Ej: nivel socioeconmico
(alto, medio, bajo) , categora hoteles (cantidad de
estrellas)

Numricas:
Escala de intervalo: consiste en agrupar la informacin en
ciertos intervalos
Escala de razn: permite comparacin y referencia de un
dato con otro. Ej: una empresa produce ms que otra.

Datos

Recoleccion

Analisis de la
informacion
(tablas, graficos,
etc)

Los datos
representan una
muestra o la
poblacion?

Conclusiones
acerca de la
poblacion

Interferencia
estadistica

ESTADISTICA DESCRIPTIVA:
Distribucin o tablas de frecuencia: El objetivo de estas tablas es el poder resumir
una gran cantidad de informacin que permita un mejor anlisis de esta.

Notacin:
X: Variable
X1, X2, Xn : denotan los datos de la variable
n : Tamao de la muestra
Ejemplo:
X = edad de los alumnos
n=6
X1 = 15
X2 = 14
X3 = 13
X4 = 16
X5 = 15
X6 = 16
La tabla de frecuencia tiene el siguiente formato:

Cat. o Clases

Marca
de Frecuen
clase Xi
cia
Absolut
a ni

Frecuencia
Relativa fi

%
100*fi

Frecuencia
Absoluta
Acum. Ni

Frecuencia
Relativa
Acum Fi

%
acumulado
100*Fi

100

100

C1
C2
C3
.
Ck
n

La marca de clase es solo para variables


cuantitativas y corresponde al punto medio del
intervalo.
Frecuencia absoluta (ni) representa al n de
observaciones que corresponde a cada clase


Frecuencia relativa (fi) es el cociente entre la
frecuencia absoluta y la frecuencia total
fi= ni/n
Al multiplicar fi*100 obtenemos la frecuencia
porcentual.

Frecuencia absoluta acumulada (Ni)

Frecuencia relativa acumulada (Fi) es


acumular las frecuencias relativas.

Para el caso de una variable categrica medida en


escala nominal las columnas 2, 6, 7 y 8 carecen
de sentido, ya que no hay ningn orden.
En el caso de una variable categrica medida en
escala ordinal la columna 2 carece de sentido.
En el caso de una variable cuantitativa discreta la
columna 2 carece de sentido, pues cada clase es
equivalente a la marca de clase.
En el caso de variables cuantitativas continuas
utilizaremos todas las columnas 963.


La inversin anual real de un grupo de industrias
pesqueras se detalla a continuacin:

Millones de dlares
10

10

16

25

30

30

18

13

21

14

15

27

13

18

30

12

15

39

12

40

30

14

20

28

26

10

17

17

19

22

14

11

15

20

60

12

36

52

Construya una tabla de frecuencia con intervalos


(clase) de igual amplitud.
Primeramente es conveniente ordenar los datos,
generalmente de menor a mayor, una formula rpida
de hacer esto es construir en tabligrama, tambin
llamado diagrama de tabla y hoja
TABLIGRAMA
0

0686578566968887472686

063227410435258509847

05186072

000609

CONSTRUCCION TABLA DE FRECUENCIAS


Determinar n de intervalos = K. Ej = 8
Determinar amplitud del intervalo = a
a = Rec/K ; Rec = max Xi min Xi
= 60 0 = 60
a = 60/8 =7.5 8
Intervalo (8) * Amplitud (8) = 64 rango table
60
Recorrido
4

Construir intervalos de clase

Li1 = Min Xi - / 2
Ls1 = Li1 + a
Li2 = Ls2
Ls2 = Li2 + a
Inversion
Real

Xi

ni

fi

Ni

Fi

% Acum

[0 8[

15

0.25

25

15

15/60

25

8 16

12

22

0.37

37

37

37/60

62

16 24

20

10

0.16

16

47

47/60

78

24 32

28

0.13

13

55

55/60

91

32 40

36

0.033

3.3

57

57/60

94.3

40 48

44

0.016

1.6

58

58/60

95.9

48 56

52

0.016

1.6

59

59/60

97.5

[56 64[

60

0.016

1.6

60

100

60

100

n=3
f2 = 0.37 ; por una empresa 37 invierten entre 8 y
16 millones
100* f2 = 37%
N4 = 55 ; 55 empresas tienen inversiones inferior a
32 millones
F2 = 0,62
100*F2 = 62% ; el 62% tienen inversiones inferiores
a 16 millones US$
Como complemento a las tablas estn los grficos, que
pueden explicar mejor los datos.

TIPOS DE GRAFICOS
Histograma :
Histograma
25

20

15

n empresas

10

0
8

16

24

32

40

48

56

64

TIPOS DE GRAFICOS
Poligono de Frecuencia Absoluta
25

20

15

n empresas

10

0
8

16

24

32

40

48

56

64

MEDIDAS DE RESUMEN DE
INFORMACION
MEDIDAS DE TENDENCIA CENTRAL: Son medidas de
un conjunto de datos que nos proporcionan un valor
simple, que resume en gran volumen de informacin.
Este valor tiende a ubicarse en el centro del conjunto.
Las medidas de tendencia central ms conocidas son:
Media aritmtica o promedio
Mediana
Moda
Percentiles
Media geomtrica
Media armnica

Media aritmtica o promedio:


Sea X una variable
X1, X2, .. Xn sus respectivos valores
La media aritmtica para este conjunto
de datos est dada por:

Datos no agrupados:

Datos agrupados:

Para el caso de la inversin real para


las 60 empresas son:
X = 16.266.666,67 US$
X = 16,266666667 Millones de US$
(8 decimales)

Propiedades de la media aritmtica


Definicin
M.A de una constante
M.A de una cte. Por una variable

Ej: Sueldo promedio de los trabajadores de


una empresa = $150000
X= sueldo trabajadores
X= 150000
La empresa decide otorgar un reajuste de un
15% determine nuevo sueldo promedio
Y = nuevo sueldo
Yi = 1,15 xi
Y = 1,15 x =172.500

M.A de una constante variable

Se le utiliza cuando a un promedio se le


agrega o disminuye una cierta cantidad
Yi = Xi + 30.000
Y = X + 30.000

Sean a y b constantes y x variable

M.A ponderada: Supongamos tener n datos


divididos en subgrupos o estratos, de tal
manera que el grupo 1 tiene n1 obj con
promedio
X1, el grupo 2 tiene n2 obj con promedio
X2, el grupo k tiene nk obj con promedio
Xk

Luego el promedio total de las n


observado esta dado por

Donde n = n1 + n2 + nk

Mediana
Es el valor central de un conjunto de n
observaciones
X1, X2 . . . Xn que han sido ordenados de menor a
mayor
Para datos no agrupados
Si n es impar existe un nico valor de la mediana
ME = X

Si n es par la mediana es un
promedio de los valores centrales

Ejemplo:
Para n impar: 4 5 6 6 7 (notas alumno)

Para n par: ingresos semanales


5.000
6.000 n=6
6.000
8.000
10.000
55.000

La mediana no se ve afectada por valores extremos


como en el caso del promedio. Sin embargo, no utiliza
gran parte de la informacin contenida en la muestra.
A pesar de ello constituye una medida til dando se
trabajo con pequeos conjuntos de datos, en especial
si estos contienen uno o ms valores extremos.

Datos agrupados
Metodologa:
Determinar el intervalo mediano, es decir, aquel primer
intervalo que se cumple Ni n/2 (intervalo J)

Ej: Ni 60/2 =30 J = (8 16)

Donde:
Li = lmite inferior del intervalo mediano Ej: Li = 8
A = amplitud del intervalo Ej: a = 8
N(J-1) = frecuencia absoluta acumulada anterior al
intervalo mediano . Ej: N(J-1) = 15
nj = frecuencia absoluta del intervalo mediano. Ej: n j
= 22

Moda (Mo):
La moda de un conjunto de n datos es el
valor de la variable que presenta mayor
frecuencia o que ms veces se repite.
Ej: notas alumno: 4 5 6 6 7
Moda = 6
La moda no es nica, puede ser bimodal,
trimodal, etc.
Ej.: 4 4 5 6 6 7
Moda = 4 y 6

Datos no agrupados
Metodologa
Determinar el intervalo modal

El intervalo con ni mayor.

Denotaremos el intervalo por y

Donde:
1 = ny n(y-1) = 22 15 = 7
2 = ny n(y-1) = 22 10 = 12
Mo = 8 + 8
de US$

= 10.95 . . . . millones

Percentiles (Pk ; k = 1, 2, . . . 99)


El k-esimo percentil es un valor tal
que despus de ordenar los datos x1,
x2 . . . xn de menos a mayor, al
menos el k% de los datos estar a la
izquierda o bajo este valor y al
menos el 100-k% de los datos estar
a la derecha o sobre este valor

Observaciones:
Cuartiles (Qk ; k = 1, 2, 3)
Divide la distribucin en 4 partes, 25% c/u

Deciles (dk ; k = 1, 2, . . . 9)
Divide la distribucin en 10 partes iguales
d1 = P10
d2 = P20
.
.
.
d9 = P90

Datos agrupados
Metodologa
Determinar el 1er intervalo que se
cumpla

Se aplica la formula

Ejemplo:
P75 Calcular K =75

El 75% tienen un valor inferior o igual a 22.4


millones de US$
El 25% tiene un valor igual o superior a 22.4
millones de US$

Ejemplo: Qu porcentaje de empresas


realizo una inversin inferior a 27 millones
de US$? Cuantas empresas invirtieron
entre 15 y 35 millones de US$?


El 83,3% de las
empresas
realizo una
inversin
inferior a 27
millones de
US$

Media geomtrica (Mg):

Datos no agrupados: sea Mg de 1 conjunto de x datos


X1, X2 . . .Xn se define como la raz n-esima del producto
de los n valores

Datos agrupados:

Se utiliza frecuentemente para promediar porcentajes o


proporciones

MEDIDAS DE DISPERSION
Hay muchos casos en los que para un conjunto de datos

se necesita ms informacin que la contenida en una


medida de tendencia central. Ej.: consideremos los
siguientes 3 conjuntos de datos
C1 =
C2 =
C3 = Medidas de tendencia central para estos conjuntos
C1: x = 4Me = 4
C2: x = 4Me = 4
C3: x=4 Me = 4

Esto demuestra que es necesario obtener


indicadores que complementen las medidas
de tendencia central.
La dispersin se relaciona con la mayor o
menor concentracin de los datos en torno a
un valor central, generalmente el promedio.
Las medidas de dispersin ms conocidas
son la varianza, deviacin estndar
(desviacin tpica), desviacin media y
coeficiente de variacin.

Varianza

(S2):
Datos no agrupados: La varianza de
un conjunto de n datos se define de
la siguiente manera:

C1:
C 2:
C3: Aqu estn ms concentrados
los datos luego en el conjunto C 1 y
finalmente en el C2
La medida de tendencia central est
mejor representada en C3

Observaciones

Se puede demostrar que la S2 para


efectos de clculos tambin se puede
calcular as:

Datos agrupados:

Ej.: x = 16,26

Observaciones

Desviacin estndar: (S)

Desviacin media: (D.M)


Tiene como objetivo ver el grado de dispersin de un conjunto de datos.
Datos no agrupados

C1:

C2:

C3:
Datos agrupados

Coeficiente de variacin (cv):


Nos
entrega un ndice de la proporcin que
representa la deviacin estndar con
respecto al promedio. Este coeficiente es
til cuando se trata de comparar variables
que tienen distintas unidades de medida y
esto definido por:

La multiplicacin por 100 tiene como motivo


representar un %

Propiedad de la varianza
Def: V(x) =

Varianza de una constante: si tenemos un conjunto de datos iguales, la S 2 = 0 no existe dispersin

Varianza de una constante una variable: la dispersin se mantiene, ya que, al sumar o restar
una constante la varianza sigue siendo igual

Varianza de una constante por una variable

Sean a y b constantes y x variable

NOTA: no existen varianzas ponderadas

Ejemplo: Un grupo de 40 cerdos tienen un peso medio de 85kg. Se


decide alimentarlos mediante una dieta proteica que permite que
cada cerdo suba de peso 1,2 kg. Por semana. Calcule el nuevo peso
promedio y desviacin estndar al cabo de la segunda semana, si se
sabe que la desviacin estndar al inicio es de 10 kg.

X = peso cerdo al inicio de la dieta (kg)


Y = peso cerdo al cabo de la primera semana de dieta

Z = peso al cabo de la segunda semana de dieta


z = 2.4 + x = 87.4

Sz = 10 kg

MEDIDAS DE FORMA:
Adems de la tendencia central y de la dispersin se puede tratar de
caracterizar la forma de una distribucin de frecuencia mediante un ndice
resumido (un indicador).
Los ndices F1 y F2 de Fisher son medidas de la asimetra y del
aplastamiento, respectivamente de una distribucin de frecuencia.
Cuando una distribucin es simtrica la media aritmtica, la mediana y la
moda son iguales.
Una distribucin de frecuencia es asimtrica sino es simtrica alrededor de
la media
F1 > 0
F1 = 0
F1 < 0

Momento Muestral
Sea X1, X2 . . . Xn ; un conjunto de n medidas.
Se define el n-esimo momento muestral
respecto a la media como sigue:
Datos no agrupados

Datos agrupados

Observaciones
M1 = 0, M2 = S2n

Coeficiente de Asimetra (F1)


F1=

Coeficiente Aplastamiento (F 2)
Se define como:

Este coeficiente mide la altura


de la distribucin. La constante
2 se elige de modo que el
coeficiente sea 0 cuando la
distribucin es la normal. El
coeficiente >0 si la distribucin
esta menos aplastada que la
normal y negativo en caso
contrario.

Cuadros o tablas estadsticas.

Resulta conveniente en algunas oportunidades


distribuir la informacin en cuadros o tablas que
permiten relacionar varias variables
simultneamente, logrando de esta forma una
rpida apreciacin de la informacin reunida.

Para la mejor interpretacin del contenido de un


cuadro, debe procurarse que su lectura se haga sin
recurrir al ttulo y el titulo sea interpretado de
manera tal que no sea necesario ver el contenido.
Conforme a este criterio el titulo debe aparecer en
cada pgina donde se extienda el cuadro, y as
mismo el nmero que lo identifica.

El formato del cuadro es el siguiente:

Numero de cuadro
Titulo

Columna
matriz
C
A
T
E
G
O
R
I
A

V.
VI.
VII.

Total
V

A1

A
R
I
A
B
L
E
A

A2
.
.
.
.
Ai
.
Ak

Nota
Llamada
Fuente de informacin

Categora variable B
B1, B2 . . . B
III.
Casilla

Casilla

IV.
Cuerpo
del cuadro

III. Casilla

Numero del cuadro: Corresponde a una enumeracin correlativa al


momento de su publicacin a objeto de referenciarlo con la interpretacin y
anlisis de los datos
Titulo: Debe ser lo ms claro, breve y conciso y adems debe responder a lo
menos a las siguientes preguntas:
De qu se trata la informacin?(numero de alumnos, pacientes, etc.); a
quienes representa la informacin?(universidad, hospital, etc.) lugar donde
se realizo el estudio?(ciudad, pas, regin, etc.) y periodo que abarco el
estudio (semana, mes, ao, etc.)
Al confeccionar el titulo se utiliza la palabra por para referirnos a la o las
variables incluidas en el encabezado y la palabra segn , para las variables
sealadas en la columna matriz.

Casilla: Es el cruce entre una columna de la variable B con una lnea de la


variable A. La casilla nunca debe estar en blanco, en ella deber aparecer
una cifra o un smbolo convencional (generalmente un guion)

Cuerpo del cuadro: Corresponde al conjunto de columnas o lneas


que contiene el cuadro en orden vertical u horizontal, es donde se
colocan los datos sobre el hecho observado.
Nota: Es la informacin de carcter general destinada a ofrecer
conceptos o definiciones empleados o utilizados que aclaran el
contenido de los cuadros o indican la metodologa adoptada de los
datos.
Llamada: Es la informacin de carcter especifico que se aplica a
determinada parte del cuadro
Fuente de informacin: Es la indicacin de la publicacin o entidad
responsable de la informacin o de la elaboracin de los datos

Ejemplo
Titulo: nmero de alumnos facultad de ciencias econmicas y administrativas,
clasificados por carrera y segn aos de estudio aprobados. Universidad de
Valparaso. ao 1995 (a)
Carreras: Ing. Comercial y Auditoria.
Aos de estudio aprobados:
1
Aos de estudio Total
N alumnos Fac. Cs.
Econ. Y
aprobados
administrativas UV
2
TOTAL

Ing. Comercial
Auditoria
3
1

4
2

5
4
5

15(b)

Matricula al 21/03/95
Fuente: Sec. Estudio fac. cs. Ec. Y adm.
Se incluyo a 3 personas que rindieron examen de grado en marzo y titulacin en
tramite

Confeccin tabla estadstica


Titulo: n
alumnos facultad
cs. Ec. Y adm.
Clasificados por
carrera y sexo, y
segn aos de
estudio aprobado
y jornada de
clase.
Universidad de
Valparaso.- ao
1995
Sexo : Masculino/
Femenino
Jornada: Diurna
/Vespertina

Aos de estudio Total alumnos


aprobados

TOTAL
Total MF
1
2
3
4
5
Jorn. diurna
1
2
3
4
5
Jorn. Vespertina
1
2
3
4
5

N alumnos Fac. Cs.


Econ. Y
administrativas UV
Ing. Comercial
Auditoria
Sub
Masc Fem. Sub
Masc Fem.
total .
total .

ANALISIS DE REGRESION:
ELEMENTOS DE REGRESION LINEAL SIMPLE: El objetivo principal del
anlisis de regresin lineal simple es establecer una relacin cuantitativa
(en forma de una ecuacin) entre dos variables relacionadas. Una vez que
esta relacin ha sido establecida es posible predecir el valor de una de las
variables si se conoce el valor de la otra.

El valor de aquella variable que se predice se denomina variable de


respuesta o variable dependiente y se denota por la letra y en tanto que
la variable conocida se llama variable independiente y se denota por x.

Para estableces una relacin entre x e y es necesario disponer de cierta


informacin muestral. Esta informacin consiste en un conjunto de pares
de observaciones de x e y, que denotaremos por (x 1, y1); (x2, y2);; (xn, yn)
como pares ordenados, donde n denota el tamao de la muestra.

Ejemplo: Una compaa fabrica cierto producto. Los lotes de produccin


varian cuando la demanda flucta. La tabla siguiente contiene el tamao
del lote de produccin y el numero de horas hombre de trabajo para las
corridas de produccin en condiciones similares.

ANALISIS DE REGRESION:
Corrida de produccin

Tamao del lote (x)

HH

30

73

20

50

60

128

80

170

40

87

50

108

60

135

30

69

70

148

10

60

132

Diagrama de Dispersion

Diagrama de Dispersion
180

Valores Y

160
140
120
100
80
60
40
20
0
10

20

30

40

50

60

70

80

90

El anlisis de regresin simple se supone que la media de la y (y)


depende de x es decir:
y= f(x)
La curva y = f(x) es llamada CURVA DE REGRESION DE Y SOBRE X.
En el caso de regresin lineal simple:
y = +x, llamada LINEA DE REGRESION DE Y SOBRE X.

Es decir si ponemos el siguiente modelo lineal simple:


Yi =+xi + i i = 1, 2, 3,. . . n
Donde 1, 2,, n son componentes de una desconocidos, los cuales
son variables aleatorias no correlacionadas con Me = 0 y varianza = G 2
Los y son parmetros desconocidos. Para conocer los valores de
y se utiliza el mtodo de min cuadrado que consiste en minimizar
la suma de los errores al cuadrado, es decir:

Los
valores de y que minimizan los
errores al cuadrado, se llama ESTIMADORES
MINIMOS CUADRATICOS, y estn dados por

n = 10


Luego, la recta de regresin estimada es:

Asi, por ejemplo si el tamao del lote es de 55(u),


estimamos que la distribucin de y para este lote
tiene 1 medida:

Adems tenemos que:


se conoce como VARIACION TOTAL la que se puede descomponer en dos
partes:

= variacin explicada de la lnea de regresin.
= variacin no explicada o error
Para determinar que tan bueno es el modelo de la lnea recta ajustada,
utilizamos un ndice que considera la siguiente proposicin:

A este indicador se le conoce con el




Donde

nombre de coeficiente de
determinacin y representa la
proporcin de la variabilidad en y
explicada por la relacin lineal con x.
Nuestro ej: R2 = 0.9956 de la
variabilidad total en hh es explicada
en un 99.56% por los tamaos de lotes
de produccin.

Observaciones:

Frecuentemente el anlisis de regresin es utilizado


para hacer predicciones. En aplicaciones de este tipo
es importante recordar que la validez de las
aplicaciones de regresin dependen de las
condiciones del periodo futuro, pues estas deben ser
similares al periodo en el cual se bas el estudio.
Otra precaucin necesaria es con las inferencias
relativas a niveles del predictos (x), fuera del rango
de las observaciones.
Existen relaciones entre variables que no son lineales.

Correlacin
El anlisis de regresin es apropiado cuando una
variable y depende de uno o mas variables x,
entonces se estudia el efecto y la habilidad de x
para predecir a y.
Sin embargo, en primer trmino se puede
estudiar el grado de asociacin entre dos
variables, sin considerar que una de las variables
depende de la otra.
El conjunto de datos consiste de mediaciones
de x e y basados en una muestra de n
observaciones: (x1, y1); (x2, y2),, (xn, yn)

COEFICIENTE DE CORRELACION DE PEARSON:

Una medida de regulacin entre 2


variables es el coeficiente de
correlacin de Pearson que est
definido por:

Anlisis de r
r=1

Relacin ms perfecta
r = -1

Relacin menos perfecta

r=0

Variables no correlacionadas

NMEROS NDICES
Un nmero ndice es una forma general una cifra relativa (expresada en trminos
de porcentaje), que representa las variaciones medias en precios, cantidades o
valor, de uno o ms itemes en un periodo dado, respecto del periodo base que
se elige como referencia. Debe quedar bien en claro, que los ndices tratan de
cuantificar variaciones y no expresar si los precios son altos o si se ha producido
mucho. Solo pretenden comparar dichas cantidades con otras que se consideran
como referencia. Estos ndices se utilizan para comparaciones en el tiempo y en
el espacio (entre dos o ms ciudades o pases).
Como en el caso de los estadgrafos ya estudiados, los nmeros ndices
proporcionan una idea o estimacin sobre los cambios en la matriz a en que indica,
sin que se pueda decir que ellos miden algo. Un mismo fenmeno (producto,
comercio exterior, precios) se puede cuantificar mediante dos o ms formulas,
bases, ponderaciones o nmeros de componentes diversos, lo que da lugar a
diferentes ndices o valores para un mismo fenmeno como la seleccin de los
elementos que conforman un ndice, en ltima instancia, provienen de una
seleccin o muestreo y debe tratarse que dicha seleccin sea constantemente
representativa, que lo que indica peridicas revisiones del ndice.

SELECCIN PERIODO BASE


Para cuantificar las variaciones de una serie durante un periodo determinado es
necesario calcular el correspondiente nmero ndice. Para ello se requiere
homogeneizar los datos, pues, por ejemplo, los precios se expresan en diferentes
unidades (pesos por unidad, por kg, por docena, etc.)
Esta situacin se puede obviar mediante el uso de precios relativos, que resultan
al comparar por cociente los precios de cada uno de los correspondientes artculos
con los del periodo utilizado como base y que se emplea como referencia.
La determinacin del periodo base depende del destino del ndice. Si nicamente
interesa conocer como han variado los precios (o cantidad) entre dos aos extremos
de un periodo determinado, basta tomar como base el ao inicial del periodo.
En cambio, para una serie continua de ndices anuales o mensuales, es de gran
importancia ubicar un periodo que no presente anomalas. Es conveniente que el
ao base no est muy lejano y que sea normal. Sin embargo, es difcil encontrar un
ao donde no exista un fenmeno externo o interno que repercuta en la economa
de un pas: sequias, inundaciones, guerras, baja o alza del precio externo de un
artculo preponderante en el comercio exterior del pas, etc. Adems en la
determinacin del periodo base suelen intervenir muchos factores que escapan al
control del estadstico o economista.

TIPOS DE NDICES:
ndices simples: Si se desea expresar todas las cifras de una serie anual o
mensual de valores en funcin de otra que se considera como base,
entonces se trata de ndices simples, que no es otra cosa que el
porcentaje que representa cada valor observado, respecto del valor
observado en el periodo base.

Al calcular el ndice de cada valor de la serie respecto del periodo base, se


dice que es un ndice de base fija.
Si al calcular el ndice se considera como base el periodo inmediatamente
anterior, se dice que es un ndice de base variable

Ejemplo

Precios de un artculo
Mes (t)

Precio (xt)

150

Indic mes 1=100 Indic


variable
(It)
100
---

165

110

110

160

106.7

96.96

170

113.3

106.3

171

114

100.5

165

110

96.5

174

116

105.5

174

116

100

175

116.7

100.6

10

170

113.3

97.14

base


Variacin del ndice =

Si disponemos de informacin nicamente respecto a un ndice de
base fija, entonces la variacin se obtienen de la siguiente manera:


Variacin de precios del mes 10 con respecto del mes 3

Cambio base
De una base fija a otra base fija: se divide cada ndice de la serie, por el ndice del nuevo
periodo base. Por ejemplo: si se desea un ndice con base en el mes 5 = 100, debo dividir todos
los valores de la serie por 114.

Cambio de base fija a base variable: Se obtiene dividendos con ndice de base fija por el ndice
del periodo inmediatamente anterior

Cambio de base variable a base fija:


Ejemplo:
Base = mes 1 = 100

Base = Mes 5 = 100

*100

ndices agregativos simples


Productos

Precios ($ x quintal)

Precios
relativos
*100

Cosecha (miles Cantidades


qq)
relativas
*100
1990
1994 qt
q0

1990 p0

1994 pt

Trigo
Trigo
Cebada
Cebada

7700
7700
7480
7480

18030
18030
19850
19850

234.2
234.2
265.4
265.4

11158
11158
1196
1196

13044
13044
1357
1357

116.9
116.9
113.5
113.5

Avena
Avena
Maz
Maz

8220
8220
8150
8150

15830
15830
23030
23030

192.6
192.6
282.6
282.6

1111
1111
1460
1460

1326
1326
1840
1840

119.4
119.4
126.0
126.0

Frijoles
Frijoles
Arroz

27110
27110
8270

44030
44030
18920

162.4
162.4
228.8

859
859
1106

997
997
870

116.1
116.1
78.7

Garbanzos

15920

53830

338.1

41

59

143.9

Papas

9380

20590

219.5

6686

7978

119.3

Lentejas

26690

42140

157.9

204

202

99.0

Sumas

118920

256250

2081.5

23821

27673

1032.7

ndices agregativos simples


Si se tienen los precios de diversos artculos, podra calcularse,
como primera aproximacin, un ndice de precios agregativo
simple, sumando los precios para el periodo y dividiendo cada
total por la suma de los correspondientes precios en el periodo
base, es decir:



El precio de estos artculos aument en 115,48% respecto del 90.

De igual forma es posible obtener un ndice de cantidad agregativo simple en


este caso:

Las cantidades producidas en el 94 aumentaron en 16.17% respecto del 90.


Ahora bien, si calculamos los precios relativos para cada artculo, podemos
obtener el ndice de precios de SAVERBECK, promediando los precios relativos.
El precio relativo se obtiene para cada artculo mediante el cociente: P t / P0
S

De igual forma obtenemos el ndice de cantidad de SAVERBECK que


corresponde al promedio de las cantidades relativas.

SQt =

NDICES PONDERADOS
Un ndice de precios es un promedio relativo (precios o cantidades). Pero los
precios de un grupo de artculos, y especialmente sus variaciones, no tiene
igual importancia desde el punto de vista de un producto, un consumidor, el
gobierno o de una duea de casa. Un aumento de $50 en el precio del kilo
de pan y en el kilo de t, tienen el mismo efecto en el ndice agregativo
simple, pero la incidencia es distinta en el ndice de SAVERBECK, ya que en
este ultimo los ndices del t y del pan varan en distinta proporcin. Es
indudable que en un presupuesto familiar, las variaciones absolutas o
relativas de los distintos productos representen en diferente forma. Por lo
tanto para calcular adecuadamente el promedio de los precios relativos,
debe establecerse la importancia o ponderacin de cada artculo en dicho
presupuesto, ya que vara segn el nivel econmico, los gustos, y los gastos
de la familia. Los ndices calculados mediante frmulas en las cuales no
aparece explcitamente una ponderacin (como los mencionados), no
pueden reflejar adecuadamente la realidad econmica.
Existen numerosas frmulas de ndices ponderados (139), pero aqu
veremos las ms importantes.

INDICE DE LAS PEYRES:


De
precios:

Mide la variacin de precios en el periodo actual


respecto del periodo base considerando las
cantidades conseguidas en el periodo base.
De cantidades:

INDICE DE PAASCHE:
De precios:

De cantidades:

Qt=

NDICE
DE LAS PEYRES

LI

90

LI

94

= 100
=

INDICE DE PAASCHE:

90

= 100

94

INDICE DE PRECIOS AL
CONSUMIDOR (IPC)
El primer ndice que se construyo fue en el ao 1923 y que utilizo como ao base 1913,
cuya canasta contena 45 artculos.
El segundo ndice fue en el ao 1928, que incluyo a empleado y la mano obrera, contena
54 artculos. Y utilizo la frmula de Las Peyes.
En 1958 se realiz la primera encuesta de presupuestos familiares, y cuya informacin
permiti crear la canasta familiar, que podemos dividir en 4 rubros: alimentacin, vivienda,
vestuario y otros.
En 1968 se realiza una segunda encuesta de presupuesto familiar luego se realiz una
tercera encuesta en 1978 y una cuarta en 1988. La tercera encuesta se realiz con una
muestra de 5000 familias aproximadamente usando como base 1978 = 100. La misma
cantidad de familias se utiliz en la cuarta encuesta que se realiz entre diciembre 1987 y
noviembre de 1988 utilizando como base abril de 1989 = 100.

Formula de Las Peyres: (Se utiliza esta frmula porque utiliza una base, ya que no sera
posible calcularlo mes a mes. Adems esta frmula es utilizada en toda Latinoamrica, por lo
tanto es posible realizar comparaciones).

Reemplaza a

NOCIONES DE
PROBABILIDADES
Es cuantificar un hecho incierto. La teora y el clculo de probabilidades tuvieron su origen en los
juegos de azar en el siglo XVII. Los juegos de azar incluyen acciones en las cuales el resultado de la
prueba es incierto, sin embargo, aun cuando el resultado de una prueba particular es incierto, existe un
resultado que se puede predecir a largo plazo. Es decir, al repartir la prueba un gran nmero de veces,
la regularidad de los resultados permite predecir alguno en particular, con cierto grado de confiabilidad.
En la ciencia experimental se presenta tambin un tipo similar de incertidumbre y regularidad a largo
plazo. Por ejemplo en gentica, es incierto saber si un descendiente ser macho o hembra, pero en un
plazo largo se conoce aproximadamente el porcentaje de descendientes que sern machos y el de
aquellos que sern hembras. Tambin podemos darnos cuenta que una compaa de seguros de vida, fija
sus aranceles de acuerdo a la edad del asegurado, ya que, si viene cierto no puede predecir cuales son
las personas de una determinada caracteristica que morirn a la edad de 65 aos, si puede predecir en
forma bastante satisfactoria cuantas de ellas morirn a los 65 aos.
El concepto de probabilidad puede ser enfocado desde distintos puntos de vista, pero para cada uno
de ellos es necesaria la definicin de los siguientes trminos:

DEF: Experimento, Espacio muestral y sucesos


Experimento: Cualquier situacin que se investigara cuyo resultado es incierto
Suceso posible: Conjunto de los resultados
Espacio muestral: Subconjunto del universo.

Entenderemos por experimento al proceso o actividad que tiene una gama


de posibles resultados que pueden clasificarse y especificarse de
antemano y cuyo resultado en particular es incierto. As por ejemplo, un
experimento puede ser lanzar una moneda para ver qu lado resulta al
caer; o bien, examinar un cilindro de gas licuado de 15 kg. Que llegan a la
planta envasadora de Lipigas, para verificar su estado de uso, o, tal vez
medir las alturas alcanzadas por ciertas plantas que han sido tratadas por
diferentes fertilizantes, con el objeto de comparar la efectividad de estos
ltimos, etc. El experimento lo denotamos con la letra

Al conjunto de todos los resultados posibles de un experimento lo


denominaremos espacio muestral y lo denotaremos por la letra S ()

Experimento no determinstico o aleatorio


Espacio muestral conjunto de todos los resultados posibles del
experimento.

Ejemplo:

E1 = Lanzar una moneda y observar el lado que muestra al caer


S = {Cara, Sello}
E2 = Lanzar un dado y observar el nmero que muestra la cara superior
S = {1, 2, 3, 4, 5, 6}
E3 = Encender una ampolleta y observar su estado
S = {Buena, Mala}
E4 = Encender una ampolleta y registrar su tiempo de duracin hasta que se queme
S = {t / t 0}
E5 = Tomar la produccin del da y contar el nmero de artculos defectuosos producidos
S = {0, 1, 2, 3,, n}
E6 = Averiguar el nmero de hijos varones en las familias con 5 hijos en la V regin
S = {0, 1, 2, 3, 4, 5}
E7 = Controlar la produccin de una maquina verificando los artculos producidos hasta
que salga un artculo defectuoso
S = {1, 2, 3, 4}

Llamaremos suceso a cualquier subconjunto del espacio muestral. Al conjunto 5 se le denomina


suceso seguro. A los recesos formados por uno de los posibles resultados del experimento se les
llama sucesos elementales.

Ejemplo: Consideremos el experimento que consiste en seleccionar 3 piezas de la produccin diaria


de una mquina y observar si estn defectuosas (D) o no defectuosas , si el inters es saber cuntas
de estas piezas estn en malas condiciones de venta, entonces S seria:

E = se eligen 3 piezas de la produccin diaria para verificar su condicin (D o )


S = {0, 1, 2, 3}
Ahora bien, si el inters fuera identificar que piezas no estn en condiciones de venta, entonces el
espacio muestral adecuado ser el siguiente

S = { DDD,, DD, DD,D,, D, }


Sucesos
Sea A1 = { a lo mas una pieza defectuosa}
A1 S
A1 = {0, 1}
A1 = {,D,, D }

Una vez que el experimento se ha desarrollado, solo puede ocurrir un suceso


elemental. Diremos que un suceso A ocurre si ocurre alguno de los sucesos
elementales contenidos en l.

DEF: Sea E un experimento y S un espacio muestral asociado al experimento.


Sean A y B dos sucesos (es decir, A es un S, B < S) entonces AB y AB
tambin son sucesos, ya que ambos son subconjuntos de S.
Si AB = , entonces diremos que A y B son mutuamente excluyentes
Ejemplo:
A = {Todos productos buenos}
B = {Todos productos defectuosos}

Si AB = , y adems AB = S entonces diremos que son sucesos


complementarios en S y los anotaremos por B = ( A complemento A c)
(B es complemento de A en S), o bien,
A = o Bc (A es complemento de B en S)

Ejemplo

E = Lanzar un dado
S = {1, 2, 3, 4, 5, 6}

AB = ,
AB = S
A=
B = Ac

A = {el resultado es par} = {2, 4, 6}


B = {el resultado es impar} = {1, 3, 5}

Probabilidades
DEF: Sea E un experimento y S el espacio muestral asociado a
ese experimento con cada suceso A<S (subconjunto)
Asociamos un nmero real, llamando la probabilidad de A y
denotado P(A) que satisface las siguientes condiciones.
La probabilidad de A se encuentra entre:

P(S) = 1
Si A y B son dos sucesos mutuamente excluyentes, entonces
P(AB) = P(A) + P(B)
Si A1, A2 An Son n sucesos excluyentes de par en par,
entonces P(A1UA2U UAn)

Teoremas:
Si
es el conjunto vacio P() = 0
Si es el complemento del suceso A,
entonces P() = 1 P(A) o P(A) = 1 P()
Si A y B son dos sucesos cualquiera,
entonces P(AB) = P(A) + P(B) - P(AB)
Si A, B y C son 3 sucesos cualquiera,
entonces
P(ABC) = P(A) + P(B) + P(C) P(AB) P(AC) P (BC) + P(ABC)

Espacio Muestral finito y resultados equiprobables

alguna caracterstica propia del experimento asigna


que
Cuando
cualquier resultado elemental (es decir, cada resultado
posible del experimento) tiene la misma probabilidad de
ocurrir que cualquier otro suceso elemental, entonces se dice
que el espacio muestral es equiprobable.

Adems si el espacio muestral consta de k sucesos


elementales, igualmente probables, es decir, S = {a 1, a2,, ak}
P(ai) = C i = 1, 2, 3,, k , entonces P(S) = 1, lo que significa
decir si uno todos los sucesos elementales P(a 1Ua2U U ak) =
1

Si A es un suceso subconjunto del S ACS, de tal manera que contiene r sucesos


elementales, entonces P(A) = R/K
P(A) = numero de resultados favorables de

Ejemplo :
Un lote consta de 16 artculos, 10 buenos, 4 con pequeos defectos y 2 con defectos
graves, se elige un articulo al zar, determine las siguientes probabilidades:
El art. Es bueno
El art. Tienen un defecto grave
El art. Es defectuoso
E = elegir un articulo al azar
A = {el articulo es bueno} P(A) =
B = {el articulo tienen un defecto grave} P(B) =
C = {el articulo es defectuoso} P(C) =

Un control de las fichas medicas de hombres diabticos que


concurrieron a una clnica proporciono los siguientes
porcentajes
Edad
Del
Paciente

Estado de salud
Leve
Padres diabticos
Si
No

Grave
Padres diabticos
si
No

Mayor de 40 aos
Menor de 40 aos
Total

15
15
30

10
20
30

8
20
28

2
10
12

35
65
100

Suponga que un paciente es elegido del azar desde este grupo,


y que los sucesos A, B y C se definen de la siguiente manera:
A = {el paciente presenta un estado grave}
B = {el tiene sobre 40 aos}
C = {sus padres son diabticos}

Calcule P(A), P(B), P(BC), y P(ABC)


Describa los siguientes sucesos verbalmente y encuentre sus probabilidades:
(), (), ()

P(A) =
P(BC) =

P(B) = P(ABC) =

() = estado leve, menos de 40 aos =

P() =
=
=

P() =

P() =

Mtodos de enumeracin
Un lote consta de 100 artculos, de los cuales 80 son buenos y 20
son defectuosos, se eligen 10 artculos al azar, sin sustituir un
artculo antes que sea elegido el prximo. Cul es la
probabilidad de que exactamente la mitad de tales artculos sea
defectuoso? (siempre se asumir sin sustitucin)

E = elegir 10 artculos al azar sin sustitucin


A = {La mitad de los artculos elegidos son defectuosos}
S = {BBBBBBBBBB,DBBBBBBBBB}
Al resolver el problema nos encontramos con que cada uno de los
elementos del espacio muestral consta de 10 artculos (i1 ,i2 ,i10 )
Cuantos hay de tales resultados?, y entre estos resultados
Cuntos tienen la caracterstica de que exactamente la mitad
sean defectuosos.

Principio multiplicativo
Supongamos que un procedimiento designado como 1
puede ocurrir de n1 maneras. Supongamos que un segundo
procedimiento designado como 2 puede ocurrir de n 2
maneras. Tambin supongamos que cada una de las
maneras de efectuar n1 puede ser seguida por cualquiera de
las maneras de efectuar n2. Entonces el procedimiento que
consta de 1 seguido por 2 se puede hacer de n 1*n2 maneras.
Un producto se arma en 3 etapas. En la primera etapa hay 5
lneas de armado, en la segunda etapa hay 4 lneas de
armado y en la tercera etapa hay 6 lneas de armado. De
cuantas maneras puede moverse el producto en el proceso
de armado?
5*4*6 =120 maneras.

Principio aditivo
Supongamos que un procedimiento, puede ocurrir
de n1 maneras y que un procedimiento 2 se puede
hacer de n2 maneras. Supongamos adems que
no es posible que ambos procedimientos se
hagan juntos. Entonces el numero de maneras
que se puede hacer 1 o 2 es n1 + n2.
Proyectamos un viaje y debemos elegir entre el
transporte por bus o por tren, si hay 3 rectas para
el bus y dos para el tren, entonces hay 3+2=5
rutas posibles para el viaje.

Permutaciones

"n objetos diferente: de cuantas maneras se pueden ordenar (permutar) estos n objetos.

Observacin: 0! = 1

Ejemplo
Cuantos nmeros diferentes de tres cifras puedo formar con los nmeros 1-2-3

3! = 1*2*3 = 6

{123, 132, 213, 231, 312, 321}

Supongamos obtener n objetos diferentes. Deseamos escoge de estos objetos y permutar el


r elegido, entonces, de cuantas maneras puedo permutar esos r objetos?

N objetos diferentes se eligen r se permutan r

n
Ejemplo: de una enciclopedia que consta de 8 tomos se eligen 4 tomos al azar y se ordenan.
Determine el nmero de maneras de efectuar esta permutacin.
8 = 1680

Combinaciones
Supongamos
tener n objetos diferente. Estamos

interesados en contar el nmero de maneras en


que podemos escoger r de esos objetos con 0 < r
n
Sin considerar el orden

Ejemplo: se dispone una enciclopedia con 8 tomos,


de cuantas maneras se pueden elegir 4 de ellos.

Permutaciones cuando no todos los


objetos son diferentes
supongamos tener n objetos tal que hay n 1 objetos

pertenecientes a la clase 2 y nk objetos pertenecientes a


la clase k, donde
n = n1+n2+nk.

Luego el numero de ordenar estos n objetos esta dado:


Ejemplo: Cuntos nmeros de 4 dgitos se pueden
formar con 1123 1123

E
= elegir 10 artculos

A = {exactamente la mitad son


defectuosos}

BBBBBDDDDD

Un lote consta de 10 artculos buenos, 4 con pequeos defectos y 2 con


defectos graves. Se eligen dos artculos al azar sin sustitucin, encuentre las
siguientes probabilidades:
Ambos sean buenos
Ambos tengan defectos graves
A lo menos 1 sea bueno
A lo ms 1 sea bueno
Exactamente 1 sea bueno
Ninguno tenga defecto grave
Ninguno sea bueno

E = elegir 2 artculos sin sustitucin

A = {ambos artculos son buenos}

E = {exactamente 1 bueno}

PROBABILIDAD CONDICIONAL E INDEPENDIENTE


probabilidad condicional: Sea E un experimento y S el espacio muestral. Sean
A y B dos sucesos cualquiera, se define P(B/A), llamado la probabilidad de que
B ocurra dado que el suceso A haya ocurrido, como sigue:

O bien

para un valor fijo de A satisface los postulados de probabilidad, es decir:

0 1
=1
= se lee probabilidad de B sobre A

Suponga
que una oficina tienen 100

maquinas de escribir. Algunas son elctricas


(E) y otras manuales (M). adems algunas
son nuevas (N), mientras que otras son
usadas (U). una persona entra a la oficina,
escoge una maquina al azar y descubre que
S
E
M

es nueva. cual es la probabilidad de que la


N
40
30
70
maquina sea elctrica?

20

10

30

60

40

100

Si se sabe que al lanzar 5 monedas aparecieron al menos 2 caras,


Cul es la probabilidad de que el nmero exacto de caras fuese 3?

E = lanza 5 monedas
A = {Aparecer al menos 2 caras}
B = {El nmero exacto de caras es 3}

#S = 2n #S = 25 = 32

S = {CCCCC, CCCCS, CCCSS, CSSS, CSSSS, SSSSS}

lanza un dado 2 veces. Determine la probabilidad de que:


Se
La suma sea 7
Si la suma resulto ser 7, que uno de los lados muestre un n2
Si uno de los lados es un n2, que la suma sea 7

E = lanzar un par de dados


#S = 6n 62 = 36

(1,1)

(1,2)

(1,3)

(1,4)

(1,5)

(1,6)

(2,1)

(2,2)

(2,3)

(2,4)

(2,5)

(2,6)

(3,1)

(3,2)

(3,3)

(3,4)

(3,5)

(3,6)

(4,1)

(4,2)

(4,3)

(4,4)

(4,5)

(4,6)

(5,1)

(5,2)

(5,3)

(5,4)

(5,5)

(5,6)

(6,1)

(6,2)

(6,3)

(6,4)

(6,5)

(6,6)

A = {la suma de los dados es 7}


B = {una de las caras es 2}

TEOREMA DE MULTIPLICACIN DE
PROBABILIDADES
La consecuencia ms importante de la definicin de probabilidad
condicional se obtiene escribindola de la siguiente manera:

O bien

Ejemplo:
Una caja contiene 4 tubos malos y 6 buenos, se sacan 2 a la vez, Cul es la
probabilidad de que ambos sean defectuosos?
A = {en el primer tubo sea malo}
B = {en el segundo tubo sea malo}

3 estudiantes: Pedro, Juan y Diego desean pedir un libro a Jos, pero


este posee solo una copia. Para resolver el problema se hace la
siguiente proporcin: voy a pensar un nmero del 1 al 3: y Pedro
adivinara primero, si adivina le presto el libro. En caso contrario Juan
tratara de adivinar; si adivina le presto el libro. En caso contrario le
presto el libro a Diego. Es correcto el mtodo propuesto? En otras
palabras tienen todos igual probabilidad de que le presten el libro?

A = {Prestan el libro a Pedro}


B = {Prestan el libro a Juan}
C = {Prestan el libro a Diego}
D1 = {Pedro adivina}
D2 = {Juan adivina}

Observaciones: Se puede generalizar el teorema anterior a ms de los sucesos de la


siguiente manera:

Ejemplo:
4 tubos malos se confunden con 6 buenos. Se eligen los tubos 1 a 1 hasta encontrar los 4
defectuosos. Cul es la probabilidad de encontrar el ltimo tubo defectuoso?
En la cuarta prueba
En la quinta prueba
En la decima prueba

4M
6B
10
P(DDDD) = 4/10*3/9*2/8*1/7
P(BDDDD) = 6/10*4/9*3/8*2/7*1/6 =
BBBBBB DDDD

P(BBBBBBDDDD) *

Definicin: Se dice que los sucesos B1, B2, , Bk representan una paricin al espacio muestral S si

Sea A un suceso respecto al espacio muestral S. por lo tanto podemos escribir

Donde y son mutuamente excluyentes


Por lo tanto
Por teorema multiplicacin de probabilidades.

Por lo tanto (

Llamado teorema de probabilidad total

Ejemplo: Una caja contiene 5 fichas rojas y 4 blancas. Una segunda


caja contiene 6 fichas rojas y 5 blancas. Se traslada una ficha de la
primera a la segunda caja al azar y posteriormente se extrae una
ficha al azar de la segunda caja. Cul es la probabilidad de que la
ficha extraida de la segunda caja sea blanca?

C1 1ficha C2
5R 6R
4B 5B

1ficha

A = {la ficha extrada de la segunda caja es blanca}


B = {la ficha trasladada fue roja}
C = {la ficha trasladada fue blanca}
(

Teorema de Bayes
Supongamos que para el ejercicio
anterior se traslada una ficha de la
primera a la segunda urna y
posteriormente se elige una ficha de
la segunda urna la cual resulto ser de
color blanco. Cul es la probabilidad
de que la ficha trasladada desde la
primera a la segunda urna tambin
haya sido blanca?

Ejercicios
Todas las noches el sr. X llega tarde a su casa. La Sra. X, que es una buena
esposa, le deja encendida la luz de entrada a la casa. La probabilidad de
que el sr x llegue borracho es 0.60. si llega borracho hay una probabilidad
de 0.90 de que olvide apagar la luz en tanto de que esta es solo 0.05 si
llega sobrio.
Cul es la probabilidad de que el sr. X apague la luz una noche cualquiera?
Dado que el sr. X apago la luz una cierta noche, cul es la probabilidad de
que haya llegado borracho?
B = {el seor x llega borracho una noche cualquiera}
A = {el seor x apaga la luz una noche cualquiera}

Definicin: Sean B1, B2,, Bk una particin del espacio muestral S sea A un
nuevo suceso asociado a S. sin deseamos obtener probabilidad de (Bi dado
A):

SUCESOS INDEPENDIENTES
se dice que los sucesos A y B son independientes sin la probabilidad de la interseccin es
igual al producto de las probabilidades:

Nota: Se dice que los sucesos A, B y C son independientes si:

(si ocurre el suceso A y no altera la probabilidad de ocurrencia de B) Cada reposicin


Ejemplo: La probabilidad de que el hombre sobreviva a los 70 aos es de 3/8 y que la
mujer sobreviva a los 70 aos es 5/7. Cul es la probabilidad de que una pareja que
contrajo matrimonio a los 20 aos celebre sus bodas de oro?
*son sucesos independientes

Ejemplo: (Sucesos Independientes)


Lanzamiento dado
Lanzamiento moneda

VARIABLES ALEATORIAS
INDEPENDIENTES
Definicin de variable aleatoria: Sea E un experimento y S el espacio muestral asociado al
experimento. Una funcin x que asigna a cada uno de los elementos es un nmero real x(S)
se llama variable aleatoria.
Definicin: El espacio Rx que es el conjunto de todos los valores posibles de x se llama el
recorrido de x.
Ejemplo: Se lanza una moneda 3 veces y se define la variable aleatoria x como el numero de
caras que aparecen.

E = lanzar una moneda 3 veces


S = {SSS, SSC, SCS, CSS, CCS, CSC, SCC, CCC}
X = nmero de caras que aparecen

X (SSS) = 0
X (SSC) = X(SCS) = X(CSS) =1
X (CCS) = X(CSC) = X(SCC) = 2
X (CCC) = 3
Rx = {0, 1, 2, 3}

VARIABLES ALEATORIAS DISCRETAS (V.A.D)


Definicin: sea X una variable aleatoria si el nmero de resultados posibles de x,
esto es el recorrido de x, es finito o infinito numerable, entonces llamamos a x
una variable aleatoria discreta. Esto es, que se pueden anotar los valores
posibles de x como:
X1, X2 Xn en el caso finito la lista continua indefinidamente.
La variable aleatoria significa que a los distintos elementos le asigno un nmero

Definicin: Sea x una variable aleatoria discreta por lo tanto el recorrido de x


consta a lo mas de un numero de valores X 1, X2, Xn, infinito numerable con
cada resultado Xi asociamos un numero p(xi) = P(X=xi), llamado la probabilidad
de xi. Los nmeros p(xi); i=1, 2, 3 (infinito numerable) deben satisfacer las
condiciones siguientes.

La funcin p definida anteriormente se llama funcin de probabilidad de la


variable aleatoria x
La coleccin de pares (xi, p(xi), i = 1,2 se llama algunas veces distribucin de
probabilidades de x o funcin de cuanta.

Ejercicio:
Una persona depositar US$ 1 si uno de los siguientes
sucesos

ocurre un cierto dia, US$2 si ambos ocurren y US$0


si ninguno ocurre.
A = {llueve en Coquimbo}
B = {nacen mellizos en Santiago}
Si P(A) = 1/5 y P(B) = 1/10
Encuentre la distribucin de probabilidades de x definida
como el nmero de dlares depositados
Xi
P(xi)

X = numero de dlares depositados


Rx = {0, 1, 2}

0
36/50

1
13/50

2
1/50

Ejercicio
Una caja contiene 20 artculos, de los cuales 5 defectuosos y 15
buenos, se eligen 4 artculos al azar y se define la variable
aleatoria x como nmero de artculos defectuosos encontrados.
Encuentre la distribucin de probabilidades de x si:
Los artculos se eligen sin sustitucin
Los artculos se eligen con sustitucin
X = nmero de artculos defectuosos encontrados

Rx = {0, 1, 2, 3, 4}

Combinatoria

Tambin considerando como distribucin de probabilidades.

Ejercicio
Rx = {0,1,2,3,4}

VARIABLES ALEATORIAS CONTINUAS (V.A.C)


DEF: sea x una variable aleatoria continua supongamos que el
recorrido de x est formado por un gran nmero de valores en un
determinado intervalo. Se dice que x es una variable aleatoria
continua si existe una funcin f llamada funcin de densidad de
probabilidad (f.d.p) que satisface las siguientes condiciones.

Para cualquier valor a, b Rx , a < b


P(a < x < b) =

Ejemplo Sea x r.a.c con f.d.p


f(x) = 2x 0 < x < 1

0 en otro caso

FUNCIN DE DISTRIBUCIN
ACUMULATIVA
Sea x una variable aleatoria, discreta o continua. Definimos F
como la funcin de distribucin acumulativa de la variable
aleatoria x como sigue:

Si x es una variable aleatoria discreta, entonces la distribucin


acumulativa es la de las probabilidades que me estn dando.
Xi
0
1
2

Si X es v.a.d
P(xi) 36/50
13/50 1/50
1
Si X es una v.a.c
Ejemplo: (caso discreto)
X = n de dlares depositados

Caso
continuo

= 0 en otro caso

Suponga que X definida como la duracin en minutos de las


llamadas telefnicas que llegan a una central, es una variable
aleatoria con funcin de densidad de probabilidad. Dado por

En otro caso
Si

Encuentre la probabilidad de que:


Una llamada dure a lo ms 3 min.
Una llamada dure ms de 4 min.
X
Una llamada
dure entre 3 y 6 min.
0
Si se sabe que una llamada duro 3 minutos determine la
probabilidad de que dure a lo mas 5 min.

FUNCIONES DE VARIABLE ALEATORIA


DEF: sea C un suceso (subconjunto) asociado con un recorrido y (Ry). Se
define B subconjunto del recorrido de x como sigue:

Si B y C estn relacionados de esta manera, entonces los llamamos sucesos


equivalentes.
Sea x una variable aleatoria en el espacio muestral S. sea Rx el recorrido de
x. sea H una funcin real y consideremos la variable aleatoria y = H(x) con Ry.
Para cualquier valor y suceso C e Ry definimos probabilidades de C como sigue:

FUNCIONES DE VARIABLE ALEATORIA DISCRETA


Caso
1: Si x es una v.a.d e y = H(x), entonces se
deduce de inmediato que y tambin es una v.a.d

Si x1,x2, xn son los valores posibles de x; p(xi) =


P(x = xi) y H es una funcin tal que a cada valor
posible y le corresponde exactamente un valor
posible de x, entonces la distribucin de
probabilidades de y se obtiene como sigue:

A la funcin H es posible que para varios valores de x


den el mismo valor de y

Ejemplo

Sea y =2x + 3
Ry ={-1, 1, 3, 5, 7, 9} se obtienen reemplazando los valores de x
-2
0
1
2
3

enXila funcin
y-1
P(xi)

2/15

4/15

3/15

1/15

3/15

2/15

Yi

-1

P(yi)

2/15

4/15

3/15

1/15

3/15

2/15

Sea y = x2
Ry= {0, 1, 4, 9}

Caso 2: Puede suceder que x sea una v.a.c mientras que y es discreta.

Por ejemplo: Supongamos que x puede tomar todos los valores reales, mientras que se
define:

Para obtener la distribucin de probabilidades de y determinamos simplemente el


suceso equivalente (en el recorrido de x) que corresponde a los diferentes valores de y.
En el caso anterior la probabilidad de que y=1 es equivalente a la probabilidad de x 0
P(y=1) = P(x0) y prob y=-1 equivalente a probabilidad x<0 P(y=-1) = P(x<0)
En el caso general si Y = yi es equivalente a un suceso a en el Rx entonces

Ejemplo: Sea x la duracin en minutos de las llamadas telefnicas que


llegan a una central, cuya funcin de densidad de probabilidad est
dada.

= 0 en otro caso
Y la f.d.a

Si una llamada dura hasta 3 minutos, el valor de esta es de $100m si


dura hasta 6 min el costo es de $300, y si dura ms de 6 min el costo
es de $1000

Yi
P(yi)

100

300

1000

Valor esperado de una v.a (esperanza matemtica)

Sea

x una v.a.d con valores posibles


x1,x2 xn sea p(xi) = p(x=xi) con y
tomando valores y1, y2 yn.

El valor esperado de x denotado


E(x), se define como:

Ejemplo:
Un jugador lanza una moneda 2 veces y gana $100 o $200 segn si aparece
1 o 2 caras respectivamente mientras que pierde $ 150 si no aparece
ninguna cara. Cul es la ganancia esperada del jugador? es favorable a
el?

x : numero de caras
Xi
y:
P(xi)
Yi
P(yi)

Rx = {0, 1, 2}

0
2
ganancia
Ry = { 1-150, 100, 200}
1/4

1/2

1/4

-150
1/4

100
1/2

200
1/4

DEF: Si x es v.a.c

PROPIEDADES VALOR ESPERADO

Sea
C = cte. E(c) = C
Sea C = cte. Y X v.a
E(c x) = C E(x)
E(c * x) = C * E(x)

Sean a y b constantes y x v.a E(a bx) = a


bE(x)
Sea y = H(x) E(y) = E(H(x))
Si x es v.a.d E (H(x)) =
Si x es v.a.c E(H(x)) =

VARIANZA DE UNA V.A


Sea x una v.a
Se define varianza de x denotada V(x) (G x2)

Observacin:

PROPIEDADES DE LA VARIANZA:
Sea c = cte V(c) = 0
Sea c = cte y X v.a
V(c x) = V(x)
V(cx) = C2V(x)
Sean a y b constantes y x v.a

Distribucin Benoulli
Sea x una v.a.d que toma los valores posibles 0 y 1. Sea A un suceso
cualquiera asociado a un experimento y S su espacio muestral.
Se define x como:
X = {1 si el suceso A ocurre}

{ 0 si el sucesi A no ocurre}

Donde P(A) = p , cte.


Si la funcin de cuanta de x es de la forma:

Entonces se dice qe x tiene una distribucin Bernoulli con parmetro p.


Notacin:
TEOREMA: si

Distribucin Binomial
Consideremos un experimento E y sea A un suceso asociado con el experimento.
Supongamos que P(A) = p y por lo tanto
Consideremos n repeticiones del experimento en forma independiente.
Supongamos que P(A) = p, cte. Para las n repeticiones del experimento.
Definamos la v.a x como el nmero de veces que el suceso A ocurre con recorrido
de x:
Rx = {0, 1, 2,n}

Bajo estas caractersticas se llama a x como una v.a con distribucin binomial con
parmetros n y p y cuya funcin de cuanta est dada por:

Las repeticiones independientes del experimento se llaman ensayos de Bernoulli


Notacin:
TEOREMA: Si

Ejemplo
Un examen de estadstica consta de 10 preguntas cada una de las cuales tiene
4 alternativas. Si un estudiante desconoce completamente la materia,
determine la probabilidad de que responda correctamente.
Exactamente dos preguntas.
Ninguna pregunta
Al menos 1 pregunta

A = {responder correctamente}
P(A) = cte n = 10 preguntas
X = numero de respuestas correctas
Rx = {0, 1, 2, 3,,10}

Distribucin de Poisson
Sea
x una v.a.d que toma todos los valores
posibles: 0,1,2 (infinito numerable)
Si
Entonces se dice que x tiene una distribucin
de Poisson con parmetro (x > 0)
Notacin:
TEOREMA: Si

Ejemplo:

En Chile en promedio hay un terremoto cada 10 aos.


Determine la probabilidad de que:
Hayan dos terremotos en los prximos 10 aos
No haya ningn terremoto el prximo ao
X = numero de terremotos en Chile en los prximos 10 aos.

Y = nmero de terremotos en Chile en un ao

Aproximacin Binomial a Poisson


Sea
x una v.a.d distribuida

Bajo estas condiciones se dice que x tiene


aproximadamente una distribucin de Poisson con
parmetros = np

Ejemplo:
Una compaa de seguros tiene 10 mil asegurados. La prob
de que uno de ellos fallezca en un accidente automovilstico
durante un ao es 0.01%.
Determine la probabilidad de que en un ao la compaa
tenga que pagar 5 plizas.
X= nmero de asegurados fallecidos por accidentes de
trnsito.

np
P 0

Distribucin Geomtrica
: Sea E un experimento y supongamos que estamos interesados solo
en la ocurrencia o no de un suceso particular A. Supongamos que las
repeticiones son independientes y que P(A) = P
(1 p) constante para las n repeticiones.
Supongamos que repetimos el experimento hasta que el suceso A
ocurre por primera vez.
Sea x numero de repeticiones hasta que A ocurre por primera vez,
con Rx = {1,2}
Luego p(x) = P(X = x) = qx-1 p
x=1,2

Luego p(x) es la distribucin de cuanta de una distribucin


geomtrica.

TEOREMA: si x se distribuye geomtrica E(x) =1/p


q/p2

V(x) =

Ejemplo
Se lanza un dado hasta que aparezca un 6. Determine la probabilidad de
efectuar.
Exactamente 3 lanzamientos
Al menos 2 lanzamientos

P = 1/6 q = 5/6
X = numero de lanzamiento hasta que aparezca un 6

Distribucin
Hipergeometrica
Supongamos tener N artculos de los cuales r pertenecen a la clase A
(por ejemplo defectuosos) y N r no pertenecen a la clase A (no
defectuosos). Se elige al azar y sin sustitucin n de esos artculos (n <
N), y se define la variable aleatoria x como numero de artculos
elegidos pertenecientes a la clase A.
Luego la funcin de cuanta es:

Entonces se dice que x tiene una distribucin Hipergeometrica.


TEOREMA: Si x hipergeometrica entonces
E(x) = np
V(x) =

Ejercicio prueba

N = 12
x = numero de
formularios con deducciones
ilegitimas
n=5
r=4

Distribucin Uniforme
La v.a x que toma todos los valores posibles en el intervalo (a,b)
en donde a y b son finitos y si la f.d.p. de x est dada por:


=0

Entonces se dice que x uniformemente en (a,b)


Notacin:
TEOREMA: si entonces

Ejercicio
Suponga que x la edad en aos de los administradores de edificio es una v.a
Calcule la probabilidad de que un administrado de edificio tena menos de
58 aos
Si se eligen 3 administradores de edificios al azar determine la probabilidad
de que exactamente dos de ellos tengan ms de 64 aos
X = edad de los administradores

f(x) = 1/10
=0

55 < x < 65

Y = numero de administradores mayores de 64 aos

Distribucin exponencial
Suponga
que x es una v.a.c que toma todos

los valores no negativos. Si la funcin de


densidad de probabilidad de x est dada por:
=0
Entonces se dice que x est distribuida
exponencialmente con parmetro ( > 0)
Notacin:

TEOREMA:

Distribucin normal
La
v.a x que toma todos los valores posibles reales,
, tiene una distribucin normal (Gaussiana) si su
f.d.p. es de la forma

Notacin:
TEOREMA: Si

Propiedades
Simtrica respecto a

Propiedades
Si = 0 y G2 = 1 no se llama normal estandarizada y su
importancia radica en que se encuentra tabulada su funcin de
distribucin acumulativa (F(x))

SI C > 0

Propiedades

TEOREMA: Sea
Sea
COROLARIO: Sea y sea
EJERCICIO
Sea

VARIABLES ALEATORIAS
BIDIMENSIONALES DISCRETAS
Sea E un experimento y S el espacio muestral asociado al
experimento. Sean: x=x(s) e y=y(s) dos funciones que asignan
un numero real a cada uno de los resultados posibles s=S
entonces llamamos a (x,y) v.a.b.
Definicin: (x,y) es una v.a.b.d si los valores posibles de x, y son
finitos o infinitos numerables. Es decir, los valores (x, y) se pueden
representar como:
(xi,yi) , i=1,2,
j=1,2,
Definicin: Sea (x,y) una v.a.b.d. con cada resultado posible (xi, yi)
asociamos un nmero real P(xi,yi) que representa: P(X=xi , Y = yi)
que satisfacen las siguientes condiciones:

DISTRIBUCION MARGINAL Y CONDICIONAL

Distribucin marginal:
Xi

P(xi)

10/84

40/84

30/84

4/84

Yj

P(Yj)

35/84

42/84

7/84

DISTRIBUCION MARGINAL Y
CONDICIONAL
Condicional: El concepto
Distribucin

de probabilidad condicional se puede


presentar de la siguiente manera:
Ej:
En general:

O bien

VARIABLES ALEATORIAS INDEPENDIENTES

Definicion:

Sea (x,y) una v.a.b.d. se


dice (x, y) son v.a independientes si:
Se debe cumplir en todas
VALOR ESPERDO (v.a.b)
Definicin: Sea (x, y) una v.a.b.d. y
sea

Anda mungkin juga menyukai