Anda di halaman 1dari 27

Universidad Catlica del Norte

Escuela de Negocios Mineros


Magster en Gestin Minera

Anlisis de Datos y Mtodos


Cuantitativos para la Toma de
Decisiones
8va versin MGM
Antofagasta, Diciembre de 2014

Freddy Higuera Cartes


Doctor en Ciencias de la Ingeniera
Mencin Ingeniera Civil de Industrias

A partir de una misma poblacin se pueden tomar muchas


muestras diferentes del mismo tamao
Desarrollaremos un ejercicio para comprender cmo se
obtienen los valores muestrales de una variable, como la
media muestral, de acuerdo con los datos observados
Adems, sabremos cmo se obtienen los valores de
probabilidad para cada uno de los valores muestrales, esto
es, veremos el concepto distribucin muestral
Supongamos que la variable aleatoria X puede tomar los
cuatro valores 2, 4, 6, 8 y que de esta poblacin se toman
muestras de tamao 2 elegidas al azar (lotera)

Muestra

X1

X2

Media muestral

10

11

12

13

14

15

16

En total existen 16 (42, en general, Nn donde N es el nmero


de elementos de la poblacin y n el tamao muestral)
muestras posibles que se pueden seleccionar de esta
poblacin
Para cada una de las 16 muestras se obtiene la media
muestral ( X ), que toma cualquiera de los siete valores del
conjunto 2, 3, 4, 5, 6, 7, 8 ( X )
De las 16 muestras posibles, una tiene media 2; dos tienen
media 3; tres media 4; cuatro media 5; tres media 6; dos
media 7 y una media 8
Con esto podemos construir una tabla en que aparezcan los
valores de x junto a sus respectivas probabilidades

Para obtener la distribucin de X se debe tener presente


que al efectuarse un muestreo con reemplazamiento cada
elemento de la muestra tiene una probabilidad 1/4 de ser
escogido, por lo tanto, cada muestra de tamao 2 tiene
probabilidad de (1/4)(1/4) = 1/16 de darse
Media muestral X

Nmero de muestras

Probabilidad P( x)

1/16

2/16

3/16

4/16

3/16

2/16

1/16

Total

16

1,0

As, la probabilidad de obtener una media muestral 2 es


1/16, de 3 es 2/16, y as sucesivamente
Antes de continuar con el concepto de muestra aleatoria, es
importante recordar el de independencia
Dadas dos variables aleatorias discretas X e Y, decimos que
son independientes si se cumple que:
P(X = x, Y = y) = P(X = x) P(Y = y)
La expresin del lado izquierdo se denomina distribucin
conjunta de X e Y, mientras que cada uno de los factores
que aparecen a la derecha se llama distribucin marginal
de X e Y respectivamente

En estos trminos, X e Y son independientes cuando la


distribucin conjunta es igual al producto de las
distribuciones marginales
Intuitivamente, y tal como ya lo habamos usado en el
ejemplo previo, dos variables aleatorias X e Y se dicen
independientes cuando los valores que asume cada una de
ellas no influyen ni est influenciados por los valores de la
otra
Por ejemplo, si lanzamos un par de dados y consideramos
las variables aleatorias:
X = Nmero de puntos que muestra la cara que queda hacia arriba
del primer dado

Y = Nmero de puntos que muestra la cara que queda hacia arriba


del segundo dado

Los valores posibles de X e Y son los mismos, a saber: 1, 2,


3, 4, 5, 6
Las distribuciones marginales de X e Y son:
X

P(X = x)

1/6

1/6

1/6

1/6

1/6

1/6

P(Y = y)

1/6

1/6

1/6

1/6

1/6

1/6

Qu podemos decir de la independencia de X e Y?


Al considerar las dos variables conjuntamente obtenemos
las parejas de valores que constituyen el espacio muestral S
= {1 - 1, ..., 1 - 6, 2 - 1, ..., 2 - 6, ..., 6 - 1, ..., 6 - 6}, por lo
tanto, N = 36
1

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

1/36

Los valores del cuadro se interpretan de la siguiente forma:


P(X = 1, Y = 1) = 1/36, P(X = 1, Y = 2) = 1/36 y as
sucesivamente
Por otra parte, P(X = 1) = 1/6 y P(Y = 1) = 1/6, por lo tanto, P(X
= 1, Y = 1) = 1/36 = (1/6)(1/6) =P(X = 1) P(Y = 1)
De este modo, X e Y son independientes
Ahora estamos en condiciones de comprender el concepto de
muestra aleatoria
Supongamos que X es la variable aleatoria que asociada a la
caracterstica en estudio y que vamos a hacer n observaciones
en la poblacin respectiva

Estas observaciones sern datos concretos una vez que


hayamos llevado a cabo el acto fsico de tomarlas; antes, slo
podemos considerar valores posibles de acuerdo con la
distribucin de X
Por ello, cada una de estas observaciones que luego se
materializarn, las denotaremos X1, X2, , Xn y se consideran n
representaciones de la variable X y, por tanto, con la misma
distribucin de X
Si adems, stas variables se consideran independientes,
tenemos lo que se llama una muestra aleatoria
As, una muestra aleatoria de una poblacin X es una
sucesin X1, , Xn de n variables aleatorias i.i.d.

Donde, i.i.d. significa independientes e igualmente


distribuidas y que, por tanto, tienen la misma funcin
de densidad con igual media y varianza
Una estadstica es cualquier frmula matemtica que
relaciona las variables de una muestra aleatoria X1, ,
Xn y que no incluye constantes desconocidas
El proceso inferencial se lleva a cabo utilizando las
estadsticas como medio para tal fin y son las de mayor
uso las denominadas media y varianza muestral:

i=1 X i

Media muestral: X =

2
(
X

X
)
i=1 i
n

Varianza muestral: S 2 =

(n 1)

Las estadsticas son de por s variables aleatorias; por ello es


de esperarse que tengan asociadas distribuciones
La distribucin muestral de una estadstica T es la distribucin
de probabilidad de T, tomada sta como una variable
aleatoria
Un parmetro es una caracterizacin numrica de la
distribucin de la poblacin, de forma que describe total o
parcialmente la funcin de densidad de la variable aleatoria
de inters
Ejemplos de parmetros son la media y varianza de una
variable aleatoria con distribucin normal

En resumen, la estadstica se calcula de acuerdo con las


variables aleatorias de la muestra, por consiguiente cambia de
muestra a muestra, pero sigue cierta ley de probabilidad, lo
que constituye la distribucin muestral
Por otro lado, el parmetro es una caracterstica de la
poblacin y como tal permanece constante y generalmente es
desconocido
A cada parmetro se le puede asociar una estadstica,
mediante la cual podemos obtener alguna informacin acerca
del parmetro desconocido
sta es la esencia de la inferencia estadstica, trtese de
estimacin o prueba de hiptesis

Sea X1, , Xn una muestra aleatoria proveniente de una


poblacin de media X y varianza X2 ; y X la media muestral,
entonces:
2

E( X) = X = E( X) = X
y
V( X) = X2 = X
n
A partir de la varianza de X se obtiene la desviacin estndar
de X o error estndar de la media, que es:
X
X =
n
Estos resultados pueden comprobarse a partir del ejemplo
dado al inicio
As, tenemos que: E( X) = E(X) = 5

X2

5
= = 2,5
Por otro lado, se tiene que: =
n
2
Ahora ya conocemos las propiedades de la media muestral
( X y X2 ), pero qu distribucin tiene X cuando X se
distribuye normalmente?
2
X

Si X1, , Xn es una muestra aleatoria proveniente de una


poblacin con distribucin normal de media y varianza 2,
entonces:
2

X ~ N ,

Por lo tanto, Z =

(X )

n (X )

~ N(0,1)

Por ejemplo, supongamos que la cantidad que envasa una


mquina dispensadora de bebidas gaseosas es una variable
aleatoria X, que tiene distribucin normal con media = 10
onzas y desviacin estndar de = 1, cul es la
probabilidad que X sea por lo menos 10,3 si nos
proponemos hacer 25 mediciones del lquido dispensado?
1

La media muestral X ~ N10,


25

Por lo tanto, P( X 10,3) = 1 - P( X < 10,3) = 0,0668


Alternativamente, P(Z 1,5) = 1 - P(Z < 1,5) = 0,0668

Pero, qu sucede si la variable aleatoria en estudio no sigue


una distribucin normal?
Al respecto el teorema del lmite central plantea: si X es una
variable aleatoria de media y varianza 2, la distribucin
muestral de la media X de una muestra aleatoria de tamao
n es aproximadamente normal con media y varianza 2/n si
n es suficientemente grande, es decir, X ~
N( , 2 n)
A partir de qu valor n puede considerarse
suficientemente grande?
Si bien se prefiere n 100, en la mayora de las aplicaciones
se considera suficiente n 30

Por ejemplo, para cierta prueba de aptitud se sabe con base


en la experiencia que el nmero de aciertos es en promedio
500 con una desviacin estndar de 60, si se aplica esta
prueba a 100 personas seleccionadas al azar cul es la
probabilidad de que tengan un promedio de aciertos menor
que 495?
Como n = 100, podemos emplear el teorema del lmite central
N(500, 3.600 100)
En este caso X ~

Por lo tanto, P( X < 495) = 0,2023


O, equivalentemente, P(Z < -0,833) = 0,2023

Una consecuencia importante del teorema del lmite


central es la que atae a la distribucin de la proporcin
muestral
Sea p la proporcin muestral asociada a una caracterstica,
la cual se presenta en la poblacin en una proporcin ,
entonces:
(1 )
N ,
p~

En trminos de la distribucin normal estandarizada:


p
N(0,1)
Z=
~
(1 ) n

Se sabe que la proporcin de artculos defectuosos en un


proceso industrial es de 0,10, si el proceso se vigila
peridicamente al tomar muestras aleatorias de tamao 100
Cul es la probabilidad de que esta muestra arroje una
proporcin de defectuosos mayor a 0,17?
Como n = 100, podemos emplear el teorema del lmite central
N(0,10, (0,10)(0,90) 100)
En este caso p ~

Por lo tanto, P( p > 0,17) = 0,0098


O, equivalentemente, P(Z > 2,333) = 0,0098

Si X1, , Xn es una muestra aleatoria proveniente de


una poblacin con distribucin normal de media y
varianza 2, entonces:
X=

(n 1)S 2

~ (2n1)

2
Es decir, X se distribuye chi-cuadrado con (n - 1) grados
de libertad
As, la variable X describe la distribucin de la varianza
muestral y empleando los valores de la distribucin
chi-cuadrado podemos calcular la probabilidad de que
S2 se encuentre en algn intervalo dado

Por ejemplo, si el espesor de cierto material est


normalmente distribuido con desviacin estndar 0,01 cm. y
una muestra aleatoria de 25 piezas de este material arroja
como resultado una desviacin estndar muestral de 0,008
cul es la probabilidad de observar un valor muestral como
ste u otro menor?
Denotando como S a la desviacin estndar muestral, se pide
P(S 0,008)

(24)(0,008) 2
=
As, tenemos que P(S 0,008) = P X
2
(0,01)

P(X 15,36) = 0,09


Hasta ahora hemos asumido en la distribucin de X de una
muestra aleatoria normal que es conocida

Pero, lo ms comn es que tambin sea desconocida y por


ello debe ser estimada
As, si en la expresin para Z = n (X ) reemplazamos por S
(desviacin estndar muestral) obtenemos:
n (X )
T=
~ t (n1)
S
Es decir, T se distribuye t de Student con (n - 1) grados de
libertad
Por ejemplo, el gerente de una fbrica de cierto tipo de
alimentos asegura que el peso promedio del producto que
elabora es de 165 gr.

Un consumidor desconfiado para probar lo afirmado por el


gerente decide escoger 16 paquetes del producto y
pesarlos
Los resultados fueron: 165, 158, 153, 162, 171, 175, 173,
169, 166, 170, 164, 177, 148, 167, 152, 149
Suponiendo que los pesos se distribuyen normalmente
Evidencian estos datos que el gerente est en lo cierto?
A partir de lo datos obtenemos que la media y desviacin
estndar muestral estn dadas por:
X = 163,6875
S = 9,24

Si lo planteado por el gerente es correcto entonces:

163,7

165

Ahora debemos responder si pertenece o no 163,7 a una


distribucin con valor esperado de 165, considerando una
probabilidad mnima del 5%
Esto es, P( X 163,7) =

16
(
163
,
7

165
)

P T

9
,
24

P(T -0,57) = 0,29 No se puede rechazar lo garantizado por


el gerente

Universidad Catlica del Norte


Escuela de Negocios Mineros
Magster en Gestin Minera

Anlisis de Datos y Mtodos


Cuantitativos para la Toma de
Decisiones
8va versin MGM
Antofagasta, Diciembre de 2014

Freddy Higuera Cartes


Doctor en Ciencias de la Ingeniera
Mencin Ingeniera Civil de Industrias

Anda mungkin juga menyukai