Anda di halaman 1dari 16

ISSN 1988-6047

2922/2007 N 29

MUEST
R

ABRIL DE

DEP. LEGAL: GR
2010

REO Y

ESTIMACIN CON

AUTORA
JUAN JOS MUOZ LEN
TEMTICA
MATEMTICAS, ESTADSTICA, NUEVAS TECNOLOGAS
ETAPA BACHILLERATO

Resumen
En este artculo, dirigido a los alumnos/as de segundo curso de bachillerato que cursan la
materia de Matemticas Aplicadas a las Ciencias Sociales, se explicar la forma de
usar una herramienta de clculo a travs de la cual se resolvern problemas de
estimacin, usando el software libre, en concreto el paquete estadstico R.
Palabras clave
Estadstica, distribucin, estimacin, error, software libre, R, matemticas,
ciencias sociales. 1. INTRODUCCIN
Para el estudio de la estimacin y haciendo uso de R, se van a definir una serie de
funciones que proporcionarn una metodologa de trabajo simple. As se resolvern de
forma rpida los problemas ms comunes de muestreo y estimacin.
2. PAQUETE ESTADSTICO R
R es un paquete estadstico de cdigo abierto, se distribuye bajo licencia GNU GPL. Es un
lenguaje y un entorno de programacin para el anlisis estadstico.
Este programa est instalado en los ordenadores de los centros TIC que usan
Guadalinex. Las versiones para otros sistemas operativos se pueden descargar
gratuitamente desde www.r-project.org. Utilizaremos este paquete estadstico como una
herramienta de clculo:
Copiaremos el cdigo de las funciones escrito en el artculo, en la ventana que
aparece cuando iniciamos R. Se pueden utilizar los comandos habituales de cortar y
pegar.
Evaluaremos las funciones con los datos del problema y nos aparecer la
solucin. 3. DISTRIBUCIONES DE PROBABILIDAD
3.1. Distribucin Binomial
Sea una distribucin Binomial B n, p , para calcular la probabilidad P ( X x ) vamos a
defnir la funcin
probabilidad_binomial(x,n,p). Esta funcin, una vez evaluada, nos devuelve el valor de la
probabilidad binomial acumulada.

Cdigo de la funcin:
probabilidad_binomial=function(x
,n,p) {
pbinom(x, size=n, prob=p, lower.tail=TRUE)
C/ Recogidas N 45 - 6A 18005 Granada csifrevistad@gmail.com

ISSN 1988-6047
2922/2007 N 29
}
A modo de ejemplo, si
acumulada P ( X 7
distribucin

ABRIL DE
queremos

DEP. LEGAL: GR
2010
calcular la probabilidad
en una

B (10, 0.3 tecleamos en la lnea de comandos la funcin probabilidad_binomial(7,10,0.3)


y R nos devuelve el valor 0.9984096.
>
probabilidad_binomial(7,10,0.
3) [1] 0.9984096
Para representar grficamente la funcin probabilidad, vamos a definir la
funcin distribucion_binomial(n,p) que nos devuelve la grfica de la distribucin de
probabilidad B ( n, p ) .
Cdigo de la funcin:
distribucion_binomial=function
(n,p) {
.x <- 0:n
plot(.x, dbinom(.x, size=n,
prob=p), xlab="Nmero de
suceso",
ylab = "Probabilidad",
main="Distribucin
Binomial", type="h")
points(.x, dbinom(.x, size=n, prob=p),
pch=16) abline(h=0, col="gray")
remove(.
x) }
En la Ilustracin 1 vemos la salida que ofrece R cuando introducimos en la lnea de
comandos la funcin distribucion_binomial(10,0.3)

C/ Recogidas N 45 - 6A 18005 Granada csifrevistad@gmail.com

ISSN 1988-6047
2922/2007 N 29

DEP. LEGAL: GR
2010

ABRIL DE
Distribucin

Binomial

0.
2
5
0.
2
0
Pr
o
b
a
bil
id
a
d

0.
1
5
0.
1
0
0.
0
5
0.
0
0
0

10

Nmero de suceso

Ilustracin

3.2. Distribucin Normal


De forma anloga al procedimiento seguido en el epgrafe anterior, vamos a defnir
una funcin probabilidad_normal() que nos proporcionar la probabilidad acumulada P ( X
x para una funcin de
1

distribucin N ( m ,s ) y una funcin distribucion_normal() que nos permitir representar


grficamente la distribucin de probabilidad.
Cdigo de la funcin para el clculo de la
probabilidad:
probabilidad_normal=function(x,m,s)
{
pnorm(x, mean=m, sd=s,
lower.tail=TRUE) }
Cdigo de la funcin para la representacin grfca de la funcin de
distribucin: distribucion_normal=function(m,s)
{
li<qnorm(c(0.001),mean=m,sd=s,lower.tail=TR
UE) ls<qnorm(c(0.999),mean=m,sd=s,lower.tail=TR
UE) curve(dnorm(x,mean=m,
sd=s),,from=li,to=ls,
ylab = "Probabilidad",
main="Distribucin
Normal")
}

A modo de ejemplo, si queremos calcular la probabilidad acumulada P ( X 130


distribucin

de una

N (125, 20 ) tecleamos en la lnea de comandos la funcin


probabilidad_normal(130,125,20) y R nos
devuelve el valor 0.5987063.
probabilidad_normal(130,125
,20)
C/ Recogidas N 45 - 6A 18005 Granada csifrevistad@gmail.com

ISSN 1988-6047
2922/2007 N 29

DEP. LEGAL: GR
2010

ABRIL DE

[1] 0.5987063
La Ilustracin 2 , muestra la
salida que
ofrece R cuando introducimos
en la lnea de comandos la funcin distribucion_normal(125,20).
Distribucin Normal
0.
0
2
0
0.
0
1
5
Pr
o
b
a
bil
id
a
d

0.
0
1
0
0.
0
0
5
0.
0
0
0

60

80

100

120

140

160

180

Ilustracin 2

3.3. Aproximacin de la Distribucin Binomial a una


Normal
La funcin de distribucin B n, p ) se aproxima a una
distribucin

N np, np(1- p)

cuando n

es

grande n 30 y p _ 0.5 . La siguiente funcin superpone la distribucin Binomial y la


Normal en un
mismo grfico:
Cdigo de la
funcin:
binomial_normal=function(
n,p) {
.x <- 0:n
li<-min(qnorm(c(0.001),mean=n*p,sd=sqrt(n*p*(1p)),lower.tail=TRUE),0) ls<max(qnorm(c(0.999),mean=n*p,sd=sqrt(n*p*(1p)),lower.tail=TRUE),n)
plot(.x, dbinom(.x, size=n, prob=p),xlab="n",ylab =
"Probabilidad",main="Binomial-Normal",col="gray",type="h")
points(.x, dbinom(.x, size=n, prob=p),

pch=16,col="gray") abline(h=0, col="gray")


curve(dnorm(x,mean=n*p, sd=sqrt(n*p*(1p))),,from=li,to=ls,add=T) remove(.x)
}
C/ Recogidas N 45 - 6A 18005 Granada csifrevistad@gmail.com

ISSN 1988-6047
2922/2007 N 29
La siguiente secuencia de
p y N np, np(1- p)

ABRIL DE

DEP. LEGAL: GR
2010

grficas

muestra las distribuciones B ( n,

para

distintos valores de n y p . De izquierda a derecha


los valores de n y p son respectivamente n = 10 p = 0.3 ,
n = 20 p = 0.2 y n = 30 p = 0.5 .

0.
25

0.
20
Pr
ob
ab
ili
da
d

Binomial-Normal
Normal
0.

0.
20

Binomial-Normal

Binomial-

15

0.
15

0.
15
Pr
ob
ab
ili
da
d

0.
10

0.
05

0.
10
Pr
ob
ab
ili
da
d

0.
10

0.
05

0.
05

0.
00
0.
00
0.
00

6
n

10

10
n

15

20

10

15

20

25

30

4. DISTRIBUCIONES MUESTRALES
4.1. Distribucin muestral de las medias
La
funcin
probabilidad_media()
evaluada
de
la
siguiente
forma
probabilidad_media(media_poblacin,desviacin_tpica_poblacin,tamao_muestra,valor)
nos devuelve como salida la probabilidad de que la media de la muestra sea mayor o
menor que un determinado valor.
Cdigo de la funcin:
probabilidad_media=function(media,desviacion,tamao,
valor_x)
{ stamao=(desviacion/sqrt(ta
mao)) z=(valor_xmedia)/stamao
p<pnorm(c(z),mean=0,sd=1,lower.tail=TRU
E) cat("Normal
N(",media,",",stamao,")\n")
cat("Z",z,"\n")
cat("Probabilidad menor
que",valor_x,"es",p,"\n") cat("Probabilidad
mayor que",valor_x,"es",1-p,"\n") }

Para ilustrar el funcionamiento de la funcin vamos a resolver un problema: La masa de


las manzanas de una cosecha se distribuye normalmente con media 125 g y desviacin
tpica de 20 g. Cul es la probabilidad de que el peso medio en una muestra de 25
manzanas sea mayor que 130 g?
>
probabilidad_media(125,20,30,13
0) Normal N( 125 , 3.651484 )
Z 1.369306
Probabilidad menor que 130 es 0.9145482
C/ Recogidas N 45 - 6A 18005 Granada csifrevistad@gmail.com

ISSN 1988-6047
2922/2007 N 29

ABRIL DE

DEP. LEGAL: GR
2010

Probabilidad mayor que 130 es


0.08545176
4.2. Distribucin muestral de
las
proporciones
La funcin que se van a definir a continuacin tiene un funcionamiento similar a la anterior.
Por lo tanto, aparecer exclusivamente su cdigo y la sintaxis de llamada a la funcin
desde R.
Cdigo de la funcin:
probabilidad_proporcion=function(probabilidad,tamao,
valor_p)
{
stamao=(sqrt(probabilidad*(1probabilidad)/tamao)) z=(valor_pprobabilidad)/stamao
p<pnorm(c(z),mean=0,sd=1,lower.tail=TR
UE)
cat("Normal
N(",probabilidad,",",stamao,")\n")
cat("Z",z,"\n")
cat("Probabilidad menor que",valor_p*100,"%
es",p,"\n") cat("Probabilidad mayor
que",valor_p*100,"% es",1-p,"\n") }
Funcin:
probabilidad_proporcion(probabilidad_poblacin,tamao_poblaci
n,valor) 5. ESTIMACIN POR INTERVALOS DE CONFIANZA
5.1. Intervalo de confianza para la
media Cdigo de la funcin:
intervalo_media=function(muestra,media,desviacio
n,nivel) {
p=(1+(nivel/100))/2
zc<qnorm(c(p),mean=0,sd=1,lower.tail=TRU
E) i<-(zc*desviacion)/sqrt(muestra)
cat("El intervalo de confianza para la
media,\n") cat("al nivel de confanza ",
nivel, "% es,\n") cat("(", mediai,",",media+i,")\n")
}
Funcin
:
intervalo_media(tamao_muestra,media_muestra,desviacin_poblacin,nivel_
confianza) Problema:
2
El consumo, en gramos, de un cierto producto sigue una ley Normal con varianza 225 g .
A partir de una muestra de tamao 25 se ha obtenido una media muestral igual a 175

g. Halle el intervalo de confianza, al 90%, para la media del consumo.


Solucin:
> intervalo_media(25,175,15,90)
El intervalo de confianza para la
media, al nivel de confanza 90 %
es,
( 170.0654 , 179.9346 )

C/ Recogidas N 45 - 6A 18005 Granada csifrevistad@gmail.com

ISSN 1988-6047
2922/2007 N 29

ABRIL DE

DEP. LEGAL: GR
2010

5.1. Intervalo de confianza


para la proporcin Cdigo de la
funcin:
intervalo_proporcion=function(casosposibles,casosfavorabl
es,nivel) {
p=(1+(nivel/100))/2
zc<qnorm(c(p),mean=0,sd=1,lower.tail=TRU
E) por=casosfavorables/casosposibles
i<-(zc*sqrt(por*(1-por)/casosposibles))
cat("El intervalo de confianza para la
proporcin,\n") cat("al nivel de confanza ",
nivel, "% es,\n")
cat("(", pori,",",por+i,")\n") }
Funcin:
intervalo_proporcion(casosposibles,casosfavorables,nivel_co
nfianza) Problema:
En una muestra representativa de 1200 residentes de una ciudad, 450 utilizan el
trasporte pblico. Obtenga el intervalo de confianza, al 90%, de la proporcin de
residentes en la ciudad que utilizan habitualmente el transporte pblico.
Solucin:
> intervalo_proporcion(1200,450,90)
El intervalo de confianza para la
proporcin, al nivel de confanza 90 %
es,
( 0.3520125 ,
0.3979875 ) 6.
TAMAO MUESTRAL
6.1. Tamao muestral para la
media Cdigo de la funcin:
tamao_muestra_media=function(error,desviacio
n,nivel) {
p=(1+(nivel/100))/2
zc<qnorm(c(p),mean=0,sd=1,lower.tail=TRU
E) n<-((zc*desviacion)/(error))^2
cat("El tamao de la muestra para,\n")
cat("un nivel de confianza de ", nivel,
"%,\n")
cat("con un error ", error," y una desviacion", desviacion,
" es\n") cat(ceiling(n), "\n")

}
Funcin
:
tamao_muestra_media=function(error,desviacin_poblacional,nivel_c
onfianza) Problema:
El tiempo de utilizacin diaria de ordenador entre los empleados de una empresa sigue
una distribucin Normal de desviacin tpica 1,2 horas. Calcule el tamao mnimo que
debera tener una muestra para
C/ Recogidas N 45 - 6A 18005 Granada csifrevistad@gmail.com

ISSN 1988-6047
2922/2007 N 29

ABRIL DE

DEP. LEGAL: GR
2010

estimar le media de tiempo de


utilizacin
diaria del ordenador con un
error no superior a 0,75 horas y
un nivel de
confanza al 96%.
Solucin:
>
tamao_muestra_media(0.75,1.2,9
6) El tamao de la muestra para,
un nivel de confanza de 96 %,
con un error 0.75 y una desviacion
1.2 es 11
6.2. Tamao muestral para la
proporcin Cdigo de la funcin:
tamao_proporcion=function(error,proporcion
,nivel) {
p=(1+(nivel/100))/2
zc<qnorm(c(p),mean=0,sd=1,lower.tail=TRU
E) n<-((zc/error)^2*proporcion*(1proporcion)) cat("El tamao de la muestra
para,\n")
cat("un nivel de confianza de ", nivel,
"%,\n") cat("con un error ", error,"
es\n") cat(ceiling(n), "\n")
}
Funcin
:
tamao_proporcion(error,proporcin_muestra,nivel_con
fianza) Problema:
En un estudio de mercado del automvil en una ciudad se ha tomado una muestra
aleatoria de 300 turismos, y se ha encontrado que 75 de ellos tienen motor diesel.
Determine el tamao mnimo que tiene que tener la muestra para estimar la proporcin
con un error mximo de 3% con un nivel de confianza del 94%.
Solucin:
>
tamao_proporcion(0.03,75/300,9
4) El tamao de la muestra para,
un nivel de confanza de 94
%, con un error 0.03 es
737
6. BIBLIOGRAFA
Garca Cebrian M.J.. Proyecto Descartes. Unidad didctica. Extrado el 14 de febrero de
2010 desde
http://descartes.cnice.mec.es/materiales_didacticos/inferencia_estadistica/contraste.htm .

Paradis E. R para Principiantes. Tutorial. Extrado el 14 de febrero de 2010 desde


http://cran.r-project.org/doc/contrib/rdebuts_es.pdf.
Autora
_ Nombre y Apellidos: Juan Jos Muoz Len
_ Centro, localidad, provincia: I.E.S. Ingeniero Juan de la Cierva, Puente Genil,
Crdoba _ E-mail: juanjosematematicas@gmail.com

C/ Recogidas N 45 - 6A 18005 Granada csifrevistad@gmail.com

Anda mungkin juga menyukai