INDICE
1 . - VAR I A B L E S , TAB L A S E S TAD S T I C A S Y G R F I C O S
2
1.1.Estadstica:conceptos
4
bsicos........................................
1.2.Poblacin y
4
Muestra.......................................................
1 . 3 . V ar i a b l e s : C o n c e p t o y
4
tipos..............................................
1.4.Series de datos: Series
5
simples......................................
1 . 5 . Tab l a s y
6
Grficos...........................................................
1.6.Organizacin de datos categricos o
6
cualitativos...............
1.7.Grfico de
10
superficies....................................................
1 . 8 . V ar i a b l e s cuantitativas
13
continuas.....................................
1.9.Grfico de barras
21
agrupadas...........................................
1.10.Cartogramas..............................................................
24
.
1 . 1 1. C a r t o g r a m a s de
24
sealizacin ........................................
1.12.Cartogramas de
24
densidad.............................................
1.13.Recomendaciones para la construccin correcta de un
Grfico..
. 25
1.14.Clasificacin de los
26
grficos.........................................
3. - PR O BABI LIDADES
3.1.Probabilidades y distribuciones de probabilidades... 37
3.2.Probabilidad y Estadstica... 37
3
3.3.Experimentos aleatorios. Espacio muestral. Eventos 37
3.4.Definicin clsica de probabilidad. 37
3.5.Definicin de probabilidad frecuencial... 37
3 . 6 . Teo r e m a d e l a s u m a d e p r o b a b i l i d a d e s . . 38
3.7. Principio del producto de probabilidades. 38
3 . 8 . V ar i a b l e a l e a t o r i a . 38
3.9.Distribuciones de probabilidades de variable aleatoria
discontinua.. 38
3.10.Distribuciones de probabilidades de variable aleatoria
continua 39
3 . 1 1. C a r a c t e r s t i c a s d e l a D i s t r i b u c i n N o r m a l , 40
3.12.La Distribucin Normal estndar.. 41
3 . 1 3 . Tab l a s d e l a D i s t r i b u c i n N o r m a l d e u n a y d o s c o l a s . .
41
.
4 . - T E O R A E L E M E N TAL D E M U E S T R E O
4.1.Poblacin,Muestra,Parmetros y Estimadores..... 43
4.2.Muestreo al azar simple....... 44
4.3.Estimacin de la media poblacional ( ) por 45
punto.....
4.4.Distribucin de medias muestrales...... 45
4.5.Estimacin de por intervalo siendo 45
conocido.......
4.6.Clculo del tamao de la muestra n para cometer un
error determinado... 46
4.7.Error de estimacin relativo o porcentual... 43
4.8.Estimacin de por intervalo siendo desconocido.. 46
La distribucin tde Student. . 46
4.9.Estimacin de proporciones por intervalo...... 47
4.1.Muestreo al azar estratificado.. 51
5 . - G U I A D E E J E R C I TAC I N . . . . 52
6 . - BIBLI OG RAFIA . . 59
7. - ANEXO . . . . 60
4
CAPI TULO I
Va r i a b l e s , t a b l a s e s t a d s t i c a s y g r f i c o s .
Poblacin y muestra
Poblacin es el conjunto de todos los individuos cuyo
conocimiento interesa. La muestra es un subconjunto de la
poblacin objeto de estudio. La Estadstica Inferencial trabaja
exclusivamente sobre la base de muestras y extienden sus
conclusiones a la Poblacin.
5
Va r i a b l e s . C o n c e p t o y t i p o s .
Las variables son el objeto de estudio de la estadstica. Se
define a una variable como una caracterstica capaz de asumir
distintos valores o calidades. Cuando se desea estudiar alguna
caracterstica de la poblacin se puede proceder de dos maneras:
a) Se mide u observa esa caracterstica en cada uno de los
individuos de la poblacin, es decir se realiza un censo, el que es
difcil de llevar a cabo por que insume mucho tiempo y por lo
tanto mucha erogacin.
b) Se mide u observa esa caracterstica en un subconjunto
de la poblacin o muestra y luego se infieren o extienden los
resultados obtenidos a la poblacin mediante herramientas que
brinda la Estadstica Inferencial.
Ya s e e x p l i c q u e l a c a r a c t e r s t i c a o b j e t o d e e s t u d i o , q u e
vara de un individuo a otro, es decir que puede tomar diferentes
valores o cualidades se denomina variable. A los valores que
toma esa caracterstica se los obtiene por mediciones, conteos u
observaciones que se efectan en cada uno de los individuos que
componen la muestra. Considrense los siguientes ejemplos:
6
los tres ejemplos que se dieron para ilustrar tipos de variables:
xi : S, S, E, E, E, S, S, E, S, S, S, S.
xi : 4, 1, 6, 2, 4, 2, 4, 2, 4, 6, 3, 5, 3, 2, 5, 4, 0, 5, 4,
2, 4, 5, 3, 5, 3, 5,4, 3, 6, 2.
x i ( c m ) : 3 8 , 1 4 , 4 4 , 11, 9 , 2 1 , 3 9 , 2 8 , 4 1 , 4 , 3 5 , 2 4 ,
3 6 , 1 2 , 2 0 , 3 1 , 2 4 , 2 5 , 1 0 , 2 1 , 11, 3 6 , 3 7 , 2 0 , 2 6 .
Ta b l a s y g r f i c o s
Ta b l a 1 . E s t a d o s a n i t a r i o d e 1 2 p l a n t i n e s d e u n v i v e r o
7
i Categoras:x i Frecuencias: fi Porcentajes:
(Estado sanitario) (n de plantas) %
1 Sano 8 67
2 Enfermo 4 33
Tot a l 12 100
Fuente: Datos ficticios
fi 8
7
6
5
4
3
2
1
0
Sano Enfermo
Estado Sanitario
8
El ancho de las barras debe elegirse teniendo en cuenta el
espacio disponible, el nmero de categoras de la variable a
representar y la altura que les corresponde, con el objeto de
obtener un grfico proporcionado. Las barras pueden dibujarse en
sentido vertical u horizontal. En algunos casos en lugar de
rectngulos se dibuja una lnea, razn por la cul se denominan
grfico de lneas.
Enfermo
Estado sanitario
Sano
0 2 4 6 8
fi (n de plantas)
fi f
i 1
1 f 2 4 8 12
Ta b l a 2 . E s t a d o s a n i t a r i o d e 1 2 p l a n t i n e s d e u n v i v e r o
i xi fi fri Porcentajes:
(Es.sanitario) %
1 Sano 8 8/12=0.67 67
2 Enfermo 4 4/12=0.33 33
9
Se pueden representar los datos de la tabla 2 mediante un grfico
de barras, slo que en el eje vertical van los porcentajes.
% 80
60
40
20
0
Sano Enfermo
Estado sanitario
Ta b l a 3 . P l a n t a s p r o d u c i d a s e n e l a o 1 9 9 9 e n e l v i v e r o d e l
INSIMA
Especies fi
(n de plantas producidas)
Grevillea 2000
Jacarand 2000
Algarrobo 3500
Casuarinas 1200
Tot a l 8700
Fuente: INSIMA
10
360 2000
x
82.76
8700
De la misma manera se calcula para cada una de las
especies restantes. Los valores son: 82.76 para jacarand,
144.83 para algarrobo y 49.65 para Casuarinas. La suma de
dicha columna debe ser igual a 360.
C a s Cu aasruianr a
i ns
as
G
Gr evvi lil lelaes a s
re
Fuente: INSIMA
Ta b l a 4 . P l a n t a s p r o d u c i d a s e n e l v i v e r o d e l I N S I M A e n l o s d o s
ltimos aos
Ao N de plantas
1998 5000
1999 8700
Fuent e: Vivero INSIMA
5000 S 98
8700 S 99
11
1- Se elige un valor del radio (depende del espacio disponible
para realizar el grfico), que corresponde al mayor total a
represent ar. Por ejem plo se elige un radio de 3 cm para dibujar el
crculo cuya superficie representar la produccin de 1999 o sea
8700 plantas.
S 99 r 2 3..1416 32 28.2744cm 2
3 cm. 2.27 cm
1998
1999
12
Se pueden combinar los grficos de superficies y sectores tal
c o m o s e m u e s t r a m s a d e l a n t e ( Tab l a 1 2 y G r f i c o 1 2 ) .
Va r i a b l e s c u a n t i t a t i v a s
Para el caso de variables cuantitativas discretas , la tabla
de frecuencias se construye de la siguiente manera: se ubica el
valor mayor y el menor valor de la variable (en el ejemplo 2 del
n de semillas germinadas en un grupo de seis semillas, el menor
valor es cero y el valor mayor 6), se colocan todos los valores
correspondientes en la primera columna de la tabla, y luego se
ve cuntas veces estn repetidos dichos valores. La tabla
resultante es:
Ta b l a 5 . C a j a s d e P e t r i c l a s i f i c a d a s s e g n e l n m e r o d e s e m i l l a s
germinadas.
Xi fi
0 1
1 1
2 6
3 5
4 8
5 6
6 3
Fuente datos ficticios
6
Frecuencias
0
0 1 2 3 4 5 6
nm ero de semillas
13
datos del ejemplo 3 (altura de plantas de Prosopis de 1 ao) que
fueron obtenidos por medicin, se recomienda construir
intervalos de clase, cuya amplitud depende de la cantidad de
intervalos que se deseen construir y la cantidad de datos que
posee la serie simple. Es recomendable que los intervalos de
clases sean iguales, es decir que la amplitud de los mismos (a)
sea constante. La tcnica a emplear para el agrupamiento de una
serie simple de variable cuantitativa continua es sencilla. Se
transcribe la serie.
X i ( c m ) : 3 8 , 1 4 , 4 4 , 11, 9 , 2 1 , 3 9 , 2 8 , 4 1 , 4 , 3 5 , 2 4 , 3 6 , 1 2 , 2 0 ,
3 1 , 2 4 , 2 5 , 1 0 , 2 1 , 11, 3 6 , 3 7 , 2 0 , 2 6 .
R x max x min 44 4 40
3. El nmero de intervalos se puede calcular con la siguiente
frmula:
log(n 1)
n de intervalos
log(2)
dnde n: n de valores de la serie o tamao de la muestra
log: logaritmo decimal
log(25 1)
n de int erv. 4.7004 5 int ervalos
log(2)
Rango 40
a 8
n de int ervalos 5
14
Li del 1er intervalo = 0
Ls del 1er intervalo = Li + a= 0 + 10 = 10
El lmite inferior del 2 do intervalo debe coincidir con el lmite
superior del primer intervalo.
Li1 Ls1 0 10
x1 5
2 2
Li Ls2 10 20
x2 2 15
2 2
Al efectuar el agrupamiento, se pierde detalle de la
informacin ya que, por ejemplo, de los valores que resultaron
ubicados en la primera clase, slo se sabe ahora que se
encuentran entre 0 y 10. Por eso, en caso de ser necesario
15
asignar un valor a cada uno de ellos, como al calcular la media
aritmtica a partir de la tabla de frecuencias, se opta por pensar
q u e t o d o s t ie n e n ig u a l v a l o r, q u e e s e l c o r r e s p o n d i e n t e a l p u n t o
medio de clase .
Un grfico adecuado para representar una serie de
frecuencias de variable cuantitativa continua es el histograma
(grfico n 6). Su construccin es fcil. Se utiliza el sistema de
coordenadas cartesianas ortogonales. En el eje de las ordenadas
(vertical) se marcan las frecuencias (f i) y en el de las abscisas
(horizontal), la variable segn la cual se efectu la clasificacin
(altura). Consiste en rectngulos adyacentes (uno por cada clase)
con bases materializadas por la amplitud de clases (10 cm). La
altura est dada por la frecuencia correspondiente a la clase.
Cuando las clases son iguales, el rea del histograma es
proporcional a la frecuencia total.
10
9
8
7
N de plantas
6
5
4
3
2
1
0
10 20 30 40 50
altura (cm)
16
300
250
200
fi / ai 150
100
50
0
5 15 25 30 40 50 60 100
Edad
1600
1400
1200
1000
N de pers.
800
600
400
200
0
5 15 25 30 40 50 60 100
Edad
17
frecuencias de las distintas clases comparables, es necesario
expresar las frecuencias teniendo en cuenta la amplitud de clase
a la cual pertenecen, para ello se divide la frecuencia entre la
amplitud de la clase.
Otro grfico adecuado para representar la serie de
frecuencias de variable cuantitativa continua es el polgono de
frecuencias (grfico 8). Se emplea para su realizacin el sistema
de coordenadas cartesianas ortogonales. Se coloca la variable
clasificadora en el eje horizontal y las frecuencias en el vertical.
La construccin es sencilla, se marcan tantos puntos como
pares de valores (xi,fi) o sea marcas de clase, frecuencias haya
en la tabla. En la tabla N 6 vemos que hay 5 pares de valores;
el primer par tiene abscisa 5 y ordenada 2 y as sucesivamente
h a s t a m a r c a r e l q u i n t o p a r. L u e g o s e u n e n lo s p u n t o s m e d i a n t e
tr az os r ect o s. Algu n o s a ut or es , e n su a f n de m a nt e n e r la
proporcionalidad entre la superficie y la frecuencia aconsejan
cerrar el polgono de frecuencias uniendo el primer punto con la
marca de clase inmediata anterior y el ltimo punto con la
inmediata superior; en stos dos casos la unin de los puntos se
realiza con trazos cortados.
La principal ventaja de los polgonos de frecuencias
consiste en que ellos permiten dibujar en el mismo sistema de eje
dos o ms polgonos correspondientes a series diferentes que
tengan similar posicin sobre el eje de las x, as se puede
compararlos, lo cual resulta engorroso efectuar con los
histogramas a causa de la superposicin de las superficies de de
los rectngulos.
10
n de plan tas
0
0 20 40 60
alt (cm)
18
Cuando el nmero de datos es grande, para ordenarlos se
debe usar el agrupamiento en una tabla de frecuencias.
Ta b l a 8 . Al u m n o s c l a s i f i c a d o s s e g n l a n o t a o b t e n i d a e n l o s
parciales de Estadstica.
xi 1 2 3 4 5 6 7 8 9 10
fi 2 11 17 48 66 40 32 21 8 5
Fuente: Datos ficticios
Pero cada miembro de una poblacin presenta diversos
aspectos que pueden ser de inters para el tcnico, y l puede
necesitar clasificar a los individuos de dicha poblacin de acuerdo
a dos variables, por ejemplo le interesa medir el dimetro a la
base y la altur a de las plnt ulas del vivero. Tiene par a cada
individuo medido dos valores de variable. Cuando el nmero de
individuos medidos es pequeo, se enumeran todos los pares de
observaciones, si alguno de ellos aparece dos veces, se lo repite
y la presentacin suele hacerse de modo que una de las dos
variables est ordenada.
Ta b l a 9 . 1 2 P l a n t a s d e u n v i v e r o c l a s i f i c a d a s s e g n e l d i m e t r o a
la base y altura
Dab 8 8 9 10 11 11 12 13 14 15 15 15
A l t 11 9 11 8 1 2 1 11 8 1 2 0 1 2 3 11 9 1 2 1 11 9 1 2 9 1 2 7 1 3 0
Datos ficticios
19
0. 2
Vo l
0. 15
( m3 )
0. 1
0. 05
0
8 10 12 14 16 18 20 22 24
Da p ( c m)
Tabla N 10. Temperatura del suelo y del aire (C) registradas en el Zanjn en el mes
de abril de 1999.
Suelo Aire
Da T(C) Tmedia Tmax(C) Tmin(C)
C)
1 20.6 16.0 18.3 14.5
2 19.5 16.1 19.7 14.1
3 19.5 16.8 19.3 15.0
4 20.1 18.8 25.6 14.7
5 20.2 18.9 29.7 10.7
6 20.6 18.3 24.6 12.7
7 20.0 17.8 24.6 13.7
8 20.0 18.3 24.8 14.4
9 20.1 18.2 25.8 13.9
10 20.3 18.4 21.0 17.0
11 20.0 18.1 22.1 14.8
12 20.0 18.7 27.3 11. 3
13 20.5 18.2 27.7 9.6
14 21.9 20.6 29.5 11. 9
20
15 20.9 15.1 19.7 11. 2
16 18.3 12.6 20.6 4.3
17 17.2 9.3 22.3 -1.3
18 17.1 10.8 24.2 -0.2
19 17.6 12.9 26.1 1.3
20 18.5 14.9 27.5 4.0
21 19.4 15.4 27.9 4.9
22 20.6 19.2 30.5 9.1
23 22.7 23.4 33.4 15.8
24 24.8 25.9 34.2 21.4
25 24.6 23.2 32.9 18.3
26 22.1 17.5 23.6 13.0
27 20.4 17.6 21.1 15.1
28 20.2 16.9 27.7 7.8
29 20.7 18.1 26.2 9.8
30 20.4 20.3 24.7 17.8
Fuente: Boletn FAAI
30
T (C) 25
20 T suelo
15
T Me
10
5
0
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Abril
Grfico N 10. Evolucin de las temperaturas del Suelo (C) y la media del
aire en El Zanjn en Abril de 1999.
Ta b l a 1 1 . P r o d u c c i n d e p l a n t a s e n u n v i v e r o s e g n e s p e c i e y
tipo de envase
21
ESPECIE T I P O D E E N VA S E
TUBETES B O L S I T AS M A C E T AS T O T AL
Eucalyptus 3000 1500 500 5000
Pinus 2000 1500 100 3600
Grevilleas 1000 2000 500 2500
Algarrobo 500 2500 3000 6000
Tot a l 6500 7500 4100 17000
Fuente: Datos ficticios
E n l a t a b l a 11 l a s v a r i a b l e s c l a s i f i c a d o r a s s o n e s p e c i e
(variable cualitativa) y tipo de envase (variable cualitativa).
La construccin del grfico de barras compuestas es
sencilla. Se comienza dibujando las barras como si fueran
simples es decir con las alturas correspondientes a los totales
y luego se yuxtaponen los valores parciales hasta alcanzar el
de su suma. En el ejemplo, para Eucalyptus, se procede de la
siguiente manera: se marca una barra de altura 5000, en ella
se indica la primera subdivisin que puede ser tubetes con el
valor 3000. Para bolsitas se aconseja proceder a la suma de
tubetes + bolsitas= 3000 + 1500 = 4500. Se marca la segunda
divisin correspondiente a bolsitas: la porcin comprendida
entre 3000 y 4500, lo que resta de la barra corresponde a
produccin en macetas.
22
Grfico de barras agrupadas
N de 7000
Plant.
6000
5000
4000 Macetas
Bolsitas
3000
Tubetes
2000
1000
0
Pinu Gre
Euca. s v. Algarro
bo
Especies
3500
N de plantas
3000
2500 Tubete
2000 Bolsitas
1500
1000 Tierra
500
0
Especie
Fuente:datos ficticios
G rfi co 11b . Pro d uc ci n d e pl an t as d e u n viv ero, se g n es pe ci e y
tipo de envase.
23
superficies combinado con el de sectores circulares. Las
superficies se utilizan para representar los totales de produccin
y se discrimina las distintas especies mediante sectores.
Ta b l a 1 2 . P r o d u c c i n d e p l a n t a s e n e l I N S I M A e n l o s a o s 1 9 9 8 y
1999, discriminada por especies
1998
Casuarinas 1999
Grevillea
Casuarinas
Grevillea
Algarrobo
Algarrobo
Jacarand
Jacarand
24
Ta b l a N 1 3 . P r e c i p i t a c i o n e s m e d i a s m e n s u a l e s e n Sgo. del
Estero en el perodo 1981-90
Mes Ene F e b . Mar. A b r. Ma y J u n J u l A g S e t . O c t . N o v. D i c .
. . o.
Pp 136.3 80.8 78.2 33.5 18.3 6.6 5.6 2.4 13.6 34.3 63.7 120.4
mm
Fuente: Ing. Pedro Boletta
Ene
Dic 150 Feb.
100
Nov Mar
50
Oct 0 Abr
Sep May
Ago Jun
Jul
25
Suelen utilizarse pictogramas, grficos de lneas, en general
cualquiera de los descriptos, sobre el mapa o plano.
26
*Aclaracin de las unidades de representacin
*Las referencias sern colocadas al pie o al costado del grfico.
*En caso de usarse abreviaturas, stas sern aclaradas con la
debida extensin, en el rengln siguiente al correspondiente a las
fuentes.
*En lo posible acompaar los grficos con las tablas estadsticas
que lo originen.
*Si el trabajo lo requiere y es necesario expresar algunos valores
en %, deben consignarse las cifras de las cuales provienen stos
porcientos.
Clasificacin
A.1.Coordenadas ortogonales .
1) Histogramas
2) Polgonos de frecuencias
3) Barras simples, compuestas, agrupadas.
4) Lineales
5) De siluetas
6) De fajas.
INTRODUCCIN
27
En todo trabajo estadstico luego de recolectar los datos,
ordenarlos y agruparlos en tablas y presentarlos grficamente, es
preciso extraer alguna informacin que permita describir la
poblacin de la cual se extrajeron los mismos.
Existen algunas medidas que resumen los datos, es decir
que nos permiten representarlos con un nico valor; stas
medidas pueden proporcionar informacin referida a la posicin
del conjunto de datos en el eje de las x y se llaman Medidas de
Posicin y otras que miden como se distribuyen los datos
alrededor del valor central y que se denominan Medidas de
Dispersin.
Cuando las medidas de posicin nos indican adems el
centro del conjunto de datos, se denominan Medidas de
Te n d e n c i a C e n t r a l . H a y o t r a s m e d i d a s indican nicamente
localizacin o ubicacin de determinados valores en la serie son
los: cuartiles, deciles y percentiles y se denominan medidas de
localizacin.
M E D I A AR I T M T I C A
x
x i
Ejemplo:
Se dispone de las siguientes alturas de plantas en cm. y se
quiere averiguar cual es la altura promedio:
xi = altura de plantas en cm.
x i = 1 5 ; 1 6 ; 1 2 ; 1 4 ; 11
15 16 12 14 11 68
x 13,6cm
5 5
P R O P I E D A D E S D E L A M E D I A AR I T M E T I C A
Ejemplo:
28
S en una plantacin de parasos a los 9 aos de edad, en el
D e p a r t a m e n t o Al b e r d i , P c i a . D e S a n t i a g o d e l E s t e r o , e l v o l u m e n
promedio por ha es de 44.17 m 3, cul es el volumen en la
superficie total que es de 125 has?. ?
Vo l u m e n t o t a l = 4 4 . 1 7 m 3 / h a . * 1 2 5 h a s . = 5 5 2 1 . 2 5 m 3 .
(xi)
15 1.4
16 2.4
12 -1.6
14 0.4
11 -2.6
di = 0
d i
2
xi x 2
mn
( 1 5 - 1 5 ) 2 + ( 1 6 - 1 5 ) 2 + ( 1 2 - 1 5 ) 2 + ( 1 4 - 1 5 ) 2 + ( 11- 1 5 ) 2 = 2 7
29
frecuencias
Ta b l a N 1 4 . A l t u r a d e p l a n t a s ( e n c m . ) d e u n v i v e r o
xi fi
11 10
12 5
14 8
15 7
23 2
Tot a l 32
FUENTE:Datos ficticios
donde
xi: altura de plantas en cm.
fi : nmero de plantas que poseen esas alturas
x ( 11+ 1 1+ . . . + 1 1+ 1 2 + . . . + 1 2 + 1 4 + . . . + 1 4 + 1 5 + . . . + 1 5 + 2 3 + 2 3 ) / 3 2
x
xi *fi
fi
Considere ahora el clculo de media aritmtica del dimetro de
ejemplares de lamos de una parcela, en una plantacin de
Santiago del Estero. Los datos figuran en la tabla 15
Clases de xi fi xi * fi
dimetro en cm
4.3 - 5.3 4.8 2 9.6
5.3 - 6.3 5.8 7 40.6
6.3 - 7.3 6.8 14 95.2
7.3 - 8.3 7.8 13 101.4
8.3 - 9.3 8.8 1 8.8
Tot a l 37 255.6
F u e n t e : C t e d r a d e E s t a d s t i c a F C F. U N S E .
30
En este caso se toma el punto medio de la clase xi como el valor
que resume todos los que estn en esa clase.
x
x i * f i 255.6
f i 37 6.91cm
Cuando el promedio se obtiene con todos los datos de la
poblacin, es decir cuando se efecta un censo, obtenemos lo
que se denomina parmetro de la poblacin y se representa y
calcula de la siguiente manera, siendo N el tamao de la
poblacin
xi
=
N
MEDIANA
Ejemplo:
Las muestra posee tamao impar n=5
31
n 1
2Se calcula la posicin del valor mediano:
2
51
= 3, Significa que el valor mediano es el que corresponde al
2
3 e r lu g a r, q u e e n e s t e c a s o c o rr e s p o n d e a 2 0 0 . E n t o n c e s
Me = 200.
89; 23 ; 74 ; 12 ; 46 ; 25
12; 23; 25 ; 46 ; 74 ; 89
n 1
2)Se calcula la posicin del valor mediano:
2
61
3.5 ,
2
significa que est ubicada entre el 3 er y 4 lugar de la serie
ordenada:
12 ; 23 ; 25 ;46 ; 74 ; 89
25 46
35.5 Md = 35.5
2
el valor de la Mediana se obtiene promediando los valores
centrales
32
encuentra ubicando el valor:
fi + 1 211
105.5
2 2
Para ello se calculan las frecuencias acumuladas y luego
ubicamos el menor valor que contiene a 105 y a 106, en ste
caso coincide y es 140.
Significa que el la posicin 105 y 106 tenemos el valor de variable
que es 1, por lo que en ste caso Md=1.
MODO
Es el valor de variable que ms se repite. Es la nica medida de
posicin que se puede calcular para variables cualitativas
nominales, es decir en las variables cualitativas en las que no se
puede establecer un orden entre sus valores.
XI : Color de flor R: rojo N: naranja A: amarillo
Xi : A ; R ; R ; A ; N ; A ; R ; R ; R ; A ; N ; R ; R ; R
Modo : Mo : R
E n la s ig u i e n t e s e r ie d e f r e c u e n c i a s a n t e r i o r, n o s f ij a m o s e n la
columna de frecuencias absolutas cul es el valor ms alto, en
ste caso es 80, que nos indica la cantidad de rboles con ningn
ataque, es decir el valor modal es cero.
MEDIA CUADRTI CA
La Media cuadrtica (Mc) es la raz cuadrada de la media
aritmtica de los cuadrados de los valores de la variable.
Mc= x i
2
en series simples
n
Mc =
x * f 2
i i
en series de frecuencias
f i
Ejemplo:
Ta b l a N 1 7 . D i s t r i b u c i n d i a m t r i c a d e l o s r b o l e s d e u n b o s q u e
irregular
33
En realidad este valor es el dimetro correspondiente a la seccin
normal media (DAP: dimetro a 1.30m, conocido vulgarmente
como dimetro a la altura de pecho)
Aplicando la frmula
43956
Mc= 16.32 cm
165
M E D I D A S D E VAR I A B I L I D A D O D I S P E R S I N
Las Medidas de Posicin no son suficientes para describir el
conjunto de datos sino que es necesario tener una idea de como
se distribuyen los datos alrededor del centro de la distribucin.
Para eso surgen las Medidas de Dispersin.
RANG O
Es llamado tambin amplitud total de variacin de la variable. Se
lo obtiene como la diferencia entre el valor mximo y mnimo de la
variable.
Ejemplo:
Los siguientes son datos de temperatura ( C) durante 5 das:
xi ( o C) = 22 , 26 , 27 , 26 , 34
Rango= 34 - 22 = 12
DESVO MEDIO
Se podra trabajar con los desvos individuales, sumarlos y
promediarlos, pero no se puede hacer esto ya que siempre su
valor sera cero, por propiedad de la media aritmtica.
Para solucionar el problema de signos y as poder encontrar el
valor promedio podemos utilizar el valor absoluto de los desvos.
DM = d i
x i x
n n
34
xi
di= xi - x
22 -5
26 -1
27 0
26 1
34 7
51 0 1 7
DM = 2.8
5
2
( x i x) * fi
S en series de frecuencias
f i 1
intervalo de clase fi xi
(xi- x )2*f i
3 - 9 62 6 3968
9 - 15 40 12 160
15 - 21 31 18 496
21 - 27 15 24 1500
27 - 33 12 30 3072
33 - 39 5 36 2420
Tot a l 165 116 1 6
2310 11616
x 14 s= 8.42
165 164
C O E F I C I E N T E D E VAR I A C I N
35
Las tres medidas de variabilidad enunciadas
precedentemente son medidas de variabilidad absoluta. El
coeficiente de variacin es una medida de variabilidad relativa.
Expresa la desviacin estndar como un porcentaje de la media.
S
CV%=
*100
x
En el ejemplo de la serie simple:
4.36
CV% = * 100 16.15%
27
36
CAPITULO III
Probabilidad
Es la posibilidad de ocurrencia de un hecho.
Matemticamente se mide con un nmero que va desde 0 hasta 1
o, si as se lo desea, en por ciento desde 0 a 100%.
Probabilidad y Estadstica
Como ya se vi, en la Estadstica Descriptiva, se hace
referencia a los datos que se tienen en la mano. Cuando se
quiere ir ms all de los datos disponibles, es necesario inferir o
sea utilizar la Estadstica Inferencial. Como ella infiere el todo
(poblacin) a partir de la informacin que da una parte de ese
todo (muestra), el conocimiento que adquiere es incompleto y por
37
lo t a n t o n o t o t a lm e n t e c ie r t o e s d e c ir, s e d e b e t r a b a j a r c o n
probabilidades. Por ello, antes de estudiar las aplicaciones de la
Estadstica Inferencial es necesario estudiar probabilidades.
38
Te o r e m a d e l p r o d u c t o d e p r o b a b i l i d a d e s
La probabilidad de la interseccin es el producto de las
probabilidades:
Va r i a b l e a l e a t o r i a
Es aqulla cuyos valores estn determinados por los
resultados de un experimento aleatorio.
xi 1 2 3 4 5 6 Tot a l
P(xi) 1/6 1/6 1/6 1/6 1/6 1/6 1
donde C nx s o n l a s c o m b i n a c i o n e s d e n e l e m e n t o s t o m a d a s
de a x,
p= probabilidad de xito en una sola prueba,
q = 1- p = probabilidad de fracaso.
x
La combinaciones se calculan como sigue: Cn = (n.(n-1). (n-
2)...(n-x+1))/x!
Los parmetros que definen a la distribucin Binomial son n y
p
39
probabilidad en puntos sino que hay que hacerlo en intervalos.
Recurdese que en las variables discontinuas las probabilidades
de intervalos se obtenan sumando las probabilidades que
corresponden a cada punto o valor de la variable. En variables
continuas, los valores que puede tomar la variable son infinitos
por lo que es necesario hacer una suma infinita es decir una
integral. En las variables continuas, la probabilidad de un
intervalo se obtiene integrando la funcin de densidad.
0,30
f (x)
0,20
0,10
0,00 40
4 6 8 10 12 14
x
La distribucin normal presenta las siguientes caractersticas:
f ( x)dx
= 1
41
-5 -3 0 3 5
z
Ta b l a s d e l a d i s t r i b u c i n n o r m a l
El clculo de probabilidades en la normal involucra el
clculo de integrales que son muy engorrosas de resolver
manualmente. Por ello, las integrales estn tabuladas para una
d is t r ib u c i n n o r m a l q u e e s la e s t n d a r.
Se disponen de dos tablas de la distribucin normal: la tabla
1 o tabla de 1 cola y la tabla 2 o tabla de 2 colas.
Ta b l a d e 1 c o l a
En ella, los valores de probabilidad se encuentran en el
cuerpo de la tabla y los valores de z se forman utilizando la
primera columna y la primera fila (es decir en lo que se conoce
como matriz de la tabla). En esta tabla es importante considerar
el signo de z.
Como su nombre lo indica, para el valor de z considerado,
da el valor del rea bajo de la curva desde menos infinito hasta z.
Por ejemplo si z = -2.1 la tabla da P(z < -2.1) = 0.0179.
Ta b l a d e 2 c o l a s
Esta tabla est construda de manera diferente: en el cuerpo
de la tabla se encuentran los valores de z y en la matriz, los
valores de probabilidad. El nombre de dos colas se refiere a que
la tabla da el rea de las dos colas simtricas. Por ejemplo para
z = 0.51 corresponde P = 0.61. Esta probabilidad es la suma de
P(z < -0.51) y P(z>0.51).
42
Esta tabla es til cuando se quieren definir intervalos
centrales simtricos que corresponde a un porcentaje determinado
de la poblacin.
E l in t e r v a lo e n t o n c e s v a d e s d e 1 . 6 0 8 gr. a 2 . 3 9 2 g r.
CAPITULO IV
T E O R A E L E M E N TAL D E M U E S T R E O . E S T I M A C I N D E L A M E D I A
PO BLACIONAL POR I N T E R VAL O . ES TI MACI N DE LA
PRO PO RCI N PO BLACI ONAL.
43
m u e s t r a l e s p u e d e n s e r, d e a c u e r d o a lo q u e s e e s t e s t u d i a n d o :
parcelas, rboles, hojas, insectos, etc.
Muestra: Subconjunto de la poblacin constituida por n
unidades muestrales.
Para que una muestra pueda ser estudiada estadsticamente
debe ser seleccionada al azar: debe ser aleatoria.
Aqu es conveniente efectuar la siguiente observacin: una
unidad muestral puede estar definida por la naturaleza (como es
el caso de un rbol, una hoja, una rama, una plntula) o debe ser
definida por el tcnico: parcela (tamao y forma). A veces es
conveniente o ms cmodo elegir un grupo de unidades
muestrales, en este caso se habla de muestreo por
conglomerados.
La teora elemental del muestreo permite conocer que
sucede cuando se extraen muestras de una poblacin y por ende,
conocer las distribuciones muestrales (distribuciones que se
originan en el muestreo) y si las muestras han sido elegidas al
a z a r, s o n d is t r ib u c io n e s d e v a r i a b le s a le a t o r i a s . S u c o n o c im i e n t o
permite entonces, a partir de una muestra, inferir a la poblacin.
Parmetros y estimadores
Los parmetros son valores constantes bajo determinadas
condiciones. En una poblacin, por ejemplo, la media aritmtica y
la desviacin estndar constituyen parmetros de tendencia
central y de variabilidad respectivamente. En las poblaciones, sus
parmetros slo pueden ser conocidos cuando se efectan
censos:
N = tamao de la poblacin
i= N
N
i= N
desviacin estndar es (x i
- ) 2
.
= i 1
N
Pero como casi siempre es imposible realizar un censo, se
debe trabajar con los datos de una muestra. El tamao de la
muestra se designa con n. Los valores que se calculan en la
m u e s t r a , c o m o s u m e d i a y d e s v i a c i n e s t n d a r, s e lla m a n
estimadores estadsticos y se calculan con las siguientes
frmulas:
i= n i= n
i 1
xi (x x)
i 1
i
2
44
la seleccin aleatoria y con igual probabilidad.
El procedimiento cambia segn el problema que se estudie.
Cuando es posible identificar a todas las unidades muestrales
mediante un nmero, se seleccionan luego nmeros al azar de tal
manera que todos tengan igual probabilidad de ser seleccionados
(distribucin uniforme). Esto se puede hacer utilizando una tabla
de nmeros aleatorios o simplemente usando la funcin random
( azar en ingls) de las calculadoras (RND).
Supngase que se tiene una poblacin de tamao
N = 1000 y se desea extraer una muestra de tamao n = 10. La
funcin random generalmente trabaja de la siguiente manera: Se
da un nmero inicial que hace de semilla y la calculadora
internamente, con esa semilla, calcula un nmero al azar en una
distribucin uniforme que va desde 0 hasta 1. El nmero aleatorio
obtenido debe ser luego llevado hasta N mediante un simple
producto.
En el ejemplo de la poblacin de N = 1000, supngase que
el primer nmero elegido es 0.752. Multiplicado por N da 752 lo
que significa que la unidad muestral identificada con el nmero
752 debe ser incluida en la muestra. De esta manera se repite el
procedimiento hasta completar la muestra.
Una vez completada la muestra, se calculan los estimadores
x y S
x y S
en donde la flecha quiere decir estima. En el
muestreo al azar simple ambos son estimadores insesgados.
Insesgado significa que en promedio son iguales al
parmetro que estiman. Por ejemplo si sacamos todas las
nuestras posibles de tamao n de una poblacin, calculamos en
cada una de ellas x , la media aritmtica de las x , ser igual a
.
45
x ~ N ( , x )
x es la desviacin estndar de la poblacin de x y se
calcula como sigue:
x =
n
= x z x
46
Muchas veces es conveniente expresar el error de
estimacin E en relacin a la media x , en ese caso el error se
denomina porcentual o relativo y se lo calcula como:
E z z z CV%
E% = 100 = x 100 = 100 =
x x x n n
Va r i a b l e s c o n t n u a s : E s t i m a c i n d e p o r i n t e r v a l o s i e n d o
desconocido. La distribucin t de Student.
La situacin que hemos descripto es la menos corriente ya
que al ser un parmetro poblacional no es conocido. Es
entonces necesario estimarlo con el valor muestral S, por lo que
S
x t a m b i n s e r e s t i m a d o p o r Sx = . En esta situacin, y bajo
n
la condicin de que la variable x cuya media poblacional se est
x -
estimando tenga distribucin normal, la variable se
Sx
denomina t y tiene una distribucin que no es la Z ( normal
estndar) sino que se llama
t(n - 1) .
Ella constituye una familia de distribuciones con forma
simtrica y acampanada muy similar a la normal. Su semejanza
aumenta a medida que aumentan los grados de libertad (n - 1).
Los grados de libertad son el parmetro que la define. Se
dispone de una tabla de t, es una tabla de una cola.
Utilizando t, la forma de calcular el intervalo del ( 1 - )
% de confianza de la media poblacional es:
= x t (n - 1) S x
13.2019 cm
5.2898
22.0481 cm
47
necesaria para cometer un error determinado se hace utilizando
frmulas similares a las presentadas para el caso de tener
c o n o c i d o , p e r o c a m b i a n d o p o r s u e s t i m a d o r S y z p o r t ( n 1)
2 2
t S t CV%
n = =
E E%
Va r i a b l e s c u a l i t a t i v a s : E s t i m a c i n d e P p o r i n t e r v a l o ( c a s o e n
que la unidad de muestreo es el individuo)
p n
0.5 30
0.4 50
0.3 80
0.2 200
0.1 600
0.05 1400
1 p (1- p)
P = p ( z Sp ) donde Sp =
2n n
48
Va r i a b l e s c u a l i t a t i v a s : E s t i m a c i n d e P p o r i n t e r v a l o ( c a s o d e
muestreo por conglomerados)
En la mayora de las situaciones, el muestreo al azar simple
es incmodo y poco prctico para su aplicacin. Por ejemplo en
viveros, es mucho ms prctico seleccionar conjuntos de plantas
p a r a e s t u d i a r, p o r e j e m p lo e l p o r c e n t a j e d e a t a c a d a s . O , e n la
determinacin del poder germinativo, tomar conjuntos de semillas.
Este tipo de muestreo se denomina por conglomerados y se
distinguen en l dos casos:
a ) C o n g l o m e r a d o s d e i g u a l t a m a o y,
b) Conglomerados de distinto tamao
pt
P Sp
( n 1)
e n d o n d e p y Sp s o n l a m e d i a a r i t m t i c a y l a d e s v i a c i n e s t a n d a r
de la media aritmtica de las proporciones y se calculan de la
manera habitual:
p
p ; S S ; S (p p )
i p i
2
n1
p p
n n
Gru. 1 2 3 4 5 6 7 8 9 10
xi 42 36 48 45 39 42 32 35 42 43
pi 0.84 0.72 0.96 0.9 0.78 0.84 0.64 0.7 0.84 0.86
p
p = 0.808; S (p p ) 0.0976;
i i
2
n1
p
n
Sp 0.0976
Sp 0.0309
10 3.1623
49
variable de rboles. En este caso, para estimar P se usa un
estimador de razones, en el que se tiene en cuenta el hecho que
los datos provengan de conglomerados de distinto tamao. Si se
designa con yi al nmero de individuos que presentan el atributo
buscado en el conglomerado isimo , con x i al tamao del
conglomerado, P y SP se calculan como sigue:
y y ; S 1 ( S p S 2PS )
2 2 2
P i y x yx
x x
P
i
x n
Syx
( x x)( y y)
i i
n1
Se presentan como ejemplo a 10 parcelas de 300 m 2 con la
informacin del nmero total de rboles por parcela (x i) y el
nmero de rboles daados por parcela (y i). Estimar por intervalo
del 95% de confianza a la proporcin P de rboles daados.
Ta b l a 1 9 . Val o r e s d e l n m e r o t o t a l d e r b o l e s p o r p a r c e l a ( x i ) ,
nmero de rboles daados por parcela (yi) y columnas auxiliares
para el calculo .
S
2 ( x x) 334 37.1111
i
2
n 1
x
9
50
S2y
( y y) 9.6 10667
i
2
.
n1 9
Syx
( x x)( y y) 45 5
i i
n1 9
1 Sy p Sx 2PS yx
2 2 2
SP 2 ( )
x n
10067
. 0.208 2 * 37.1111 2 * 0.208 * 5
0.0097
25 2 * 10
51
CAPITULO V
G U I A D E E J E R C I TAC I O N
3.- Escriba tres series simples de datos (una para cada tipo de
variable), n = 10.
52
10 . - En la pla ni ll a d e cam po d el An exo 1 la colum n a t it ul a d a n b
contiene la informacin del nmero de brotes (ramitas) en el
f us t e. Agr up e a los 40 r bo le s se g n e st a var i ab le y pr es e nt e la
tabla correspondiente.
11. - R e p r e s e n t e m e d i a n t e e l g r f i c o a p r o p i a d o a l a t a b l a o b t e n i d a
en el ejercicio ant erior.
F u e n t e : S A G P YA, 1 9 9 8
18 . - D ur an t e la pr im er a sem an a d el m es d e Abr il d e 19 9 9 se
registraron las siguientes temperaturas diarias, medidas en
grados centgrados:
16 ; 16.1 ; 16.8 ; 18.8 ; 18.9 ; 18.3 ; 17.8
Cul es la temperatura promedio de esa semana?
53
250 3
300 4
Tot a l o p e r a r i o s 10
xi fi
0 80
1 60
2 30
3 25
4 10
2 2 . - Tod o s l o s e j e r c i c i o s q u e r e s o l v i a n t e r i o r m e n t e e n f o r m a
manual deber resolverlos ahora usando calculadora cientfica .
54
tabla
Lote 1 : 10 ; 2 ; 3 ; 2 ; 4 ; 2 ; 5
Lote 2 : 50 ; 12 ; 13 ; 12 ; 14 ; 12 ; 15
a) Calcule la Mediana en cada lote
b) Compare los resultados y emita una conclusin.
XI 0 1 2 3 4 5 9
fi 1 2 7 6 2 1 1
XI 0 1 2 3 4 5 9
fi 1 2 7 6 2 1 1
a ) C a l c u l e l a M e d i a A r i t m t i c a , D e s v i a c i n E s t n d a r , Var i a n c i a y
C o e f i c i e n t e d e Var i a c i n .
55
31.- La siguiente es una tabla donde se muestra las alturas de
lamos en una parcela de una plantacin del Dto. Capital, Sgo.
del Estero.
C L A S E S D E A LT U R A ( m ) fI
xI
1 - 4 1
4 - 8 3
8 - 12 4
12 - 16 14
16 - 20 5
Tot a l r b o l e s 27
xi (n de 1 2 3 4 Tot a l
puntos)
fi 200 180 320 300 1.000
3 7 . - D e u n m a z o d e 4 0 c a r t a s e s p a o l a s s e e xt r a e u n a a l a z a r.
Cul es la probabilidad de que: a) sea un oro o un basto? b)
sea un as o una espada.
56
distribucin de probabilidades de la variable x suponiendo que
sigue una distribucin binomial.
x
45.- El cambio de variable Z conduce a la normal
est ndar. a) Qu parm etr os def inen a esta distribucin?
57
a) rboles con dimetros menores a 57 cm?
b) rboles con dimetros mayores a 48 cm?
c) rboles comprendidos entre 45 y 55 cm?
d) entre qu valores se encuentra el 95% central de la
poblacin de dimetros?
5 3 . - Tom e u n a m u e s t r a d e 5 a l u m n o s , a n o t e s u a l t u r a y u t i l i c e e s a
muestra para estimar por intervalo del 95 % de confianza a la
altura media poblacional.
58
relativo a la mitad?
Bibliografa
Di Rienzo, J., Robledo, W., Guzm n, W., Balzarini, M.,
C a s a n o v e s , F., G o n z a l e z , L . , Tab l a d a , M . 2 0 0 1 . I n f o s t a t . M a n u a l
d e l u s u a r i o . Ve r s i n E s t u d i a n t i l .
Pea Snchez de Rivera, D. 1995. Estadstica. Modelos y
Mt o do s. Fu nd a m e n t o s. Alian za Uni ver si d a d t e xt os . 5 65 pp .
Pea Snchez de Rivera, D.(1995). Estadstica Modelo y Mtodos.
Vo l I I :
Di Rienzo, J., Robledo, W., Balzarini M., Diaz, M., Gonzalez, L.,
Tab l a d a , M . , c a s a n o v e s , F. 1 9 9 5 . E s t a d s t i c a p a r a l a s C i e n c i a s
Agropecuarias.
Cuadras, Carles M.(1990). Problemas de Probabilidades y
E s t a d s t i c a . Vo l I : P r o b a b i l i d a d e s . 4 1 1 p .
Cuadras, Carles M.(1990). Problemas de Probabilidades y
E s t a d s t i c a . Vo l I I : I n f e r e n c i a E s t a d s t i c a . 4 5 2 p .
Cochran, W. 1974. Tcnicas de muestreo. Cuarta Edicin.
Compaa Editorial Continental S.A. Mxico. 507 p.
F r e e s e , F. 1 9 7 0 . M t o d o s e s t a d s t i c o s e l e m e n t a l e s p a r a t c n i c o s
f o r e s t a l e s . C e n t r o R e g i o n a l d e Ay u d a T c n i c a . A g e n c i a p a r a e l
Desarrollo Internacional. Mxico. 102 p.
59
Anexo
60
61