Anda di halaman 1dari 27

METODOLOGIA ESTADISTICA

ANTONIO CAMPANA

Este
documento
ha
sido
elaborado
slo
con
fines
pedaggicos y su objetivo es
presentar algunos de los temas
esenciales que se ofrecen en el
Curso
403:
Metodologa
estadstica.

CELADE - SI-':.;/'.'
D o c I'/. .: :
SO G R

DOOPAL

i A c 1o w

P ;.;S u A C S O i.;

A M E R IC A

L A T IN A

EN

El objetivo de este documento es presentar, en forma sucinta,


los

principales

conceptos

tcnicas

investigacin en temas de poblacin.


establecer

la

relacin

entre

la

estadsticas -v^ara

la

Asimismo, se h a r ^ i n c a p i en
estadstica

Issr

ciencias

sociales, por un lado, y entre las variables de la poblacin y las


variables econmicas y sociales, por el otro.

ESTADISTICA DESCRIPTIVA

1. Escalas de Intervalo: medidas de tendencia central


El promedio es un valor tpico de un conjunto de datos. Los
promedios tambin reciben el nombre de medidas de tendencia central
o centralizacin,

puesto que

sus valores tienen

la tendencia a

ubicarse en el centro de un conjunto de datos que, a la vez, han


sido ordenados de acuerdo a su magnitud.
En las ciencias sociales destacan, principalmente, dos tipos
de medidas de tendencia central que se usan en la investigacin; la
media aritmtica y la mediana. Tambin se incluyen dentro de estas
tendencias el modo, la media geomtrica y la media armnica.

LA MEDIA ARITMETICA
La media aritmtica -o, simplemente, la media- de un conjunto
de N mmeros X^, Xg, Xj, ...., X, se indica con el smbolo X y se
define como:
hJ

X, + X 2 + ... + X

. 2 X,
L-

X =

N
en

la que

X, representa

segundo valor de

el primer valor

de

la variable,

la variable y as sucesivamente,

siendo X el

ltimo valor.

Propiedades de la media aritmtica:


1.-

La suma de las desviaciones de un conjunto de nmeros


respecto de la media ser siempre cero.

Xj el

Por ejemplo, la media de los nmeros 72, 81, 86 , 69 y 57 se


obtiene al sumar todos los nmeros y luego dividir por cinco; X=73.
Al restar la media de cada uno de las cifras y luego al sumar las
cifras restantes,

se verifica que la sumatoria es igual a cero.

Supongamos, en cambio, que hubisemos obtenido una media de 70. Al


restar sta de cada una de las cifras en cuestin nos daramos
cuenta que la media de 70 es errnea, puesto que la suma resultante
no es igual a cero.
X

X-73

X-70

81

-1
8

2
11

86

13

16

69

-4

-1

57

-16

-13

72

0
2 .

15

La suma de las desviaciones cuadradas de cada cifra dentro de


un conjunto de nmeros con respecto a la media es menor que la
suma de las desviaciones cuadradas con respecto a cualquier
otro nmero.
Es decir:

Z (Xj - X)^ = mnimo.


bi

(X-73)^

(X-70)^

72

81

64

121

86

169

256

69

16

57

256

169

506

551

Tomando los nmeros usados en el ejemplo anterior, se obtiene


que la suma de las desviaciones cuadradas respecto de la media es
menor (506) que la de cualquier otro nmero (551).

clculo de la media aritmtica de datos agrupados:


Cuando el nmero de datos es lo suficientemente grande, es ms
conveniente agrupar los datos en categoras o grupos y calcular la
media a partir de

la distribucin de

frecuencia resultante.

Al

efectuar los clculos se procede a tomar en consideracin ciertos


supuestos que facilitan o simplifican la labor estadstica. Por lo
tanto,

en el caso de la media se toman todos los casos como si

estuvieran concentrados
respectivos.

en

los puntos medios de

sus

intervalos

Estas simplificaciones conducen a ciertos grados de

inexactitud. Sin embargo, en la medida en que el nmero de datos


sea ms grande las distorsiones introducidas sern menores y menos
insignificantes. El clculo de la media de datos agrupados se puede
hacer a partir de dos mtodos: el mtodo largo y el mtodo corto.

La frmula del mtodo largo es la siguiente:

S f,m,.
X =

t-i

donde f, = nmero de casos de la categora i


m, = punto medio de la categora i
k

= nmero de las categoras

Ejemplo 1:
Lmites fijados

Puntos medios (m,)

fi

firn,

1950 - 2950

2450

17

41650

2950 - 3950

3450

26

89700

3950 - 4950

4450

38

169100

4950 - 5950

5450

51

277950

5950 - 6950

6450

36

232200

6950 - 7950

7450

21

156450

189

967050

967050
X =

= 5117
189

El mtodo corto se calcula de la siguiente manera:

X = X' +

iF i
N

donde

X' = media anticipada (corresponde al punto medio de uno


de los intervalos)
fi

nmero de casos de la categora i

d, = X, - X'
Escogemos 5450 como punto medio de un intervalo, puesto qe la
media debera ser un poco menor.

Ejemplo 2:
fijados

Puntos medios (mf)

f,d,

fi

1950

2950

2450

17

-3000

-51000

2950

3950

3450

26

-52000

3950

4950

4450

38

4950

5950

5450

51

5950

6950

6450

36

7950

8950

7450

21

-2000
-1000
0
1000
2000

-38000

0
36000
42000
-63000

189

(-63000)
= 5450 - 333

X = 5450 +

5117

189

LA MEDIANA
La mediana de un conjunto de nmeros ordenados en relacin a
su magnitud es el valor medio o la media aritmtica de los dos
valores medios.
Por ejemplo, para el conjunto de nmeros 3, 4, 4, 5, 6 , 8 , 8 ,

8 , 10 la mediana es 6 . En cambio, para el conjunto de nmeros 5, 5,


7, 9, 11, 12, 15, 18 la mediana se obtiene en la siguiente forma;
(9+11)/2=10.

Clculo de la mediana de datos agrupados:


El procedimiento para calcular la mediana de datos agrupados
se obtiene mediante interpolacin y se resume en la siguiente frmula:

N/2 Md = L

donde

X 1

Md

intervalo en que se encuentra la mediana

lmite inferior del intervalo que contiene la mediana

numero de casos

frecuencia acumulativa correspondiente al lmite


inferior

nmero de casos del intervalo que contiene la mediana

amplitud del intervalo que contiene la mediana

Para

obtener

el

clculo

de

la

media

aritmtica

de

datos

agrupados se requiere, en primer lugar, localizar el intervalo que


contiene el caso medio. En el presente ejemplo el nmero total de
frecuencias es 189, por lo que el caso medio equivale a 189/2 =
94.5. En segundo lugar se busca el intervalo que contenga el dato
medio. Dado que hay 81 casos por debajo de $4950 y 132 casos por
debajo

de

$5950,

la mediana

ha

de

quedar

en

algn

intervalo que va de $4950 a $5950.


fijados

f,-

1950

2950

17

17

2950

3950

26

43

3950

4950

38

81

4950

5950

51

132

5950

6950

36

168

7950

8950

21

189

189
94.5 - 81
Md

4950 +

X 1000

51

lugar

del

1000
4950 + 13.5
51
4950 + 265
=
Asimismo,
agrupados

se

hay
puede

que

$ 5215
tener

obtener

presente

restando

que

la mediana

cierta

cantidad

de datos
al

lmite

superior U. Para este caso la frmula es la siguiente:

F - N/2
Md = L

+ ----------- X i
f

en donde F representa la frecuencia acumulativa correspondiente al


lmite superior del intervalo. Por lo tanto,
132 - 94.5
Md

5950 +

1000

51
$5215

EL MODO
El modo de un conjunto de nmeros se define como aquel valor
que ocurre ms frecuentemente; es decir, el valor ms comn. Puede
ocurrir que un conjunto de nmeros no tenga modo o que ste no sea
nico.

10
Por ejemplo,
(i)

(ii)
(iii)

2 1 , 27, 63, 27, 65, 69


2 1 , 27, 63, 15, 65, 69
2 1 , 27, 63, 27, 63, 69

La primera serie de nmeros tiene un modo de 27, en cambio la


segunda serie no tiene modo. La tercera serie cuenta con dos modos:
el 27 y 63.
En caso de refiramos a una distribucin de frecuencias,

el

modo se representar por el punto ms alto de la curva. En cambio,


en una distribucin simtrica -que cuenta con un slo modo ubicado
en el centro de la curva- la media,

la mediana y el modo sern

idnticos.
Aquellas

series

de

nmeros

que

slo

cuenten

con

un

modo

recibirn el nombre de distribuciones unimodales; en cambio cuando


existan dos modos en una serie, las distribuciones se denominarn
bimodales.

LA MEDIA GEOMETRICA
La media geomtrica,

G, de un conjunto de N nmeros X,, Xg,

X 3 ,..., X^ es la raiz N del producto de los nmeros:

V,
X2X3X4____ X

Por ejemplo, la media geomtrica de los nmeros 2, 4, 8 es;

G = l{2) (4) (8 )

11
LA MEDIA ARMONICA
La media
Xj,...,

armnica,

H,

de un conjunto de N nmeros X,,

Xj,

X^ es el recproco de la media aritmtica del recproco de

los nmeros.
N
H =
S

X
Por ejemplo, la media

armnica de los nmeros 2, 4, 8 es;

H ------------1
_

1
+

----- 3.43.

1
_

7
_

2. Escalas de intervalo: medidas de dispersin


La dispersin o variacin de la informacin muestra el grado
en que los datos numricos tienden a esparcirse en relacin a un
valor medio. Existen varias medidas de dispersin, entre las cuales
podemos mencionar el rango,

la desviacin media y la desviacin

estndar.
EL RANGO
El rango de un conjunto de datos se define como la diferencia
entre el nmero mayor y el menor.
hayan agrupado,

En el caso que los nmeros se

se toma como recorrido

puntos medios de las categoras extremas.

la diferencia entre

los

12
Por ejemplo:
(i)

21, 27, 63, 27, 65, 69

(ii)

500

9500

El primer conjunto de datos presenta un rango equivalente a


48. En cambio el rango correspondiente al segundo conjunto de datos
equivale a 9000.
Como punto de referencia es conveniente precisar que el rango
se basa nica y exclusivamente en dos casos,

los cuales, adems,

son casos extremos. Suele suceder en problemas empricos que los


casos extremos no sean representativos del conjunto total de datos,
por lo que se crea una situacin de extrema delicadeza,

pues el

rango no seria un fiel representante de una medida de dispersin.

LA DESVIACION MEDIA
La desviacin media de un conjunto de datos se define como la
media aritmtica de las diferencias absolutas de cada valor de la
variable con respecto a la media.

iJ

.s
Es decir:

Desviacin Media =

ix,-x|

l- L

Por ejemplo:
La media de

los nmeros

72,

81,

8 6 , 69 y 57 es 73.

Para

obtener la desviacin media sustraemos la media -73- de cada uno de


los nmeros, se ignoran los signos, se suman los resultados y se
divide por el nmero de datos del conjunto.

13

7 2 - 7 3 + I 8 1 - 7 3 I + |8 6 - 7 3 + 6 9 - 7 3 | + 5 7 - 7 3 |

Desviacin Media =

1 + 8 + 13 + 4 + 16

42
=

Podemos,
difieren

por consiguiente,

8.4

decir que en promedio los datos

de la media en 8.4 unidades.

LA DESVIACION ESTANDAR
La desviacin estndar es la ms til y frecuente medida de
dispersin. Se define como la raz cuadrada de la media aritmtica
de las desviaciones cuadradas con respecto a la media.

-S
Es decir:

s =

(X,. - X)'

C'l

donde:

(X,- - X)^ =
s = desviacin estndar

14
Por ejemplo:
X,

(X, - X)

72

-1

81

64

86

13

169

69

-4

16

57

-16

256

X=73

506

(Xi -

s = \ 5 0 6 / 5 = VlOl.2 = 10.06

Una formula de clculo alternativa de la desviacin estndar


que tiene el beneficio de cometer menos errores de redondeo, por lo
cual se recomienda, es la siguiente:

fi 2
^
2
N E X, - (S X,)"

s =
N

c-i

c=l

Por ejemplo:
X,

X,

72

5184

81

6561

86

7396

69

4761

57

3249

365

27151

15

s = 1/5\/5 (27151) - (365)


= 1/5 V 1 3 5 7 5 5 - 133225
= 10.06

Otra medida de uso frecuente en las ciencias sociales es la


varianza, que se define como el cuadrado de la desviacin estndar.
Es decir:

2
Varianza

(X,

c'l

X)'

En algunos casos es necesario distinguir entre la desviacin


estndar de una poblacin

-a-

muestra de la poblacin -s-

la desviacin

. Por lo tanto,

estndar de una

la varianza de una

muestra y de una poblacin presentan la misma terminologa; s y a ,


respectivamente. Asimismo, es importante mencionar que en algunos
casos el denominador de la frmula de la desviacin estndar de una
muestra

se

define

principalmente,

como
que

(N-1)

el

en

valor

vez

de

obtenido

N.

Esto

representa

se

debe,

mejor

la

estimacin de la desviacin estndar de la poblacin de la cual se


obtuvo la muestra. Para valores grandes de N (N>30) prcticamente
no

existe

diferencia

entre

ambas

dispongamos de la poblacin total,

definiciones.

En

el

caso

que

se usa la siguiente frmula:

Desviacin estndar de una poblacin:

Desviacin estndar de una muestra:

16

Clculo de la desviacin estndar de datos agrupados:


Por ejemplo:
Limites verdaderos

Puntos medios

fi

d'i

f|d'i

f,d',

1950 - 2950

2450

17

-3

-51

153

2950 - 3950

3450

26

-2

-52

104

3950 - 4950

4450

38

-1

-38

38

4950 - 5950

5450

51

5950 - 6950

6450

36

36

36

6950 - 7950

7450

21

42

84

-63

415

189

K.

IC

s =
N

C--1

L -1

1000
s =

189(415) - (-63)'
189

s = 5.291
S = 5.291

y ? 8 4 3 5 - 3969
04466

s = 5.291 (272.885)
s = 1443.84 = 1444

17

3.- La Distribucin Normal

La nocin de distribucin de frecuencias pasa a ser parte


fundamental
lug^,

de la estadstica descriptiva,

dado que,

en primer

la curva normal se emplea generalmente para interpretar la

desviacin estndar y, en segundo lugar, por su significado terico


en la comprensin del mismo.

Areas bajo la curva normal:


La curva normal posee la propiedad de que, independiente de la
media o de la desviacin estndar que una curva presente, habr un
rea

constante

(o proporcin

de

casos)

entre

la

media

una

ordenada, que es una distancia determinada a partir de la media en


trminos de unidades estndar.
Al

colocarse

izquierda)

de

la

en

una

media,

desviacin

estndar

encontraremos

siempre

la

derecha

.3413

del

(o

rea

incluida entre la media y la ordenada en dicho punto. Por lo tanto,


dos

veces

dicha

rea,

.6826,

estar

incluida

entre

las

dos

ordenadas situadas a una desviacin estndar a ambos lados de la


media. Asimismo, el rea comprendida entre la media y la ordenada
a dos desviaciones estndar de aquella ser siempre .4773 y, por
tanto, el rea entre las dos ordenadas a dos desviaciones estndar
a ambos lados de la media ser .9546. Para fines prcticos se puede
decir que todos los casos estarn dentro del rea que va desde la
media hasta tres desviaciones estndar a ambos lados,

aunque la

curva

en

ambas

la

curva

normal

direcciones.

se
Es

extienda
importante

tericamente
tener

al

presente

infinito
que

aunque

normal proporciona una interpretacin de la desviacin estndar,


esta propiedad no puede emplearse para definir lo que se entiende
por desviacin estndar.

18

Tal vez el aspecto de mayor importancia de la distribucin


normal

es

que

resulta

posible

tomar

cualquier

curva

normal

transformar sus valores numricos de tal forma que pueda utilizarse


un simple cuadro para evaluar la proporcin de casos al interior de
cualquier intervalo deseado. Es decir:

X - X

z =

donde

Z: representa la desviacin con respecto a la media en


unidades de desviacin estndar; y
X: es el valor de la ordenada.

Por ejemplo:
Supongamos que tenemos una curva normal con una media de 50 y
una desviacin estndar de 10. Se desea obtener la proporcin de
casos que se encuentran en el

intervalo

50 a 65.

Para ello se

requiere precisar a cuntas desviaciones estndar se halla 65 de la


media 50.
65 - 50
Z =

= 1.5
10

Este procedimiento estipula que en tanto la distribucin de la


variable X es normal con una media de X y una desviacin estndar
de s, la nueva variable, en cambio, es normal con una media de cero
y una desviacin estndar de uno.

19

ESTADISTICA INDUCTIVA
l.~ Introduccin a la estadstica inductiva
Uno

de

los

comprensin de
entre

las

muestra,

aspectos

que

la estadstica

caractersticas

reviste

gran

inductiva es

propias

de

una

importancia
aquel

en

la

que distingue

poblacin

de

una

sta ltima obtenida de dicha poblacin o universo.

De

esta manera, las caractersticas de la poblacin se designarn como


parmetros;

en cambio,

estadsticos.

As,

las caractersticas

en

adelante

se

de

designar

la muestra,
la

media

como

de

la

poblacin con /i y la de la muestra con X; la desviacin estndar de


la primera con ct y la de la muestra con s.
Es importante tener presente que el objetivo primordial que se
persigue es obtener informacin acerca de la poblacin y no de una
muestra

cualquiera.

herramienta

de

La

muestra

conveniencia

se

sin

debe

comprender

importancia

en

como

una

misma.

Las

conclusiones que se obtengan -utilizando muestras escogidas- deben


estar basadas en una serie de parmetros de la poblacin. Como lo
ha

expuesto

Blalock

en

su

libro

Estadstica

Social:

"En

las

verificaciones de hiptesis formulamos supuestos a propsito de los


parmetros desconocidos, y preguntamos a continuacin cmo serian
nuestras

estadsticas

especficas

si

dichos

supuestos

fueran

correctos. Al proceder as, tratamos de decidir racionalmente si


los valores supuestos de dichos parmetros son o no razonables a la
vista de la evidencia de que disponemos .
Caracterstica de la poblacin:

parmetros

Caracterstica de la muestra:

estadsticos

Media de la poblacin:

Media de la muestra:

Desviacin estndar de la poblacin:

Desviacin estndar de la muestra:

20

2.** Pruebas de muestras simples


El teorema del lmite central;
Si de una poblacin normal con una media d e n
de

y una varianza

se extraen reiteradas muestras al azar, la distribucin de

seleccin de las medias de las muestras ser normal, con la media


/i y la varianza ct^/N.
En

otras

palabras,

respectivas medias X.
variar

con

respecto

alrededor de

se

obtienen

varias

muestras

con

sus

Cada una de estas medias de las muestras


al

resto,

pero

en

general

la verdadera media x de la poblacin.

se

agruparn

El teorema,

entonces, dice que un grfico de la distribucin de estas muestras


ser una curva normal.
Al

referirnos

las pruebas

estadsticas,

es ms

bien

la

distribucin de las muestras y no la poblacin original la que se


utiliza directamente en las pruebas de significacin. En resumen,
las medias

las

desviaciones

estndar

de

las

tres

clases

de

distribucin son como sigue:

Media
Poblacin

Muestra

Distribucin de las muestras

fx

El

teorema

del

lmite

central

Desviacin estndar

a/

pone

de

suponiendo que se hayan evitado distorsiones,

manifiesto

que,

puede tenerse ms

confianza en la apreciacin de la media de una muestra grande que


de una pequea.

21

La ley de los grandes nmeros:


si se extraen al azar diversas muestras de magnitud N de una
poblacin cualquiera (de la forma que sea) con una media de /i y una
varianza de a
las muestras

entonces, a medida que N crece,

la distribucin de

(que corresponden a las medias de las muestras)

se

aproxima a la normalidad, con la media /i y la varianza a^/N.


En otras palabras, por muy notable que sea la distribucin de
la que partimos, a condicin que N sea lo bastante grande, podemos
contar con una distribucin de la muestra aproximadamente normal.
Para comprender integralmente el teorema del lmite central y para
convencerse que el error estndar es realmente a/\[^, se extrae un
nmero

de

muestras

de

una

poblacin

cuya

media

desviacin

estndar son conocidas, luego se procede a calcular las medias de


las muestras y,

finalmente, se compara el resultado obtenido con

a f^ .
3.- Estimacin de intervalo
El procedimiento efectivo empleado para obtener una estimacin
de intervalo o,

lo que comnmente se designa como intervalo de

confianza, es el siguiente:
Primero

se decide acerca del riesgo

de

error

que

se

est

dispuesto a asumir al afirmar que el parmetro se sita en algn


punto al interior del intervalo si en realidad no es as.

En el

caso de intervalos de confianza nos referimos a la unidad menos la


probabilidad de error.

Esto

significa que tenemos

confianza de

estar en lo cierto, por ejemplo, el 95 por ciento de las veces. El


intervalo
estimacin

se

obtiene

del

punto

apartndose
cierto

en

ambas

mltiplo

de

direcciones
errores

de

la

estndar

correspondiente al nivel de confianza elegido. As, por ejemplo,


para apreciar la media \i de la poblacin obtenemos un intervalo
como sigue (tomando un nivel de confianza del 95 por ciento):

22

X 1.96

= X 1.96 ---

\jW
en donde 1.96 corresponde a la regin crtica de la curva normal,
usando el nivel de confianza equivalente a 95% y una prueba de dos
colas. Si X=15, a=5 y N=100, el intervalo de confianza sera;

15 1.96 ---

= 15 0.98

Vioo
en otros trminos el intervalo ira de 14.02 a 15.98. Por lo tanto,
sabemos

que

slo

un

5%

de

las

veces

obtendremos

con

este

procedimiento intervalos que no comprendan el parmetro.

El 95%

restante de

de una

muestra

lo

las veces

el procedimiento

suficientemente

cercanas

al

nos dar medias


parmetro

para

que

los

intervalos de confianza obtenidos comprendan efectivamente a ste.


Por ltimo, cabe recordar que el parmetro es un valor fijo y que
son los

intervalos los que varan de una muestra a otra.

escoge un nivel

de

confianza mayor,

existe ms

certeza

Si se
que

el

intervalo contiene nj pero, por otro lado, necesitamos un intervalo


mayor para tener un nivel mayor de confianza.

Tamao de la muestra:
Para tener un intervalo corto y que al mismo tiempo tenga un
nivel alto de confianza se tendr que aumentar el tamao de la
muestra. Tomando un ejemplo sencillo para facilitar la comprensin,
tenemos

que

se

desea

confianza de 95%.

calcular

Dado que

el

la

longitud

de

un

intervalo

intervalo es X 1.96

a / '/,

de
la

longitud total del intervalo es 2(1.96) a/yj. Si el investigador


desea que la longitud sea igual a 60, la ecuacin se puede resolver
de la siguiente manera:

23

2(1.96)120
60 =

v/n
2(1.96)120
\/

--------------- 7.84
60

n = 61.47 = 62.

Es importante tener presente que este procedimiento se puede


llevar a cabo debido a que el investigador conoce el valor de la
varianza de la muestra que decidi utilizar.

La distribucin t:
En

la mayor

parte

varianza se desconoce,

de

las

investigaciones

el

valor

de

la

lo que significa que debe ser estimada con

base en los datos. En general el investigador desconoce el valor de


a,

por lo tanto obtiene una estimacin de sta mediante el clculo

de s. Acto seguido se forma la cantidad t=(X-/i) / (s/ \^-l) , la que


ser utilizada en vez de z = { X - n ) / {a/>J) . El valor o la cantidad que
adquiere t no tiene una distribucin normal. La distribucin de t
es diferente para distintos valores de n, el tamao de la muestra.
Las reas bajo las curvas de distribucin para la cantidad t han
sido obtenidas y puestas en forma de una tabla. La primera columna
de la tabla en cuestin da a conocer un nmero que se denomina
grados de libertad. Este es el nmero que se us en el denominador
al calcular s^ n - 1 en este caso.

24
Intervalo de confianza para la inedia usando la distribucin t:
Cuando la desviacin estndar se estima de
intervalo de confianza para n,

la muestra,

un

la media de la poblacin, se forma

de la misma manera que cuando a se conoce, con la excepcin de que


s reemplaza a a y las tablas de distribucin t reemplazan a las
tablas

normales.

Al

conocer

a,

el

intervalo

de

confianza

donde z 95 seala el valor

equivalente a 95% para /x es X z


donde se ubica el 95% de las zetas

(^.95 ^ .96). Usando s, que ha

sido calculada de la muestra da X t^^s/\Jn-l, donde t 95 seala el


valor donde el 95% de las t se ubican en la distribucin t con n-1
grados de libertad.
Por ejemplo:
X=311.9 gramos
s^=20,392
s=142.8
n=17
Por lo tanto, el intervalo de confianza equivalente a 95% es:
142.8
311.9 t .95

d.f.= 16

142.8
311.9 2.120
\/6

311.9 2.120(35.7)
311.9 75.7
236.2 a 387.6 gramos

25
Este intervalo de confianza debe interpretarse de la siguiente
manera:

el investigador tiene un 95% de confianza de que n se

encuentra entre 236.2 y 387.6 gramos, puesto que si el experimento


se repitiera

-con una muestra

de

tamao

17-

usando siempre

la

frmula X t.,5S /\/n-l para formar un intervalo de confianza, el 95%


de los intervalos formados incluiran jn.
De

la misma

normales,

el

forma

que

se

efectu

investigador puede definir

equivalentes

distribucin

t.

95%

99%

mediante

De esta manera

el

podemos

con

las

distribuciones

intervalos de confianza
uso

de

la

estimar

tabla

de

la

la media

de

la

poblacin n dentro de lmites especificos de confianza.


Por ejemplo,

si -t 95 y t 95 son

los valores

de t para

los

cuales 2.5% del rea se ubica en cada cola de la distribucin t (5%


para ambos), entonces un intervalo de confianza equivalente a 95%
para t es:

X-n

-t .95

por

lo

que

\n-l

se puede estimar

<

t .95

que /i se ubicara

en el

siguiente

intervalo:
s
X - t 95

s
<

< X + t 9 5 -----

^ -1

\ n-l

con una confianza equivalente a 95%. Es importante tener presente


que t 95 representa el valor equivalente al 95 percentil.
En

general,

podemos

representar

medias de la siguiente manera:

limites

de

confianza

para

26

s
X t.
>/n-l

donde

los

valores

t^,

definidos

como

valores

crticos

coeficientes de confianza, dependen del nivel de confianza deseados


y del tamao de la muestra.
El nmero de grados de libertad de una estadstica se define
como el nmero N de observaciones
menos

el

nmero k

de parmetros

independientes en la muestra
de

la

poblacin

que

estimar basndose en las observaciones de la muestra.

Es decir:

V = N - K

se

deben

27
BIBLIOGRAFIA
Blalock

Jr.,

Hubert

M . , Estadstica

social. Fondo

de

Cultura

Econmica, Mxico, D.F., 1966.


Dixon,

Wilfred

J.

Y Massey

Frank J . , Introduccin

al

anlisis

estadstico. 2a edicin, Ediciones Castilla, Madrid, 1966.


Spiegel, Murray R . , Teora v problemas de estadstica. McGraw Hill,
Bogot, Colombia,

1977.

Anda mungkin juga menyukai