Anda di halaman 1dari 91

MAESTRA: CIENCIAS ADMINISTRATIVAS

MENCIN: GERENCIA GENERAL Y FINANZAS


ASIGNATURA: ESTADISTICA

INTEGRANTES

RAIFEL MORALES
EVELYN QUINTERO
YARIAM SANCHEZ
WILLIAM LEE

EL TIGRE, 12 DE AGOSTO DE 2017


INTRODUCCIN

En el presente trabajo se desarrollara el concepto de estimacin de parmetros y se


explicar la funcin de las pruebas de hiptesis y como aplicarlas. Una vez calculado el
estadstico de la muestra estamos en capacidad de usar la teora de la Estimacin para elegir
un estimador adecuado que nos permita inferir resultados sobre la poblacin de donde
proviene la muestra. Estos estimadores pueden darse de manera puntual o por intervalos. Y
para probar estos resultados disponemos de la Prueba de Hiptesis, lo que nos permitir
aceptar o rechazar afirmaciones planteadas a priori.

La Estimacin y la Prueba de Hiptesis son los componentes principales de la inferencia


estadstica. La teora de la Estimacin comprende un estudio detallado de la bsqueda de un
estimador (estadstico de la muestra, para el cual se construye su distribucin muestral),
digamos, del parmetro poblacional. Este estimador puede darse a travs de un valor
puntual, Estimador Puntual; por el contrario, puede darse a travs de un intervalo, llamado
Intervalo de Confianza. La estadstica nos dar las herramientas necesarias que
fundamenten la potencia de este estimador puntual o el nivel de confianza en el caso de la
estimacin por intervalo.

En el mbito del Mtodo Estadstico, se busca un estimador del parmetro poblacional por
que se desea comprobar, probar, verificar o contrastar una determinada Afirmacin,
Supuesto al cual se le denomina Hiptesis Nula, H0, contra otra Hiptesis llamada
Hiptesis de Trabajo o Hiptesis Alternativa, H1, proveniente de los resultados de la
Estimacin dando como resultado la Aceptacin o el Rechazo de la Hiptesis Nula.

La Estadstica descriptiva y la teora de la Probabilidad van a ser los pilares de un nuevo


procedimiento (Estadstica Inferencial) con los que se va a estudiar el comportamiento
global de un fenmeno. La probabilidad y los modelos de distribucin junto con las
tcnicas descriptivas, constituyen la base de una nueva forma de interpretar la informacin
suministrada por una parcela de la realidad que interesa investigar. En el siguiente esquema
representa el tema a tratar y que ser desarrollado a continuacin.
ESTIMACIN DE LA MEDIA POBLACIONAL

En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar un


valor aproximado de un parmetro de una poblacin a partir de los datos proporcionados
por una muestra. Por ejemplo, una estimacin de la media de una determinada caracterstica
de una poblacin de tamao N podra ser la media de esa misma caracterstica para una
muestra de tamao n.

La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos
mtodos que se usan en funcin de las caractersticas y propsitos del estudio:

Estimacin punctual.
o Mtodo de los momentos;
o Mtodo de la mxima verosimilitud;
o Mtodo de los mnimos cuadrados;
Estimacin por intervalos.
Estimacin bayesiana.

Estimador

Un estimador es una regla que establece cmo calcular una estimacin basada en las
mediciones contenidas en una muestra estadstica.

DEFINICIN Y CARACTERSTICAS DE LA ESTIMACIN PUNTUAL Y POR


INTERVALO

Estimacin puntual

Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una
frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado
grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la
talla media de los individuos. Lo ms importante de un estimador, es que sea un estimador
eficiente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o
eficiente (varianza mnima).

Estimacin puntual. Sea X una variable poblacional con distribucin F , siendo


desconocido. El problema de estimacin puntual consiste en, seleccionada una muestra X1,
..., Xn, encontrar el estadstico T(X1, ..., Xn) que mejor estime el parmetro . Una vez
observada o realizada la muestra, con valores x1, ..., xn, se obtiene la estimacin puntual de
, T(x1, ..., xn) = .

Vemos a continuacin dos mtodos para obtener la estimacin puntual de un parmetro:


mtodo de los momentos y mtodo de mxima verosimilitud.

Mtodo de los momentos: consiste en igualar momentos poblacionales a momentos


muestrales. Deberemos tener tantas igualdades como parmetros a estimar. Momento
poblacional de orden r r = E(Xr) Momento muestral de orden r ar = Xn i=1 Xr i n.
Mtodo de mxima verosimilitud: consiste en tomar como valor del parmetro aquel que
maximice la probabilidad de que ocurra la muestra observada. Si X1, ..., Xn es una muestra
seleccionada de una poblacin con distribucin F o densidad f(x), la probabilidad de que
ocurra una realizacin x1, ..., xn viene dada por: L(x1, ..., xn) = Yn i=1 f(xi).

A L(x1, ..., xn) se le llama funcin de verosimilitud.(credibilidad de la muestra


observada). Buscamos entonces el valor de que maximice la funcin de verosimilud, y al
valor obtenido se le llama estimacin por mxima verosimilitud de . Nota: si la variable X
es discreta, en lugar de f(xi ) consideramos la funcin masa de probabilidad p(xi).

Ejemplo:

Sea X N(, ), con desconocido. Seleccionada una m.a.s. X1, ..., Xn, con realizacin
x1, ..., xn, estimamos el parmetro por ambos mtodos. Segn el mtodo de los
momentos: E(X) = Xn i=1 Xi n = X, y al ser = E(X) se obtiene que = x. Por el
mtodo de mxima verosimilitud: L(x1, ..., xn) = Yn i=1 f(xi ) = = Yn i=1 1 2 e
(xi) 2 2.

Estimacin por Intervalos de conanza 109 y maximizamos en tal funcin; en este caso
resulta ms fcil maximizar su logaritmo: lnL(x1, ..., xn) = 1 2 2 Xn i=1 (xi ) 2 n
ln( 2) lnL(x1, ..., xn) = 1 2 Xn i=1 (xi ) = n x n 2 = 0 =

Estimacin por intervalos

Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro
estimado con una cierta probabilidad. En la estimacin por intervalos se usan los siguientes
conceptos:

Intervalo de confianza

El intervalo de confianza es una expresin del tipo [1, 2] 1 2, donde es el


parmetro a estimar. Este intervalo contiene al parmetro estimado con un determinado
nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no
garantiza un axioma o un equivalente circunstancial.

Variabilidad del Parmetro

Si no se conoce, puede obtenerse una aproximacin en los datos aportados por la literatura
cientfica o en un estudio piloto. Tambin hay mtodos para calcular el tamao de la
muestra que prescinden de este aspecto. Habitualmente se usa como medida de esta
variabilidad la desviacin tpica poblacional y se denota .

Error de la estimacin

Es una medida de su precisin que se corresponde con la amplitud del intervalo de


confianza. Cuanta ms precisin se desee en la estimacin de un parmetro, ms estrecho
deber ser el intervalo de confianza y, si se quiere mantener o disminuir el error, ms
observaciones debern incluirse en la muestra estudiada. En caso de no incluir nuevas
observaciones para la muestra, ms error se comete al aumentar la precisin. Se suele
llamar E, segn la frmula E = (2 - 1)/2.

Lmite de Confianza

Es la probabilidad de que el verdadero valor del parmetro estimado en la poblacin se


site en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-),
aunque habitualmente suele expresarse con un porcentaje ((1-)100%). Es habitual tomar
como nivel de confianza un 95% o un 99%, que se corresponden con valores de 0,05 y
0,01 respectivamente.

Valor

Tambin llamado nivel de significacin. Es la probabilidad (en tanto por uno) de fallar en
nuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-).
Por ejemplo, en una estimacin con un nivel de confianza del 95%, el valor es (100-
95)/100 = 0,05.

Valor crtico

Se representa por Z/2. Es el valor de la abscisa en una determinada distribucin que deja a
su derecha un rea igual a /2, siendo 1- el nivel de confianza. Normalmente los valores
crticos estn tabulados o pueden calcularse en funcin de la distribucin de la poblacin.
Por ejemplo, para una distribucin normal, de media 0 y desviacin tpica 1, el valor crtico
para = 0,1 se calculara del siguiente modo: se busca en la tabla de la distribucin ese
valor (o el ms aproximado), bajo la columna "rea"; se observa que se corresponde con -
1,28. Entonces Z/2 = 1,64. Si la media o desviacin tpica de la distribucin normal no
coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-)/ para su
clculo.

Con estas definiciones, si tras la extraccin de una muestra se dice que "3 es una estimacin
de la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos
interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una
probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando,
respectivamente, la mitad del error, para obtener el intervalo de confianza segn las
definiciones dadas.

Para un tamao fijo de la muestra, los conceptos de error y nivel de confianza van
relacionados. Si admitimos un error mayor, esto es, aumentamos el tamao del intervalo de
confianza, tenemos tambin una mayor probabilidad de xito en nuestra estimacin, es
decir, un mayor nivel de confianza.
ERROR MUESTRAL

Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media
poblacional , entonces la media muestral, como medida, conlleva algn error. Por
ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamao 25 de una
poblacin con media = 15: si la media de la muestra es x=12, entonces a la diferencia
observada x- = -3 se le denomina el error muestral. Una media muestral x puede
pensarse como la suma de dos cantidades, la media poblacional y el error muestral; si e
denota el error muestral, entonces:

Ejemplo 1.5

Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y 6, para


simular una poblacin "grande" de manera que el muestreo pueda realizarse un gran
nmero de veces, supondremos que ste se hace con reemplazo, es decir, el nmero elegido
se reemplaza antes de seleccionar el siguiente, adems, se seleccionan muestras ordenadas.
En una muestra ordenada, el orden en que se seleccionan las observaciones es importante,
por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra
(4,2), se seleccion primero 4 y despus 2. La siguiente tabla contiene una lista de todas las
muestras ordenadas de tamao 2 que es posible seleccionar con reemplazo y tambin
contiene las medias muestrales y los correspondientes errores muestrales. La media
poblacional es igual a:

= (2+4+6)/3 = 4. Ver la tabla en la siguiente pgina.

Notese las interesantes relaciones siguientes contenidas en la tabla:

La media de la coleccin de medias muestrales es 4, la media de la poblacin de la que se


extraen las muestras. Si x denota la media de todas las medias muestrales entonces
tenemos:

x = (3+4+3+4+5+5+2+4+6)/9 = 4

La suma de los errores muestrales es cero.

e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0

Muestras ordenadas x Error muestral e = x -

(2,2) 2 2 4 = -2
(2,4) 3 3 4 = -1

(2,6) 4 44=0

(4,2) 3 3 4 = -1

(4,4) 4 44=0

(4,6) 5 54=1

(6,2) 4 44=0

(6,4) 5 54=1

(6,6) 6 64=2

En consecuencia, si x se usa para medir, estimar, la media poblacional , el promedio de


todos los errores muestrales es cero.

Distribuciones Muestrales

Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia,
impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de
la misma poblacin tenga la misma media muestral o que sean completamente parecidas;
puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las
medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere
estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones
sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias
sobre las poblaciones se harn usando estadsticas muestrales. Como el anlisis de las
distribuciones asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad
de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro
poblacional desconocido.

Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le
puede considerar como una variable aleatoria con su correspondiente distribucin de
frecuencias.

La distribucin de frecuencia de un estadstico muestral se denomina distribucin


muestral. En general, la distribucin muestral de un estadstico es la de todos sus valores
posibles calculados a partir de muestras del mismo tamao.

Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin


grande. Se calcula la madia muestral x para cada muestra; la coleccin de todas estas
medias muestrales recibe el nombre de distribucin muestral de medias, lo que se puede
ilustrar en la siguiente figura:
Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se
calcula la deviacin estndar de cada una. La coleccin de todas estas desviaciones estndar
muestrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver
en la siguiente figura:

Ejemplo 1.6

Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2,


4 y 6. Encuentre:

, la media poblacional.

, la desviacin estndar poblacional.

x, la media de la distribucin muestral de medias.

x, la desviacin estndar de la distribucin muestral de medias.


Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de
medias.

Solucin:

a. La media poblacional es:

b. La desviacin estndar de la poblacin es:

c. A continuacin se listan los elementos de la distribucin muestral de la media y la


correspondiente distribucin de frecuencias.
La media de la distribucin muestral de medias es:

d) La desviacin estndar de la distribucin muestral de medias es:

De aqu que podamos deducir que:

Como para cualquier variable aleatoria, la dsitribucin muestral de medias tiene una media
o valor esperado, una varianza y una desviacin estndar, se puede demostrar que la
distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:

Distribuciones muestrales

Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral
se genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y
calculndoles a stas su estadstico.

Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de


medias ser normal sin importar el tamao de la muestra.

Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la


muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma
acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin
muestral de ser normal.
Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La
forma de la disitribucin muestral de medias sea aproximadamente normal, an en casos
donde la poblacin original es bimodal, es realmente notable.

ESTIMACIN DE LA MEDIA POR INTERVALO USANDO MUESTRAS


GRANDES

Se pueden usar distintos estimadores para estimar un mismo parmetro. Por ejemplo para estimar la
media poblacional se puede usar la media muestral, la mediana, la moda, el promedio entre el valor
ms chico y ms grande de la muestra, etc.

Cada estimador obtenido de muestras de tamao fijo n, vara con cada muestra que se toma. Por lo
tanto, los estimadores son variables aleatorias y pueden considerarse sus distribuciones muestrales
(similar a los estadsticos que se estudiaron la clase pasada).

La distribuciones de muestreo de los estimadores se usan para compararlos y decidir cul de todos
es el mejor. Se prefiere un estimador que tenga una distribucin muestral cuya media coincida con
el parmetro que se desea estimar y cuya extensin o dispersin (medida con la variancia) sea lo
menor posible.

Notacin. Si denota un parmetro entonces denotar la estadstica correspondiente.

Como dijimos anteriormente, se prefiere una estadstica que tenga una distribucin muestral cuya
media coincida con el parmetro que se desea estimar. Un estimador de este tipo se llama
insesgado.

Si es un estimador de un parmetro y si la media de la distribucin de es , es decir,

E( ) = ,

entonces se dice que es un estimador insesgado. De otra manera, se llama sesgado.

Si se calcula una vez lo ms probable es que se encuentre cerca de la media E( ). Entonces en
el primer caso lo ms probable es que se encuentre cerca de y en el segundo que sea ms grande
que .
Se prefiere una estadstica que adems tenga una distribucin muestral cuya extensin o dispersin
(medida con la variancia) sea lo menor posible. Nota: Para simplificar se habla de variancia del
estimador para referirnos a la variancia de la distribucin muestral del estimador.

Si se calcula una vez , en ambos casos, lo ms probable es que se encuentre cerca de la media E(

). Pero como la desviacin estndar del primero es menor que la del segundo, es ms probable
que en el primer caso se encuentre ms cerca de la media que en el segundo caso.

En base a lo anterior se elige de todas las estadsticas disponibles aquella con el menor sesgo y
variancia posible. Ms an, el mejor estimador posible es aquel que es insesgado y que de todos los
insesgados tiene la menor variancia, a este estimador se lo llama estimador insesgado de menor
variancia (EIMV).

En este curso definiremos poblaciones y los parmetros de inters y se dir en cada caso cual es el
estimador adecuado, su media y su desviacin estndar.

Ejemplos de estimadores insesgados.

Media muestral x (estimador insesgado de la media poblacional )


Si se seleccionan muestras aleatorias de n mediciones de una poblacin con media y desviacin
estndar , la distribucin de muestreo de x tendr media
E( x ) = .
y desviacin estndar
x =/ n.

Proporcin muestral p (estimador insesgado del parmetro p).


Si se seleccionan muestras aleatorias de n observaciones de una poblacin binomial, con parmetro
x
p, la distribucin de muestreo de la proporcin muestral p = tendr media
n
E( p ) = p
y desviacin estndar
pq
p =
n

Diferencia de medias x 1 x 2 (estimador insesgado del parmetro 12).


Se tienen dos poblaciones I y II con medias y desviaciones estndar (1, 1) y (2, 2),
respectivamente.
Se seleccionan en forma independiente muestras de tamao n1 para I y de tamao n2 para II.
Si x 1 y x 2 son las medias muestrales para tales muestras, entonces la distribucin de muestreo de
x 1 x 2 tendr media
E( x 1 x 2) = 12
y desviacin estndar
12 22
x x =
1 2
n1 n2
Proporcin muestral p 1 p 2 (estimador insesgado del parmetro p1 p2)
Se tienen dos poblaciones binomiales I y II con parmetros p1 y p2, respectivamente.
Se seleccionan en forma independiente muestras de tamao n1 para I y de tamao n2 para II.
Si p 1 y p 2 son las proporciones muestrales de tales muestras, entonces la distribucin de muestreo
de p 1 p 2 tendr media
E( p 1 p 2) = p1 p2
y desviacin estndar
p1q1 p 2 q2
p p =
1 2

n1 n2

Observar que en cada caso, se toma como estimador la estadstica que corresponde al parmetro que
se quiere estimar.

La media muestral, la proporcin muestral, la diferencia de medias muestrales y la diferencia de


proporciones muestrales tienen una distribucin de muestreo que se aproxima a una normal cuando
el tamao de la/s muestra/s es grande. Como regla prctica se supone que esto se cumple cuando n
30.

Teniendo en cuenta esto y como estamos interesados en muestras grandes, en adelante supondremos

que n 30, y que trabajamos con un estimador insesgado de que tiene una distribucin normal.

Una manera de evaluar la bondad de una estimacin puntual es a travs de la distancia entre el
estimador y el parmetro. Esta cantidad se denomina

Error de estimacin. | |.
Como se desea que este error sea lo menor posible, interesa saber si es menor que una cierta cota
que se suele expresar en trminos de la desviacin estndar del estimador:

Cota para el error de estimacin. c .


Ahora bien, no se puede saber si | | < c pues desconocemos . Sin embargo, conociendo las

caractersticas de la distribucin de , se puede calcular la probabilidad de que | | < c , es
decir,

P(| | < c )

Por ejemplo, si c = 1.96 y suponiendo que la distribucin de es normal,

P(| | < 1.96 ) = 0.95
En la siguiente figura aparece el rea correspondiente.
Ejemplo. Se quiere estimar la media de una poblacin. Se toma una muestra de tamao n = 50 y
se obtiene x = 9.1, s = 0.24. Dar una estimacin para y evaluar la exactitud de la estimacin
con c = 1.96.

Parmetro
Estimador x (insesgado E( x ) = y tiene una distribucin de muestreo normal si el tamao de la
muestra es grande).
Estimacin para : 9.1.
Cota para el error de estimacin (usando s para aproximar ):
1.96 x = 1.96 / n 1.96 s / n = 1.96 0.24 / 50 0.07.
Como
P(| x | < 1.96 x ) = 0.95 P(| x | < 0.07) = 0.95

podemos decir que la probabilidad de que el error de estimacin sea menor que 0.07 es de 95%.
En la siguiente figura aparece el rea correspondiente.
ESTIMACIN DE LA MEDIA POR INTERVALO USANDO MUESTRAS
GRANDES CON VARIANZA POBLACIONAL CONOCIDA Y CON VARIANZA
POBLACIONAL DESCONOCIDA

Supongamos que disponemos de una poblacin en la que tenemos una v.a. con distribucin
N( ,) con conocida (de estudios previos, por ejemplo). Obtenemos una muestra
de tamao n y deseamos estimar la media de la poblacin.

El estimador puntual de la misma es la media muestralcuya distribucin muestral es


conocida

El estimador puntual de la misma es la media muestral cuya distribucin muestral es


conocida

la cantidad

tendr distribucin normal estndar.

Sobre la distribucin N(0 , 1) podremos seleccionar dos puntos simtricos -z yz ,


tales que

Figura 1: Seleccin de los puntos crticos para el cculo del intervalo de confianza.
Sustituyendo Z por su valor en este caso particular

Despejando la media muestral y la varianza

que verifica las condiciones de la definicin.

As, el intervalo de confianza para la media puede escribirse como

en la prctica, de todos los posibles valores de tenemos uno slo y por tanto un nico
intervalo de todos los posibles para distintas muestras

La importancia del intervalo de confianza para la estimacin est en el hecho de que el


intervalo contiene informacin sobre el estimador puntual (valor central del intervalo) y
sobre el posible error en la estimacin a travs de la dispersin y de la distribucin muestral
del estimador. Observese que el error en la estimacin est directamente relacionado con la
distribucin muestral del estimador y con la varianza poblacional, e inversamente
relacionado con el tamao muestral.

El grfico siguiente ilustra la interpretacin del nivel de confianza para el intervalo de


confianza para la media de una distribucin normal con varianza conocida. Para los
distintos posibles valores de la media, representados mediante su distribucin muestral,
obtenemos distintos intervalos de confianza. La mayor parte incluye al verdadero valor del
parmetro, pero el resto no. Concretamente el 95% lo incluye y el 5% no, si el nivel de
confianza es del 95%.

En la prctica disponemos de una nica repeticin del experimento, y por tanto de un nico
intervalo de confianza, el sealado en negro en el grfico, por ejemplo. Confiamos en que
nuestro intervalo sea de la mayora que con tiene al verdadero valor objetivo aunque no
tenemos la seguridad de que sea as, tenemos concretamente un riesgo del 5% de
equivocarnos.
Figura 2: Interpretacin del nivel de conmfianza en el intervalo para la media de una
distribicin normal.

LONGITUD DEL INTERVALO Y ERROR EN LA ESTIMACIN

En la prctica hemos de tratar de que la longitud del intervalo de confianza sea lo ms


pequea posible, es decir, que el error en la estimacin sea lo mas pequeo posible.

Esto puede conseguirse modificando las distintas cantidades que aparecen en la frmula: el
nivel de confianza, a travs del valor crtico, la variabilidad y el tamao muestral.
Estudiaremos cada una por separado

-NIVEL DE CONFIANZA

La longitud del intervalo de confianza aumenta al aumentar el nivel de confianza ya que el


valor crtico de la distribucin es mayor. Si consideramos un nivel de confianza del 100%,
el intervalo de confianza ser que, evidentemente contiene al verdadero valor del
parmetro pero no es de ninguna utilidad en la prctica. Si disminuimos el nivel de confinza
tambin disminuye la longitud, sin embargo conviene mantenerlo en unos lmites
razonables que suelen ser del 95% o del 99% en la mayor partede las aplicaciones.

-VARIANZA

La longitud del intervalo de confianza disminuye con la varianza, es decir, la estimacin


ser ms precisa cuanto menor sea la variabilidad en la poblacin, lo que significa que la
poblacin es ms homognea. En la prctivca es posible obtener estimaciones ms precisas,
por ejemplo, restringiendo la poblacin a conjunts lo m,s homogneos posible.

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION NORMAL CON


VARIANZA DESCONOCIDA

La situacin prctica ms habitual es aquella en la que no se conoce la varianza de la


poblacin, que habr que estimar a partir de los datos muestrales. Utilizaremos la cuasi-
varianza muestral como estimador por sus buenas propiedades.

La distribucin muestral asociada a la cuasi-varianza es la siguiente:

Teniendo en cuenta la distribucin normal asociada a las medias y combinndola con la ji-
cuadrado, obtenemos una distribucin t de Student:

Siguiendo el mismo proceso que en el caso de la normal el intervalo de confianza resulta

Obsrvese la similitud con el intervalo calculado para la distribucin normal, salvo en el


valor crtico y en que la varianza ha sido estimada a partir de la muestra.
Desde el punto de vista prctico esto implica que los valores crticos son un poco ms
grandes y, por tanto el intervalo tiene mayor longitud, este es el precio que debemos pagar a
cambio de no conocer la varianza de la poblacin.

Cuando el tamao muestral es grande, la distribucin t es muy similar a la normal, de forma


que pueden intercambiarse los valores crticos correspondientes. El intervalo de confianza
para la media en muestras grandes se puede escribir como

DETERMINACIN DEL TAMAO DE MUESTRA PARA ESTIMAR LA MEDIA


POBLACIONAL

Supngase que un investigador est interesado en estimar la media de una poblacin


normal de forma que la diferencia existente entre la media muestral que obtenfdr del
experimento y la media poblacional verdadera, est por debajo de un error prefijado de
antemano.

Teniendo en cuenta el intervalo de confianza

podemos escribir

Despejando n de la igualdad
obtenemos la expresin deseada para el tamao muestral.

Obsrvese que n ha sido calculado en el supuesto de que la variabilidad es conocida. Si no


es as, la variabilidad aproximada puede obtenerse de trabajos bibliogrficos o
experimentos previos o a partir una muestra piloto con unas pocas observaciones.

Obsrvese que en el clculo del tamao muestral se han igualado el error fijado a priori con
el error en la estimacin obtenido del intervalo de confianza y que este ltimo incluye el
nivel de confianza. En este aprtado un nivel de confianzadel 95%, por ejemplo, implicaria
que en el 95% de las veces que repitieramos el experimento con el tamao muestral
calculado, obtendramos un error por debajo del prefijado, mientras que en el 5% restante
obtendramos un error superior.

USO DE PROGRAMAS DE COMPUTACIN

Anlisis de una muestra con el SPSS

En este apartado describimos el uso del SPSS para el anlisis de una muestra mediante
la obtencin de intervalos de confianza y la resolucin de contrastes de hiptesis, todos
ellos referidos a la media de la poblacin de la que proviene la muestra.

Una vez abierto un banco de datos, por ejemplo AMBIENTE, podemos invocar el
Procedimiento:

Prueba T para una muestra, eligiendo el men Analizar/Comparar medias/Prueba T


para una muestra, con lo que aparece la siguiente pantalla:
Esta pantalla nos permitir obtener intervalos de confianza y resolver contrastes para las
medias de aquellas variables que seleccionemos y, con el puntero, situemos en la ventana
de Contrastar Variables. Por su parte, el Valor de prueba nos permite introducir el punto
crtico que define la hiptesis nula (0). Por ltimo, si seleccionamos Opciones aparece
una ventana en la que podemos introducir el coeficiente (porcentaje) de confianza deseado
para el intervalo. Por defecto es del 95%.

Se activa, entonces, el botn Aceptar, y al pulsarlo, el SPSS muestra en el Visor de


resultados, bajo el ttulo de Estadsticos para una muestra, el tamao de la muestra, la
media, la desviacin tpica y el error tpico de la media. A continuacin, bajo el ttulo de
Prueba para una muestra, encontramos el estadstico del contraste (t), los grados de libertad
(gl), el p-valor bilateral (Sig (bilateral) ), la diferencia de medias, el error tpico de la
diferencia, un intervalo de confianza para la diferencia -0. (Por ejemplo, los
resultados siguientes se obtinen seleccionando la variable PH con un valor de prueba 7).

Estadsticos para una muestra

Prueba para una muestra

Es importante tener en cuenta que el contraste que realiza el SPSS es el siguiente:

por lo que el p-valor aparece como sig.(bilateral), es decir, corresponde siempre al


contraste bilateral o no direccional. Por tanto, si el problema que queremos resolver
involucra un contraste unilateral o direccional debemos adaptar dicho p-valor.

La Prueba T es vlida siempre que el tamao muestral sea suficientemente grande o, en


caso contrario, cuando la muestra provenga de una poblacin con distribucin
normal. En la siguiente Seccin veremos como comprobar si se satisface esta ltima
condicin.

Ejercicio:
En estudios previos se concluy que el nivel medio de sulfato era de 5.1. Confirman los
datos del fichero AMBIENTE las conclusiones de dichos estudios?

ESTIMACIN DE LA PROPORCIN POBLACIONAL

Es frecuente, en los sondeos de opinin, investigar las preferencias de la poblacin por una
determinada opcin A, frente a otra opcin B.

Por ejemplo : qu proporcin de posibles votantes optan por un candidato A frente a otro
B?.

Otras veces interesa saber, qu proporcin de individuos de una poblacin, presentan una
caracterstica A, frente a los que no la presentan.

En cualquier caso, como normalmente no podemos estudiar a todos los individuos de una
poblacin porque, o es muy caro o sencillamente es imposible, tenemos que tomar una
muestra

Estudiamos la proporcin de individuos que presentan la caracterstica, objeto de estudio,


en la muestra que hemos tomado, as tenemos la proporcin de la muestra, que
representaremos por P ( p mayscula) ; en general, no coinciden la proporcin de la
poblacin, p y la proporcin de la muestra P

Sea la muestra que hemos tomado, de n individuos, si al individuo que presenta la


caracterstica objeto de estudio, le asignamos el valor 1 y al que no la presenta le asignamos
el valor 0, tenemos el parmetro de la muestra Sj, que representa el nmero j de individuos
de la muestra, que presentan la propiedad objeto de estudio.

La proporcin de la muestra, P, es:

Si tomamos aleatoriamente muestras de tamao n, el parmetro Sj de las muestras sigue,


una distribucin binomial b(n,p), donde p es la proporcin de la poblacin.

Y podemos definir la variable xj :

Que tambin sigue una distribucin binomial y que bajo ciertas condiciones, se puede
aproximar por una distribucin normal estndar.
Como :

Y xj se ajusta a una distribucin normal estndar, la proporcin de las muestras de tamao


n, P sigue una distribucin normal, de media p (proporcin de la poblacin) y desviacin
tpica :

<="" p="">

As pues, el valor ms esperado (la media) de las proporciones de las muestras ,P, es la
proporcin de la poblacin p y adems cuando aumenta el tamao de las muestras, P
se aproxima a p.

Estimacin puntual de la proporcin de la poblacin

La proporcin de la muestra, P, es un buen estimador para la proporcin de la poblacin, p.


En los prrafos anteriores hemos visto, como, bajo ciertas condiciones, la distribucin de P
, cuando n aumenta, tiende a una distribucin normal de media p y desviacin tpica :

En la prctica, las concidiones que se consideran suficientes para que la estima sea
aceptable, son :

Sabemos como se distribuyen las proporciones muestrales, slo desconocemos la


proporcin de la poblacin. Si supiramos la proporcin de la poblacin, podramos
calcular un intervalo, alrededor de la media de las proporciones de las muestras (proporcin
de la poblacin) , tal que con una probabilidad dada, las proporciones de las muestras
estuvieran dentro de ese intervalo.

Por ejemplo, supongamos que queremos que la probabilidad de que la proporcin de una
muestra est dentro de un intervalo a calcular, sea de 0,95; slo tenemos que tipificar P y
mediante la tabla de la distribucin normal estndar, calcular tpara = 1-0,95=0,05.
Como no conocemos la proporcin de la poblacin, p, la sustituimos por la proporcin
de la muestra, P, con lo cual el intervalo ser diferente para cada muestra, pero, con
probabilidad 1- , la proporcin de la poblacin, estar dentro del intervalo as
calculado y tendremos una estimacin de la proporcin de la poblacin por un
intervalo.

Estimacin de la proporcin de la poblacin por un intervalo

El intervalo de confianza, para la proporcin de una poblacin, con un nivel de confianza


de 1-, teniendo la proporcin, P, de una muestra de tamao n, es :

Donde t queda determinado en la tabla de la distribucin normal estndar en funcin de .

Error mximo con una confianza de 1-

Tamao de la muestra
DETERMINACIN DEL TAMAO DE MUESTRA PARA ESTIMAR UNA
PROPORCIN POBLACIONAL

A partir de la frmula para el intervalo de confianza

podemos determinar el tamao muestral necesario con el fin de que la precisin de la


estimacin sea la deseada con antelacin. La frmula que resulta es

donded es el radio mximo deseado para el intervalo y z/2 tiene el significado habitual.
Ntese que no hemos tenido en cuenta el ltimo trmino de la primera expresin.

La aplicacin efectiva de la frmula obtenida requiere el conocimiento de p y de q = (1


p), valores que nos son desconocidos en la prctica. Para solventar este problema tenemos
dos alternativas:

Considerar el caso ms desfavorable posible, es decir, aquel que verifique que p


q da el valor mximo posible. Es fcil verificar que esto sucede si p = 0,5. En este
caso el producto es p q = 0,25.

Utilizar un valor de referencia obtenido a partir de una muestra piloto o a partir de


datos bibliogrficos y utilizar el valor compatible con la informacin ms cercano a
p = 0,5.

A partir de la frmula puede comprobarse que el tamao muestral requerido, una vez fijada
p, crece al incrementarse la confianza del intervalo y crece tambin al incrementarse la
precisin (al disminuir el radio).

Con el programa siguiente podemos calcular los tamaos muestrales necesarios para
conseguir una precisin determinada bajo diferentes supuestos.

Seleccionar: la mxima diferencia admisible (el radio del intervalo), el nivel de


confianza del intervalo y el valor estimado para el parmetro p.

Si no se posee estimacin previa para la p, hay que dejar el valor por defecto p = 0,5.

DEFINICIN DE PRUEBAS DE HIPTESIS


Para ilustrar los conceptos generales, considere el problema de la rapidez de combustin del
agente propulsor presentado con anterioridad. La hiptesis nula es que la rapidez promedio
de combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50
cm/s. Esto es, se desea probar:

Ho; = 50 cm/s

H1; 50 cm/s

Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se
observa cual es la rapidez de combustin promedio muestral. La media muestral es un
estimador de la media verdadera de la poblacin. Un valor de la media muestral que este
prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero valor de la
media es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula Ho. Por otra
parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la
hiptesis alternativa H1. Por tanto, en este caso, la media muestral es el estadstico de
prueba.

La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si <48.5 >51.5,
entonces se acepta la hiptesis alternativa H1; 50 cm/s.

Los valores de que son menores que 48.5 o mayores que 51.5 constituyen la regin
crtica de la prueba, mientras que todos los valores que estn en el intervalo 48.5 51.5
forman la regin de aceptacin. Las fronteras entre las regiones crtica y de aceptacin
reciben el nombre de valores crticos. La costumbre es establecer conclusiones con
respecto a la hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de
prueba cae en la regin crtica, de lo contrario, no se rechaza Ho.

EL USO DE LAS PRUEBAS DE DECISIN ESTADSTICA EN INVESTIGACIN


EDUCATIVA

Habitualmente se acepta que la Estadstica resulta una herramienta de trabajo til en la


investigacin educativa en la medida en que ofrece tcnicas y procedimientos que pueden
ser aplicados en la etapa de anlisis de datos. Aceptando que sta es la aplicacin de mayor
peso en el contexto de la investigacin educativa.

a) Planteamiento del problema y formulacin de hiptesis

La Estadstica est presente en la formulacin del problema de investigacin. El proceso de


investigacin constituye un todo interrelacionado en el que las decisiones sobre cualquiera
de los elementos suponen condicionantes de cara a los restantes elementos del proceso.
Desde esta perspectiva, la formulacin del problema determinar en buena medida el tipo
de datos que es necesario recoger, las tcnicas de recoleccin adecuadas para ello y los
procedimientos estadsticos que se utilizarn en el anlisis. Por otra parte, entre las
caractersticas que debe poseer cualquier problema de investigacin se encuentra su
resolubilidad, aspecto que a veces slo queda garantizado si contamos con tcnicas
estadsticas adecuadas, capaces de abordar los interrogantes de partida. Por ejemplo, el
planteamiento de problemas que supongan comparaciones entre mltiples grupos no podra
hacerse sin contar con tcnicas como el anlisis de la varianza; un gran nmero de
problemas de investigacin en los que se incluyen mltiples dimensiones o variables
simultneamente de hecho no han llegado a ser estudiados hasta contar con tcnicas de
anlisis multivariante que permiten abordarlos.

El mismo argumento podra utilizarse para justificar la presencia de la Estadstica en la


formulacin de hiptesis. La formulacin de hiptesis no puede hacerse de espaldas a
consideraciones acerca de las tcnicas estadsticas que permitirn su contrastacin. Como
afirman Arnal, Del Rincn y Latorre (1992), el investigador se ve en la necesidad de
salvaguardar la coherencia entre la teora, la hiptesis y el posterior anlisis estadstico que
le permitir aceptarla o rechazarla. En el marco de los programas de investigacin
positivistas la hiptesis cientfica, para ser contrastada, suele ser expresada en trminos
estadsticos, dando paso a la aplicacin de tcnicas para el contraste de hiptesis.

En el planteamiento del problema y la posterior formulacin de hiptesis han de tenerse en


cuenta tanto el marco terico como los trabajos previos realizados sobre el mismo tema, a
cuya revisin podran contribuir tcnicas de metaanlisis, aplicadas a la sntesis e
interpretacin tanto de los resultados obtenidos en la investigacin como de los mtodos
utilizados para ello (Gmez Benito, 1987; Snchez y Ato, 1989). Los resultados a los que
nos conduce el metaanlisis son sntesis de los obtenidos en las diferentes investigaciones
realizadas sobre un tema, nos informan sobre el rigor de la misma, los mtodos empleados,
la representatividad de las muestras, la fiabilidad y validez de los estudios. Una va para
determinar las tendencias dominantes en el modo de abordar el estudio de un tema, los
aspectos del mismo que son objeto de mayor atencin por parte de la comunidad cientfica,
o los autores que por encontrarse entre los ms citados gozan de mayor autoridad, la
constituye la utilizacin de revisiones bibliomtricas, en las que a travs de estudios
estadsticos se pueden poner de manifiesto las tendencias que se dibujan en publicaciones o
investigaciones sobre un tema. Las bases documentales informatizadas permiten con
facilidad realizar estadsticas acerca del nmero de registros relativos a diferentes tpicos,
lo cual nos aporta cierta aproximacin a la importancia y relevancia de distintos objetos de
investigacin o modos de abordarlos a lo largo de una determinada poca.

Todo este tipo de resultados estadsticos en ningn modo sustituyen a la revisin exhaustiva
de la literatura y el estudio del marco terico-conceptual en el que se inscribe el trabajo de
investigacin, pero constituyen una informacin complementaria en manos del investigador
a la hora de concretar el objeto de inters y fundamentar su estudio.

Por otra parte, a veces la formulacin del problema no se apoya slo en resultados de
investigaciones anteriores, sino que el investigador recurre a trabajos descriptivos previos o
estudios pilotos, en los que el empleo de la Estadstica puede contribuir a clarificar el
problema en estudio. Los resultados de una descripcin estadstica acerca de determinadas
variables implicadas en algn fenmeno educativo, podran dar pie a que se formularan
hiptesis en las que se contemple la relacin entre variables; y estudios basados en la
obtencin de medidas estadsticas de correlacin entre variables facilitaran el
planteamiento de problemas y la formulacin de hiptesis que suponen relaciones de
causalidad. Tatsuoka y Tiedeman (1963), en su trabajo sobre la Estadstica en el mtodo
cientfico, insisten en esta posibilidad, afirmando el papel de las tcnicas estadsticas en el
desarrollo de constructos tericos e hiptesis acerca de las relaciones entre ellos. De este
modo, la Estadstica est presente en la fase inductiva del mtodocientfico, contribuyendo
a la creacin de modelos tericos a partir de los cuales se deducirn hiptesis contrastables
que relacionan variables observables.

b) Diseo de investigacin

La Estadstica forma parte de los diseos de investigacin experimentales. Como es sabido,


en el concepto de diseo es posible contemplar de un lado la organizacin de los aspectos
que constituyen el experimento y, de otro, el procedimiento estadstico que har posible la
interpretacin de los resultados (Fisher, 1953). Para Kerlinger (1981:214), el principio
estadstico en el que descansa el diseo es maximizar la varianza sistemtica, regular la
varianza sistemtica extraa y minimizar la varianza de error. Las tcnicas estadsticas
constituyen una parte contemplada en el diseo del experimento en la medida en que
facilitarn el anlisis de los datos y posibilitarn el control de la varianza debida a variables
extraas. Si dentro del diseo del experimento se consideran grupos experimentales y
grupos control, que antes de la aplicacin de los tratamientos han de ser equivalentes, el
investigador necesitar recurrir a tcnicas estadsticas para el contraste de hiptesis acerca
de la existencia de diferencias entre los grupos y comprobar de ese modo la equivalencia
pretendida.

Adems, la Estadstica est presente cuando el diseo incluye la seleccin de sujetos. La


teora de muestras proporcionar tanto los procedimientos de seleccin como la
determinacin del tamao muestral necesario para mantener el error y la confianza dentro
de lmites aceptables.

La recoleccin de datos es una tarea en la que aparentemente no parecen jugar un papel las
tcnicas estadsticas. Sin embargo, la Estadstica est de manera implcita presente si
consideramos el modo en que se elaboran los instrumentos utilizados para la recogida de
datos (tests, cuestionarios, protocolos de observacin, etc.). A esta disciplina corresponde
un papel crucial en la construccin de tales instrumentos, dado que las tcnicas estadsticas
estn en la base de los procedimientos por los cuales se analizan sus caractersticas
tcnicas. Por citar algunos ejemplos, la determinacin de la fiabilidad y validez de algunos
instrumentos se apoya directamente en coeficientes de correlacin; la aplicacin de tcnicas
de anlisis de componentes principales o anlisis factorial permite explorar o confirmar la
dimensionalidad de los instrumentos; los mtodos para el anlisis de items, en la teora
clsica de los tests o en la teora de res- puesta al tem, se basan en correlaciones y en la
estimacin de parmetros recurriendo a diferentes procedimientos estadsticos, tales como
los mtodos de mxima verosimilitud o los mtodos de inferencia bayesiana; tests como el
de chi-cuadrado permiten valorar el grado de ajuste de las respuestas a los items a modelos
logsticos de uno, dos o tres parmetros.
Al margen de todo el aparato estadstico que se esconde tras la elaboracin o el anlisis de
los instrumentos de recogida de datos, la Estadstica puede participar indirectamente en la
operacin de recogida proporcionando primeras elaboraciones de los datos en el momento
mismo de su registro. Por ejemplo, cuando tras aplicar un test se registran los resultados en
forma de percentiles o eneatipos, resultantes de la comparacin de la puntuacin del sujeto
con un grupo normativo.

c) Anlisis de datos

Ya hemos destacado la importancia de las tcnicas estadsticas en la fase de anlisis de


datos. Traigamos aqu, para insistir en esta idea, las palabras de De la Orden (1985:XXI),
cuando afirma que la forma ms adecuada de razonar sobre la base del gran nmero de
observaciones exigidas para el estudio experimental de la educacin, con pretensin
generalizante, es la Estadstica.

De acuerdo con el concepto de Estadstica que hemos apuntado, a la Estadstica


corresponden tareas de organizacin, descripcin, anlisis y presentacin de datos acerca de
las muestras estudiadas, y tambin de generalizacin de los resultados a las poblaciones de
donde las muestras fueron extradas. El anlisis estadstico de los datos supone una
descripcin de stos, el descubrimiento de regularidades y la inferencia de caractersticas
relativas a conjuntos ms amplios que los directamente estudiados.

d) Obtencin de conclusiones y redaccin del informe

Recordando las palabras de Siegel (1991:20), la estadstica nos proporciona herramientas


que formalizan y uniforman nuestros procedimientos para sacar conclusiones. De alguna
forma, las conclusiones estn predeterminadas por el tipo de tcnicas estadsticas que
utilicemos. Un anlisis de regresin, por ejemplo, nos permitir obtener conclusiones
acerca de la posibilidad de que determinadas variables independientes puedan predecir el
valor observado en una variable dependiente; un anlisis de conglomerados nos llevar a
concluir sobre formas de agrupamiento entre los individuos u objetos que estudiamos; un
anlisis simple de la varianza supondr llegar a conclusiones acerca de las diferencias
significativas entre las medias de diferentes grupos; etc. En cualquier caso, la Estadstica
estar presente a la hora de elaborar las conclusiones, aportando las claves para la
interpretacin de los resulta- dos del anlisis.

La presentacin de las conclusiones, as como de todo el proceso de investigacin, debe


contar con la inclusin de resultados estadsticos. Aunque no se trata de una aplicacin de
tcnicas estadsticas en el momento de redactar el informe, s que la Estadstica est de
algn modo presente a la hora de mostrar los resultados. Las conclusiones de un estudio se
vern convenientemente ilustradas mediante la presentacin de tablas, cuadros, etc.
recogiendo medias, porcentajes, coordenadas, correlaciones, o cualquier otro tipo de
estadsticos. La inclusin de los pesos factoriales de las variables consideradas en un
anlisis factorial, por ejemplo, es imprescindible si queremos ilustrar el modo en que cada
factor se ve saturado por las variables observadas.
Otro tanto podemos decir acerca de los resultados estadsticos expresados grficamente. La
utilizacin de determinadas tcnicas estadsticas y la intencin posterior de comunicar los
resultados obtenidos requieren incluir representaciones estrechamente vinculadas a aqullas
en los informes de investigacin. Tcnicas como el anlisis de conglomerados, el
pathnalysis o el anlisis de correspondencias, son indisociables de formas de representacin
grfica como dendogramas, diagramas de flujos o grficos factoriales, respectivamente.

En cuanto a la calidad de las investigaciones, la Estadstica aporta sus procedimientos para


garantizar la validez interna y la validez externa en los experimentos. Procedimientos de
muestreo aleatorio y tcnicas estadsticas como el anlisis de la covarianza, para controlar
el efecto de variables intervinientes que pudieran enmascarar el efecto de las variables
independientes, resultan recursos tiles en este sentido.

2. LA ESTADSTICAY LOS PROGRAMAS DE INVESTIGACIN


POSITIVISTAS

Frecuentemente, entre los rasgos diferenciadores de los programas de investigacin


positivistas frente a otros programas (sobre todo interpretativos) se encuentra el carcter
cuantitativo de las estrategias, tcnicas e instrumentos de recogida de datos y en los
procedimientos para el anlisis de los mismos. Pero de acuerdo con la posiciones
integradoras, actualmente ms extendidas, deberamos considerar que los mtodos
cuantitativos pueden ser empleados tanto desde enfoques positivistas como desde enfoques
interpretativos o crticos. A pesar de este tipo de planteamientos superadores de la
tradicional oposicin entre lo cuantitativo y lo cualitativo, lo habitual en la investigacin
educativa es que no sea muy frecuente encontrar investigaciones de tipo interpretativo en
las que se recurre a la Estadstica y, por el contrario, que la utilizacin de sta sea mucho
ms amplia e intensa en las investigaciones enmarcadas dentro de los programas
positivistas.

Una prueba de ello puede hallarse en el interesante estudio emprico de Morales (1995),
realizado sobre una muestra de 92 artculos y captulos de libros referidos a las
metodologas de investigacin cualitativa y/o cuantitativa. De acuerdo con las conclusiones
de aquel estudio, el modelo ideal de metodologa cuantitativa se caracteriza, entre otros
aspectos, por su asociacin a las concepciones epistemolgicas positivistas y por el uso de
la Estadstica en el anlisis de datos, mientras que la metodologa cualitativa queda
caracterizada por concepciones interpretativas o fenomenolgicas y por el anlisis de los
datos siguiendo vas diferentes a la Estadstica.

Tomando como marco la presencia de las tcnicas estadsticas directa o indirecta- mente en
los diferentes momentos del proceso de investigacin educativa, podramos destacar
tcnicas y procedimientos estadsticos que resultan especialmente caractersticos de los
mtodos descriptivos, correlacionales y experimentales emplea- dos en la investigacin
desarrollada desde una perspectiva cientfico-experimental.
En el caso de los mtodos descriptivos, el propsito del investigador es llegar a describir las
caractersticas de un objeto, hecho o fenmeno a partir de algn modo de observacin
sistemtica del mismo, una vez que ste ya se ha producido. La Estadstica cuenta con un
amplio abanico de tcnicas que contribuyen directa o indirectamente al objetivo de la
descripcin de un conjunto de datos. Por ejemplo, cuando los datos recogidos se refieren a
una sola variable, las tcnicas estadsticas disponibles son las propias de la Estadstica
descriptiva univariable, y la Estadstica multivariante tambin cuenta con tcnicas
apropiadas al objetivo de la descripcin de fenmenos o realidades educativas.
En los mtodos correlacionales, la presencia de la Estadstica es indispensable, en la
medida en que el establecimiento de relaciones entre variables se apoya directamenteen
ndices, tcnicas o procedimientos estadsticos especficos. Adems del uso de la
correlacin, los mtodos correlacionales se caracterizan por el empleo de tcnicas esta-
dsticas que permiten estudiar las covariaciones que se dan entre los fenmenos educativos
en los que concurren mltiples aspectos o dimensiones.

Adems de stas, en los estudios en que la finalidad no es nicamente identificar y valorar


la magnitud de las interrelaciones que se dan entre variables implicadas en determinados
fenmenos, sino tambin conseguir un cierto grado de prediccin de determinadas variables
o efectos, estn presentes tcnicas estadsticas apropiadas.

Dadas las dificultades que a veces presenta la realizacin de experimentos en el campo de


la investigacin educativa, se han desarrollado tcnicas estadsticas que permiten llegar a
determinar un cierto nivel de relacin causal sin necesidad de recurrir al experimento. A
partir de matrices correlacionales, los modelos de anlisis de estructuras de covarianza dan
una respuesta interesante a este tipo de situaciones.

El uso de la Estadstica aparece tambin estrechamente vinculado a los mtodos


experimentales, en los que el objetivo es determinar diferencias entre grupos debidas a la
intervencin de una variable experimental o independiente. El anlisis de los efectos
producidos por la manipulacin de variables independientes se apoya en mtodos
estadsticos para el contraste de grupos. Una preocupacin fundamental en los mtodos
experimentales radica en el control sobre la situacin. Siguiendo a Tejedor (1984), existen
diferentes modos de reducir el error experimental, debido a la existencia de fuentes de
variacin extraas, en los diseos de investigacin. Un modo de abordarlo sera prestar un
especial inters por reducir los errores de medida, para lo cual, entre otros aspectos
relevantes, cabra situar la preocupacin por la calidad de los instrumentos de medicin y la
calidad de las medidas. En relacin a la construccin de tales instrumentos ya fue destacado
anteriormente el papel que juegan los procedimientos estadsticos. Otros procedimientos
especficos para reducir el error experimental pasa- ran por el ajuste estadstico de los
datos con el fin de controlar la influencia de otras variables; una preocupacin fundamental
ser determinar la varianza explicada por las variables independientes objeto de estudio,
separndola de la varianza debida a otras variables cuya influencia sobre la variable
dependiente se supone, pero que no centran el inters del investigador.

Si bien los procedimientos fsicos resultan ser el medio ms adecuado para el control de
variables en la experimentacin desarrollada en ciencias fsico-naturales, en el campo de las
ciencias humanas, y en particular en la investigacin educativa, este tipo de control no es
posible. En nuestro campo, estamos lejos de lograr situaciones en las que el experimentador
posee un dominio casi absoluto, como se contempla en la tradicin experimental de Fisher.
En este contexto, la solucin al control de las variables se consigue a travs de tcnicas
estadsticas. Por ejemplo, conseguir la aleatorizacin en la constitucin de grupos cuando
stos existen de forma natural sera difcil. Por ese motivo, las variables extraas podran
estar presentes en los grupos constituidos con distintos niveles, haciendo que los grupos
sean diferentes antes de comenzar el experimento. Gracias a la utilizacin de tcnicas
estadsticas como el anlisis de covarianza, es posible suplir el control riguroso de la
situacin en este tipo de experimentos, pues mediante tal tcnica se consigue un ajuste
estadstico de los datos que permita comparar los grupos despus de la aplicacin del
tratamiento como si se hubiera partido de una situacin inicial de equivalencia.Esta
potencialidad de las tcnicas estadsticas cuando el experimentador carece de control sobre
la situacin experimental era ya anunciada por Campbell y Stanley (1963), al afirmar que
una capacitacin ms a fondo de los investigadores educacionales en tcnicas modernas de
estadstica experimental permitira elevar la calidad de la experimentacin pedaggica.

3. LA ESTADSTICA EN LOS PROGRAMAS DE INVESTIGACIN CUALITA-


TIVOS

Para algunos, an siguen siendo irreconciliables el anlisis estadstico de datos y la


investigacin que se desarrolla desde planteamientos diferentes del tradicional marco
cientfico-experimental. Sin embargo, el empleo de los mtodos estadsticos trasciende a
estos lmites y puede estar presente de alguna manera en estudios e investigaciones
realizados desde perspectivas interpretativas o crticas, a las que globalmente podemos
referirnos como perspectiva cualitativa. Indirectamente al menos, la Estadstica contribuira
a delimitar o introducir el problema de estudio, en la medida en que ste podra apoyarse en
los resultados de estudios previos basados en el anlisis estadstico. Comienza a ser
relativamente frecuente, en el acercamiento a las realidades educativas, partir de un estudio
descriptivo extensivo con base metodolgica cuantitativo-estadstica que abra paso a
estudios de tipo interpretativo, basados en el estudio de casos y dirigidos a profundizar en la
explicacin de los fenmenos analizados. Es lo que se ha denominado una estrategia de
combinacin metodolgica (Bericat, 1998), como forma de integracin de mtodos
cuantitativos y cualitativos.

En lugar de basarse en procedimientos de muestreo probabilstico, dirigidos a


construir modelos reducidos de la poblacin total, con resultados extrapolables al
universo del que se extraen (Rodrguez Osuna, 1991:12), el modo habitual en que suelen
determinarse el nmero y las caractersticas de los individuos o contextos que sern
estudiados se encuentra ms prximo al modelo de muestreo deliberado o intencional
(Patton, 1984). El problema de investigacin, las concepciones sobre el mismo, los factores
empricos que lo afectan y las caractersticas de la poblacin estudiada, llevan a
determinar qu casos van a ser seleccionados. Cuando no existe un suficiente conocimiento
previo de la realidad objeto de estudio, la fase de muestreo podra verse auxiliada por
anlisis previos realizados sobre la poblacin, que contribuyan a un mejor
conocimiento de la misma. En la medida en que se lleven a cabo estudios sobre la
poblacin, habremos de trabajar con grandes colectivos y el recurso a las tcnicas
estadsticas ser necesario. Estas permitirn por ejemplo una descripcin y/o clasificacin
de los sujetos, fenmenos o casos estudiados, que ayudarn al investigador en la fase
de seleccin de casos.

Existen vas diferentes a la Estadstica para llevar a cabo el anlisis de datos en la


investigacin cualitativa. En este sentido, entre los procedimientos de anlisis de datos,
entendidos como tcnicas para extraer informacin de los datos e interpretar su significado,
cabra hacer una distincin entre anlisis cualitativo, que expresa, ordena, describe,
interpreta los datos mediante conceptos, razonamientos y palabras, y anlisis cuantitativo,
en el que se recurre a conceptos y razonamientos que se apoyan en nmeros y estructuras
matemticas (Yela, 1994). Aunque lo ms caracterstico es el empleo de tcnicas
cualitativas, al analizar los datos son muchos los investigadores interpretativos o crticos
que recurren en algn momento de su proceso analtico a las tcnicas estadsticas, usadas
para complementar o contrastar las conclusiones obtenidas por otras vas. Incluso este rasgo
se ha destacado como una caracterstica de los enfoques de investigacin interpretativos o
crticos, en los que se recurre, sobre todo a la hora del anlisis de datos, a procedimientos
cuantitativos propios del enfoque positivista (De Miguel, 1988).

La naturaleza de los datos cualitativos palabras, y no nmeros constituye una


dificultad metodolgica en la investigacin educativa, pues si bien las palabras encierran
una mayor carga de significados, los nmeros tienen la ventaja de ser menos ambiguos y
son analizados con menor esfuerzo. Esta razn lleva a una parte de los investigadores a
preferir el trabajo con nmeros y traducir los textos en valores numricos desde las
primeras fases del anlisis. Para Miles y Huberman (1984:215), cuando identificamos un
tema o modelo estamos aislando algo que ocurre un nmero de veces y que ocurre
consistentemente de un modo especfico, es decir respecto a cualquier tema establecemos
algn tipo de recuento. Los nmeros, siguiendo a estos autores, permiten que nos hagamos
una idea de la importancia de los temas que tenemos ante nosotros cuando trabajamos con
un volumen importante de datos cualitativos, y constituyen un criterio a la hora de verificar
la existencia de una hiptesis o relacin entre temas. Autoras tan representativas de la
investigacin etnogrfica como Goetz y Lecompte (1988:178-179) reconocen igualmente el
papel de los datos numricos, al afirmar que una vez identificados los elementos, es
posible reducirlos a forma cuantificable examinndolos, elaborando listas, codificndolos y
asignndoles puntuaciones.

Partiendo de las frecuencias con que se dan determinados fenmenos o estn pre- sentes
determinados temas en los textos, identificaramos las relaciones que se dan entre los
elementos mediante la aplicacin de determinadas tcnicas estadsticas, cuya importancia
en el contexto de un anlisis de datos cualitativos vara ampliamente, desde una presencia
nula hasta el uso de tcnicas estadsticas de variado grado de complejidad (Wilcox, 1982).
Cuando los resultados de la cuantificacin de textos son analizados estadstica- mente,
conviene emplear pruebas estadsticas inferenciales, preferentemente no para- mtricas,
dado que con este tipo de datos no es posible mantener el supuesto de normalidad de la
poblacin, en el que en gran medida se apoya la Estadstica clsica. Adems, no podramos
pasar mucho ms all de un nivel de medida nominal y ordinal. Una revisin de las tcnicas
estadsticas aplicables a datos categricos resultantes de la reduccin cuantitativa de datos
textuales puede consultarse en el trabajo de Garca, Gil y Rodrguez (1994).
Desde determinados enfoques, los procedimientos estadsticos ganan importancia frente a
las tcnicas cualitativas de anlisis. Es el caso del anlisis de contenido tradicional, donde
el inters del investigador se diriga al recuento de frecuencias de aparicin de palabras o
temas de especial relevancia en el estudio, con el objetivo deproceder a su tratamiento
estadstico. Desde muy pronto, los programas de anlisis automtico de textos se han
basado en los recuentos y el tratamiento estadstico. Cabe citar el programa GENERAL
INQUIRER (Stone y Otros, 1966), uno de los pioneros, o el programa WORDS (Iker,
1975), con el que llegan a ser extrados los temas presentes en un texto sometiendo a
tratamiento estadstico las frecuencias de las palabras en cada unidad considerada.
Con este tipo de enfoques, la cuantificacin y el procesamiento estadstico pueden llegar a
ser la va exclusiva por la que se analizan los textos. Sirva como ejemplo la aplicacin de
las tcnicas de anlisis de datos de la escuela francesa al anlisis de textos procedentes de
respuestas abiertas a cuestionarios, entrevistas, textos literarios, etc., permitiendo el
recuento de unidades elementales en los textos y la realizacin de anlisis estadsticos
multivariantes (anlisis de correspondencias, clasificaciones) a partir del mismo. Este tipo
de enfoques se ha desarrollado enormemente, dando lugar a la denominada Estadstica
textual (Lebart y Salem, 1994).

4. LMITES DE LA ESTADSTICA EN EL ESTUDIO DE LA REALIDAD


EDUCA- TIVA

Hasta ahora hemos comentado la amplia gama de posibilidades que la Estadstica ofrece en
las diferentes etapas del proceso de investigacin y en los modos diversos de afrontar la
indagacin acerca de la realidad educativa. De alguna forma, la Estadstica es una
herramienta fundamental en la metodologa de investigacin, hasta el punto de que ha
llegado a ser considerada como el lenguaje de la ciencia.

Pero si el progreso de la Estadstica puede ser entendido como un verdadero motor para el
desarrollo de la investigacin pedaggica, bien es verdad que la aplicacin de la Estadstica
en el campo de la investigacin educativa se ve limitada por fronteras que surgen a veces de
una mala concepcin de estas herramientas, traducida en un uso inadecuado o para fines
cuestionables, y otras, de las limitaciones con las que las propias tcnicas cuentan,
especialmente cuando se trata de abordar un objeto de estudio tan complejo como es la
educacin.

4.1. Usos incorrectos de la Estadstica

La Estadstica no puede ser empleada ms all de lo que la utilizacin adecuada de las


tcnicas permite, ni puede responder a finalidades distintas a las que le son propias. De
acuerdo con esta idea, recogemos a continuacin los principales factores o circunstancias
que conllevan un uso inadecuado de las tcnicas estadsticas.

a) Fines cuestionables

El empleo de la Estadstica no puede obedecer a la finalidad de enmascarar


conscientemente la realidad, tratando de presentar slo determinadas perspectivas acerca
del objeto estudiado. Ya comentbamos al inicio de este trabajo la percepcin que algunos
poseen acerca de la Estadstica, considerndola como un instrumento para
ocultarinformacin bajo la apariencia de objetividad y veracidad. Kruskal (1978:1073)
denunciaba el mal uso de la Estadstica por quienes la utilizan para tratar de ofuscar,
mitificar o impresionar.
Otro de los usos incorrectos de la Estadstica consiste en emplearla con el fin de justificar el
rigor de un trabajo, con base en la falsa idea de que los resultados de un estudio quedarn
avalados por la sofisticacin de los procedimientos estadsticos utilizados, y ms an si
stos han sido llevados a cabo con el auxilio de paquetes esta- dsticos informatizados.
Tambin Kruskal (1978:1073) adverta de este mal uso, cuando afirmaba que los mtodos
estadsticos sirven a algunos para suministrar el requisito de autenticidad cientfica. Ello se
basa en una asociacin falaz entre la complejidad de la tcnica y la calidad de la
investigacin, que conduce a una especie de fetichismo esta- dstico, cuando bien sabemos
que la complejidad del aparato estadstico no va a mejorar los resultados de la
investigacin. En realidad, la calidad de las conclusiones de un estudio depende de otros
muchos elementos del proceso de investigacin, tales como una slida fundamentacin
terica, la correcta delimitacin del problema y formulacin de hiptesis, la adecuada
seleccin de los individuos estudiados o las tcnicas empleadas en la recogida de datos.
De alguna forma, las consideraciones expuestas hasta ahora apuntan hacia la necesidad de
observar ciertas reglas ticas en el uso de la Estadstica, las cuales incluiran junto a su no
utilizacin para ocultar la verdad o para servir a finalidades que no le son propias,
consideraciones acerca del anonimato y la confidencialidad en el uso de los datos y
resultados obtenidos (Moore, 1979). Y, por supuesto, habra que aadir la necesidad de que
el analista no llegue a alterar los datos con los que trabaja, ni elimine aquellos casos que
hacen alejarse los resultados obtenidos de lo esperado, con la justificacin de que
posiblemente se trate de errores de medida o codificacin.

b) Subordinacin del problema al mtodo

La eleccin de tcnicas estadsticas est subordinada al objetivo de investigacin, es decir,


debe dar respuesta a los interrogantes o problemas planteados. A veces, la seleccin de los
procedimientos estadsticos podra responder a ciertas modas que llevan al empleo
constante de determinadas tcnicas en detrimento de otras que tal vez resulten ms
adecuadas. Ms grave an resultara el uso incorrecto de la Estadstica que supone hacer
depender el problema de investigacin del mtodo estadstico que vamos a emplear,
invirtindose as el orden epistemolgico. Es decir, podra caerse en la incorreccin de
seleccionar un problema con el nico fin de utilizar tcnicas cuyo uso es novedoso o est
bien valorado dentro de la comunidad cientfica.

En ningn caso es la Estadstica el fin de la investigacin educativa, sino un medio para su


desarrollo. La investigacin no puede reducirse al empleo de sofisticadas tcnicas de
anlisis estadstico, sin que exista un trasfondo terico del que surge el problema
investigado, dando lugar a lo que algunos han calificado de vaciamiento terico y trasvase
desde el diseo de investigacin al diseo estadstico (Bartolom, 1988).

Cabra aqu recoger las palabras de Cormack (1971) cuando afirma que la Estadstica es
una combinacin de tcnicas y sentido comn, sin que ste pueda ser sustituidopor
aqullas. El autor citado refleja su pensamiento con una muy ilustrativa metfora:
las tcnicas son los caballos; el sentido comn sostiene las riendas (1971:164). En
nuestro campo de estudio, podemos sealar parafraseando la afirmacin anterior que
la aplicacin de la Estadstica supone una combinacin de tcnicas y conocimiento
sobre lo educativo. Al aplicar la Estadstica en la investigacin educativa es preciso no
olvidar el conocimiento no estadstico. Como afirman Box, Hunter y Hunter (1989) al
ocuparse de la utilizacin de la Estadstica, las tcnicas son ms efectivas cuando se
combinan con el apropiado conocimiento del tema al que se aplican.

c) Violacin de supuestos

La Estadstica no puede ser aplicada sin ms en la investigacin educativa. El investigador


educativo que emplea modelos estadsticos ha de establecer una correspondencia entre los
sistemas formales y la realidad estudiada; considerar unos supuestos (que no son sino
axiomas de ciertos modelos matemticos) de manera que las deducciones a las que llegue a
partir del modelo estadstico sean vlidas para interpretar la realidad educativa slo en la
medida en que se cumplan dichos supuestos (Tejedor, 1986).

Por tanto, cada tcnica de anlisis estadstico requiere el cumplimiento de unas condiciones
para poder ser aplicada, y esta aplicacin ha de ir precedida de un estudio sobre el
cumplimiento o no de tales condiciones. A veces, la violacin de los supuestos de partida
conlleva pequeas alteraciones sobre los resultados que en parte pueden ser previstas por el
investigador; pero como norma general, y ante el desconocimiento de la robustez de las
pruebas y los efectos que la violacin de los supuestos pueda acarrear sobre los resultados,
es preferible ajustarse a la ms pura ortodoxia si no queremos que las conclusiones
extradas puedan resultar poco vlidas.

d) Conocimiento insuficiente de las tcnicas

La utilizacin de la Estadstica presupone un conocimiento de las propias tcnicas y


procedimientos empleados. A veces, el investigador posee concepciones errneas que
pueden limitar la utilizacin correcta de las herramientas estadsticas. As, por ejemplo,
algunos de los errores habituales podran ser el pensar que cuando no se rechaza la
hiptesis nula sta queda confirmada, el considerar que una relacin alta entre las variables
implica causalidad, o creer que el anlisis de la varianza permite un contraste de varianzas
en lugar de un contraste de medias. Reflexiones acerca de los errores conceptuales en
Estadstica pueden encontrarse en el artculo de Cohen (1990), e interesantes
consideraciones en este mismo sentido aparecen en el trabajo de Vallecillos y Batanero
(1995).

La carencia de una suficiente formacin estadstica podra llevar a algunos investigadores a


limitar su uso a tcnicas relativamente simples e insuficientes para abordar y resolver
problemas relevantes. A veces, esta situacin deriva en un traspaso de responsabilidades a
expertos que se encargan de realizar los anlisis estadsticos. Sin embargo, la colaboracin
entre investigadores y estadsticos profesionales no est exenta de problemas,
fundamentalmente derivados de la dificultad de comunicacin.

La aplicacin de las tcnicas estadsticas en la investigacin educativa requiere adems el


conocimiento profundo de las reglas de interpretacin de los resultados obtenidos. El
producto de los anlisis estadsticos ha de ser interpretado y traducido a conclusiones
relevantes de cara al problema investigado. La aplicacin de la Estadstica implica una
modelizacin del problema, operativizndolo en trminos matemticos susceptibles del
razonamiento lgico que las tcnicas conllevan, y finalmente una traduccin de los
resultados a los trminos en que se plante el problema de partida. Las conclusiones no son
las que el analista espera conseguir, sino que se derivan directa- mente de los ndices,
valores, grficos o tablas obtenidas, cuya interpretacin requiere un conocimiento
exhaustivo de la tcnica empleada y, a veces, cierta experiencia, olfato o incluso
imaginacin. Por ejemplo, al hablar de la interpretacin de los resultados del escalamiento
multidimensional, Kruskal y Wish (1986) consideran que stos estn sub- ordinados a lo
que denominan una interpretacin creativa.

4.2. Limitaciones intrnsecas de la Estadstica

En cuanto a los lmites propios de las tcnicas estadsticas, podemos comenzar hablando de
la incertidumbre respecto a los resultados. El conocimiento al que llegamos a travs de la
Estadstica no es exacto sino probable. No debemos olvidar que las conclusiones
alcanzadas por medio de los procedimientos inferenciales se apoyan en conceptos
probabilsticos y contemplan la posibilidad de un margen de error.

En relacin a este aspecto puede hacerse una consideracin adicional. Cabra cuestionar el
modo en que se logra la inferencia inductiva cuando rechazamos la hiptesis nula y
adoptamos para ello el nivel de significacin del 0.05. Como seala Cohen (1990), las ideas
de Fisher se han convertido en la base de la inferencia estadstica debido a que ofrecen un
esquema determinista, mecnico y objetivo que permite, con independencia del contenido,
llegar a decisiones de aceptacin o rechazo. Sin embargo, el nivel establecido para la toma
de decisiones (a=0.05) no deja de ser un criterio arbitrario y convencional, un punto de
referencia en el continuo de probabilidades asocia- das a la hiptesis nula. Ante una
probabilidad p=0.050 y una probabilidad p=0.051 no podemos afirmar taxativamente que
existen razones ontolgicas para justificar una decisin de signo contrario en la
investigacin educativa. Tal vez este dogma sea una de las razones que llevaban a Salsburg
(1985) a afirmar que la aplicacin de la Estadstica en las ciencias sociales se asemeja a la
prctica de una religin secular.

Por otra parte, los resultados del anlisis estadstico pueden resultar incompletos en s
mismos. Por ejemplo, al realizar un anlisis de la varianza somos capaces de determinar los
factores que explican la varianza experimental, pero desconocemos qu se esconde detrs
de la varianza de error. En un anlisis de regresin llegamos a explicar slo un porcentaje
de la varianza en la variable criterio, pero desconocemos qu elementos se esconden tras la
varianza no explicada. De alguna forma, el conocimiento que nos permiten las tcnicas
estadsticas es limitado.
Cuando la Estadstica es aplicada a la investigacin educativa surgen limitaciones
adicionales derivadas de la complejidad del objeto de estudio. Las realidades educativas,
los comportamientos humanos resultan extremadamente multifacticos y estrechamente
vinculados a las caractersticas del contexto en el que se dan, de tal forma que muchos
consideran difcil que los nmeros sean capaces de reflejarlos. El nmero supone alejarse
de la riqueza de significados asociada al objeto de estudio. Por otra parte, las tcnicas
estadsticas implican seleccionar un modelo que traduce la realidad emprica en un sistema
formal de elementos relacionados; si tratamos de que este modelo sea simple nos alejamos
del fenmeno real, mientras que si incluimos en este modelo la complejidad de la situacin
convertiramos el problema en prcticamente inabordable desde el punto de vista de la
metodologa estadstica.

Algunos conceptos estadsticos resultan aparentemente opuestos a la naturaleza de los


fenmenos en que interviene el hombre. La idea de causalidad que subyace a determinados
modelos estadsticos supone para algunos que la conducta humana podra llegar a estar
determinada por causas externas. No obstante, como afirma Keny (1979), es necesario
matizar que en los modelos causales no se llega a explicar mucho ms del 50% de la
varianza; la libertad humana podra permanecer formando parte de la varianza no explicada
o trmino de error.

Existen dificultades epistemolgicas que obstaculizan en las ciencias humanas la utilizacin


de la experimentacin tal y como es aplicada en las ciencias fsico-naturales, y por tanto, la
aplicacin de la Estadstica. Para que los grupos sean comparables es preciso que las
diferencias individuales se repartan en ellos del mismo modo, objetivo que puede lograrse,
entre otras vas, con los procesos de aleatorizacin. Sin embargo, habitualmente los grupos
con los que trabajamos son grupos naturales, preexistentes en el contexto estudiado (grupo
de alumnos de una clase, profesores de un centro, etc.), sin que podamos controlar la
asignacin de los sujetos a los grupos.

La aleatoriedad de las muestras no es el nico caso. Buena parte de los supuestos exigidos
para la aplicacin de las tcnicas estadsticas no siempre se dan en la realidad educativa. Es
el caso de la distribucin normal de las variables o del supuesto de homoscedasticidad de
varianzas. Por otra parte, la aditividad resulta difcil de aceptar cuando medimos realidades
no observables directamente. Adems, gran parte de la Estadstica inferencial se apoya en
distribuciones de frecuencias para poblaciones infinitas, cuando en el mundo real, y en
particular en el mundo educativo, se suelen estudiar poblaciones finitas.
Adems de estas objeciones epistemolgicas, la medida en educacin presenta ciertas
dificultades que limitan el alcance de los resultados a los que nos conduce el anlisis
estadstico de los datos. Como seala Tejedor (1988), entre los problemas ms importantes
de la ciencia pedaggica se encuentra la obtencin de mtodos adecuados de medicin: en
nuestro campo no existen a veces instrumentos adecuados o unidades de medida para
valorar dimensiones o caractersticas de los fenmenos.

Todo ello hace que, an reconociendo el importante papel que desempean las tc- nicas
estadsticas en la investigacin educativa, su empleo sea contemplado con cierta cautela,
puesto que un uso incorrecto de las tcnicas de anlisis, bien por desvirtuar sus fines y su
lugar natural en el proceso de investigacin, o bien por desconocimiento, puede llevarnos a
cuestionar su pertinencia para el estudio de los problemas plantea- dos. Adems, es preciso
ser conscientes de las propias limitaciones de los mtodos estadsticos y de los supuestos
estadsticos que imponen a las situaciones estudiadas,que en el caso de las educativas
podran resultar difciles de cumplir. En la medida en que se tengan en cuenta
consideraciones de este tipo, conseguiremos combatir la ima- gen negativa que no pocas
veces se proyecta de la Estadstica.

FORMULACIN DE LAS HIPTESIS ESTADSTICAS


Para analizar la etapa correspondiente a la formulacin de una hiptesis, es necesario
considerar como punto inicial al proceso de percepcin del entorno, que en trminos
sencillos involucra la utilizacin de nuestros sentidos. Ya que la comprensin habitual de la
evolucin del hombre es resultado del hecho de que entendemos dicho proceso explorando
la realidad fsica con nuestros cinco sentidos. Hasta el momento actual hemos sido seres
humanos cinco-sensoriales.

Este camino de la evolucin nos ha permitido comprender los principios bsicos del
Universo de manera concreta. Gracias a nuestros cinco sentidos, sabemos que cada accin
es una causa que provoca un efecto, y que cada efecto posee una causa. De tal forma que el
proceso de percepcin involucra a su vez cuatro etapas, conocidas como: formacin de
imgenes, establecimiento de sensaciones, esclarecimiento de ideas y elaboracin de
conceptos.

Estas cuatro etapas en conjunto conducen al proceso de observacin. De tal forma que la
observacin es la utilizacin de los sentidos para la percepcin de hechos o fenmenos que
nos rodean, o son de inters del investigador.

Entonces, la observacin, permite abordar la realidad, esto es, la totalidad de hechos


existentes y concretos que rodean los fenmenos que se estudian. El profesor de fsica
David Bohm, del Birkbeck College, de la universidad de Londres dice que la palabra
"realidad" est derivada de las races "cosa" (res) y "pensar" (revi). Realidad, por lo tanto,
significa "todo aquello en lo que se puede pensar". Tal definicin tiene la influencia de la
fsica cuntica, que est basada en la percepcin de un nuevo orden en el universo.

Desde el punto de vista de la Epistemologa, existen tres herramientas bsicas para abordar
a los hechos, o todo aquelloque sucede en la naturaleza: observando,midiendo y
experimentando. Lo cual puede realizarse en una accin a la vez, o las tres de manera
simultnea. Esto quiere decir que un fenmeno se est observando.

Por lo que, la observacin metdica y sistemtica de los hechos, permitir a travs del
tiempo, generar informacin (o datos) acerca de su comportamiento. De esto resulta, que un
hecho o fenmeno, podr observarse en trminos de fracciones de segundo, como en una
reaccin qumica, o de manera perpetua, como en el movimiento de los planetas, o de
alguna variable del clima. Y la disponibilidad de datos a su vez permite observar, medir o
experimentar en torno al fenmeno estudiado, todo en un proceso dialctico.

La Etapa Emprica para la Generacin de Conocimiento Cientfico

La etapa en la cual se est generando informacin referente a un hecho o fenmeno, se


conoce como etapa EMPIRICA; o de manera atinada, aquella etapa que proporciona
experiencia. En esta etapa utilizamos como herramienta fundamental a la observacin.
Resaltemos la importancia de la observacin y su relacin con la formulacin de hiptesis,
analizando algunos episodios de la ciencia que han resultado fundamentales.
La observacin se define como la utilizacin intencionada de nuestros sentidos para captar
informacin. En la actualidad se considera que la observacin tiene un papel importante en
la ciencia cuando est guiada por una hiptesis, tal como lo mencionaba Claude Bernard:
"todo el conocimiento humano se reduce a ascender de los efectos observados, a su causa.
Despus de una observacin, se presenta al espritu una idea relativa a la causa del
fenmeno observado; luego esta idea anticipada es introducida en un razonamiento en
virtud del cual se hacen experiencias para comprobarla. Por el momento, es necesario hacer
notar que la idea experimental no es arbitraria ni puramente imaginaria; debe tener siempre
un punto de apoyo en la realidad observada, es decir en la Naturaleza. La hiptesis
experimental, en una palabra, debe estar siempre fundada en una observacin anterior". La
observacin cientfica se da a partir de la seleccin deliberada de un fenmeno o aspecto
relevante de ste, mediante la gua del mtodo cientfico.

Los astrlogos caldeos de los siglos VII y VI a. C., quienes al igual que sus antecesores
babilonios, crean que los cielos eran divinos, y por lo tanto identificaban a cada planeta
con una deidad (Mercurio, Venus, Marte). Pensaban que observando sus movimientos
podan predecir sus intenciones. Si la conducta de los planetas hubiera sido irregular,
haciendo algo nuevo cada vez, la tarea de los astrlogos habra sido muy difcil y,
probablemente no lo habran iniciado. Pero dado que los movimientos eran cclicos y se
repetan una y otra vez, la operacin no pareca tan difcil y, por tanto, tena sentido ser
extremadamente cuidadoso y preciso en las observaciones. Kidinnu (siglo VI a. C.) calcul
el movimiento del sol con una exactitud tal que slo fue superada en el siglo XX. Cabe
recordar que caldeos, babilonios y griegos, carecan de telescopios.

El evento que permite generar experiencia y que est ampliamente relacionado con el de
observacin puede ejemplificarse con la formidable actividad de Tyge o Tico Brahe; l
nunca hizo grandes descubrimientos, salvo uno, que lo convirti en el padre de la
Astronoma moderna, fundada en la observacin. El descubrimiento estriba en que la
astronoma tena necesidad de datos observados, precisos y continuos. Guardad todos
silencio y escuchad a Tico, quien dedic treinta y ocho aos de su vida a la observacin del
movimiento de los planetas (de 1563 a 1601).

Poco se ha escrito e investigado acerca de las ciencias entre los pueblos mesoamericanos.
Sin embargo una constante emerge entre lo que normalmente se pone de relieve: la
observacin detallada y continua de los astros para obtener la precisin de los clculos
astronmicos. Eli de Gortari presenta en su libro, "La ciencia en la historia de Mxico" la
siguiente tabla, en la cual es posible comprender la magnitud e importancia de la
observacin.

Perodo Sindico
CLCULO MAYA CLCULO MODERNO
Luna 29.530864 29.53058877
Mercurio 115 115.667
Venus 584 583.92
Marte 780 779.936
Jpiter 389.6 398.867

Hiptesis estadsticas:

Son transformaciones de las hiptesis deinvestigacin en smbolos estadsticos y


seformulan cuando los datos del estudio soncuantitativos. Estas pueden ser
hiptesisestadsticas de estimacin, de correlacin ode diferencia. El smbolo de correlacin
es"r" para dos variables y "R" para ms dedos variables.

Ejemplos:

Estimacin: Hi: X > 90 Para una hiptesis deinvestigacin descriptiva de una variable
que diceel promedio de la clase es mayor de 90. Se leantepone una hiptesis nula que
estadsticamentesera Ho: X = 90 y la hiptesis alternativa podrarepresentarse
estadsticamente como: Ha: X < 90.

Algunos investigadores consideran las hiptesis deestimacin como de diferencia dado que
se evala ladiferencia entre un valor hipottico y uno observadoen una sola muestra.

Ejemplo:

Hi: El promedio mensual de casos de trastorno psiconeurtico caracterizados por


reaccinastnica, que fueron atendidos en los hospitales de la ciudad de Linderbuck es
mayor a
200.

Hi: X > 200 (promedio mensual de casos atendidos)

La hiptesis estadstica nula sera la negacin de la hiptesis anterior:

Ho: X < 200 ( El promedio mensual de casos es menor que 200)y la hiptesis
alternativa sera:

Ha: X = 200 ( El promedio mensual de casos es igual que 200)

B. Correlacin: Hi: r xy = 0 Significa que lasvariables X y Y estn correlacionadas


dadoque, de no ser as, la correlacin sera 0.

Esta hiptesis de correlacin tiene su contraparteen la siguiente hiptesis estadstica nula, la


cualniega la correlacin: Ho: r xy = 0 Significa que lacorrelacin entre X y Y es cero es
decir, noexiste.

Hiptesis estadsticas de correlacin


Tienen por objeto traducir en trminos estadsticos una cor relacin entre dos o ms
variables. Elsmbolo de una correlacin entre dos variables es r (minscula) y entre ms
de dos variablesR (mayscula). La hiptesis a mayor cohesin en un grupo , mayor ef
icacia en el logro desus metas primar ias, puede traducirse as:

Hi: r x y = 0
Ho: rxy = 0 (Las dos variables no estn correlacionadas; su correlacin es cero.)
Otro ejemplo:
Hi: R xyz = 0 (La correlacin entre las variables autonoma, variedad y motivacin
intr nseca no es igual a cero.)
Ho: R xyz = 0 (No hay correlacin.)

C. Diferencia: (entre grupos o sujetos a partir de una misma medida oestadgrafo - media,
mediana, rango, porcentajes).

Supngase la hiptesis de investigacin que dice que los porcentajesde individuos que
prefieren una locin en particular difieren segn elnivel acadmico (3 niveles).

Hi: %1 %2 %3 Significa que los porcentajes son diferentes. Y lahiptesis estadstica


nula sera: Ho: %1 = %2 = %3

Es decir, no hay diferencia entre los porcentajes de los gruposconstituidos por los niveles
acadmicos.

Estructura de las Hiptesis

Las hiptesis contienen tres elementos estructurales que son:Las unidades de anlisis o de
observacin. A saber, individuos,instituciones, conglomerados.

Las variables. Son los atributos, caractersticas, o propiedadescualitativas o cuantitativas


que manifiestan en las unidades deobservacin.

El enlace lgico o trmino de relacin. Que describe la relacinexistente entre las unidades
de anlisis con las variables y de stas entres.

En la hiptesis: "a mayor satisfaccin entre la pareja, menor la frecuenciade infidelidad


conyugal", las unidades de observacin son las parejas, lasvariables : satisfaccin e
infidelidad conyugal, el trmino de relacin: amayor...menor frecuencia.

Ejemplo de la operacionalizacin de una variable.

Se trata de cuatro columnas la primera identifica la variable porsu nombre, la segunda nos
dice qu es? cmo se defineconceptualmente, la tercera columna no da la respuesta a
lapregunta cmo se observa esta variable? y contiene losindicadores de la misma. La
cuarta columna nos responde lapregunta cmo se mide? (suponiendo que se trata de
unavariable medible). La definicin operacional permite conocercon claridad el nivel de
medicin de la variable (Nominal,ordinal, escalar o de razn)
HIPTESIS NULA E HIPTESIS ALTERNATIVA

Un contraste de hiptesis estadstico se plantea como una decisin entre dos hiptesis.

La hiptesis nula consiste en una afirmacin acerca de la poblacin de origen de la muestra.


Usualmente, es ms simple (menor nmero de parmetros, por ejemplo) que su antagonista.
Se designa a la hiptesis nula con el smbolo H0.
La hiptesis alternativa es igualmente una afirmacin acerca de la poblacin de origen.
Muchas veces, aunque no siempre, consiste simplemente en negar la afirmacin de H0. La
hiptesis alternativa se designa con el smbolo H1.

De momento trataremos el caso ms sencillo, en el cual las dos hiptesis se refieren a un


nico valor del parmetro. En esta situacin general, las hiptesis se refieren a un
parmetro (theta). La formulacin es:

H0: = 0

H1: = 1
En la teora del contraste de hiptesis este tipo de planteamiento se conoce como contraste
de hiptesis simple contra simple.

As pues, una hiptesis simple postula que el parmetro slo puede tomar un valor o bien,
ms tcnicamente, que el conjunto de parmetros asociado a una hiptesis simple consiste
en un slo punto.

Ejemplos de hiptesis que se han de contrastar

Caso 1: hiptesis para dirimir la controversia acerca del nmero de hembras.


Caso 2: hiptesis a contrastar en el problema de la tasa de statdrolona.

HIPTESIS SIMPLE Y COMPUESTA

1) Simples cuando se refieren a un solo valor del parmetro poblacional.

H o : o
Prueba de 2 colas
H1 : o

2) Compuestas cuando se refieren a mas de un valor del parmetro poblacional.

H o : o
Prueba de cola izquierda
H1 : o

H o : o
Prueba de cola derecha
H1 : o
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres
maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha
cambiado el valor del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora
o modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de
las especificaciones.

PRUEBAS UNILATERALES Y BILATERALES

Prueba unilateral

Prueba de hiptesis con muestra grande ( 30), acerca de una media de la poblacin
para una prueba unilateral de la forma:
0 : 0
1 : < 0
Estadstico de prueba:conocida.
0
=

Estadstico de prueba: desconocida
0
=

Una prueba de una cola o unilateral para la media poblacional tiene una de las dos formas
siguientes.
Prueba de la cola inferior Prueba de la cola superior (o
(o izquierda) derecha)
0 : 0 0 : 0
1 : < 0 1 : >

Pruebas unilaterales sobre la media de una poblacin.


La forma general de una prueba, es la siguiente:

Prueba de hiptesis con muestra grande ( ), acerca de una media de la poblacin


para una prueba de la forma:
:
: <
Estadstico de prueba:conocida


=

Estadstico de prueba: desconocida




=

Regla de rechazo a un nivel de significancia


Rechazar <
0
Una segunda prueba unilateral rechaza la hiptesis nula cuando el estadstico se encuentra
en el extremo o cola superior de la distribucin muestral.

Prueba de hiptesis para una prueba grande ( ), acerca de un promedio de poblacin


para una prueba unilateral de la forma:
:
: >
Estadstico de prueba: conocida


=

Estadstico de prueba: desconocida


=

Regla de rechazo a un nivel de significancia
Rechazar >

Ejemplo:

La comisin Federal de Comercio lleva a cabo estudios peridicos para probar las
afirmaciones que hacen los fabricantes acerca de sus productos. Por ejemplo, la etiqueta de
una lata grande de caf Cumbre dice que ese envase contiene, cuando menos, tres libras de
caf Cumbre dice que ese envase contiene, cuando menos, tres libras de caf. Supongamos
que deseamos comprobar esta aseveracin mediante la prueba de hiptesis.

De Caf Cumbre se selecciona las siguientes hiptesis nula y alternativa:


0 : 3
1 : < 3
Con la prueba grande ( 30)
Desviacin estndar de la poblacin = .18
Nivel de significancia = .01
= 36
= 2.92
Estadstico de prueba:

=

2.92 3 .08
= .18 = = 2.66
. 03
36

Con el nivel de significancia = .01 se tiene una prueba de -2.33 que ser nuestro punto
crtico (notificar con la tabla de Valores crticos de Z en las pruebas de hiptesis)
1 0

2.66

De acuerdo a las reglas que se mencionaron antes, se rechaza la hiptesis nula, ya que entra
en la zona de rechazo, en donde se acepta la hiptesis nula.
Por lo que nuestra conclusin queda as:

Se rechaza la hiptesis nula ya que no cumplen con la afirmacin de que cada envase
contiene cuando menos 3 libras de caf y los fabricantes no cumplen con sus afirmaciones
y con el contenido que dicen sus etiquetas.
Ejercicio:
De acuerdo con la Asociacin Nacional de Vendedores de Automviles, la media del precio
de los automviles usados es de $10,192 dlares. Un gerente de una agenda de automviles
usados en la cuidad de Kansas reviso en su establecimiento una muestra de 100 ventas. El
precio de la media de la muestra fue de $9300 dlares y la desviacin estndar de la
muestra fue de $4500 dlares. Si representa la media del precio de la poblacin de
automviles usados en esa agencia, pruebe la hiptesis:

0 : 10,192
1 : < 10,192

Con un nivel de significancia .05.

Hiptesis nula y alternativa:

Con la prueba grande ( 30)

Desviacin estndar de la muestra s= 4500

= 100
= 9300

Estadstico de prueba:

=

9300 10192 892
= 4500 = = 1.98
450
100

Con el nivel de significancia = .05 se tiene una prueba de -1.645 que ser nuestro punto
crtico (notificar con la tabla de Valores crticos de Z en las pruebas de hiptesis)

1.98

Conclusin:

Se rechaza que el promedio del precio de los automviles sea mayor que $10,192 dlares,
el gerente que realizo la prueba debe de estar seguro que la afirmacin nula que se hiso es
aberrante y que puede considerar o aceptar que el precio de los automviles usados es
menor que $10192 dlares.

Prueba bilateral
La pruebas bilaterales difieren de las unilaterales en que la regin de rechazo esta
simultneamente en las colas o extremos inferior o superior, de la distribucin muestral.
Debe rechazar 0 para valores del estadstico que caigan en la cola inferior o en la cola
superior de la distribucin de la muestra. A esto se le llama prueba bilateral de hiptesis.

Pruebas bilaterales sobre la media de una poblacin.


La forma general de la prueba bilateral de hiptesis respecto a una media de
poblacin es la siguiente:

Sea 0 el valor de la media en las hiptesis.

Prueba de hiptesis con muestra grande ( ) respecto a una media de poblacin para
una prueba bilateral de la forma:
: =
:
Estadstico de prueba: conocida


=

Estadstico de prueba: desconocida



=

Regla de rechazo a un nivel de significancia
< >

La prueba de hiptesis por intervalos


Para llevar a cabo la prueba de hiptesis, en el caso de la media de poblacin, la prueba
bilateral de hiptesis tiene la forma
0 : = 0
1 : 0
En donde 0 es el valor supuesto de la media de poblacin. Al aplicar la regla de rechazo
originada con la ecuacin vemos que la regin donde no rechaza 0 comprende todos los
valores de la media que estn entre los errores estndar 2 + 2 de 0 .
En consecuencia, la regin de no rechazo para la media de la muestra en una prueba
bilateral de hiptesis con nivel de significancia se expresa por

0 2 Cuando se conoce


0 2 Cuando se desconoce.

Ejemplo:

La Asociacin Americana de Golf ha establecido reglas que deben cumplir los fabricantes
de equipos de golf para que sus productos se acepten en los eventos de USGA. Una de las
reglas, para la fabricacin de las pelotas de golf, dice: una marca de pelota de golf, al
probarse en l aparato aprobado por la USGA en el campo de la USGA no debe de llagar
a una distancia promedio mayor , en el aire y en el rodamiento, que sea de 280 yardas.
Suponga que Sperflight, Inc., acaba de desarrollar un mtodo da fabricacin con alta
tecnologa que puede producir pelotas de golf para alcanzar una distancia promedio de 280
yardas.
Dio como resultado la siguiente prueba bilateral.
0 : = 280
1 : 280
Apara probar esta hiptesis:
Con un nivel de significacin = .05,
Se muestrearon n=36 pelotas
Se determino una media de la muestra para la distancia = 278.5 yardas
Desviacin estndar de la muestra = 12 yardas
Sustituyendo estos resultados con 2 ---- 1.96

2

12
= 278.5 1.96
36
= 278.5 3.92
274.58 282.42 (275,283)
Se acepta con un 95% de confianza, la medida de la distancia para la poblacin de pelotas
de golf est entre 275 y 283 yardas. La conclusin de la prueba es que no se puede rechazar
la hiptesis nula : = 280
Ejercicio:
LA oficina de Anlisis Econmico, del departamento de Comercio en Estados Unidos,
informo que la media del ingreso anual de un residente de Carolina del Norte es de $18,688
dlares. Un investigador de Carolina del Sur desea probar:
0 : = 18688
1 : 18688
Apara probar esta hiptesis:
Con un nivel de significacin = .05,
Se muestrearon n=400 residentes
Se determino una media del ingreso anual = 16860 dlares
Desviacin estndar de = 14624 dlares
Sustituyendo estos resultados con 2 ---- 1.96

2

14624
= 16860 1.96
400
= 16860 1433.152
15,427 18294 (15427,18294)

Anexo:
Tabla de Valores crticos de Z en las pruebas de hiptesis.
Tipo de prueba
Nivel de significancia
Unilateral Bilateral
+1.645
5% 1.96
1.645
+2.33
1% 2.58
2.33
ERRORES TIPO I Y II.

Error de tipo I. Rechaza la hiptesis nula H0 cuando es verdadera.

Ejemplo del error de tipo I:

Una muestra de 50 tarjetas de circuito impreso que se recibieron, revelo que 4 de estas es
decir 8% estaban fuera de especificaciones. El embarque se rechaz porque exceda el
mximo de 6% de tarjetas abajo del estndar. Si la remesa era en realidad fuera de
especificaciones, entonces la decisin de devolver las tarjetas al proveedor fue adecuada.
Sin embargo supngase que las 4 tarjetas fueran de especificaciones que se encontraron en
la muestra de 50, eran las nicas que estaban abajo del estndar, en el envi de 4 000
tarjetas.

Entonces solo 1/10 de 1% eran defectuosas (4/4000=0.001). En este caso, menos de 6% de


todo l envi estaba abajo del estndar y fue un error rechazar la remesa. En trminos de
una prueba de hiptesis, se rechaz la hiptesis nula de que el envi no estaba abajo del
estndar, cuando debi haberse aceptado.
Al rechazar una hiptesis nula verdadera se comete un error de tipo I. La probabilidad de
cometer un error de tipo I es.

Error de tipo II. Aceptarla hiptesis nula cuando esta es falsa.

Ejemplo de erro tipo II:

El fabricante de computadoras personales cometera un error de tipo II, dado un envi de


circuito impreso en el que hubiera 15% de tarjetas abajo del estndar, se acepta el envi.

Supngase que 2 de las 50 tarjetas de las muestras (4%) estuvieron debajo del estndar, y
que 48 de las 50 tarjetas de circuito impreso fueron aceptables. De acuerdo con el
procedimiento establecido, como la muestra contena menos del 6% de tarjetas abajo del
estndar, se acepto el envi Podra ser que debido al azar, las 48 tarjetas en buen estado
que se seleccionaron en la muestra fueran las nicas aceptables en la remesa completa,
integrada por miles de tarjetas.
Ejemplo con error de tipo I y error de tipo II:

En un ejemplo concerniente a la estatura promedio de los soldados, si la hiptesis de 68 es


rechazada de acuerdo con el resultado de la prueba, pero realmente el promedio es 68
pulgadas, se ha cometido un error tipo l. Por otra parte, si la hiptesis de 68 pulgadas es
aceptada de acuerdo con el resultado de la prueba, pero realmente el promedio es 70
pulgadas (o n.68 pulgadas), el investigador ha cometido un error de tipo II

Visto en retrospectiva, el investigador no puede estudiar cada elemento o individuo de la


poblacin. Por tanto, existe la posibilidad de cometer estos dos errores, un error de tipo I en
el que se rechaza la hiptesis nula cuando deba haber sido aceptada y un error de tipo II,
en el que se acepta la hiptesis nula cuando debera haberse rechazado.
La probabilidad de cometer estos dos errores se denomina alfa, y beta, . Alfa es la
posibilidad de cometer un error de tipo I, y beta () es la posibilidad de cometer un error de
tipo II.

En la siguiente tabla se resumen las decisiones que pueden tomar el investigador y las
consecuencias posibles.

Prueba para la diferencia entre dos proporciones poblacionales

Ejemplo 1:

Un fabricante est evaluando dos tipos de equipo para fabricar un artculo. Se obtiene una
muestra aleatoria de n1 = 50 para la primera marca de equipo y se encuentra que 5 de ellos
tiene defectos. Se obtiene una muestra aleatoria de n2 = 80 para la segunda marca y se
encuentra que 6 de ellos tienen defectos. La tasa de fabricacin es la misma para las dos
marcas. Sin embargo, como la primera cuesta bastante menos, el fabricante le otorga a esa
marca el beneficio de la duda y plantea la hiptesis H0: 1 2 . Pruebe la hiptesis en el
nivel de significancia del 5%.

Datos

n1 = 50 n2 = 80
1 = .10 2 = .075
H0 (1 2 ) 0H1 (1 2 ) > 0
= (= 0.05) = +1.645

Operaciones

n1 p1 + n2 p2 50(0.10) + 80(0.075) 5 + 6

= = = = 0.085
n1 + n2 50 + 80 130
(1 +
) (1 +
) (0.085)(0.915) (0.085)(0.915)
p1p2 =
+ = +
n1 n2 50 80
0.0778 0.0778
= + = 0.0016 + 0.0010 = 0.051
50 80
p1 p2 0.10 0.075 0.025
z= = = = +0.49
p1 p2
0.051 0.051
El valor calculado de z de +0.49 no es mayor que +1.645 para esta prueba del extremo
superior. Por ello, no puede rechazarse la hiptesis nula en el nivel de significancia del 5%.

MATRIZ DE DECISIN.

Una matriz de decisin es un grfico que permite a un equipo o un individuo identificar


yanalizar la tasa de la fuerza de las relaciones entre conjuntos de informacin.Una matriz
de decisin se utiliza con frecuencia durante las actividades de planificacin de lacalidad
para seleccionar producto / servicio, caractersticas y objetivos y desarrollar los procesosy
sopesar las alternativas.

Para mejorar la calidad una matriz de decisin puede ser til en la seleccin de un proyecto,
en laevaluacin de soluciones alternativas a problemas, y en el diseo de los
recursos.Dependiendo de las necesidades del equipo, estos pueden ser producto /
prestaciones del
servicio; etapas del proceso, los proyectos, o las posibles soluciones.

Criterios existentes para tomar una decisin en situacin de incertidumbre:

- Criterio optimista: Se denomina tambin maxi-max, es el que elegira una persona que
pensase que fuese cualfuese la estrategia que eligiera, siempre se le presentara el estado de
la naturaleza ms favorable, por ello elegirala estrategia que presentase el mejor resultado.

- Criterio pesimista o de Wald: Este criterio lo elegira una persona que creyera que una vez
elegida una estrategia,se le presentara el estado de la naturaleza ms desfavorable. En este
caso se podra escoger el valor mximo entrelos mnimos (criterio maxi-min), es decir,
elegira la estrategia que proporcionara el valor mximo entre los mnimosexistentes de
todas las opciones; o el valor mnimo entre los mximos (criterio mini-max).

- Criterio de Laplace: En este caso al no conocerse las probabilidades de cada uno de los
estados de la naturaleza,se asigna a cada uno la misma probabilidad. A continuacin se
calcula el valor monetario esperado de cadaestrategia, y se elige la que ofrezca un valor
ms alto.

- Criterio de Hurwicz: Al utilizar este criterio se consideran slo los valores mximos y
mnimos de cada estrategia, ya que se suma el mejor resultado de cada estrategia ponderado
con el coeficiente de optimismo (), con el peor resultado de cada estrategia ponderado con
el coeficiente de pesimismo (1 - ). El coeficiente de optimismo es subjetivo en la medida
en que lo decide la persona que toma las decisiones.

- Criterio de Savage: Lo utilizaran las personas que tienen miedo a equivocarse, por ello se
crea una nueva matriz de desenlaces en trminos de coste de oportunidad.
Sustituyendo los valores anteriores o resultados por los perjuicios resultantes de no haber
elegido la mejor estrategia, es decir, el coste de oportunidad. De este modo este criterio
muestra lo que se deja de ganar por escoger una estrategia equivocada.

Cuando se toma una decisin en condiciones de riesgo significa que se conoce la


probabilidad que existe de que suceda cada uno de los estados de la naturaleza. Por ello,
para decidir la alternativa ms beneficiosa se calcula el valor monetario esperado de cada
una para, finalmente, elegir el mximo valor.

En cambio, cuando se toma una decisin en condiciones de incertidumbre se desconoce la


probabilidad de que suceda cada uno de los posibles estados de la naturaleza. Por este
motivo, en este caso la decisin depende de la persona que deba tomarla y de su actitud
ante el riesgo. Los criterios ms utilizados que manifiestan esa actitud ante el riesgo son:
el criterio pesimista o de Wald (maxi-max), el optimista, el de Laplace, el de Hurwicz, y el
de Savage.

Ejemplo-Aplicacin

Una empresa dedicada a la fabricacin de calzado tiene que analizar entre diferentes
estrategias de produccin, aquella que le proporcione ms ventas, y, en consecuencia, ms
beneficios. Los posibles productos son: botas, zapatos y sandalias.

La decisin la debe tomar en funcin de las predicciones del tiempo que haga en los
prximos meses, ya que esto determinar que se venda ms un producto u otro. Los estados
de la naturaleza previstos son tres: tiempo fro, normal y clido.

En el momento de tomar la decisin el empresario no sabe con seguridad el estado de


tiempo, pero consultando los estados climticos de los ltimos aos llega a las siguientes
estimaciones en forma de probabilidad: existe un 30% de probabilidad de que el tiempo sea
fro, un 45% de que sea normal, y un 25% de que sea clido.
Por otro lado, la experiencia en el sector le permite estimar los resultados esperados en
cuanto a ventas, y esto le permite elaborar las siguientes predicciones o desenlaces:

La fabricacin de botas le dara unos beneficios (en euros) de 60.000, 15.000 y 2.500, si el
tiempo es fro, normal o clido respectivamente.

La fabricacin de zapatos le dara unos beneficios (en euros) de 5.000, 30.000 y 10.000, si
el tiempo es fro, normal o clido respectivamente.

La fabricacin de sandalias le dara unos beneficios (en euros) de -5.000, 7.500 y 50.000, si
el tiempo es fro, normal o clido respectivamente.

Teniendo en cuenta estos datos, se pide:

I. Situacin de riesgo
Elaborar la matriz de decisin.
Calcular los valores esperados de cada una de las estrategias.
II. Situacin de incertidumbre
Suponiendo que no conociera la probabilidad que existe de que el tiempo sea fro, normal o
clido:
Utilizando el criterio pesimista o de Wald, indicar qu opcin se elegira.
Qu opcin se elegira si se utiliza el criterio optimista?
Qu decisin se adoptara si se utiliza el criterio de Laplace?
Indicar qu opcin elegira el directivo si selecciona el criterio de Hurwicz para tomar la
decisin, conociendo que el
criterio de optimismo es 0,7.
Cul sera la opcin elegida si se utilizara el criterio de Savage?

I. Situacin de riesgo
a) Matriz de decisin:

b) Valor esperado para cada una de las estrategias:


II. Situacin de incertidumbre
c) Opcin elegida segn el criterio pesimista (maxi-min):

Los valores mnimos de cada opcin son 2.500 (botas), 5.000 (zapatos), y 5.000
(sandalias). Segn este criterio eldirectivo elegira la estrategia que le presentara el valor
mximo de los mnimos, por ello la opcin elegida sera la dezapatos porque asegura como
mnimo unas ganancias de 5.000 unidades monetarias.

d) Opcin elegida segn el criterio optimista (maxi-max):

Los valores mximos de cada opcin son 60.000 (botas), 30.000 (zapatos), y 50.000
(sandalias); por ello la opcinelegida sera la de botas que supone el valor mximo entre los
mximos de las tres alternativas (el beneficioesperado en la mejor de las opciones es el
superior).

e) Opcin elegida segn el criterio de La Place: este criterio supone que no se conoce la
probabilidad de queocurra cada una de las alternativas posibles, por ello el directivo
considera que cada una de ellas tiene la mismaprobabilidad de que ocurra; en este caso,
como son tres las opciones, sera 1/3 en cada una de ellas. El valoresperado se calcula
teniendo en cuenta esta probabilidad y se elige la mejor opcin.
En este caso se elegira la opcin de fabricar botas que es la que ms beneficios podra
proporcionar (25.575 unidades monetarias).

f) Utilizando el criterio de Hurwicz slo se consideran los valores mximos y los


mnimos de cada opcin. Para calcularlo, en cada opcin se suma el valor mximo
(ponderado por el coeficiente de optimismo) al valor mnimo (ponderado por el
coeficiente de pesimismo). El coeficiente de optimismo (), subjetivo ya que lo marca
quien toma las decisiones, es 0,7, por ello el coeficiente de pesimismo es (1-) = 0,3.

La alternativa elegida sera la de botas porque, al ponderar con estos coeficientes, ofrece el
valor esperado ms alto.

g) Utilizar el criterio de Savage para tomar una decisin significa elaborar una matriz de
coste de oportunidad. Para ello, en cada estado de la naturaleza se da valor 0 a la mejor
opcin, en el resto de las opciones se halla la diferencia en relacin con la mejor:

La opcin elegida sera la de abrigos porque es la que tiene un menor coste de


oportunidad.
ELECCIN DE LA PRUEBA ESTADSTICA

Una investigacin bien planificada debe incluir en su diseo referencias precisas acerca de
las tcnicas estadsticas que se utilizan en el anlisis de los datos.

El anlisis estadstico es el procedimiento objetivo por medio del cual se puede aceptar o
rechazar un conjunto de datos como confirmatorios de una hiptesis. El desarrollo de las
pruebas estadsticas se ha incrementado a tal grado que en la actualidad se cuenta con
varias pruebas alternativas, las cuales se pueden usar para casi todo diseo experimental, de
modo que el investigador se encuentra ante el dilema de seleccionar la ms apropiada y
econmica, para las preguntas que, mediante.la.investigacin,.deseacontestar.

Ante esa situacin, es necesario tener una base racional, por medio de la cual se
seleccione la prueba ms apropiada. Esta seleccin constituye el punto crtico del anlisis
estadstico.

EN LA SELECCIN DE UNA PRUEBA ESTADSTICA, SE DEBEN APLICAR LOS


CRITERIOS SIGUIENTES:

a. Tipo de escala.
b. Hiptesis.
c. Potencia y eficiencia de la prueba.
d. Caractersticas muestrales.
e. Tendencia rectilnea o curvilnea del fenmeno.

a) TIPO DE ESCALA: En las observaciones de una investigacin se puede dar una


medicin que en este campo consiste en asignar nmeros a objetos y eventos de
acuerdo con reglas de la lgica aceptables.

El sistema numrico es una creacin altamente lgica, que ofrece mltiples posibilidades,
para manifestaciones tambin de carcter lgico. Si se puede, de manera legtima, asignar
nmeros al describir caractersticas, objetos y eventos, ser factible operar con ellos en
todos sus modos permisibles y, de esas operaciones, derivar conclusiones aplicables a los
fenmenos observados y medidos. Entonces, se justifica describir cosas reales por medio de
nmeros, siempre y cuando exista un grado de isomorfismo (semejanza de propiedades)
entre las cosas reales y el sistema numrico, es decir, ciertas propiedades de los nmeros
deben tener paralelismo con los fenmenos observados, para que confiadamente se pueda
asignar los nmeros.

Tres propiedades fundamentales de los nmeros permiten su aplicacin en el campo de la


investigacin cientfica en Psicologa: Identidad, Ordinalidad y Aditividad.

1- IDENTIDAD: Cada nmero slo es igual a s mismo, de manera que ningn otro es
igual a l, es decir, posee identidad y, por lo tanto, a cualquier objeto o evento diferenciable
de los dems, que tenga identidad, se le podr aplicar un nmero. Este carcter de identidad
de los nmeros da origen a la escala nominal, que es un mtodo para identificar
cualitativamente los distintos objetos y eventos, y resulta obvio que no se le puede dar
ningn significado cuantitativo, por ejemplo: si en un modelo experimental se cuenta una
serie de clases, en las cuales se consignan sus frecuencias, stas revelan un conjunto de
cada clase.
Grupo de 120 nios con y sin Dislexia.
SERIES DE FRECUENCIAS
FRECUENCIAS
Nias con Dislexia 40
Nias sin Dislexia 20
Nios con Dislexia 50
Nios sin Dislexia 10
TOTAL 120

Bajo el contexto de la tabla anterior, una muestra de 120 individuos en edad infantil se ha
clasificado en dos grupos por sexo (masculino y femenino) y por la presencia o ausencia de
Dislexia.

Por otro lado, las frecuencias informan de conjuntos de nios o serie de clases con una
categora e identidad, que dan una medida de las observaciones y son los valores sujetos a
operaciones aritmticas. En estas condiciones, se puede contrastar hiptesis de la
distribucin de los casos, mediante la aplicacin de pruebas estadsticas. No todas estas
pruebas son apropiadas para datos nominales, pues revelan las frecuencias en las categoras,
es decir, en datos enumerativos.

2- ORDINALIDAD: las pruebas tambin tienen un orden o rango siempre mayor que otro,
el cual le precede en un continuum ascendente. Los objetos y eventos susceptibles de un
ordenamiento a lo largo de un continuum tienen una escala ordinal.

Las escalas ordinales se emplean frecuentemente en la investigacin clnica, en la que el


refinamiento cuantitativo a veces no es posible; por ejemplo: cuando se clasifica una
respuesta en pacientes bajo los trminos sin cambio, mejorado, curado, esto indica un
rango de orden y clasificacin.

En conclusin, cabe establecer que mientras las escalas nominales slo clasifican, las
ordinales clasifican y ordenan, de manera que dan como resultado una serie de clases y
categoras mutuamente exclusivas, llamadas rangos.

3- ADITIVIDAD:los nmeros tienen propiedad aditiva, lo cual quiere decir que la suma de
un nmero con otro debe dar un tercer nmero nico. Esta propiedad de los nmeros no
slo identifica y ordena, sino adems puede sujetarse a todas las operaciones aritmticas de
los nmeros. Las conclusiones de tales operaciones son vlidas para las observaciones y
dan lugar a la denominada escala de intervalo.

De las mediciones que en el terreno de la investigacin se hayan realizado, puede inferirse


que el tipo de escala (nominal, ordinal e intervalo), de modo que ste es el primer paso para
elegir un procedimiento estadstico: la prueba paramtrica y la no paramtrica.
MEDICIONES, VARIABLES Y ESCALA PARA LA ELECCIN DE LA PRUEBA
ESTADSTICA.

b) HIPTESIS: La Hiptesis Alterna(H1) que se desea analizar debe ser precisa, tan
completa como resulte posible, pues se trata de la aseveracin operacional de la
hiptesis de investigacin por el experimentador. Conjuntamente al proceso
anterior, se declara la Hiptesis Nula (Ho), en la cual simplemente se establece la
ausencia de diferencia y se declara, pare percibir con claridad, que la hiptesis se
ajusta a la prueba estadstica.

* El nivel de significacin corresponde al lmite de confianza, del riesgo de error,


que enjuicia el investigador para aceptar su Ha como verdadera. De manera
universal y arbitraria, dicho nivel se ha fijado en 0.05 y 0.01 de error y en 0.95 y
0.99 de certeza para aceptar hiptesis en el rea psicolgica, por que se espera un 5%
de variacin en las mediciones.

Contrariamente a lo anterior, tambin se debe establecer la zona de rechazo, la cual


corresponde al lmite de confianza, en que el investigador rechaza la hiptesis alterna y
acepta la hiptesis nula.

Bajo los trminos expresados, el investigador debe ser meticuloso al elegir la prueba
estadstica y al plantear la hiptesis, el nivel de significancia y la zona de rechazo, en virtud
de que es factible cometer dos errores graves en la decisin estadstica: a) Error tipo I.
Rechazar la (Ho), siendo verdadera.

b) Error del tipo II. Aceptar la (Ho), siendo falsa.


La probabilidad de cometer un error del tipo I est dada por (alfa), de manera que cuanto
mayor sea alfa, ms probable ser que Ho se rechace, siendo verdadera. La siguiente figura
muestra una escala de falso a verdadero, donde cero es falso y el valor uno verdadero.

Escala de probabilidad.
Entre el 0 y el 1 existen valores intermedios, mientras que donde marca 0.95 existe
una diferencia de 0.05 con respecto a 1. Este lmite corresponde al nivel de
significancia o error alfa, donde todo valor igual o menor que 0.05 se acepta Ha. Por
lo tanto, 1 - alfa = beta.

De no decidir entre una u otra hiptesis, el investigador se plantea la alternativa de


aumentar el tamao de la muestra, para que el fenmeno se define con ms claridad
y la decisin en el contraste de la hiptesis sea ms consistente.

c) EFICIENCIA DE LA PRUEBA: La validez del anlisis estadstico depende mucho de


la eficacia de la prueba estadstica empleada. Se acepta que una prueba estadstica
es eficaz cuando tiene una probabilidad muy pequea de rechazar una hiptesis
verdadera, y una alta probabilidad de rechazar la hiptesis cuando sta es falsa.

La pruebas estadsticas se dividen en dos grandes grupos: paramtricas y no paramtricas.


Las primeras son aquellas cuyo modelo especifica ciertas condiciones o premisas que debe
tener la poblacin, de la cual se ha derivado la muestra. Por otra parte, las pruebas no
paramtricas, como su nombre lo indica, no requieren satisfacer esas condiciones o
premisas.

* Las pruebas paramtricas son las ms eficaces y de uso comn en la investigacin, como
las de comparacin de promedios o prueba t de Student y la de anlisis de varianza de
Fischer (ANOVA).
* Cuando por cualquier razn no se puedan cumplir los requisitos de las pruebas
paramtricas, el investigador podr recurrir a las no paramtricas. En ellas no hay
exigencia de homogeneidad de varianzas y, auxiliadas por un modelo matemtico de ajuste,
se puede obtener una eficacia que es muy cercana a la de las pruebas t de Student y de
anlisis de varianza.

Cabe sealar que, conforme menos condiciones o presunciones exige una prueba
estadstica, en que se basa su modelo matemtico, ms generales son sus conclusiones
derivadas de su aplicacin; sin embargo, tambin es menos eficaz para rechazar la
influencia del azar, cuando ste no desempea un papel importante.

d) CARACTERSTICAS MUESTRALES: La manera en que influye la muestra para


elegir una prueba estadstica est en funcin de su TAMAO, SELECCIN Y
DISTRIBUCIN EN EL DISEO EXPERIMENTAL.

1.- TAMAO DE LA MUESTRA: Anteriormente se habl de que la eficacia de una


prueba estadstica disminuye cuando se reducen las condiciones o premisas del modelo; sin
embargo, a medida que aumenta el tamao de la muestra, se incrementa tambin la
eficacia.

2.- SELECCIN DE LA MUESTRA. Las muestras por analizar pueden ser


independientes y dependientes o relacionadas.
* Muestras Independientes. Son aquellas cuyo universo de poblacin resulta diferente y
que, por cada variable existente, hay un universo finito o infinito; por ejemplo, en la Tierra
hay un nmero finito de seres humanos, pero la variable sexo divide en dos universos
diferentes: hombres y mujeres. En el mismo sentido, el estado civil define otros universos
distintos, solteros, casados, divorciados, viudos, etc. De esta manera, se pueden enumerar
mltiples variables, que dan lugar a una infinidad de universos muestrales, de donde es
factible elegir muestras independientes.

* Muestras Dependientes o Relacionadas. Se refieren a las provenientes de un universo


muestral, a las que se aplicar un plan experimental, mediante el cual se espera un cambio,
que obligadamente exige un punto de referencia de no cambio.

3.- DISTRIBUCIN DE LA MUESTRA EN EL DISEO EXPERIMENTAL.El nmero


de muestras con que est elaborado el modelo de investigacin tiene singular valor para
elegir la prueba estadstica, pues las conclusiones a que se llegue al no aplicar la prueba
adecuada darn lugar a falsas interpretaciones del experimento.

Por ejemplo: Para saber si los pacientes han alcanzado una total remisin de una
enfermedad, se atiende a los hallazgos de tiempo de sobrevida y a las alteraciones clnicas
de la patologa. Si cuenta con varios tratamientos, se plantea la pregunta de cul de ellos ha
sido el ms efectivo.

Un ejemplo vlido es el de un investigador que trabaja con roedores, para estudiar las
caractersticas conductuales de agresividad y la concentracin de neurotransmisores en el
sistema nervioso central. El conjunto de la muestra est constituido por cobayos, ratas y
ratones, que representan grupos con tres gradientes de agresividad. En estas condiciones, el
diseo experimental tiene tres muestras independientes. La eleccin de la prueba estadstica
se basar en las dos caractersticas y en el tipo de escala de las mediciones. En el supuesto
de que las concentraciones de neurotransmisores tengan una medicin cuantitativa, una
variable continua, una escala de intervalo y una distribucin normal, con varianzas
homogneas, la eleccin ms adecuada ser el ANOVA de Fischer de una entrada.

EL NIVEL DE SIGNIFICACIN Y EL TAMAO DE LA MUESTRA

Todo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin del


tamao muestral necesario para la ejecucin del mismo. El no realizar dicho proceso, puede
llevarnos a dos situaciones diferentes:

1) Que realicemos el estudio sin el nmero adecuado de pacientes, con lo cual no


podremos ser precisos al estimar los parmetros y adems no encontraremos diferencias
significativas cuando en la realidad s existen.

2) Que podramos estudiar un nmero innecesario de pacientes, lo cual lleva implcito no


solo la prdida de tiempo e incremento de recursos innecesarios sino que adems la calidad
del estudio, dado dicho incremento, puede verse afectada en sentido negativo.

Para determinar el tamao muestral de un estudio, debemos considerar diferentes


situaciones:

A) Estudios para determinar parmetros Pretendemos hacer inferencias a valores


poblacionales (proporciones, medias) a partir de una muestra.

A.1. Estimar una proporcin: Debemos saber:

a) El nivel de confianza o seguridad (1- ). El nivel de confianza prefijado da lugar a


un coeficiente (Za ). Para una seguridad del 95% = 1.96, para una seguridad del 99%
= 2.58.
b) La precisin que deseamos para nuestro estudio.
c) Una idea del valor aproximado del parmetro que queremos medir (en este caso una
proporcin). Esta idea se puede obtener revisando la literatura, por estudio pilotos
previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%),
ya que asi maximiza el tamao muestral.

dnde:

Za 2 = 1.962 (ya que la seguridad es del 95%)


p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1 0.05 = 0.95)
d = precisin (en este caso deseamos un 3%)

Si la poblacin es finita, es decir conocemos el total de la poblacin y desesemos saber


cuntos del total tendremos que estudiar la respuesta seria:

dnde:

N = Total de la poblacin
Za2 = 1.962 (si la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1-0.05 = 0.95)
d = precisin (en este caso deseamos un 3%).

Segn diferentes seguridades el coeficiente de Za vara, as:

Si la seguridad Za fuese del 90% el coeficiente sera 1.645


Si la seguridad Za fuese del 95% el coeficiente sera 1.96
Si la seguridad Za fuese del 97.5% el coeficiente sera 2.24
Si la seguridad Za fuese del 99% el coeficiente sera 2.576

A.2. Estimar una media: Debemos saber:

El nivel de confianza o seguridad (1- ). El nivel de confianza prefijado da


lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96; para una
seguridad del 99% = 2.58.
La precisin con que se desea estimar el parmetro (2 * d es la amplitud del
intervalo de confianza).
Una idea de la varianza S2 de la distribucin de la variable cuantitativa que
se supone existe en la poblacin.

Ejemplo: Si deseamos conocer la media de la glucemia basal de una poblacin, con una
seguridad del 95 % y una precisin de 3 mg/dl y tenemos informacin por un estudio
piloto o revisin bibliogrfica que la varianza es de 250 mg/dl
Si la poblacin es finita, como previamente se seal, es decir conocemos el total de la
poblacin y desearamos saber cuantos del total tendramos que estudiar, la respuesta sera:

B) Estudios para contraste de hiptesis: Pretenden comparar si las medias o las


proporciones de las muestras son diferentes. Para el clculo del tamao muestral se precisa
conocer:

a. Magnitud de la diferencia a detectar que tenga inters clnicamente


relevante. Se pueden comparar dos proporciones o dos medias.
b. Tener una idea aproximada de los parmetros de la variable que se estudia
(bibliografa, estudios previos).
c. Seguridad del estudio (riesgo de cometer un error )
d. Poder estadstico (1 - ) (riesgo de cometer un error )
e. Definir si la hiptesis va a ser unilateral o bilateral.

o Bilateral: Cualquiera de los dos parmetros a comparar (medias o


proporciones) puede ser mayor o menor que el otro. No se establece
direccin.
o Unilateral: Cuando se considera que uno de los parmetros debe ser
mayor que el otro, indicando por tanto una direccin de las
diferencias.

La hiptesis bilateral es una hiptesis ms conservadora y disminuye el riesgo de cometer


un error de tipo I (rechazar la H0 cuando en realidad es verdadera).

B1. Comparacin de dos proporciones:

Donde:

n = sujetos necesarios en cada una de las muestras


Za = Valor Z correspondiente al riesgo deseado
Zb = Valor Z correspondiente al riesgo deseado
p1 = Valor de la proporcin en el grupo de referencia, placebo, control o
tratamiento habitual.
p2 = Valor de la proporcin en el grupo del nuevo tratamiento, intervencin
o tcnica.
p = Media de las dos proporciones p1 y p2 :

Los valores Za segn la seguridad y Zb segn el poder se indican en la Tabla 2(8).

B2. Comparacin de dos medias:

Donde:

n = sujetos necesarios en cada una de las muestras


Za = Valor Z correspondiente al riesgo deseado
Zb = Valor Z correspondiente al riesgo deseado
S2 = Varianza de la variable cuantitativa que tiene el grupo control o de
referencia.
d = Valor mnimo de la diferencia que se desea detectar (datos
cuantitativos)

Los valores Za segn la seguridad y Zb segn el poder se indican en la Tabla 2(8).

Tabla 2. Valores de Za y Zb ms frecuentemente utilizados


Za
Test unilateral Test bilateral
0.200 0.842 1.282
0.150 1.036 1.440
0.100 1.282 1.645
0.050 1.645 1.960
0.025 1.960 2.240
0.010 2.326 2.576
Potencia
(1-) Zb
0.01 0.99 2.326
0.05 0.95 1.645
0.10 0.90 1.282
0.15 0.85 1.036
0.20 0.80 0.842
0.25 0.75 0.674
0.30 0.70 0.524
0.35 0.65 0.385
0.40 0.60 0.253
0.45 0.55 0.126
0.50 0.50 0.000

El tamao muestral ajustado a las prdidas

En todos los estudios es preciso estimar las posibles perdidas de pacientes por
razones diversas (prdida de informacin, abandono, no respuesta.) por lo que se debe
incrementar el tamao muestral respecto a dichas prdidas.

El tamao muestral ajustado a las prdidas se puede calcular:

Muestra ajustada a las prdidas = n (1 / 1R)

n = nmero de sujetos sin prdidas


R = proporcin esperada de prdida

ZONAS DE ACEPTACIN Y DE RECHAZO DE LA HIPTESIS

Nivel de significacia: Probabilidad de rechazar la hiptesis nula cuando es verdadera. Se le


denota mediante la letra griega , tambin es denominada como nivel de riesgo, este
termino es mas adecuado ya que se corre el riesgo de rechazar la hiptesis nula, cuando en
realidad es verdadera. Este nivel esta bajo el control de la persona que realiza la prueba.

Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin


indicar la probabilidad de no aceptarla, es decir, estn fuera de rea de aceptacin. El
nivel de confianza (1-), indica la probabilidad de aceptar la hiptesis planteada, cuando es
verdadera en la poblacin.

La distribucin de muestreo de la estadstica de prueba se divide en dos regiones, una


regin de rechazo (conocida como regin crtica) y una regin de no rechazo (aceptacin).
Si la estadstica de prueba cae dentro de la regin de aceptacin, no se puede rechazar la
hiptesis nula.

La regin de rechazo puede considerarse como el conjunto de valores de la estadstica de


prueba que no tienen posibilidad de presentarse si la hiptesis nula es verdadera. Por otro
lado, estos valores no son tan improbables de presentarse si la hiptesis nula es falsa. El
valor crtico separa la regin de no rechazo de la de rechazo.

PRUEBAS DE HIPTESIS EN EL CASO DE UNA SOLA MUESTRA

Pruebas de hiptesis es una parte de la ESTADISTICA INFERENCIAL y tiene su analoga


con los pasos que se realizan en un JUICIO.

Objetivo:

Aqu no se busca Estimar el parmetro sino determinar cul de las hiptesis contrapuestas
propuestas por el investigador es la correcta para cierto nivel.
Procedimiento de Prueba de Hiptesis

El investigador establecer las hiptesis en base a la teora que quiere verificar, para un
parmetro .
Tomar una muestra aleatoria de la poblacin en estudio.
Comparar lo observado con su teora, si lo observado se contrapone a su teora se rechaza
su hiptesis en caso contrario se dice que no se observ cambio.

Primero definiremos los elementos necesarios para lleva adelante una Prueba de hiptesis.
a) El investigador debe establecer las hiptesis contrapuestas de inters para , llamadas
Hiptesis Nula () e Hiptesis Alternativa ().

hiptesis de no cambio, no diferencia, no mejora, etc.


hiptesis que el investigador pretende validar.

Si es el parmetro de inters y 0 un valor fijado por el investigador entonces en nuestro


tratamiento de Prueba de hiptesis consideraremos estas posibles hiptesis alternativas

><

b) Estadstico de Prueba: estadstico con distribucin conocida bajo hiptesis nula, sobre
el cual se basar la decisin a tomar.
c) Regin de Rechazo (RR): conjunto de valores del estadstico de prueba para los cuales
ser rechazada.
d) Luego ser rechazada si el valor observado o alcanzado del estadstico pertenece a la
RR, en cuyo caso diremos que la es la correcta. En caso contario diremos que no se
encontr evidencia suficiente para rechazar .

Al tomar una decisin se pueden cometer dos tipos de errores.


Error tipo I: Rechazar cuando es verdadera.
Error tipo II: Aceptar cuando es falsa.
Denotaremos con a las probabilidades de cometer los Errores tipo I y tipo II
respectivamente.
Llamaremos nivel de significacin de una prueba al valor
= , : .
La RR determina las probabilidades de cometer cada uno de los errores.

En resumen los pasos a seguir para realizar una Prueba de Hiptesis son:
a) Identificar el parmetro de inters.
b) Determinar las Hiptesis nula y alternativa para el problema.
c) Determinar el Estadstico de Prueba adecuado, con distribucin conocida bajo .
d) Fijado un nivel de significancia determinar la Regin de Rechazo.
e) Calcular el valor observado o alcanzado del estadstico de prueba con la muestra
obtenida.
f) Determinar si debe ser rechazada o no para el nivel de significacin dado,
estableciendo una conclusin en el contexto del problema.

PROBLEMA:
Supongamos que el 10% de las tarjetas de circuito producidas por cierto fabricante son
defectuosas.
Con el fin de reducir la proporcin de tarjetas defectuosas se ha sugerido un nuevo proceso
de produccin.
En este caso = es la verdadera proporcin de tarjetas defectuosas con este nuevo mtodo
de produccin.
a) Establecer las hiptesis de inters.
b) Se tom una muestra aleatoria de n=200 tarjetas producidas con este nuevo mtodo.
Determinar el Estadstico de Prueba.
c) Dada la = 15 , calcular el nivel de significancia aproximado y hallar una
expresin para la probabilidad aproximada de cometer el Error de tipo II.
d) Si ahora la = 12 , calcular el nivel de significancia aproximado.
e) Si en la muestra aleatoria se obtuvo x=13 cul sera su conclusin? Usando la regin de
rechazo dada en el tem c).

Observaciones:
i) crece cuando se aproxima a 0,10.
ii) =max0,10 = 0,10 .Luego esta prueba sigue teniendo el mismo nivel de
significancia para la hiptesis simplificada 0:=0,10.
Por lo tanto de ahora en ms nuestra hiptesis nula ser: =

Pruebas de Hiptesis para la media poblacional


As como hicimos en IC consideraremos diferentes situaciones para plantear Prueba de
Hiptesis.
Hiptesis Nula: =
Caso A:
Sea 1,2,, una m.a. de (,2) con 2 conocido.
Bajo estos supuestos sabemos que ~ , ~ (,)
Estadstico de Prueba
~ (,) , bajo
Si la Hiptesis alternativa fuese: <
Fijado un nivel de significancia entonces veamos cmo definir la Regin de Rechazo
() y estudiemos el comportamiento de la funcin .

PRUEBAS DE HIPTESIS EN EL CASO DE DOS MUESTRAS

La prueba de hiptesis para dos muestras es casi semejante a la prueba de una sola muestra
es decir que este captulo se tomaran dos muestras aleatorias para determinar si proviene de
una misma poblacin o a su vez de poblaciones iguales.

As mismo puedo entender que en el caso de que se den las dos poblaciones iguales, se
esperar que la media entre las dos medias mustrales sea cero.

En el caso que existan poblaciones independientes, estas son iguales a la suma de dos
variables individuales.

Por ende las muestras deben ser suficientemente grandes para que la distribucin de las
medias mustrales siga una distribucin normal.
As mismo constituyo que para realizar una comparacin de poblaciones con muestras
pequeas es necesario tener en cuenta las siguientes suposiciones: las dos muestras
provienen de poblaciones independientes, de igual manera las desviaciones estndar de las
dos poblaciones son iguales, as mismo las poblaciones muestreadas siguen una
distribucin normal.

Como consiguiente tenemos que el nmero de grados de libertad en la prueba es igual al


nmero total de elementos muestreados, menos el nmero de muestras.

Existen casos en que las muestras no son independiente sino son dependientes o que a su
ves estas estn relacionadas entre si.

Por tal razn puedo entender que existen dos tipos de muestras dependientes:

1.- las que se caracterizan por una medicin, una intervencin de cierto tipo y est a su ves
otra medicin.
2.- existe una formacin de pares de las observaciones correspondientes.
Para tener una idea ms concreta formulare la existencia de una comparacin de las
muestras independientes y dependientes.

Las muestra dependiente son aquellas que se caracteriza por una medicin seguida, por un
intervalo de algn tipo y despus otra medida. A esta tambin se la puede llamar un estudio
antes o despus.

De la misma forma el segundo tipo de muestra dependiente se caracteriza por la formacin


de pares de observaciones.

PROBLEMA

Se realiza un estudio acerca del impacto que tiene el Programa de Planificacin Familiar
que
lleva a cabo el HMI Ramos Larrea en dos asentamientos humanos de su jurisdiccin, uno
ubicado en rea urbana (A) y otro en rea rural(B), tomando para ello dos muestras de
mujeres
en edad frtil y con actividad sexual: nA = 30 y nB = 30. Despus de aplicado el
instrumento de
medicin, se obtienen los siguientes datos:

Segn los datos obtenidos y suponiendo normalidad, podramos decir que el impacto fue
mayor en las mujeres del asentamiento humano ubicado en el rea urbana? Utilizar un nivel
de
significacin del 5%.

Solucin:
1. Planteamiento de hiptesis:
Ho: 1 2
H1: 1 >2
2. Nivel de significancia: = 0.05
3. Prueba estadstica:

Con los supuestos:


Las distribuciones son normales
Las muestras se seleccionaron al azar.
1. Criterios de decisin:

Si Zc 1.64 se acepta la Ho en caso contrario se rechaza.


2. Clculo: (Anlisis de datos con Excel)

Conclusiones:
Se rechaza la hiptesis nula (Ho), se acepta la hiptesis alterna (H1) a un nivel de
significancia de = 0.05. La prueba result ser significativa.
La evidencia estadstica no permite aceptar la hiptesis nula.
La evidencia estadstica disponible permite concluir que probablemente el impacto
del
Programa de Planificacin Familiar fue mayor en las mujeres del asentamiento humano del
rea urbana.

LA PRUEBA DE DIFERENCIA ENTRE DOS MEDIAS

En ocasiones interesa definir un intervalo de valores tal que permita establecer cuales son
los valores mnimo y mximo aceptables para la diferencia entre las medias de dos
poblaciones. Pueden darse dos situaciones segn las muestras sean o no independientes;
siendo en ambos casos condicin necesaria que las poblaciones de origen sean normales o
aproximadamente normales:
MUESTRAS INDEPENDIENTES

Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo de
confianza para la diferencia de medias poblacionales est centrado en la diferencia de las
medias muestrales, siendo sus lmites superior e inferior:

t /2 es el valor crtico correspondiente al grado de confianza 1- de la distribucin t de

Student con n1+ n2-2 grados de libertad y es una


estimacin de la desviacin tpica comn a ambas poblaciones obtenida a partir de las
varianzas de las dos muestras. En la prctica si n1 y n2 son moderadamente grandes, el
valor crtico

t /2 se aproxima, como ya se ha visto anteriormente, a los valores de la distribucin


normal.

Si las varianzas poblacionales no pueden suponerse iguales los lmites del intervalo de
confianza son:

El valor crtico t /2 corresponde a una distribucin t cuyos grados de libertad se calculan


en base a ambos tamaos muestrales y a las desviaciones tpicas de cada grupo segn la
correccin propuesta por Dixon y Massey:

Para obtener el intervalo de confianza en ambos casos la secuencia es:

Analizar

Comparar medias

Prueba T para muestras independientes


En el cuadro de dilogo hay que seleccionar en Contrastar variables la variable objeto de
anlisis e indicar la Variable de agrupacin junto con el criterio para Definir grupos (las
dos poblaciones).

Los grupos pueden definirse en funcin de una variable cuantitativa o de una cualitativa. Si
la variable de agrupacin presenta slo dos valores o modalidades, entonces se debe
seleccionar Usar valores especificados e indicar la modalidad que define el grupo 1 y la del
grupo 2. Si la variable tiene ms de 2 valores o modalidades se elige la opcin Punto de
corte indicando el valor de la variable que induce una particin en dos grupos, uno de los
cuales estar formado por todos los casos con valores menores que el especificado y el otro
por el resto de casos.

Al aceptar se obtienen:

- resultados de la prueba de Levene para contrastar la igualdad de varianzas


*
- resultados de la prueba T para contrastar la igualdad de medias

- intervalo de confianza para la diferencia de medias al 95% por defecto.


Si se quiere cambiar el grado de confianza del intervalo, antes de aceptar hay que
modificarlo con el botn Opciones.

MUESTRAS DEPENDIENTES. En este caso las muestras estn formadas por


parejas de valores, uno de cada poblacin y el estadstico se obtiene a partir de las
diferencias de los valores de las dos variables correspondientes a cada caso o di que
se define como di= xi-yi.

Para contrastar la hiptesis de igualdad de medias y obtener el intervalo de confianza la


secuencia es:

Analizar

Comparar medias

Prueba T para muestras independientes

Las variables se deben seleccionar por parejas. Haciendo clic sobre las variables de la lista
aparecen sus nombres en el cuadro Selecciones actuales; una vez seleccionadas las dos
variables se trasladan al recuadro Variables relacionadas de la forma habitual. En cada
sesin se pueden seleccionar tantos pares de variables como medias se quieran comparar.

Al aceptar se obtienen para cada par de variables, los siguientes resultados:

- Media, desviacin tipo y error tpico de la media de las di.

- Intervalo de confianza, por defecto al 95%, para la diferencia de medias poblacionales que
viene dado por:

es el valor de la distribucin t de Student con n-1 grados de libertad


que deja por encima una probabilidad de /2.
- Estadstico t del contraste (contraste de dos colas).

EJEMPLO

Ejemplo 1

Con los datos de la encuesta Enctran.sav obtener la estimacin puntual y los intervalos de
confianza del 95 y del 99% para la media de la poblacin de la variable Coste.

En el cuadro de dilogo Explorar, que se obtiene con la secuencia Analizar > Estadsticos
descriptivos > Explorar, se selecciona como variable dependiente la variable Coste. En
Estadsticos comprobamos que est activada la opcin Descriptivos y que el intervalo para
la media definido es el del 95%.

Al aceptar se obtiene el siguiente cuadro de resultados:

La estimacin puntual del valor esperado del coste es 5236,40 Pta. Esta estimacin tiene un
error tpico de 365,97. Los lmites inferior y superior del intervalo de confianza del 95%
son 4511,34 y 5951,46, respectivamente. Este resultado se interpreta como que de los
intervalos obtenidos con este mtodo el 95% contendrn el verdadero valor esperado del
coste. Una medida del grado de precisin con el que se est estimando el valor esperado es
la amplitud del intervalo, que en este caso es igual a 1450,12 y la mitad de la amplitud, que
es 725,06, es el error mximo de estimacin que puede garantizarse con una probabilidad

de 0,95. Este error mximo es igual a donde t /2 , es el valor crtico para =0,05

de la distribucin t e Student, en este caso con 113 grados de libertad, y es el error


tpico de la estimacin.
Para obtener el intervalo del 99% de confianza modificamos el valor del grado de confianza
en el cuadro Explorar:Estadsticos
fijndolo en el 99%.

Los lmites del intervalo de confianza del 99% son 4277,54 y 6195,27; la confianza de que
este intervalo contenga el verdadero valor esperado del coste es 0,99. La amplitud de este
intervalo es 2217,73 que es mayor que la amplitud del intervalo del 95%, por lo tanto,
1108,865, es el error mximo de estimacin que puede garantizarse con una probabilidad
de
0,99. Como puede verse, a medida que aumenta el grado de confianza del intervalo
disminuye la precisin de la estimacin.

Ejemplo 2.

Para la misma variable Coste verificar si se puede aceptar el supuesto de que el valor
esperado del Coste es superior a 6000.

Con la secuencia Analizar > Comparar medias > Prueba T para una media se abre el
cuadro de dilogo Prueba T para una muestra en el cual se selecciona la variable Coste y
se indica como Valor de prueba 6000. Esto quiere decir que las hiptesis que se estn
contrastando son Se trata por tanto de un contraste a
una sola cola.
El estadstico de prueba toma el valor t=-2,086, que en las tablas de la
distribucin t de Student con 113 grados de libertad deja por debajo un rea de 0,0195. Esto
quiere decir que se rechaza la hiptesis nula en favor de la alternativa para niveles de
significacin superiores a 0,0195. Obsrvese que 0,0195 es la mitad del nivel de
significacin para la prueba de dos colas que aparece en el cuadro de resultados.

Por otra parte si las hiptesis hubieran sido se rechazara la


hiptesis nula en favor de la alternativa para niveles de significacin superiores a 0,039. El
intervalo del 95% de confianza para la media calculado en el apartado anterior no contena
el valor 6000; lo que equivale a decir que para un nivel de significacin del 5% se rechaza
la hiptesis nula. Por el contrario, el intervalo del 99% contena el valor 6000 y, por lo
tanto, para un nivel de significacin del 1% no se rechazara la hiptesis nula.

Ejemplo 3.

Verificar si existe diferencia significativa entre el coste esperado en transporte de los


alumnos que viven en Barcelona y el de los que viven fuera.

Con la secuencia Analizar> Comparar medias > Prueba T para muestras independientes
se abre el cuadro de dilogo Prueba T para muestras independientes en el cual se
selecciona la variable Coste y se indica como Variable de agrupacin Resid. En la opcin
Definir grupos se asigna al Grupo 1 el valor 1 (vive en Barcelona) y al Grupo 2 el valor 2
(no vive en Barcelona). Aceptando se obtienen entre otros los siguientes resultados:
Las hiptesis que se estn contrastando son frente Para
realizar este contraste previamente se debe comprobar si es aceptable la hiptesis de
varianzas poblacionales iguales para los dos grupos . El estadstico F de la
prueba de Levene* no permite aceptar la igualdad de varianzas poblacionales, por lo cual el
valor del estadstico de prueba es t=-3,750 que para cualquier nivel de significacin lleva a
rechazar la hiptesis de igualdad de medias. El signo negativo del estadstico t indica que el
coste del transporte es significativamente superior para los que viven fuera de Barcelona.

Ejemplo 4.

Con los datos de la encuesta Encinf.sav contrastar si existe diferencia significativa entre
las puntuaciones medias asignadas a las aulas de inforntica en cuanto a la Dotacin y
Software.

Las puntuaciones que se quiere comparar han sido generadas dos a dos por los mismos
individuos; se trata por tanto del caso de muestras relacionadas. Las hiptesis que se
contrastan son

Con la secuencia Analizar > Comparar medias >Prueba T para muestrasrelacionadas se


abre el cuadro de dilogo en el cual se selecciona la pareja de variables Dotacion-Software.
Al aceptar se obtienen los siguientes resultados:

El anlisis slo ha considerado los casos que no presentan ningn valor missing en el par de
puntuaciones, quedando nicamente 106 casos vlidos de los 114.

El promedio de las diferencias entre las puntuaciones asignadas a la dotacin y al software


es de -1,12 con un error tpico igual a 0,19. El estadstico de prueba t es igual a -5,93 y se
distribuye segn una t de Student con 105 grados de libertad. Con este valor de t se rechaza
la hiptesis nula para cualquier nivel de significacin. Los resultados proporcionan tambin
el intervalo de confianza para la diferencia de las dos medias poblacionales con el 95% de
nivel de confianza. Como puede observarse el intervalo no contiene el valor 0, de lo que se
deduce tambin que no se puede aceptar que las puntuaciones medias sean
significativamente iguales.

ERROR TPICO DE LA DIFERENCIA DE MEDIAS


Para un valor dado en una muestra aleatoria con un error distribuido normal, la imagen de
arriba representa la proporcin de muestras que pueden caer entre 0,1,2, y 3 desviaciones
estndar por encima y por debajo del valor real.

El error estndar es la desviacin estndar de la distribucin muestral de un estadstico.1


El trmino se refiere tambin a una estimacin de la desviacin estndar, derivada de una
muestra particular usada para computar la estimacin.

Error estndar de la media

El error estndar de la media (llamado en ingls "standard error of the mean" (SEM))
cuantifica4 las oscilaciones de la media muestral (media obtenida en los datos) alrededor de
la media poblacional (verdadero valor de la media). El EEM o SEM se estima generalmente
dividiendo la desviacin estndar de la poblacin entre la raz cuadrada del tamao de la
muestra (asumiendo independencia estadstica de los valores en la muestra):

donde

s es la desviacin estndar (es decir, la estimacin basada en la muestra de la


desviacin estndar de la poblacin).
n es el tamao (nmero de individuos de la muestra)

Esta estimacin puede ser comparada con la frmula de la verdadera desviacin estndar de
la media de la muestra:

donde

es la verdadera desviacin estndar de la poblacin.


Esta frmula puede alcanzarse desde lo que ya conocemos sobre la varianza de la suma de
variables independientes aleatorias.5

Si son observaciones independientes de una poblacin que tiene una

media y una desviacin estndar , entonces la varianza del total es

La varianza de debe ser

Y la desviacin estndar de debe ser .

Por supuesto, es la media de la muestra .

Nota: El error estndar y la desviacin estndar de muestras pequeas tienden a


infravalorar sistemticamente el error estndar y la desviacin estndar de la poblacin: el
error estndar de la media es un parmetro sesgado del error estndar de la poblacin. Con
n=2 la infravaloracin puede ser del 25%, pero para n=6 la infravaloracin es slo del 5%.

LA PRUEBA DE DIFERENCIA ENTRE DOS PROPORCIONES

La distribucin normal puede servir como aproximacin de una distribucin binomial


cuando n 30 y tanto np 5 como n(q) 5, donde = 1 . Esta es la base para la
determinacin de intervalos de confianza para la proporcin. Sin embargo en el caso de
intervalos de confianza se requiere por lo general de un tamao de muestra de al menos n=
100, en la determinacin de los intervalos de confianza la proporcin muestral sirve de
base para el error estndar. En la prueba de hiptesis, el valor del error estndar de la
proporcin se basa por lo general en el uso del valor hipottico 0 :
0 (10 )
=

As la frmula del estadstico z para probar una hiptesis referente al valor de la proporcin
de la poblacin es

0
=

EJERCICIO PRCTICO

Se formula la hiptesis de que no ms del 5% de las partes producidas en un proceso de


manufactura son defectuosas. En una muestra aleatoria de n= 100 partes, 10 de ellas fueron
encontradas defectuosas.
Probare la hiptesis nula al nivel de significancia del 5%

0 : = .05 1 > .05


0 (1 0 ) (. 05)(. 95) . 0475
= = = = . 000475 = .022
100 100

0 . 10 .05 . 05
= = = = +2.27
. 022 . 022

El valor calculado de z es de +2.27 el cual es mayor que el valor crtico de +1.645 de esta
prueba de cola superior. Por lo tanto, con 10 partes de 100 detectadas como defectuosas, la
hiptesis de que la proporcin de partes defectuosas de la poblacin es de o inferior a .05
se rechaza, con el uso en la prueba del nivel de significancia de 5%.

-3.0 -2.27 -1.645 0 +1.645 2.27 +3.0

DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES


Cuando deseamos probar la hiptesis de que las proporciones de dos poblaciones no son
diferentes, las dos proporciones mustrales se combinan como base para determinar el
error estndar de la diferencia entre proporciones. La estimacin combinada de la
proporcin de la poblacin, con base en las proporciones obtenidas de dos muestras
independientes, es

1 1+ 2 2
=
1 + 2

ERROR TPICO DE LA DIFERENCIA ENTRE DOS PROPORCIONES

El error estndar de la diferencia entre proporciones usando en conjuncin con la prueba


del supuesto de que no hay diferencia es
(1 ) (1 )
1 2 = +
1 2

La formula de la estadstica z para probar la hiptesis nula de que no existe diferencia entre
dos proporciones poblacionales es

1 2
=
1 2

Una prueba de la diferencia entre proporciones puede realizarse ya sea como prueba
unilateral o como prueba bilateral.

EJERCICIO PRCTICO

Una muestra de 50 hogares de una comunidad revela que 10 de ellos vieron un programa
especial de televisin sobre la economa nacional. En una segunda comunidad, 15 hogares
de una muestra aleatoria de 50 vieron ese programa especial de televisin. Probamos la
hiptesis de que la proporcin global de espectadores de las dos comunidades no difiere,
con un nivel de significancia de 1% de la siguiente manera:
0 : (1 2 ) = 0
1 : (1 2 ) 0

Donde el valor critico es 2.58


Z= .99/2 .495= 2.58
= .01

1 1+ 2 2 50(. 20) + 50(. 30) 10 + 15


= = = = .25
1 + 2 50 + 50 100
(1 ) (1 )
1 2 = +
1 2

(. 25)(. 75) (. 25)(. 75)


= + = . 00375 + .00375 = .087
50 50

1 2 . 20 .30 .10
= = = = 1.15
1 2 . 087 . 087

Lo que nos dice que la z calculada de -1.15 se encuentra en la regin de aceptacin de la


hiptesis nula. Por lo tanto la hiptesis de que no existe diferencia en la proporcin de
espectadores de las dos zonas no puede rechazarse.
-2.58 0 2.58

-1.15
EJERCICIO PRACTICO 2

Un fabricante evala dos tipos de equipo para la fabricacin de un componente. Una


muestra aleatoria de 1 = 50 se recolecta de la primera marca de equipo, y cinco artculos
son encontrados defectuosos, una muestra aleatoria de 2 = 80 se recolecta de la segunda
marca y seis artculos son encontrados defectuosos. El ndice de fabricacin de ambas
marcas es el mismo. Sin embargo dado que el costo de la primera marca es sustancialmente
menor, el fabricante le concede el beneficio de la duda y formula la hiptesis 0 1
2 Pruebe esta hiptesis al nivel de significancia de 5%
0 : (1 2 ) = 0 1 (1 2 ) > 0

Z critica (= .05) = +1.645

1 1+ 2 2 50(. 10) + 80(. 075) 5 + 6


= = = = .085
1 + 2 50 + 80 130

(1 ) (1 )
1 2 = +
1 2

(. 085)(. 915) (. 085)(. 915) . 0778 . 0778


= + = +
50 80 50 = 80
= . 0016 + .0010 = .051

1 2 . 10 .075 . 025
= = = = +.49
1 2 . 051 . 051

El valor calculado de z de +.49 no es mayor que +1.645 en esta prueba de cola superior. Por
tanto, la hiptesis nula no puede ser rechazada al nivel de significancia de 5%
-4 -3 -2 -1 0 1 2 3

PRUEBAS PARAMTRICAS

Se llaman as porque su clculo implica una estimacin de los parmetros de la poblacin


con base en muestras estadsticas. Mientras ms grande sea la muestra ms exacta ser la
estimacin, mientras ms pequea, ms distorsionada ser la media de las muestras por los
valores raros extremos.

Suposiciones que subyacen a la utilizacin de las pruebas paramtricas.

El nivel de medicin debe ser al menos de intervalo. Debemos tomar una decisin a cerca
de nuestra variable dependiente. Es realmente un nivel de intervalo? Si es una escala no
estandarizada, o si se basa en estimaciones o calificaciones con humanos. Frecuentemente
aparecen como intervalo pero lo reducimos a nivel ordinal al darles rango.

Los datos de la muestra se obtienen de una poblacin normalmente distribuida. Este


principio suele mal entenderse como: la muestra debe distribuirse normalmente, "no es as".
La mayora de las muestras son demasiado pequeas para siquiera parecerse a una
distribucin normal, la cual solo obtiene su caracterstica en forma de campana con la
acumulacin de muchas puntuaciones.

La varianza de las 2 muestras no son significativamente diferentes, esto se conoce como el


principio de homogeneidad de la varianza. Los especialistas en estadstica han investigado
ms sobre ese requisito, el cual saba exigir varianzas muy similares. Estos se ignoran
cuando tratamos con muestras relacionadas sin gran riesgo de distorsionar nuestro
resultado. Para muestras no relacionadas necesitamos ser ms cuidadosos cuando los
tamaos de las muestras sean bastante diferentes.

Cules son algunas pruebas paramtricas?

Prueba del valor Z de la distribucin normal


Prueba T de Student para datos relacionados (muestras dependientes)
Prueba T de Student para datos no relacionados (muestras independientes)
Prueba T de Student-Welch para dos muestras independientes con varianzas no
homogneas
Prueba de ji cuadrada de Bartlett para demostrar la homogeneidad de varianzas
Prueba F (anlisis de varianza o ANOVA).

PRUEBAS NO PARAMTRICAS

Las pruebas no paramtricas nos permiten analizar datos en escala nominal u ordinal a
pesar de que no se conozcan los parmetros de una poblacin, utilizada para hacer un
contraste de hiptesis.

Utilizacin de las pruebas No Paramtricas

Cuando los datos puntualizan a las escalas nominal u ordinal.


Se utiliza solo la frecuencia.
Poblaciones pequeas.
Cuando se desconocen los parmetros media, moda, etc.
Cuando los datos son independientes.
Cuando se quiere contrastar o comparar hiptesis.
Investigaciones de tipo social. (Muestras pequeas no representativas >5).
Cuando se requiere de establecer el nivel de confianza o significatividad en las diferencias.
Cuando la muestra es seleccionada no probabilsticamente.

Para escala nominal:


Leyes de la probabilidad y prueba binomial
*Prueba ji2 de Pearson para una muestra
*Prueba ji2 de Pearson para dos y ms muestras independientes
*Prueba de bondad del ajuste mediante ji2
*Prueba ji2 de proporciones para tres o ms muestras independientes
Prueba de probabilidad exacta de Fischer y Yates
Prueba de McNemar para muestras dependientes
Prueba Q de Cochran para tres o ms muestras dependientes
Anlisis secuencial

* ji2 = X2

Para escala ordinal:


Prueba de Kolmogorov-Smirnov para una muestra
Prueba de U Mann-Whitney para dos muestras independientes
Prueba de Wilcoxon de rangos sealados y pares igualados para dos muestras dependientes
Anlisis de varianza de una entrada de Kruskal-Wallis para ms de dos muestras
independientes
Anlisis de varianza de doble entrada por rangos de Friedman para ms de dos muestras
dependientes.
CONCLUSIONES

1. Analizando el estimador de la media muestral se concluye que para las distribuciones


continuas y discretas los dos mtodos de estimacin trabajados proporcionan las mismas
medidas descriptivas: la media, la varianza, el error promedio de estimacin, coeficiente de
asimetra, mnimo y mximo valor observados de los estimadores. Con lmite superior e
inferior de los intervalos de confianza para la media poblacional,

2. Al utilizar el estimador de mxima verosimilitud para la varianza tanto para


distribuciones continuas como para distribuciones discretas en la mayora de los casos, la
estimacin proporciona valores de mayor magnitud para la varianza, error de estimacin
promedio, longitud promedio de los intervalos de confianza al 95%, y sesgo de estimacin;
y a medida que aumenta el tamao muestral todas las medidas descriptivas para la
distribucin de los estimadores son similares en magnitud al utilizar los dos mtodos de
estimacin.

3. El estimador insesgado para la varianza obtenido con los mtodos de estimacin


trabajados proporcionan con tres dgitos de precisin las mismas medidas descriptivas para
los estimadores, tanto para distribuciones discretas como para distribuciones continuas, al
igual que en el caso del estimador para la media, la longitud de los intervalos de confianza
para tamaos muestrales menores a 30 es menor mediante la estimacin frente a la
estimacin convencional.

4. La determinacin del tamao muestral en una investigacin es de vital importancia,


tanto para caracterizar la distribucin de la variable, como para fijar el grado de precisin
del estudio. En el clculo del tamao muestral cuando se efecta un estudio de carcter
cuantitativo, en el cual se utilizan mtodos estadsticos inferenciales como medios para el
anlisis, como son la estimacin estadstica, las pruebas de hiptesis y el anlisis de
experimentos, que requieren de informacin precisa sobre las variables consideradas, y que
es obtenida a partir de la muestra representativa de la respectiva poblacin.

BIBLIOGRAFIA
1.- Mood A. M., Graybill F. A., Boes D. C. Introduccin a la teora de estadstica. McGraw
Hill, 1983.

2.- Devore J. Probabilidad y estadstica para ingeniera y ciencias. Thomson, 2001.

3.- Garza T. Elementos de clculo de probabilidades. UNAM, 1983.

4.-https://sites.google.com/site/aprendizajedeestadistica/

5.-https://sites.google.com/site/estadisticaconelspss/

6.-http://estadisticacomputarizada.wordpress.com

7.-http://hamletylaestadisticaugma.jimdo.com/

8.-http://hamletyestadisticaspss.jimdo.com/

9.-http://ocwus.us.es/metodos-de-investigacion-y-diagnostico-en-educacion/analisis-de-
datos-en-la-investigacion-educativa/guia_aprendizaje.pdf

10.- ftp://ftp.repec.org/opt/ReDIF/RePEc/iad/wpaper/0311.pdf

Anda mungkin juga menyukai