KENNEDY
PSICOESTADISTICA
Gua de Lectura
2016
1
Introduccin
Los objetivos del diseo curricular de Psicoestadstica estn formulados con el
objeto de alcanzar resultados positivos en tres aspectos diferentes: cognitivos, sociales y
motivacionales. Los mismos pueden sintetizarse en los siguientes:
1.
grupal.
9.
Por ltimo, se propondr una discusin grupal que se base en la reproduccin del
recorrido que realiza la estadstica desde el inicio de la propuesta del anlisis de un
problema social hasta la elaboracin de las conclusiones del investigador. Este paso
tender ha integrar y reconstruir, cuando fuera necesario, la secuencia del razonamiento
estadstico, ponderando la significacin de sus conclusiones a partir del margen de error
que adopte el investigador y de sus limitaciones instrumentales.
Respecto de la metodologa de enseanza de la estadstica, se partir del supuesto
de que el educando construye su propio conocimiento en la interaccin social con otros. La
complejidad de este proceso que involucra a un sujeto social con su historia singular dentro
de una cultura determinada invalida cualquier intento de suponer una nica metodologa
posible, por lo que se sealarn algunas pautas desde lo didctico y lo interaccional que
parecen pertinentes para alcanzar los objetivos.
El rol docente se centrar fundamentalmente en la construccin de situaciones
didcticas tomando en cuenta los intereses y las vivencias de los alumnos, promoviendo la
aparicin de las ideas intuitivas del estudiante que, a partir de la argumentacin escrita u
oral, permitan un enriquecimiento conceptual en el trabajo individual en grupos
pequeos interactuando.
El trabajo sobre las los ejemplos prcticos permitir desarrollar una tarea de
aplicacin de los conceptos estudiados de manera progresiva para desarrollar una
investigacin
sobre
objetivos
predeterminados
que
habr
que
resignificar
peridicamente.
El docente priorizar la actividad de anlisis de los resultados y de la deteccin de
las posibles causas de error, valorando el surgimiento de alternativas para aumentar la
confianza y la motivacin de los estudiantes, lo que favorecer el proceso de aprendizaje
de la estadstica.
La introduccin de nuevos conceptos requerir del alumno una preparacin previa a
partir de una gua de lecturas de la materia que se le suministrar al iniciar las clases. La
lectura previa del tema favorecer el proceso reflexivo que favorezca la identificacin por
parte del alumno de sus dudas y sus pre-conceptos y la discusin grupal posterior. El
profesor
coordinar
la
discusin,
despejando
los
obstculos
enriqueciendo
Pareci
relaciona:
10
11
sistema de ideas generales necesario y coherente, y en funcin del cul puedan ser
interpretados todos los elementos de la experiencia.
2.
responsabilidad humana.
12
A partir del trabajo de estos investigadores surgen los filsofos empiristas para
fundamentar el nuevo mtodo de obtener conocimiento. Babon, Hobbes, Locke, Berkeley
y Hume justifican el empirismo como el nico camino para conocer la verdad y al
procedimiento inductivo como el mtodo lgico para deducir conocimientos generales a
partir de experiencias particulares. Estos autores intentaron desarrollar un sistema de
inferencia racional para obtener un conocimiento general. Como consecuencia de esta
visin, el proceso cientfico era un proceso lineal y acumulativo y las teoras constituan la
organizacin lgica de las leyes experimentales.
La elaboracin de este concepto de ciencia da un paso adelante cuando Comte
fundamenta el positivismo considerando a la experiencia emprica y sus consecuentes leyes
como nica fuente de certidumbre.
Pensadores como Poincar y Pearson, entre otros instalaban a esta ciencia de base
emprica como una gua pragmtica para enfrentar la vida.
Tanto para el empirismo como para el positivismo el Universo se constituye a partir
de fenmenos que se conectan casualmente entre s y dichas conexiones podan descubrirse
a partir del proceso inductivo aplicado al mtodo experimental.
Este camino demostr su enorme potencial al impulsar los grandes descubrimientos
cientficos de los ltimos tres siglos, que se tradujeron en la amplia hegemona de las leyes
de la mecnica newtoniana en la fsica y la concepcin kantiana de la filosofa.
Las leyes de Newton explican el movimiento de las partculas materiales en funcin
del tiempo y eran aceptadas como la expresin del conocimiento ideal, objetivo y
completo, y en ellas el tiempo es reversible y expresa la equivalencia entre pasado y futuro.
En cambio, a partir del Siglo XIX el principio de entropa, tambin universalmente
aceptado, demostr que el tiempo no es equivalente en pasado y futuro. Algunos
cientficos han tratado de explicar esta contradiccin con argumentos discutibles y
simplificadores.
Hume ya haba planteado limitaciones lgicas al conocimiento inductivo, pues
independientemente de cuntas observaciones se hayan hecho de una regularidad, esto no
da ninguna garanta lgica de que volver a ocurrir del mismo modo en la siguiente
ocasin.
Las hiptesis mecanicistas, que parten de las leyes de la mecnica clsica, que
poblaron las teoras de fuerzas que actuaban a distancia en todos los campos de la
naturaleza, comienzan a tambalear con los descubrimientos de la fsica atmica, al
demostrar sta que las partculas atmicas no obedecan a las leyes de Newton y, por el
13
contrario, tenan movimientos azarosos impredecibles explicados por una nueva ley (de
Schrdinger)..
Puede afirmarse con Susel: ...la concepcin mecnica, de valor incalculable para la
ciencia, refrendada por las predicciones que permiti hacer sobre la existencia de planetas
desconocidos, con los cuales se complet el conocimiento astronmico del sistema
planetario, y a la cual se deben mirades de adelantos en todas las regiones del pensamiento
se basaba, no obstante, en ideas mgicas de fuerzas y fluidos que, ms que hiptesis eran
fantasas.
La salida al dilema de Hume fue elaborada por Popper (1972) al postular que toda
teora, modelo o ley cientfica es una conjetura de cmo es la realidad. De acuerdo con
Popper, el nfasis del investigador debe centrarse, al contrario de cmo lo plantea la
ciencia tradicional, no en probar que la teora es verdadera sino en demostrar que no es
falsa. Toda teora, ley o hiptesis es una conjetura que ser valorada en su poder
explicativo y general siempre que supere los intentos rigurosos de refutarlas.
Desde esta perspectiva, los datos experimentales sirven para plantear una hiptesis
cientfica que se pone a prueba por medio de la crtica lgica y emprica. Si los hechos
apoyan la teora, no podemos pensar que la justifican sino que, hasta ahora no ha sido
refutada.
Este esquema para entender el conocimiento refuerza an ms la importancia del
razonamiento lgico, que deviene de los filsofos griegos, al enfatizar el mecanismo del
pensamiento hipottico-deductivo aplicado al trabajo experimental.
Este punto de vista hace impensable la inclusin del azar como determinante en algunos
fenmenos como se ha descubierto, por ejemplo, en la mecnica cuntica.
En las ltimas dcadas, algunos cientficos orientados por Ilya Priogine, intentan crear una
nueva formulacin de la dinmica que supere la contradiccin de la fsica clsica puesta en
evidencia por la fsica cuntica.
Prigogine seala que la pretensin de la lgica racional de un encadenamiento
causal, de tal manera que todo efecto tiene una causa y se transforma a su vez en causa de
un efecto posterior, provoca una tensin y contradice la creencia en la libertad del hombre
para poder elegir entre varios caminos a seguir.
A esta paradoja del sentido comn W. James la llam el dilema del determinismo.
Este dilema dispara dos interrogantes: El futuro est dado o en perpetua construccin?,
Es la creencia en nuestra libertad una ilusin?. Implcitamente estas cuestiones
interrogan acerca del concepto del tiempo. El tiempo es un concepto incorporado a la
14
que an hoy se manifiesta, es una defensa, una racionalizacin que se pone en juego frente
al conflicto que significa abandonar la pretensin omnipotente de alcanzar el conocimiento
universal y completo.
As como el desarrollo de la fsica cuntica a fines del siglo XIX fue, sin
proponrselo los propios investigadores, el disparador de una visin indeterminista de la
ciencia, contemporneamente, en psicologa surgen los descubrimientos de S. Freud acerca
del inconciente y su influencia. La imposibilidad de la certeza absoluta y definitiva, que
comienza a esbozarse en la fsica, se verifica tambin en la esfera de la conducta. No es
casual que estos dos procesos coincidieran histricamente, como as tambin que sus
descubridores siguieran aferrados a una visin determinista de la ciencia. La nocin de
inconciente instituy la incertidumbre en la explicacin de la conducta a nivel psicolgico,
as como la nocin del movimiento azaroso de las partculas atmicas lo hizo en la fsica.
Lo azaroso en psicologa habra que buscarlo en el principio de policausalidad con
que opera el funcionamiento psquico, ya que si bien la aparicin de sntomas est ligada a
elementos del pasado, stos son necesarios pero no suficientes, y debe considerarse la
influencia del contexto con sus connotaciones azarosas.
Freud demuestra que el proceso cognitivo no depende slo de la conciencia y que
factores inconcientes pueden impulsar a la negacin de un aspecto de la realidad de una
nueva idea que ponga en peligro los intereses yoicos. Estos ataques a la primaca del yo
son ataques al narcisismo del hombre y si se producen por la aparicin de grandes cambios
en la teoras del conocimiento revoluciones cientficas se transforman en heridas
narcisstas que motorizan la resistencia a dichos cambios.
Freud enfatiza esta situacin con su formulacin de las tres heridas fundamentales
que ha sufrido el hombre a travs de la historia: la primera llamada cosmolgica se
produce a partir de los descubrimientos de Coprnico del heliocentrismo del sistema
planetario terrestre que desplaza a la Tierra del centro del mismo; la segunda, herida
biolgica, cuando Darwin demuestra que el hombre proviene de una evolucin desde
especies animales inferiores elimina la superioridad abismal que el hombre supona
respecto de las otras especies; y por ltimo, la herida psicolgica, que se produce con el
descubrimiento del inconciente y su influencia impredecible y, por lo tanto, incontrolable
sobre la conducta humana. En los tres momentos histricos el hombre sufre un ataque que
pone en peligro la seguridad y la omnipotencia de los intereses yoicos que aseguraban las
teoras vigentes hasta ese momento.
17
18
los
elementos del sistema estudiado tienen la misma posibilidad de intervenir y por lo tanto
pueden elegirse azarosamente.
El mtodo de inferencia estadstica permite contrastar los resultados de una
investigacin con los valores que establece, para la problemtica en estudio, la distribucin
de probabilidades que mejor se adapta al conjunto total de los elementos estudiados y del
cual se extrajeron los datos empricos.
Cuando se inicia una investigacin se debe plantear una hiptesis que pueda ser
corroborada a posteriori. Estas hiptesis surgen de los conocimientos previos acerca del
fenmeno estudiado que el investigador posee y que son el soporte que justifican la
19
necesidad de investigar. Estos datos previos se refieren a los diferentes factores que
determinan el comportamiento de los elementos analizados (unidades experimentales).
En los problemas asociados al comportamiento humano est demostrado que,
cuando se analizan a escala macrosocial, los factores determinantes se distribuyen de tal
forma que los ms frecuentes corresponden a valores medios y van disminuyendo en
cantidad los valores que se alejan tanto para un extremo otro de la distribucin. Esta
caracterstica se intensifica a medida que crece el nmero de elementos estudiados.
Este comportamiento de los factores sociales puede representarse, como se ver
ms adelante, mediante el modelo de la distribucin normal de probabilidades. En el
contraste de los datos experimentales con este modelo se basan la mayora de las tcnicas
estadsticas que se utilizan en psicologa.
Como ya se seal, la estadstica proporciona una serie de tcnicas para organizar
la informacin cientfica y tomar decisiones a partir de ella.
Una investigacin se refiere, en general, a un conjunto de datos que provienen de
objetos, animales personas. Un psiclogo, por ejemplo, puede querer observar si hay
alguna regularidad en la conducta de distintos grupos de pacientes frente a un mismo
estmulo, sabiendo que analizados en forma individual seguramente existen diferencias en
el comportamiento.
La investigacin en psicologa es, por lo tanto, de capital importancia en reas
como la de patologas psicosociales (adicciones, alcoholismo, trastornos alimenticios, etc.)
para encarar un tratamiento eficaz para tareas en prevencin.
Si bien la investigacin y el pensamiento estadstico estn incorporados al comportamiento
individual, desde un lugar ligado a la intuicin y al sentido comn, aqu se explorar esta
interrelacin desde una mirada ms rigurosa y cientfica.
Bibliografa (adicional a la que figura en el programa de la materia)
Hacking I. (1991) La domesticacin del azar. Barceloma: Ed. Gedisa
Morin E. (1977) El Mtodo. Vol. 1. Madris: Ed. Ctedra
Prigogine I. Tal solo una ilusin? Ed. Tusquets, Barcelona (1983)
Prigogine, I. (1991) El nacimiento del tiempo. Barcelona: Ed. Tusquets
Prigogine I. y Stengers I.(1991) Entre el tiempo y la eternidad. Bs. As.: Ed. Alianza
Schnitman D. (Comp.) (1994) Nuevos paradigmas. Cultura y subjetividad. Bs. As.: Ed
Paidos
Wagensberg J. (Comp)(1996) Proceso al azar. Barcelona: Ed. Tusquets
Wagensberg J. (1985) Ideas sobre la complejidad del mundo. Barcelona: Ed. Tusquets
20
21
22
Funciones de la Estadstica
Describir
Inferir o generalizar
Estadstica
Estadstica
Descriptiva
Inferencial
se la observa
Tcnicas
Tcnicas
Estadstica grfica.
Medidas de tendencia
muestra
central.
Medidas de orden.
Distribucin muestral
Probabilidad
Medidas de variabilidad/
dispersin
23
observaciones en
Descripcin
gran nmero
Estadstica
asigna valores
Sntesis
24
Investigacin o estudio
Poblacin o
Poblacin de datos
procedimiento
25
Muestra
de estudio
Muestra de datos
UNIVERSO
HIPOTTICO
(prcticamente infinito)
UNIVERSO o
POBLACIN, (finito)
MUESTRA, N
Unidades a observar
26
27
producto es variada pero con iguales caractersticas en toda la ciudad se elige la muestra
al azar en un barrio de la misma.
La muestra escogida al azar es la nica que puede ser examinarse con completa confianza
por medio de la teora estadstica. En una muestra aleatoria representativa se incluyen,
proporcionalmente, elementos de todos los diferentes grupos que haya en la poblacin. No
todas las muestras aleatorias son representativas.
Condiciones o requisitos de la muestra para determinar la seriedad, validez y
confiabilidad de un informe estadstico:
1. Comprender parte del universo o de la poblacin y no su totalidad.
2. Amplitud. Es estadsticamente proporcionada a la magnitud de la poblacin,
3. Representatividad. Refleja verdaderamente la composicin y las caractersticas
de la poblacin.
4. Muestra tomada al azar. La ausencia de distorsin en la eleccin de los
elementos de la muestra. Esto asegura que cada miembro de la poblacin tienen
igual posibilidad de pertenecer a la muestra.
Ventajas
Limitaciones
Cierta
relativamente
parmetros.
reducida
en
relacin
al
inexactitud
respecto
de
2.4. Variables
Todos los elementos de la muestra y los de la poblacin tienen atributos,
caractersticas. La variable es un atributo susceptible de tomar distintos valores o variantes.
Cuando el atributo es variable en formas impredecible, se trata de una variable aleatoria.
La Estadstica se ocupa solo de variables aleatorias. Es un aspecto o dimensin de
un objeto o fenmeno y de las propiedades que estos pueden asumir y no puede predecirse
el valor para ninguna unidad de anlisis. Por ej. sexo, rendimiento escolar, nacionalidad,
puntaje en un examen, edad, peso, color de ojos, etc.
28
los
Cuando el atributo toma siempre el mismo valor para todo los elementos
observados, no se trata de una variable, sino de un atributo constante o simplemente de una
constante. Es decir este atributo no se modifica a travs del tiempo. Ej.: La edad mnima
para votar
As como los atributos tienen diferente naturaleza, esto debe reflejarse en la forma
de medirlos.
CUALITATIVAS
VARIABLES
No admiten valores intermedios.
DISCRETAS
CUANTITATIVAS
(numricas)
Medicin Indirecta: se obtiene a partir de tomar datos que se incluirn en una ecuacin.
Ejemplo: Energa, Inteligencia, etc.
Segn el tipo de variable, sus magnitudes pueden expresarse segn diferentes Niveles de
Medicin o Escalas de Medicin
29
VARIABLES CUANTITATIVAS
NIVEL NOMINAL
NIVEL ORDINAL
ESCALA DE
ESCALA DE RAZN
(nombra/ clasifica)
(jerarquiza/ordena)
INTERVALOS
O COCIENTES
Determina igualdad
Determina la igualdad de
de elementos respecto a
intervalos constantes. El
elementos, asigna un
punto 0 (cero) y la
smbolo, un nmero o
Relaciona
indepe3ndientemente de
una descripcin en
jerrquicamente a los
arbitrarios.
la unidad de medida.
palabras. No es
escala cuantitativa, y
verdadero en su origen
es el MODO. La
a menor o viceversa.
La aplicacin estadstica
cantidad de elementos
presentes en cada
es la MEDIANA.
categora, la frecuencia.
EJ.:
es la MEDIA y el
COEFICIENTE
Ordenacin de
DESVIO STANDAR O
VARIACIN.
Categoras
TPICO ()
Ej.:
psicopatolgicas
Dureza de los
Ej.:
N de jugador de
minerales
Escalas de
football
Nivel
medicin de
socioeconmico
inteligencia
Ej.:
es
la
MEDIA
y
el
DE
Longitud
Peso
Temperatura
30
Nmero de estudiantes
Altura (cm.)
160-162
163-165
18
166-168
42
169-171
27
172-174
N (total)
100
Los datos se los ordenan con algn criterio y este depende de del objetivo de las
investigacin y del tipo de variable. Por ejemplo, si se desea analizar el aumento o la
disminucin de la variable es conveniente ordenar los datos de manera creciente.
Una tabla de distribucin de frecuencias contiene dos columnas. La primera
muestra todos los posibles valores que asume la variable: altura de estudiantes, edad,
cursada de otra carrera, sexo, estado civil, etc. En la segunda columna se ubica el nmero
de veces, la frecuencia, con que se presenta dicho valor
Si se trata de tabular los datos de ms de una variable, como cantidad de alumnos
que cursan otra carrera y sus respectivas edades, se debe elegir una variable y ordenar los
restantes en funcin de la misma. Este tipo de distribucin de frecuencias que resume los
datos de dos variables asociadas de la muestra se llama Tabla de Contingencia
31
Frecuencias dobles
corresponden a dos
variables distintas
Cursan otra
carrera
NO
SI
TOTAL
18-23
23-28
28-33
33-38
38-43
12
15
Edad
TOTAL
Frecuencias simples o
Frecuencias absolutas
xi
160-162
163-165
18
166-168
42
169-171
27
172-174
8
100
N: Tamao de la muestra
32
La frecuencia relativa (r) de una clase es su frecuencia absoluta dividida por el tamao de
la muestra N (fr =i / N)
r =i / N
Ejemplo de aplicacin
Muestra de altura de 100 estudiantes universitarios
xi
160-162
0,05
163-165
18
0,18
166-168
42
0,42
169-171
27
0,27
172-174
0,08
100
1,00
1 = 5, 2 = 18, 3 = 42, 4 = 27 y 5 = 8
r = i / N = 42 / 100 = 0.42
Otra expresin de la r es la frecuencia relativa porcentual o frecuencia porcentual (%)
que indica las veces que se repite la variable cada 100 observaciones de la misma. Esta se
obtiene multiplicando cada r por 100. La suma de todas las % da como resultado 100.
r . 100 = %
Muestra de altura de 100 estudiantes universitarios
xi
r %
160-162
0,05
5%
163-165
18
0,18
18%
166-168
42
0,42
42%
169-171
27
0,27
27%
172-174
0,08
8%
100
100%
33
Xi
20
21
22
24
25
31
10
datos agrupados por intervalos de clase. Este recurso se utiliza cuando es muy
grande el nmero de valores diferentes de la variable.
Ej. Edades de estudiantes varones del segundo ao de la carrera de psicologa
i
20-22
7
23-25
2
26-28
0
29-31
1
10
N
Cada valor de la variable se agrupa en intervalos de valores que se denominan clases
Xi
Cuando los datos se agrupan en intervalos, los valores extremos de la clase se denominan
lmites inferiores y superiores respectivamente de la clase. Las distancia entre sus lmites,
o sea entre el mnimo y el mximo, se denomina mdulo de la clase La seleccin del
intervalo de clase se relaciona con cada caso particular. Es necesario conservar una
informacin suficientemente detallada del fenmeno. Para esto hay que evitar clases
34
demasiado pequeas o muy numerosas que podran complicar, sin provecho alguno, los
clculos ulteriores y la informacin.
Cuando se desconoce el lmite inferior del menor intervalo o el lmite superior del
mayor intervalo o se desconocen los lmites de ambos, se presenta un fenmeno
denominado intervalos abiertos y se registra:
Xi
menos de
20
20-22
23-25
26-28
Ms de 29
N
i
0
7
2
0
1
10
li + Ls
2
Limite superior
xi
20-22
23-25
26-28
29-31
N
i
7
2
0
1
10
Lmite inferior
Ejemplo:
li + Ls = 23 + 22 = 22,5
2
2
lir
xi
Lsr
19,5
20-22
22,5
22,5
23-25
25,5
25,5
26-28
28,5
28,5
29-31
31,5
10
Lmites reales
35
19,5 + 22,5 = 21
2
lir
xi
Lsr
xi
19,5
20 - 22
22,5
21
22,5
23 - 25
25,5
24
25,5
26 - 28
28,5
27
28,5
29 - 31
31,5
30
10
lir
xi
Lsr
19,5
20 - 22
22,5
22,5
23 - 25
25,5
25,5
26 - 28
28,5
28,5
29 - 31
31,5
c = 25,5 - 22,5 = 3
c = 28,5 - 25,5 = 3
2.5.2. Reglas generales para formar distribuciones de frecuencias
a. Determinar el mayor y el menor de todos los datos, hallando as el rango o
diferencia entre ambos.
36
20-22
//// //
23-25
//
Xi
26-28
29-31
N
0
/
1
10
37
Xi
Fi
Fir
Fi%
20-22
0,7
70%
23-25
0,9
90%
26-28
0,9
90%
29-31
10
100%
10
La lectura que se puede hacer de tabla es por ejemplo, 2 varones tienen entre 23-25
aos, pero tambin que 9 varones tienen menos de 25 aos, o que estn entre 20-25
2.6. Representaciones Grficas
Un grfico es una representacin de la distribucin de valores de la variable. Para
cada tipo de variables existe una gama de grficos especficos. Los grficos permiten una
visualizacin rpida de la evolucin o distribucin de una variable. Esta representacin
permita una rpida y clara comparacin y superposicin de muestras tomadas en distintas
oportunidades de tiempo o lugar. El requisito que deben cumplir los grficos es la
proporcionalidad del rea representada.
BARRAS
CUALITATIVAS
(categricas)
SECTORIAL / PASTEL
PICTOGRAMA
VARIABLES
BASTONES
DISCRETAS
CUANTITATIVAS
PICTOGRAMA
(numricas)
CONTINUAS
HISTOGRAMA
POLIGONO DE
FRECUENCIAS
OJIVA DE GALTON
POLGONO DE
FRECUENCIAS
ACUMULADAS
38
40
35
35
30
30
25
25
20
20
15
15
10
10
37
39
Escala Verbal
Escala de Ejecucin
i x 360
N
39
El siguiente grfico representa la distribucin por sexos de padres que asistan a un centro
de atencin en violencia familiar. Los consultantes eran vctimas de violencia por parte de
sus hijos. La muestra, 250 personas, est tomada del archivo de historias clnica.
xi
mujeres
195
varones
55
N
250
VARONES 22%
MUJERES 78%
VARONES
Por ejemplo, en el caso de la muestra anterior, de los padres golpeados por sus hijos:
40
xi
mujeres
195
varones
55
250
N
L = 5 personas
mujeres
varones
LLLLLLLLLL
LLLLLLLLLL
LLLLLLLLLL
LLLLLLLLLL
LLLLLLLLL
Por las caractersticas del pictograma, se lo puede usar en para representar escalas
cualitativas y particularmente cuantitativas discretas, pero no es conveniente. No es el tipo
de grfica ms conveniente porque puede generar confusin el valor, la frecuencia y el
significado.
BASTONES: para este grfico se ubican en el eje horizontal las categoras de las
variables, igual que en las barras, con la diferencia que los bastones no tienen amplitud
en su base, son solo lneas o segmentos que guardan una distancia proporcional y
preestablecida entre si.
HISTOGRAMA: es un conjunto de rectngulos continuos con base en el eje
horizontal (x), centros en las marcas de clase o punto medio y longitudes iguales a los
tamaos de los intervalos de clase, o sea considerando los lmites inferiores y superiores
de cada intervalo. Tambin tienen reas proporcionales a las frecuencias de clases que
se ubica en le eje vertical (y).
Tiempos cronometrados en una carrera
Nota: Esto
es la nota al pie
Subttulo
T
t
u
l
o
5,2
4,8
4,4
4
3,6
Y
1
3,2
2,8
2,4
1,6
10
20
30
40
50
Ttulo de columna
41
42
La media
La mediana
La moda
Cada una de estas medidas representan ventajas o inconvenientes a la hora de
expresar una tendencia, aunque en ciertas ocasiones y para muestras muy numerosas
pueden coincidir.
La media (X)
fi
fr
x1 f1 fr1
.........
Xk fk frk
La media es el valor que podemos escribir de las siguientes formas equivalentes:
1
X = X1 fr1 + ... + Xk frk = 1 (X1 f1 + ...Xk fk) =
N
N
i=1
Xi. fi
_
x1 + .....+ xn
X = ---------------------N
En algunas situaciones, debe revisarse cuidadosamente la representatividad de la
media:
43
La mediana (Md)
N/2 - Fi-1
M = l (i-1) + ------------------ mi
fi
Esto equivale a decir que la mediana divide al histograma en dos partes de reas
iguales.
Propiedades de la mediana
Entre las propiedades de la mediana, vamos a destacar las siguientes:
La moda (Mo)
Percentiles
Cuartiles
Los cuartiles Q son un caso particular de los percentiles. Hay 3, y se definen como:
Q1 = P25
Q2 = P50 = M
Q3 = P75
Deciles
Se definen los deciles como los valores de la variable que dividen a las
observaciones en 10 grupos de igual tamao. Ms precisamente, definimos D1,D2, ..., D9
como:
Di = P10 i
donde
i =1, ..., 9
Por ejemplo:
D1=P10
D6=P60
45
Por lo tanto:
D5=P50=M
2.7.3. Medidas de variabilidad o dispersin
Los estadsticos de tendencia central o posicin indican donde se sita un grupo de
puntuaciones. Los de variabilidad o dispersin describen si esas puntuaciones o valores
estn prximas entre s o si por el contrario estn muy dispersas.
Rango Amplitud
Es fcil de calcular y sus unidades son las mismas que las de la variable.
Varianza
N
2
( Xi - X)
i =1
una cantidad positiva, con propiedades interesante para la
realizacin de inferencia estadstica. Como sus unidades son las del cuadrado de la
variable, es ms sencillo usar su raz cuadrada, que es la que vemos en la siguiente seccin.
En muchos textos tcnicos esta frmula est ligeramente modificada al dividir la sumatoria
por N - 1. Cuando estudiemos las tcnicas de inferencia se ver en qu casos se utiliza esta
modificacin.
La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se
miden en metros, la varianza lo hace en metros cuadrados).
Si se desea que la medida de dispersin sea de la misma dimensionalidad que las
observaciones bastara con tomar su raz cuadrada. Por ello se define la desviacin tpica o
estndar S como
S =
V
46
X = (3+3+4+4+5) / 5 = 3, 8 metros
La varianza es:
1
V = -------N
N
2
( Xi - X)
= 1/5
i =1
2
2
2
2
2
(-0.8) + (-0.8) + 0.2 + 0.2 + 1.2
S =
0.545
= 0,738 metros
decir, si una puntuacin cambia, cambia con ella la varianza. La razn es que si
miramos su definicin, la varianza es funcin de cada una de las puntuaciones.
Coeficiente de variacin
47
Slo se debe calcular para variables con todos los valores positivos. Todo
Bibliografa
Aron A. y Aron E. (2001) Estadstica para Psicologa Cap.1 Bs.As.: Pearson Education,
Cortada de Kohan, N. y Carro, J. M. (1968) Estadstica aplicada. Bs. As.: EUdeB
48
se
estudiar es la correlacin lineal, que existe cuando la relacin entre las variables en el
grfico de coordenadas cartesianas se puede representar con una recta. Esta correlacin
se puede medir mediante el coeficiente de correlacin (ro), que es un nmero,
asociado a los valores de las dos variables. El coeficiente de correlacin puede valer
entre -1 y 1.
Cuando = 1 existe una correlacin directa y absoluta o perfecta entre las dos
variables de modo que el valor de cada variable tiene un nico valor de la otra y est
ubicado sobre la recta que las representa. Los puntos de la nube estn todos situados
sobre una recta de pendiente positiva de tal forma que al aumentar una variable aumenta
la otra.
Esto ocurre, por ejemplo, cuando una barra metlica se somete a distintas
temperaturas, x1, x2,, xn, y se miden con precisin sus correspondientes longitudes, y1,
y2,, yn. Las longitudes se obtienen funcionalmente a partir de las temperaturas de
modo que, conociendo la temperatura a que se va a calentar, se podra obtener la longitud
que tendra la barra.
Esto solo puede suceder cuando las variables estn relacionadas mediante una
ecuacin lineal.
En la realidad, cuando se estudian la relacin entre variables en el campo
biopsicosocial, no existe nunca una relacin perfecta. En estos casos la relacin est
representada por una nube de puntos como el que indica la figura.
Cuando es positivo y grande (prximo a 1) se dice que hay una correlacin
fuerte y positiva. Los valores de cada variable tienden a aumentar cuando aumentan los
de la otra.
50
Es el caso de las estaturas, x1, x2,, xn, y los pesos, y1, y2,, yn, de diversos
atletas de una misma especialidad. A mayor estatura cabe esperar que tengan mayor peso,
pero puede haber excepciones.
Cuando es prximo a cero (por ejemplo, = - 0,12 o = 0,08) se dice que la
correlacin es muy dbil (prcticamente no hay correlacin) y en este caso la nube de
puntos es amorfa.
51
(X x) . (Y y)
xy =
(X x) . (Y y)
52
de que tome valores entre 1 y 1 hace que resulte muy cmodo interpretar sus
resultados.
Por todo ello, es un parmetro sumamente adecuado para calcular la correlacin
entre dos variables estadsticas.
Cuando la correlacin se determina sobre una muestra de la poblacin el smbolo
que se usa para representar el coeficiente de correlacin de Pearson es r y solo se podrn
generalizar los resultados a la poblacin mediante una prueba de significacin que
descarte el posible error de muestreo.
La frmula para conocer el valor del ndice o coeficiente de correlacin en una
muestra es la misma que la sealada precedentemente pero aplicada a muestras:
(X - X ) . (Y -Y )
-1 r 1
r=
(X - X) . (Y - Y)
El valor y el signo del coeficiente de correlacin puede variar segn sea la fuerza
de la misma y su sentido. Cuanto ms cerca 1 -1 ms fuerte es la correlacin y cuanto
ms cerca de 0 es ms despreciable.
En sntesis, el coeficiente de correlacin brinda tres informaciones: si hay o no
correlacin, la fuerza y el sentido de la misma.
3.2. Ecuacin de Regresin
Se llama recta de regresin a una recta que marca la tendencia de la nube de
puntos. Si la correlacin es fuerte (tanto positiva como negativa) y, por tanto, los puntos
de la nube estn prximos a una recta, el uso de la recta de regresin permite predecir el
valor de una variable a partir del valor de la otra.
Matemticamente hay dos rectas de regresin, la recta de regresin de Y sobre X y
la de X sobre Y.
La ecuacin de la recta de regresin de Y sobre X es:
^
Y = ayx
^
+ byx . X
Y en funcin de la variable X
El smbolo ^ sobre la variable Y significa que se trata de un valor estimado por la
recta de regresin y no es un valor medido experimentalmente.
Los parmetros a y b de la recta de regresin se determinan mediante un mtodo
matemtico que se denomina el mtodo de los cuadrados mnimos partiendo de la
53
condicin por la cual la suma de los cuadrados de las desviaciones entre los valores Y
experimentales de los estimados por la recta de regresin es la mnima posible.
De igual forma, la recta de regresin de X sobre Y es aquella para la cual la suma de los
cuadrados de las desviaciones de los valores experimentales de X respecto de las X
estimadas por la recta de regresin es la mnima.
La ecuacin que surge para el parmetro b de la recta Y en funcin de X es:
(X - X) . (Y - Y)
bxy =
(X - X )
El parmetro a es:
axy = Y - b . X
Las rectas de regresin tienen las siguientes peculiaridades:
distribucin.
54
hay una correlacin fuerte y positiva. Los valores de cada variable tienden a
aumentar cuando aumentan los de la otra.
0,93) se dice que hay una correlacin fuerte y negativa. Los valores de cada
variable tienden a disminuir cuando aumentan los de la otra.
pendiente negativa y entonces existe una existe una correlacin negativa y absoluta
entre las dos variables.
55
6
=1 -(
)
N (N - 1)
Alumno
Matemtica
Historia
Di
Di
-1
-2
56
= 0,77
6 (36 1)
57
58
abordaje teraputico. Esta hiptesis de investigacin slo podr aprobarse con seguridad a
partir de un experimento que permita la evaluacin y medicin de todas las variables que
intervengan en el fenmeno investigado.
Este procedimiento que es comn en ciencias tales como la qumica y la fsica, con
sus experimentos de laboratorio, es imposible cuando se trabaja con fenmenos complejos
que involucran conductas sociales, en los que participan muchas variables, y algunas no
controlables o desconocidas. Es en estos casos en que se recurre a la comprobacin
estadstica de las hiptesis, que tendr como resultado la afirmacin de la hiptesis de
investigacin o su negacin.
Como se seal, la estadstica slo puede evaluar una probable diferencia
significativa en los resultados de una investigacin respecto de un comportamiento
poblacional conocido, por lo que, la aprobacin de la hiptesis se realiza slo cuando
existe una muy pequea probabilidad que se trate de una diferencia producto del azar del
muestreo. Esto implica que la decisin sobre la hiptesis de investigacin se toma de
manera indirecta y una vez que se descarte un error de muestreo.
Es por esto, que se necesita plantear una hiptesis en la que se pueda contrastar
estadsticamente ese probable error de muestreo y es la que se denomina Hiptesis nula o
Hiptesis estadstica, y sta ser la que se ponga a prueba en la prueba de hiptesis o
prueba de significacin estadstica.
La hiptesis nula afirma que no hay diferencias significativas entre los resultados
de la investigacin y los marcados por el modelo terico de distribucin muestral, o lo
que es lo mismo, que la diferencia en los valores de los ndices respecto del parmetro
poblacional es producto del error de muestreo.
Frente a esta hiptesis siempre habr una hiptesis que afirme lo contrario que se
denomina hiptesis alternativa.
Slo si se rechaza la hiptesis nula el investigador podr afirmar la hiptesis
alternativa. Si sta coincide con la hiptesis de investigacin habr afirmado esta ltima.
Como se ver en los temas siguientes, siempre que se contraste una distribucin
muestral el investigador debe decidir previamente el nivel de error que est dispuesto a
asumir en su decisin. A este nivel de error posible se lo llama el nivel de significacin de
la prueba.
Este nivel de significacin corresponde con una zona de muy baja probabilidad del
modelo de probabilidades que se descarta para realizar el contraste de la hiptesis nula. La
zona de probabilidades que efectivamente se utiliza para contrastar la Hiptesis nula es la
60
61
diferencias entre las especies, entre individuos dentro de una especie y entre partes
de un mismo individuo.
Por estas razones, se denomina a toda variable que es observada como parte de un
experimento como variable aleatoria. Por lo tanto, cada observacin de un conjunto de
datos revela un resultado de dicha variable aleatoria. En algunos casos se asignan
arbitrariamente nmeros a los resultados de una variable aleatoria que no puede expresarse
cuantitativamente, por ejemplo, 0 si la cualidad estudiada no est presente, 1 si lo est,
resultando una variable aleatoria discreta dicotmica (slo dos resultados posibles). En
otros casos, variables pueden expresarse con una escala cuantitativa continua como
mediciones de tiempos mediciones de habilidades tratndose, entonces, de variables
aleatorias continuas.
Como se seal, la aleatoriedad de la variable deviene del concepto de azar en la
manifestacin del fenmeno, al que entendemos como el suceso o caso fortuito, es decir
aquello que sucede imprevistamente, es decir, sin "intencionalidad" conocida.
Con la cada del determinismo, como plantea Sussel, la evolucin del pensamiento
cientfico lleva a darle hoy, un real estatuto al azar como inherente a toda investigacin;
no ya en forma peyorativa, como ignorancia, sino como aquello que se desconoce en una
primera aproximacin a partir de un pensamiento lineal y simple, y que exige considerarlo
permanentemente parte del proceso.
Sistematizar el azar, sera entonces algo as como un sofisma, pues como podra
sistematizarse lo fortuito, como podramos sistematizar lo desconocido. Pero el azar es
posible de sistematizar a partir de la Teora de las Probabilidades que permite contrastarlo
permanentemente utilizando herramientas apropiadas.
La estadstica inferencial se constituye en una de esas herramientas, permitiendo al
cientfico, en cualquier campo "predecir y prever" con relacin a los fenmenos que le
62
conciernen, acotando as el impacto de lo que llamamos "lo imprevisto", pero no como una
forma ilusoria ms para eliminar la "incertidumbre", sino amplificando la predictibilidad.
Para ilustrar lo expresado acerca del desconocimiento y la incertidumbre.de un
problema investigado, puede tomarse un ejemplo: si estudiamos las consecuencias del
parto de cinco madres, internas de un neuropsiquitrico con diagnstico de psicosis, se
podra suponer que ninguno de los hijos recin nacidos, o algunos, o todos podran
presentar alteraciones de personalidad significativa. Estamos en presencia de una situacin
azarosa (o aleatoria) y lo esencial de este azar es que no se sabe el resultado cierto, ya que
podran ser cualquiera de los mencionados. Si no es posible evaluar o conocer qu tan
factible es cada resultado, tenemos una situacin de incertidumbre. Pero si, por el
contrario, es posible tener una idea de cunto probables son los diferentes resultados
(ninguno, alguno, algunos o todos), se tendr una situacin de riesgo, sobre la que se
puede actuar preventivamente..
Estas situaciones enfrentaron al pensamiento cientfico, imperante hasta fines del
siglo XIX, a su imposibilidad de resolverlas. El esquema causal determinista concibe a las
leyes cientficas, como una relacin entre fenmenos, de tal suerte, que estaran
encadenados indefectiblemente y eternamente a una relacin causa-efecto, en forma
inmutable y unvoca, donde a idnticas situaciones se obtienen idnticos resultados. Pero
si los fenmenos responden a situaciones de riesgo, es decir son fenmenos aleatorios, que
implican el comportamiento de poblaciones o universos numerosos que no se ajustan a
leyes sistemticas y estn influidos por el azar, ante idnticas situaciones pueden obtenerse
comportamientos diversos de los sujetos o entidades.
Esta aspecto afianza ms a la Estadstica y al Clculo de Probabilidades, ya que
estas disciplinas permiten arribar a leyes estables (no fijas), del comportamiento
"promedio" de los individuos de la poblacin.
El clculo de probabilidades se atribuye a los matemticos Pascal y Fermat, a partir
del siglo XVII, cuando estudiaban responder a las preguntas que surgan en los juegos de
azar.
Posteriormente Laplace, a fines del siglo XVIII - principios del XIX, le da una
estructuracin definitiva al Clculo de Probabilidades, permitiendo adems su unificacin
con la Estadstica, hasta ese momento disciplinas separadas, de tal manera, que se
constituye la Probabilidad como una estructura matemtica de base de la Estadstica.
La probabilidad es una cualidad, de lo "probable", y ambas palabras provienen de la
familia de "probar", siendo sta un verbo, que significa por tanto una accin, un hacer, con
63
el fin acreditar por la experiencia que algo del orden de un atributo o fenmeno es
verosmil, la verosimilitud indica aquello que puede ser verdad o no para la razn.
Por lo tanto probar es hacer un examen y un experimento de cualidades, que
permita el conocimiento del fenmeno.
Por ello se tiene, por un lado los conceptos que apuntan a los hechos como
fenmenos captados por los sentidos y por otro, a experiencias que intentan mediante la
comparacin, por oposicin o analoga con experiencias previas,
arribar a la
comprobacin.
Los sucesos aleatorios se caracterizan porque admiten dos resultados posibles o
ms, y no se tienen elementos de juicio, para afirmar cul de esos resultados ocurrir en
una determinada situacin.
A esos resultados que tienen la misma oportunidad de ocurrir, se los llama sucesos
o fenmenos equiprobables, es decir que son igualmente posibles de suceder cuando no
hay razn para que uno de ellos pueda producirse con preferencia a otro.
De esto se deducen los dos componentes esenciales en toda situacin o experimento
aleatorio:
probabilidades.
La probabilidad de un evento dentro del espacio muestral, puede ser nula, posible o
segura. Si se toma un ejemplo, sera:
a. Nula. Ej. Cul es probabilidad de encontrar un alumno, en una comisin de
Psicoestadstica, del turno noche, en Agosto de 2016, en la Universidad Kennedy,
que tenga 6 aos de edad.
b. Posible. Cul e la probabilidad de que llueve en algn da del mes.
c. Segura. Qu probabilidad existe, de que un alumno universitario tenga el nivel
primario completo.
4.6. Probabilidad Terica y emprica
La probabilidad es una rama de las matemticas que se ocupa de medir
cuantitativamente la posibilidad de que un suceso o experimento tenga un determinado
resultado.
64
f
n
Es un cociente, que se resuelve reemplazando los trminos:
Ejemplo: si se tienen cuatro lpices negros y uno rojo en mi cartera, al sacar un lpiz sin
mirar, tengo la probabilidad de sacar el lpiz rojo entre cinco posibilidades, esto sera el
total de lpices, n = 5, f, es decir lo favorable, es el lpiz rojo, o sea f = 1.
p=
1
5
p = 0,20
La probabilidad emprica de un suceso, est determinada por las veces que ese
suceso se d al repetir la experiencia, o sea la frecuencia con que se produce ese resultado,
y como la probabilidad es la relacin con el nmero total de experiencias, se puede
analogar la probabilidad con la frecuencia relativa de aparicin de ese evento.
Esta analoga responde a una Ley emprica formulada por el matemtico Bernoulli,
que la llam Ley emprica de los grandes nmeros, y puede enunciarse como: los
resultados de la experimentacin y observacin en los ms diversos campos de la ciencia,
tcnica, en los juegos de azar, etc., permiten afirmar, con "certeza" prctica, que, a
medida que crece el nmero de repeticiones de un acontecimiento de probabilidad p, la
frecuencia relativa se aproxima a p, llegando
prcticamente
iguales
(probabilidad
terica
0,50,
probabilidad
emprica
49000/100000 = 0,49)
Observaremos que cuanto ms veces se repita el fenmeno, o sea cuanto ms
grande sea el nmero de observaciones, mayor es la aproximacin al valor que defina la
probabilidad de ese suceso.
Es importante destacar que no todos los problemas son sencillos, pues se pueden
estudiar acontecimientos en que los distintos resultados pueden tener distintas
probabilidades de ocurrir, o incluso tener un nmero infinito de posibles resultados. En
este caso se esrt en presencia de eventos compuestos.
Ante eventos compuestos, es necesario tener en cuenta de qu forma se arriba a la
estimacin cuantitativa de la probabilidad, siempre teniendo en cuenta delimitar
exactamente en tiempo y espacio el fenmeno y la forma en que se desean determinar los
resultados.
Puede analizarse a travs de un ejemplo: Se considera una poblacin marginal, es
decir de escasos recursos econmicos y se toma una muestra de 100 nios entre 5 y 7 aos,
66
P (A y B) = P (A) . P (B)
Pero si ocurre, que ambos eventos se deben dar juntos, pero que la presencia de
uno depende de la presencia previa del otro, y viceversa, se plantea una probabilidad
condicional, dado que cada uno de los eventos puede depender del otro, son sucesos
dependientes. En este caso la frmula:
4 . 4
= 0,01
40
40
b.- Si en una bolsa hay 3 bolas blancas y 2 negras, si el primer suceso E1 es que la
primera bola que se saque sea negra:
P (E1)
2
3 + 2
2
5
1
3 + 1
1
4
67
2,
3...
Xn
Donde cada uno es un valor numrico o modalidad correspondiente al atributo que se est
midiendo (variable).
Se entiende que puede atribuirse a cada X una probabilidad P, resultando que la
sumatoria de todas las probabilidades individuales de todos los valores de X es igual a
1,00. De esta forma se define una variable aleatoria, con relacin a la ley de
probabilidades, mediante pares de valores (X1, P1), (X2, P2),..... , (Xn, Pn).
Si toma la variable valores continuos, al graficar el polgono de frecuencias resultar una
curva continua, y el rea debajo de la curva, dado que constituye una distribucin de
68
probabilidad continua, toma en cuenta todas las probabilidades por lo que representa a
1,00.
4.2.4. Modelos probabilsticas
Un modelo matemtico de probabilidades es una representacin ideal o una
construccin, en la forma de un sistema, proposicin, frmula o ecuacin y representa
todas las probabilidades que puede asumir una variable aleatoria que pueda represntarse
con el mismo. Estos modelos preexistentes son instrumentos para la interpretacin de
comportamientos en fenmenos aleatorios. En Estadstica son los que nos permiten la
interpretacin de los sucesos que investigamos. Muchas veces la interpretacin no resulta y
esto no depende de errores del modelo elegido, sino precisamente en el error al elegir el
modelo. Este debe responder a los fines de la investigacin para permitir la lectura e
interpretacin adecuada de los resultados y para lograr tener cierta predictibilidad sobre el
comportamiento de las variables dentro de una poblacin, en relacin el fenmeno
estudiado. Como debe indicar en qu forma se distribuyen los valores de la variable y sus
probabilidades, se les llama distribucin.
Una distribucin de probabilidad es un modelo para una variable aleatoria, que
describe la forma en que la probabilidad est distribuida entre los valores posibles que la
variable aleatoria puede asumir. Como se vio anteriormente la probabilidad puede ser
interpretada como la frecuencia relativa en un nmero indefinido de pruebas. Desde el
punto de vista matemtico, los conceptos distribucin de la probabilidad y variable
aleatoria estn interrelacionados; una variable aleatoria debe tener una distribucin de
probabilidad y sta debe estar asociada a una variable aleatoria.
El primer paso para toda inferencia estadstica que permita obtener informacin de la
poblacin a partir de la informacin de una muestra de la misma, es la adopcin de un
modelo
matemtico
de
distribucin
de
probabilidades
que
represente
el
Se puede tomar como ejemplo de esta variable a los resultados del lanzamiento de
monedas. En este tipo de problemas, el nmero de los lanzamientos constituye la magnitud
de la muestra, y el inters se centrar en el nmero de caras (xitos) obtenidas en n
pruebas.
Suponiendo que las n pruebas son estadsticamente independientes una de otra,
podemos evaluar inmediatamente las probabilidad de obtener r caras sucesivas seguidas de
(n-r) cruces. Supongamos que p es la probabilidad de obtener una cara; en este caso la
probabilidad de obtener una cruz es (1-p) y se simboliza como q. Como las pruebas son
independientes, puede utilizarse la regla de la multiplicacin para el clculo de la
probabilidad para el caso considerado:
r
p . p . p. . . . . . .p .
q.q.q.......q = p
n-r
. (1 - p)
( r trminos )
( n-r trminos )
Esto representa la probabilidad de este suceso segn un orden determinado de
aparicin de las caras y cruces
Es obvio que la probabilidad de obtener r caras y n-r cruces en otro orden tiene
la misma probabilidad. Por lo tanto, para
n!
) = ----------------r
r ! ( n-r) !
70
0,50
0,33
0,16
0,25
0,03
n caras
n caras
Un lanzamiento
n caras
Dos lanzamientos
Cinco lanzamientos
1
p=
e
2
Donde
= media
(parmetro de la curva)
= desvo estndar (parmetro de la curva)
e y son valores numricos constantes
Esta funcin est definida en todo el campo real y la representacin grfica
responde a una curva en forma de campana simtrica al eje de las ordenadas p. En esta
distribucin, la variable p es dependiente de X, y sta ltima es la variable independiente,
por lo que se conoce como distribucin de probabilidad continua de X.
Ejemplo grfico de la funcin normal
p
71
La mayora de las variables en los fenmenos objeto de estudio para las ciencias
sociales y biolgicas, cumplen aproximadamente las caractersticas de esta distribucin,
dado que las frecuencias tienden a distribuirse simtricamente alrededor de los valores
promedios de la variable, es decir de su media por lo cual cobra importancia relevante
cuando se adoptan como parmetros de la curva normal los parmetros de una variable en
una poblacin para permitir la observacin e interpretacin del comportamiento de las
misma.
Es un modelo til, que a travs de una extensa aplicacin en innumerables
investigaciones, justifica su empleo, pues se adecua y adems facilita trabajar
inferencialmente a travs de muestras y hacer la consecuente proyeccin a la poblacin.
Como expresa la ecuacin del modelo, las probabilidades no dependen del nmero
de casos considerados por tratarse de poblaciones y no de muestras.
Se observa su utilidad cuando al estudiar muestras cada vez ms grandes la distribucin de
las frecuencias relativas de sucesos aleatorios se hacen muy semejantes a las distribucin
normal de probabilidades. En la distribucin normal, se sabe que todos los sucesos se
consideran independientes, con la misma fuerza, y la misma probabilidad de ocurrir, tal
cual se supone a priori de cada una de las variables involucradas en el campo de los
fenmenos sociales, y este modelo hipottico encuentra en ello otro motivo de eleccin.
Volviendo a su expresin grfica, debe tenerse en cuenta que toda curva o figura,
en un grfico, encierra un rea proporcional al tamao de la poblacin ya que hay una
relacin proporcional del rea encerrada con la cantidad de sujetos o entidades que
presentan los valores de la variable, encerradas en esa superficie.
Con relacin a la curva normal, el rea de la regin encerrada bajo la curva entre
los valores X1 y X2, es la probabilidad de que la variable aleatoria continua X, tome valores
encerrados entre los dos valores de X:
p
X1
X2
72
Puntaje estndar
Los valores de las variables cuantitativas pueden expresarse de una forma que
facilita la utilizacin del modelo normal y que se denomina puntuacin estndar o
reducida y que se simboliza por la letra Z.
Consiste en transformar el valor de la variable restando el valor de la media poblacional y
dividiendo el resultado por el desvo estndar poblacional
Si llamamos X1 valor de la variable X cuya distribucin tiene una media de y un
desvo estndar de , el valor expresado en el puntaje estndar en
X1 -
Z1 =
Es una curva con ordenadas p siempre positivas y decreciente hacia ambos lados
d.
-1
+1
73
70 (media)
-z
+z
1
P/ =
2
e
74
-3
-2
-1
75
76
m = -------------
(Error Estndar)
N
Siendo: y los parmetros de la poblacin en estudio
77
78
79
Una cola
P(x)
Intervalo de Confianza
Nivel de Significacin ()
xf
Dos colas
P(x)
( - )
( + )
80
(1)
N
X es la media muestral,
es la media poblacional
es el desvo poblacional,
N es el tamao de la muestra.
El procedimiento para realizar una prueba de significacin de medias muestrales
consiste en determinar el valor de la media muestral que est en el lmite entre nivel de
confianza y el de significacin. Una vez calculada la media muestral terica del este punto
del modelo se observa si la media experimental est dentro del nivel de confianza o dentro
del nivel de significacin. En el primer caso no se rechaza la Hiptesis nula y se rechaza la
alternativa. Si el resultado experimental cae dentro del nivel de significacin se rechaza la
Hiptesis nula y se acepta la alternativa.
Para el clculo del valor lmite de la media de la distribucin muestral se aplica la
definicin de Z expresada en la ecuacin (1), despejando trminos resulta:
X lim = + Z lim / N
donde: Zlim surge de la Tabla de Z que representa a la distribucin normal, para el Nivel
de significacin elegido
La interpretacin de X lim es que se trata del mayor valor de media terica
probable por error de muestreo para ese nivel de confianza (si la cola de significacin es
la derecha de la curva) y si la media experimental es mayor a este valor el investigador
puede arriesgarse y rechazar la Hiptesis nula y aceptar la Hiptesis alternativa. Si la cola
est a la izquierda de la curva el razonamiento es similar, dando el menor valor de media
terica probable por error de muestreo y se rechazar la Hiptesis nula si la media
experimental es menor que ese valor.
81
Si la prueba es de dos colas se debern determinar los dos valores lmites de las
medias de la distribucin muestral para el nivel de significacin elegido. El razonamiento
para rechazar la Hiptesis nula se deduce de los dos anteriores.
Existe un procedimiento alternativo para la toma de decisiones en esta prueba que
deriva del anterior y consiste en calcular el valor de Z exp para la media experimental y
luego compararlo con el Z lim que surge de la tabla. Si el Z exp est dentro del nivel de
significacin se rechaza la Hiptesis nula y se acepta la alternativa
1 + 2
( X1 X2 ) 0
Donde dif =
Z exp =
dif
N1
N2
Si las muestras son mayores a N=30 pueden utilizarse los desvos muestrales de cada
muestra para estimar dif. Por lo tanto, el Zexp puede calcularse como:
( X1 X2 )
Zexp = ------------Donde Sd es el Desvo estndar de las diferencias estimado
Sd
Donde:
Sd =
S1 2 S2 2
---- + ---N1
N2
Una vez obtenida Zexp y tratndose de una prueba de dos colas siempre, el procedimiento
82
gl = N 1
texp =
S
N1
donde X es la media de la muestra, S su desvo estndar y N su tamao, y la media
poblacional o de referencia.
83
texp =
Sd
Donde:
N1 S12 + N S22
Sd =
N1 + N2 - 2
En este caso. Los grados de libertad estarn dados por:
gl = N1 + N2 - 2
Consultando la tabla para encontrar el tlim se acepta o rechaza la hiptesis nula con
la misma lgica de siempre
4.4.8. Prueba de estimacin de
Cuando se ha probado de una muestra es significativamente diferente a las
probables de una poblacin, se impone la tarea de predecir cual ser el parmetro que
corresponder a la nueva poblacin a la que pertenece la muestra. Debe recordarse que
cuando se habla de poblacin se est sealando el comportamiento de una variable en una
poblacin, por lo que la tarea ser predecir el parmetro que define el nuevo
comportamiento de la variable.
La prueba estadstica que permite hacer esta inferencia se denomina Prueba de
estimacin de y se basa en estimar los valores probables de a partir de la media y el
desvo estndar de la muestra y conociendo que la media est dentro del nivel de confianza
84
lim
que
tlim
S
N-1
X + tlim
S
N-1
Bibliografa
Aron A. y Aron E. (2001) Estadstica para Psicologa Cap.1 Bs.As.: Pearson Education,
Cortada de Kohan, N. y Carro, J. M. (1968) Estadstica aplicada. Bs. As.: EUdeB
85
La Prueba de chi cuadrado es una prueba muy general que puede emplearse
cuando se desea estudiar si las frecuencias obtenidas empricamente difieren
significativamente o no de las que se esperaran bajo cierto conjunto de supuestos tericos.
Se trata de una Prueba de hiptesis que se realiza a partir de las frecuencias, por lo que no
es imprescindible que se trabaje con variables cuantitativas como en las pruebas de
hiptesis ya estudiadas.
De hecho, es la prueba ms valiosa para estudiar variables cualitativas expresadas
en escala nominal ya que para variables cuantitativas existen otras pruebas de hiptesis,
que son ms adecuadas.
En esta prueba las hiptesis se expresan como igualdades o desigualdades entre las
frecuencias observadas en una investigacin y las frecuencias esperadas en funcin de
alguna condicin pre-determinada o modelo.
Es por esto, que se expresan las frecuencias como frecuencias observadas (las que
son producto de la investigacin) y frecuencias esperadas (las que son producto del
modelo terico de comparacin). Estas frecuencias se comparan segn un nuevo ndice
estadstico denominado Chi cuadrado y representado por el smbolo .
La Hiptesis de Nulidad de esta prueba se plantea como una igualdad entre las
frecuencias observadas y esperadas. Esta hiptesis conjetura que las diferencias entre las
frecuencias observadas y esperadas se deben al azar de muestreo y, por lo tanto, no son
significativas.
En cuanto a su lgica de contraste de las hiptesis, es similar a las dems pruebas
de significacin que se han estudiado, ya que se adopta un nivel de significacin y se
contrasta el estadstico
86
( fo - fe )
fe
Cuanto mayor es la diferencia entre las frecuencias observadas y las esperadas,
tanto mayor es el chi cuadrado. Este slo ser cero si todas las frecuencias observadas y
las esperadas son exactamente las mismas.
La distribucin de muestreo, esto es la distribucin de probabilidades de valores de
chi cuadrado producto del muestreo es conocida y est tabulada. Existe una curva de
distribucin probabilstica diferente para cada grado de libertad de la variable.
Si el chi cuadrado resulta mayor de lo que anticipara el azar de muestreo estaremos
en condiciones de descartar la hiptesis nula siguiendo el procedimiento habitual
2.
modelo propuesto
3.
atributo
4.
5.
atributo
6.
Sumar los resultados del paso anterior para obtener el chi cuadrado
de la prueba
7.
Rechazar o no la Ho
Esta prueba puede utilizarse para diferentes situaciones segn los modelos de
comparacin de las frecuencias esperadas.
87
fOi = N
prueba =
( foi - fei ) 2
fei
Los grados de libertad, para elegir la curva de chi cuadrado a contrastar se calcula
restando 1 a la cantidad de valores o atributos diferentes de la variable:
88
gl = n - 1
Los requisitos para aplicar la prueba son los siguientes:
1.
2.
3.
independencia entre las dos variables. En este caso se denomina Prueba de independencia.
Esta prueba se utiliza generalmente para probar la no-independencia de las
variables. Es la prueba ms importante para estudiar la Asociacin o Correlacin entre dos
variables cualitativas en escala nominal y complementa las pruebas de correlacin ya
estudiadas para variables cuantitativas o cualitativas en escala ordinal.
En la prueba de independencia los grados de libertad se calculan multiplicando los
grados de libertad de cada variable, calculados en la seccin anterior.
89
Bibliografa
Aron A. y Aron E. (2001) Estadstica para Psicologa Cap.1 Bs.As.: Pearson Education,
Cortada de Kohan, N. y Carro, J. M. (1968) Estadstica aplicada. Bs. As.: EUdeB
90