Anda di halaman 1dari 12

Captulo 10

Kerlinger

Cristian Fredes.

Bruno Gaete.

Valentina Silva.

El anlisis de frecuencias

La forma ms simple de analizar datos para estudiar relaciones es por medio


de particin cruzada de frecuencias. Para estudiar relaciones entre variables
se le llamar tabulacin cruzada.

Terminologa de datos y variables


Las variables activas se refieren a variables experimentales o manipuladas, Las
atributo a variables medidas.
V.nominal: Los nmeros o smbolos asignados a los objetos no tienen un
significado numrico ms all de la presencia de la propiedad que se est
midiendo.
F={(x,y): x = cualquier objeto, Y y=cualquier numeral}
F: una regla de correspondencia X: algn objeto y: es algn nmero asignado
aX
Las variables continuas son aquellas donde Y={0,1,2..k} o algn sistema
numrico donde los nmeros indican ms o menos el atributo en cuestin.

Tabulacin cruzada: definiciones y propsito.

Una tabulacin cruzada es una presentacin tabular numrica de los


datos, generalmente en forma de frecuencias o porcentajes en la que las
variables se dividen de forma cruzada.

Suele utilizarse al analizar datos categricos o nominales. Puede usarse de


forma descriptiva. Tambin sirve para determinar la naturaleza de las
relaciones entre variables. Otro propsito es el control de las variables

Tabulacin cruzada: definiciones y propsito.

La forma ms simple de una tabulacin cruzada es una tabla d 2x2. No existen reglas aceptadas de
forma general respecto a cmo construir tabulaciones cruzadas. Se sabe, sin embargo, que son
particiones cruzadas y que deben seguir las reglas de la particin o categorizacin que son:

1-Las categoras se establecen de a cuerdo a la hiptesis de investigacin

2-Las categoras son independientes y mutuamente excluyentes

3-Las categoras son exhaustivas

4-Cada categora es derivada de un solo principio de clasificacin

5-Todas las categoras estn en un nivel de discurso.

En el caso de tres variables se requiere de un cubo, cada casilla de ste tiene una triple etiqueta
pero ya que manejar un cubo es incomodo se utiliza la tabla de tabulacin cruzada de tres.

Clculo de porcentajes

Los porcentajes se calculan de la variable independiente hacia la dependiente. En los estudios en los
que no se pueden hacer estas etiquetas la regla no aplica, pero en la mayora de los casos es aplicable.

Cuando hay ms de una variable independiente las tablas son frecuentemente impresas de arriba abajo.

Las tablas cruzadas con frecuencias pueden ser interpretadas si convertirlas en porcentajes, pero es
aconsejable convertirlas siguiendo la regla dada anteriormente: calcular una columna(o regln) a la
vez, de la variable independiente hacia la variable dependiente. Para hacer esto primero se suman las
frecuencias en los reglones y en las columnas y luego se colocan las sumas resultantes en la parte
inferior y al lado de la tabla.

El clculo de los porcentajes es equivalente a la hiptesis.

Significancia estadstica y la prueba de Chi cuadrado

Esta prueba compara los resultados obtenidos (f1) con aquellos esperados con base
en el azar (f0)

Chi cuadrado dice simplemente reste cada frecuencia esperada con la frecuencia
obtenida, eleve esta diferencia al cuadrado, divida la diferencia cuadrada entre la
frecuencia esperada y despus sume estos cocientes

Adems se debe conocer los grados de libertad, estos definen la amplitud de


variacin contenida en un problema estadstico.

Niveles de significancia estadstica

Un nivel .05 quiere decir que un resultado que es significativo al nivel .05 puede ocurrir por azar
no ms de 5 veces en 100 ensayos

Los niveles recomendados son .01 y .05

Algunos cientficos utilizan tambin un nivel .10, aunque otros dicen que es un criterio
demasiado amplio, que no otorga la confianza suficiente como para tomar una decisin

Rozeboom: Recomienda el uso de intervalos de confianza y reporte de valores precisos de


probabilidad de los resultados experimentales

Brady: Establece que esa precisin generalmente carece de significado en las ciencias sociales y
conductuales por la imprecisin de las mediciones

Un resultado estadsticamente significativo no implica significancia personal o prctica

Babbie:

Rechaz el uso de pruebas de significancia en la investigacin

Los supuestos detrs de las pruebas estadsticas generalmente no se encuentran en ciertos tipos de
estudios sociales

Hay una tendencia a interpretar las pruebas de significancia estadstica como la fuerza de asociacin o
como significancia sustantiva

En

sta tabla se ilustra el uso de la prueba con la tabulacin


cruzada
La frmula dada anteriormente es ms difcil aplicarla en la tabla 10.6
que en la 10.4
La principal diferencia entre stas tablas es el clculo de frecuencias
esperadas (los clculos se muestran en la tabla 10.6)
fe: Frecuencia esperada. Se ubican en la esquina superior izquierda de
cada celda
fo: Frecuencia obtenida. Se ubican en el centro de cada casilla
El clculo fo - fe requeridos por la frmula, se pueden ver en la esquina
inferior izquierda de cada casilla, y son los mismos en todas las
casillas, excepto por el signo
Esto es para las tablas de 2x2
La frmula de requiere elevar al cuadrado estas diferencias,
dividiendo los cuadrados por las fe, y sumando los resultados
Los clculos se indican abajo, dando por resultado = 95.0653, con
un grado de libertad
Grado de libertad: Nmero de valores que pueden ser asignados de
forma arbitraria, antes de que el resto de variables tomen un valor
automticamente producto de establecerse las que son libres. El fin
es compensar e igualar un resultado que se ha conocido previamente
Al observar la tabla de valores de , un grado de libertad en el nivel .
01 se lee 6.635
Dado que el valor de excede ese nmero, se puede decir que es
estadsticamente significativa, que los resultados obtenidos
probablemente no son derivados del azar y que la relacin expresada
en la tabla es real

necesita una correlacin si N es pequea

La regla implica el uso de la correccin por continuidad

Correccin por continuidad: Consiste en restar .5 de la diferencia absoluta de fo - fe antes de


elevar al cuadrado, cuando las frecuencias esperadas son menores que 5 en tablas de 2x2

El , como cualquier otro estadstico de significancia, no nos dice nada acerca de la magnitud
de la relacin

Un estadstico que es fcilmente aplicable y que puede ser usado con una tabla de contingencia
de cualquier tamao es la V de Cramer, una medida de asociacin basada en el valor de .

La frmula de la V de Cramer es:

Donde k es el nmero de renglones o el nmero de columnas de una tabla. Se escoge el


nmero que sea ms pequeo

La V de Cramer es la generalizacin del coeficiente phi ()

En las tablas de 2x2 la V de Cramer y son idnticos

Ocasionalmente aparece el coeficiente de contingencia (C) en la literatura, sin embargo,


su valor no es tan adecuado cono la V de Cramer

La mejor forma de manejar datos categricos es calcular (para determinar la


significancia), calcular V, calcular los porcentajes (explicado anteriormente) y despus
interpretar los datos usando toda la informacin

Tipos de tablas cruzadas y tablas

Hay 3 tipos de tablas:

Unidimensional (1 dimensin)

Bidimensional (2 dimensiones)

k-dimensional (k dimensiones)

El nmero de variables determina el nmero de dimensiones de una tabla

Tablas unidimensionales

2 tipos:

verdadera tabla unidimensional: Es de poco inters puesto que no expresa


relaciones. Slo una variable es usada en la tabla

El otro tipo corresponde a tablas que parecen unidimensionales pero que


realmente son bidimensionales, como por ejemplo la tabla 10.7

Tablas de especificaciones

Son tambin conocidas como tabulaciones cruzadas

Tienen 2 variables, cada una con dos o ms subclases

Las tablas bidimensionales no slo estn limitadas a la forma de 2x2, ya que


no hay una limitante lgica en el nmero de subclases de cada variable

Tablas bidimensionales, dicotomas verdaderas


y medidas continuas

Dicotomas verdaderas: Variables que realmente son dicotomas, como


sexo, vivo/muerto, etc.

Existen variables que se presume son continuas pero se dicotomizan (o


tricotomizan) de forma artificial.

Tablas de tres dimensiones y de k-dimensiones

Es posible tericamente hacer anlisis cruzados con cualquier nmero de


variables, pero en la prctica el lmite es de 3 o 4

Esto sucede porque a ms variables se necesitan N muy grandes, y la


interpretacin de los datos se puede volver extremadamente difcil

El anlisis de 3 o ms variables tiene 2 propsitos importantes:

Estudiar las relaciones entre 3 o ms variables

Por ejemplo: Variables A, B, C se pueden relacionar A con B, A con C, B con C, y A con B y con C.

Controlar una variable al estudiar la relacin entre las otras 2 variables

Por ejemplo, se puede estudiar la relacin entre B y C mientras se controla A

Especificacin

Especificacin: Proceso de describir las condiciones bajo las


cuales una relacin existe o no existe, o existe en mayor o menor
grado

Tabulacin cruzada, relaciones de pares ordenados.

Relacin: Conjunto de pares ordenados que se puede expresar en: a) Listado


de pares y b) Graficandolos.

Coeficiente de correlacin: Es un ndice que expresa la magnitud de una


relacin.

Tabulacin cruzada: Expresa los pares ordenados en una tabla de frecuencias.

Razn de probabilidad

Es la razn o tasa de dos probabilidades.

Las probabilidades son calculadas como la razn de probabilidad de que


el evento ocurra con la probabilidad de que el evento no ocurra.

Puede ser calculado partiendo de las tablas de contingencia de 2x2.

Ayuda a tratar de explicar qu est sucediendo.

Importante para el trabajo con datos categricos y til cuando se consideran las tablas
de contingencia multifactoriales o anlisis en los que se usan funciones logsticas.

Anda mungkin juga menyukai