Anda di halaman 1dari 16

Anlisis de Datos I

(SOL 106)
PROFESRAS: BEATRIZ FERNNDEZ, DANIELLA LEAL,
PAMELA AYALA.
ANDRS GONZLEZ

ndice
Investigacin cuantitativa y operacionalizacin.................................................................2
Objetivos, hiptesis, modelos....................................................................................... 4
Tipos de variables, niveles de medicin..........................................................................7
Indicadores compuestos............................................................................................ 10
Proporciones, porcentajes y tasas................................................................................ 10
Creacin de Tablas de Contingencia I...........................................................................12
Creacin de Tablas de Contingencia II..........................................................................14

7 de Marzo.

Investigacin cuantitativa y operacionalizacin.


El punto de partida de una investigacin est en funcin de un problema de investigacin.
Para poder definir uno hay que tener clara la temtica y lo que se pretende de responder con
la investigacin. Lo que est contenido en los objetivos es lo que se pretende conseguir con
la investigacin. Estos objetivos se ven alimentados por la teora; de ah la relevancia de la
revisin bibliogrfica. La teora retroalimenta la temtica y los objetivos de investigacin.
El conjunto de todo ello impulsar el planteamiento de ciertas hiptesis, las que se pueden
cumplir o no. (Si bien es cierto que autores han investigado, hay elementos de la
contingencia, ya sean formas de medicin o adopcin de conceptos, en la unidad de anlisis
utilizada, por ejemplo, que hagan que una hiptesis en un contexto sea verdadera y en otro
falso; la diferencia puede estar en el levantamiento de datos, en la adopcin de ciertos
conceptos, etc. Esto se puede dar particularmente en estudios de vida de las personas, por
ejemplo. Esto es lo que se conoce como limitaciones metodolgicas.) La hiptesis es la
relacin entre determinados conceptos. El punto es de dnde salen esos conceptos, cmo
tomo una idea y se plantea en un set de preguntas en un cuestionario. Luego viene la
observacin de los datos recogidos. Luego, una vez que se tienen los datos recogidos se
pasa al anlisis de tipo descriptivo; cmo se responde a la pregunta de investigacin a partir
de un instrumento.
El proceso de operacionalizacin parte de la definicin de un concepto: qu se va a
entender por La definicin de un concepto proviene de una concepcin (imagen mental
que surge de la percepcin intuitiva de una regularidad entre diversos eventos empricos:
esto ocurre), a partir de ah aparece el concepto (cmo coloco lmites a la concepcin; es
la seleccin de un nombre para indicar la concepcin sobre algo); el nombre debe estar
relacionado con una definicin (poder decir yo entiendo por A, esto). La
operacionalizacin parte con esta conceptualizacin. A partir de ella, para poder llegar a la
medicin hay que pasar por la identificacin de dimensiones, sub-dimensiones, indicadores
y cmo estos indicadores se traducen en preguntas que me permitan la medicin. El
concepto para ser medido necesita ser traducido en indicadores y preguntas.
2

(Ejemplo: Las personas atendidas en el centro de salud estn molestas por el alto
nivel de espera, eso es lo que se observa. Y el concepto a partir de la observacin ser el
nivel de satisfaccin con el tiempo de espera y la definicin ser nivel de satisfaccin
manifestado por los usuarios del centro de salud respecto al tiempo de espera para recibir la
prestacin de salud. Este sera un ejemplo unidimensional, en la medida que existe una
sola dimensin del concepto. Ahora, pensando en un concepto multidimensional puede ser
la accesibilidad a los servicios de salud, siendo su definicin la posibilidad de acceder al
servicio de salud y beneficiarse de sus prestaciones, pero segn la concepcin se pueden
ver distintas dimensiones de la accesibilidad: geogrfica, econmica y cultural; cada uno de
los cuales puede dividirse en sub-dimensiones. Si estuvieran dentro de una misma
dimensin se estara diciendo que el problema de accesibilidad financiero es igual al
problema de accesibilidad geogrfica; al separarlos se est diciendo que la una y la otra no
se condicionan: tener accesibilidad econmica no significa tener accesibilidad geogrfica,
es decir, cada dimensin se comporta de manera distinta. Una dimensin es independiente
de otra dimensin, una respuesta a una dimensin es distinta a la de otra dimensin.)
Las variables tericas son aquellas asociadas al concepto en s, los indicadores son
las variables empricas. Este paso es importante en la medida en que no se puede preguntar
a partir de variables tericas (Cul es tu nivel de vulnerabilidad social? es distinto a
preguntar Cul es tu edad?). La operacionalizacin vincula la conceptualizacin con la
medicin, es decir, es el proceso que permite vincular un concepto abstracto con su
medicin emprica, por medio de indicadores. Un indicador indica la presencia o ausencia
de una dimensin del concepto que se pretende observar. Un indicador debe ser:
a) Exhaustivo: abarcan todo el rango de significados contenidos en la definicin
nominal,
b) Mutuamente excluyente: no se superponen entre s en la dimensin del concepto
que estn midiendo,
c) Confiable: permiten que lo observado corresponda a la realidad y no al azar de
la medicin,
d) Vlidos: reflejan el significado real del concepto o su dimensin, (un indicador
no valido puede ser uno que pretende preguntar por temor, pero pregunta por
victimizacin).

Ahora bien, los indicadores se relacionan de forma probable con la dimensin que
miden. No hay una nica forma de medir un fenmeno. Hay distintos caminos para llegar a
la medicin de un concepto. Los indicadores permiten saber cmo se pretende trabajar una
pregunta.
La pregunta puede ser transformada en una pregunta distinta con indicadores
distintos; puede ser recodificada, por eso se tiene que distinguir entre el atributo con el cual
se va a trabajar y la pregunta de la encuesta.
Cmo se trabaje con cada uno de los indicadores ser en funcin de la hiptesis que
se busque responder.
Las categoras NS/NR es lo que se conoce como una categora residual; ello le
permite dar exhaustividad al indicador: al encuestado no se le puede obligar que me
conteste S o No, se tiene que dar la posibilidad a la persona que No Sabe que pueda
responder, al igual que a quien no quiera responder.

14 de Marzo1.

Objetivos, hiptesis, modelos.


La hiptesis es un punto intermedio entre la teora y la observacin; sera un universo de
posibilidades de las cosas que ocurren en la realidad, aunque no necesariamente ocurran en
la realidad. Los objetivos estn ntimamente relacionados con el problema de investigacin;
ayudan a delimitar el campo de accin para acercarse al problema de investigacin,
responden a la pregunta de qu se pretende conseguir con la investigacin. Las hiptesis
son potenciales respuestas de lo que uno se plantea en los objetivos con una determinada
posicin.
Las hiptesis pueden ser de dos tipos:
a) Descriptivas: enuncia cul es el estado de un determinado fenmeno, no
relaciona ningn concepto con otro, slo describe un escenario potencial.
1 La clase pasada fue terminar de ver operacionalizacin (ltimo caso de un concepto
multidimensional), y hacer la Gua N1.
4

b) Explicativas: relaciona conceptos entre s.


Una hiptesis explicativa se puede traducir o esquematizar a travs de un modelo
explicativo, que es la relacin que se establece entre cada concepto. Pero antes de pasar al
modelo explicativo veremos la diferencia entre unidad de anlisis y unidad de observacin:
a) Unidad de anlisis: sobre quien voy a realizar el anlisis. Es la unidad de inters
analtico de la investigacin, sobre la cual se contrastan las hiptesis. Es el
alcance del estudio, a quien represento en mi estudio.
b) Unidad de observacin: sobre quien aplico el instrumento de medicin. La
obtencin de datos est en funcin de ella.
Dentro de una investigacin se puede tener ms de una unidad de observacin y, al mismo
tiempo, ms de una unidad de anlisis, no es lo habitual, pero puede darse en
investigaciones ms complejas.
Ahora bien, los objetivos definen los lmites de la investigacin, permiten fijar
propsitos (por ejemplo, analizar, explicar, describir, etc.) Tienen que ser claros,
susceptibles de alcanzar; en ese sentido los objetivos estn en directa relacin con las
herramientas analticas que se poseen y el carcter de la investigacin misma; y
congruentes entre s, es decir, tienen que tener una secuencia lgica entre ellos al interior de
una investigacin. Los objetivos se pueden clasificar como:
a) Exploratorios: se busca un mnimo grado de familiaridad con un fenmeno.
Generalmente se destinan a fenmenos con poca bibliografa. (Se tiende a usar
una metodologa ms cualitativa, dado que el tipo de aproximacin es ms
enriquecedora.)
b) Descriptivos: se busca medir cierta regularidad que se da algn fenmeno. Se
busca caracterizar cmo es un determinado atributo en la poblacin.
c) Explicativos: busca explicar el por qu se dan determinados fenmenos o por
qu se observan determinados atributos en la realidad. Apunta directamente a la
relacin entre conceptos, a diferencia del objetivo descriptivo.
Para distinguir entre un estudio descriptivo y otro explicativo hay que ver si el estudio
establece una relacin entre conceptos. Si en el objetivo no se busca determinar una
relacin ser descriptivo; no busca explicar el fenmeno, sino que describirlo.
5

(Cuando se analizan percepciones, es decir, opiniones, comentarios que los sujetos


pueden tener sobre ciertos hechos. Estos estudios no son restrictivos de las investigaciones
cualitativas; a nivel cuantitativo tambin se encuentran investigaciones en base a
opiniones.)
Cuando se logra dilucidar los objetivos de una investigacin es posible desprender
algunas hiptesis. En el caso de ser un objetivo descriptivo la hiptesis ser de tipo
descriptiva (una idea tentativa de lo que pasa de manera descriptiva. Se da un estado de
situacin; es un yo creo que se da esto); si la investigacin busca explicar el fenmeno, la
hiptesis ser de tipo explicativa (una explicacin tentativa de la direccionalidad de los
conceptos de tipo tentativa. Hipotetisa sobre las razones del porqu se da un fenmeno).
Hay dos niveles de hiptesis explicativa: a
a) Nivel terico: la hiptesis relaciona conceptos tericos, por lo tanto no es
verificable empricamente.
b) Nivel emprico: la hiptesis relaciona conceptos empricos, medibles y
observables. Es deducida de la hiptesis terica, y debe ser confirmada o
refutada de manera emprica.
Las hiptesis nacen de la revisin de la literatura. De ah nace una hiptesis terica, luego,
en funcin de la operacionalizacin de los conceptos contenidos en la hiptesis nacer la
hiptesis emprica.
Como ya se dijo, las hiptesis son explicaciones tentativas que no necesariamente se
adaptan a la verdad. En el caso de las hiptesis explicativas se plantean relaciones entre dos
o ms conceptos, y propone una respuesta a la pregunta de investigacin. Estas relaciones
deben ser propuestas de manera clara y plausible; pueden ser de dos tipos:
a) Causal: es una relacin entre conceptos con una determinada direccionalidad.
b) Relacional: dir que dos conceptos estn relacionados pero no dice cul de los
dos afecta al otro.
Evidentemente, una hiptesis tiene que estar sustentada en la literatura. Una buena hiptesis
debe referirse a una situacin social real, con conceptos comprensibles, precisos y
concretos; as mismo, los conceptos deben ser observables y medibles. Finalmente, una
hiptesis debe especificar una direccin entre los conceptos y precisar la unidad de anlisis.
6

21 de Marzo2.

Tipos de variables, niveles de medicin.


Dependiendo del tipo de variable se van a realizar distintas operaciones matemticas.
Las variables son los indicadores que se miden; es el equivalente del indicador pero a nivel
de anlisis de dato. La variable es bsicamente un conjunto lgico de atributos: los distintos
elementos que se pueden medir en una encuesta son variables. Lo importante en el anlisis
de datos es que las variables tengan cierta variabilidad: es decir, que se tengan distintos
estados de respuesta; hay que evitar las variables con poca heterogeneidad. Adems de la
variabilidad, para tener una buena variable, los atributos que la componen deben ser:
a) Exhaustivos: las respuestas a las variables deben permitir que toda persona se
pueda clasificar; se deben anotar todas las posibles respuestas. Por ejemplo, la
variable Estado civil debe tener las opciones de: 1. Casado, 2. Conviviente, 3.
Soltero, 4. Viudo, 5. Divorciado, 6. Unin civil.
b) Mutuamente excluyentes: Por ejemplo, se pregunta Cul es su estado de salud?
1. Muy bueno, 2. Buensimo, 3. Regular, 4. Muy malo, 5. Malsimo. Entre 1 y 2;
4 y 5 no est clara la diferencia.
c) Precisos: Se tiene que ser detallado en el listado de atributos, tanto para quien
responde como para el anlisis. Hay que desagregar detalladamente el listado de
atributos.
Lo siguiente que se ver ser la clasificacin de las variables dependiendo de distintos
criterios:
a) Segn funcin en la investigacin:
1. Independiente: aquellas que hacen cambiar la variable de inters, es
decir, la dependiente.
2. Dependiente: aquella que es afectada por la variable independiente.
3. De control: aquellas que regulan la relacin entre la variable dependiente
e independiente.
b) Segn escala de medicin: Slo se aplica a las variables cuantitativas.
2 La clase pasada fue terminar de ver el planteamiento de las hiptesis y los modelos explicativos.
7

1. Continuas: las escalas se miden en decimales. Por ejemplo, Nmero de


horas vistas de TV.
2. Discretas: slo se mide en nmeros enteros. Por ejemplo, nmero de
hijos; no se tiene 1,2 hijos.
c) Segn nivel de medicin:
1. Nominales: son variables cualitativas; permiten caracterizar, pero sin
ordenar. Un ejemplo puede ser La Religin.
2. Ordinales: se pueden ordenar, aunque no numricamente, sino que
cualitativamente; no slo permite clasificar. Por ejemplo, las Escalas de
Likert la cual se puede aplicar a los atributos Bueno, Malo, Regular.
3. De intervalo: no existe el cero como cero. Por ejemplo, la temperatura:
cuando se dice que hubo 0C no implica ausencia de temperatura.
4. De Razn: el cero s implica la ausencia del atributo. Por ejemplo, el
Nmero de hijos.
5. Escalar: la unin entre las variables de intervalo y las de razn.
d) Segn tipo de variable:
1. Cualitativas (no-mtricas): las categoras de respuestas no son
numricas, son cualitativas, cualidades. Por ejemplo, Estado civil.
2. Cuantitativas (mtricas): las categoras de respuesta son numricas. Por
ejemplo, Nmero de hijos.

Por ejemplo:
Variable y atributos
Nivel de medicin
Edad.
Cuantitativa, de intervalo y continua.
Con qu tendencia poltica usted se Cualitativa y ordinal.
identifica? a. Extrema derecha b. Derecha
c.

Centro

d.

Izquierda

e.

Extrema

izquierda.
En una escala de 1 a 10, donde 1 representa Cualitativa y ordinal.
ms de izquierda, y 10 representa ms de
derecha, en qu posicin se encuentra
usted?
1 2 3 4 5 6 7 8 9 10

Izquierda
Derecha
Cantidad de hijos nacidos vivos.
Puntaje PSU.
Nivel educativo:

De razn.
De intervalo.
Ordinal.

1. Sin estudios
2. Ed. Bsica incompleta
3. Ed. Bsica completa
4. Ed. Media incompleta
5. Ed. Media completa
6. Ed. IP o CFT incompleta
7. Ed. IP o CFT completa
8. Ed. Universitaria incompleta
9. Ed. Universitaria completa
10. Post-grado incompleto
11. Post-grado completo
Aos de escolaridad aprobados.
Asisti a cursos de capacitacin.

De razn.
Nominal.

a. S

b. No

28 de Marzo3.

Indicadores compuestos.
Cmo se pueden sintetizar distintos indicadores en uno solo? El indicador compuesto es
un indicador formado a partir de la combinacin, suma, multiplicacin, etc. de otros
indicadores en mi base de datos, en la encuesta. En l se puede resumir la informacin de
varios indicadores en uno solo, en una sola variable. Este tipo de indicador permite dar
cuenta de conceptos de mejor forma en la medida que puede comunicar un concepto de
caractersticas ms abstractas; permiten resumir informacin de mejor forma.
Hay dos tipos de indicadores compuestos:
a) Sumativo: simplifican dos o ms variables a travs de una operacin
matemtica. Le atribuyen el mismo peso a todos los indicadores simples; no

3 Falta clase anterior.


9

diferencia entre los distintos elementos considerados en el indicador. Es un


indicador ms simple en trminos de construccin en la medida que se basa en
una operacin matemtica.
b) Combinado: no implican una operacin matemtica de ningn tipo; se basa en la
interseccin de dos o ms indicadores, que deben representar dos o ms
dimensiones de un concepto. As, lo que hacen es resumir informacin
proveniente de dos o ms dimensiones.

6 de Abril4.

Proporciones, porcentajes y tasas.


Se pueden diferenciar entre dos tipos de anlisis.
I.

Anlisis descriptivo5: busca el anlisis de la puntuacin de una muestra.


Puede ser viendo las variables por s solas, o por variables combinadas; cada
una se conoce como univariada y bivariada, respectivamente. En el caso de
un anlisis univariado se tienden a ocupar tablas de frecuencias, histogramas,
etc. en cambio, en el caso de un anlisis bivariado se utilizan tablas de

II.

contingencia.
Estadstica inferencial: lo que se busca establecer es a tratar de establecer a
partir de los datos de una muestra un parmetro poblacional; busca
generalizar. Tambin se divide en dos: univariada y multivariado.

La gran diferencia es que las conclusiones del anlisis se refieren a la muestra, en el caso
del anlisis descriptivo; en el caso de la estadstica inferencial se hacen generalizaciones a
la poblacin.
La frecuencia corresponde a cul fue el nmero de veces que es observada una variable en
la muestra; es el nmero de casos asociados a los atributos de una variable. Por lo general
son expresados en porcentajes o en trminos de proporciones, ello para poder hacer ms
4 Faltan las clases correspondientes al 23, 28 de Marzo y 3 de Abril.
5 A esto corresponde el curso de Datos I.
10

comunicables los datos obtenidos. La proporcin establece la relacin entre un cierto


nmero de casos contra el total de casos; ahora bien, ella tampoco es muy cercana, de ah
que se estandarice en trminos de porcentajes. La mayora de las investigaciones trabajan
con porcentajes.
Dicho lo anterior, se ver qu es una tabla de frecuencia. Ella se compone de cuatro
columnas:
I.

Frecuencia absoluta: son nmero brutos de casos que respondieron


determinada alternativa. Y la suma de ellos dice cuntas personas
respondieron algunas de esas alternativas. En algunas tablas de frecuencia
existen los casos perdidos, es decir, aquellos que no respondieron a la
pregunta debido a algn filtro; en el ejemplo de la gua, los menores de 15

II.

aos. Y el total que incluye a estos casos perdidos es el total de la muestra.


Porcentaje: refiere a la operacin estadstica correspondiente a la
transformacin de los nmeros brutos de cada variable en porcentajes. Es la
frecuencia relativa en la relacin con el total de casos, incluyendo los

III.

valores perdidos.
Porcentaje vlido: ya que en la columna de porcentajes se incluyen los casos
perdidos, se tiende a trabajar con esta columna, ya que slo considera los
casos que efectivamente respondieron a la pregunta, es decir, es un

IV.

porcentaje que se calcula en funcin del total de casos vlidos.


Porcentaje acumulado: es la suma consecutiva de cada uno de los atributos
en funcin del porcentaje vlido.

Las tablas de frecuencia se usan para casos en los cuales hay pocas categoras, pocas
opciones en las variables; por ejemplo, en el caso de una pregunta por edad no se puede
usar una tabla de frecuencia, ah se utiliza un grfico de histograma. Este grafico se
compone por dos ejes:
I.
II.

Eje X
Eje Y

Es una forma simple de ver cmo se comporta una variable; de manera grfica se muestran
barras que muestran la cantidad de veces que se repite un valor. A su vez permite ver de
mejor manera si existe algn sesgo en los resultados de la muestra.
11

11 de Abril.

Creacin de Tablas de Contingencia I.


Existen dos tipos de estadsticas: las descriptivas y las inferenciales. La primera se puede
dividir en dos tipos de anlisis: univariado y bivariado. En este ltimo conjunto se ubican
las tablas de contingencia.
(De ahora en adelante, cada vez que se analicen variables ser importante saber qu
variable se est analizando. El tipo de tcnica va a variar dependiendo de si se trata de
tcnicas cualitativas o cuantitativas. Si se quiere probar cmo se relacionan dos variables
cuantitativas, por ejemplo: aos de escolaridad e ingresos, la tcnica de anlisis a utilizar es
una correlacin o un anlisis de dispersin. Luego, se puede estar interesado en analizar una
variable cuantitativa con otra cualitativa, por ejemplo: la relacin existente entre sexo e
ingreso, se va a trabajar con lo que se conoce con estadsticos descriptivos y grficos boxplot. Finalmente, cuando se tienen dos variables cualitativas, por ejemplo: la relacin entre
sexo y grado de acuerdo con alguna frase, se utilizan las tablas de contingencia y los
grficos de barra.)
Las tablas de contingencia van a ser utilizada cada vez que se quiere estudiar dos
variables cualitativas.
Una primera finalidad de las tablas de contingencia es la descripcin, busca
describir los datos segn grupos de variables; una segunda finalidad es su rol explicativo, es
decir, busca comprobar una hiptesis. La diferencia entre una y la otra es que en la primera
no se plantea una hiptesis; slo se busca describir cmo funciona en ciertos grupos una
variable, no hay una causalidad.
En la construccin de las tablas es importante tener claro la diferencia entre las filas
y las columnas, en funcin de dnde se ubique la variable de inters.

12

Variable sociodemogrfica.

Variable

de % de columna

inters.

Variable

de

inters

Variable socio- % de fila


demogrfica
En

el primer caso, el 100% se ubica en la

base de la

tabla. En el segundo caso el 100% se

ubica al extremo derecho de la tabla.


Si se construye una tabla con porcentaje de columna, se comparan las filas; si se
construye una tabla con porcentaje de filas, se comparan las columnas.
Cuando el objetivo es explicativo, es importante definir cul es la variable
dependiente y cual la independiente. En trminos estrictos, lo que va a pasar es que, si la
variable independiente se ubica en las columnas, se calcula el porcentaje de columnas;
ahora, si se ubica en las filas, se calcula el porcentaje de filas.
Al minuto de hacer un anlisis de datos, hay que tener presente que existen distintos
tipos de relaciones entre variables:
I.

Simtricas: al hacer un anlisis de datos se observa que dos variables se


mueven conjuntamente, pero que de sentido lgico no estn asociadas, es
decir, existe una relacin espuria: existe una tercera variable que no se logra

II.

observar, pero que explica la variacin de las otras dos.


Recprocas: ambas variables se influencian mutuamente, es una relacin

III.

bidireccional.
Asimtricas: slo una de las variables influencia causalmente a la otra, es
una causalidad unidireccional. Ello se puede dar por una anterioridad
temporal, anterioridad estructural, etc.

13

13 de Abril.

Creacin de Tablas de Contingencia II.


Cmo leer una Tabla de Contingencia? Supongamos un ejemplo entre sexo y compromiso
religioso, leyendo el porcentaje de columna:

Alto
Medio
Bajo
Total

Hombre

Mujer

Total

70
100

30
100

50
100

Lo primero es leer el marginal, es decir, los totales, en especial aquellos que sean ms
importantes de mencionar. Lo importante es que se den conclusiones sustantivas, la
hiptesis va a permitir saber qu es lo que se quiere observar. Una vez que se han
observado los totales se ve la relacin entre las variables. Uno se ubica en las variables
dependientes y se concentra en una de las categoras. En el ejemplo, se ver que hay una
relacin entre el sexo y el compromiso religioso: hay comportamientos distintos entre
hombres y mujeres para el caso del compromiso religioso.
Para el caso del porcentaje de las filas, pensando en el mismo ejemplo
Alto
Hombre
Mujer
Total

Medio

Bajo
70
30
50

Total
100
100
100

Se lee el total, y luego se elige una categora de la variable dependiente.


Ahora, el tamao de significacin va a depender del tamao de la muestra. Entre
mayor sea el tamao de la muestra, el tamao de significacin tiene que ser menor. Si se
trabaja con muchos nmeros, un porcentaje del 2 o 3% puede ser significativo.

14

15

Anda mungkin juga menyukai