CUANTITATIVAS
pueden tomar cualquier valor dentro de unos límites, por lo
que, entre dos valores cualesquiera, por próximos que sean,
siempre pueden encontrarse valores intermedios.
CONTINUAS
Por su
Posición en Es la variable que es afectada por la presencia o acción de la variable
una Variable independiente.
Hipótesis Se llama también de efecto o acción condicionada
Dependiente Utilizada para describir o medir el problema estudiado .
o Relación de
Dependencia
La creatividad
La ignorancia
Esta variable es cualitativa ya que la creatividad Cuando se califica un examen con los términos
no puede ser medida numéricamente. De igual aprobado, sobresaliente, aceptable o deficiente,
forma, es un factor que varía de persona a se trata de una variable cualitativa ordinal, ya
persona dependiendo del momento específico en que no se le está asignando un valor numérico al
el que tenga lugar. resultado, pero sí se le está dando un lugar
dentro de una escala de valor (Mendenhall,
La calificación de un examen Beaver, & Beaver, 2009).
EVALUACION
La muestra En estadística, una muestra es un subconjunto de casos o individuos de una población. En diversas
aplicaciones interesa que una muestra sea una muestra representativa y para ello debe escogerse una técnica de
muestra adecuada que produzca una muestra aleatoria adecuada (se obtiene una muestra sesgada cuyo interés y
utilidad es más limitado dependiendo del grado de sesgo que presente).
I. Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equi probabilidad. Es decir,
aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, con siguientemente,
todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos
aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestr eo probabilísticos
encontramos los siguientes tipos:
2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados co n
una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es
muy grande.
2.- Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en
lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al aza r, y los
elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n -1)k, es decir se toman los individuos de k en k,
siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto
de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población
ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemo s introducir una homogeneidad que no se da en
la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son va rones y
las 5 últimas mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres,
no podría haber una representación de los dos sexos.
3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen
reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estr atos) que
poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el mun icipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estr atos de interés
estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo apl icarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasion es las
dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la poblac ión. (Tamaño geográfico, sexos,
edades...). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos :
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la
desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.
4.- Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los
elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la
unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones
se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas ge ográficas
suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de
conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertene cientes a
los conglomerados elegidos.
II. Métodos de muestreo no probabilísticos A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude
a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estima ciones inferenciales sobre la
población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la poblaci ón tienen la misma
probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que
la muestra sea representativa.
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de
muestreo no probabilístico, por ejemplo, los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población. Entre
los métodos de muestreo no probabilísticos más utilizados en investigación encontramos:
También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos d e la
población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con
el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condici ones, por
ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que
se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión e n la muestra
de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han
marcado tendencias de voto.
También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frec uente de
este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha
frecuencia a sus propios alumnos).
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se
emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de
enfermos, etc.
4.- Muestreo Discrecional · A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.
En ciertas ocasiones resultará conveniente estratificar la Tiende a asegurar que la muestra represente
muestra según ciertas variables de interés. Para ello adecuadamente a la población en función de unas
Estratificado
La necesidad de listados de las unidades de una etapa se El cálculo del error estándar es complejo.
No es preciso tener un listado de toda la población, sólo
limita a aquellas unidades de muestreo seleccionadas en la
de las unidades primarias de muestreo.
etapa anterior.
ORDENAR DATOS:
En una escuela se aplica un examen a un grupo de 40 personas y se obtuvieron los siguientes resultados (puntaje):
Primero es necesario ordenar los datos (en forma creciente o decreciente); en este caso se hace en forma decreciente
Primer paso: Se localizan los números más altos y más pequeños: son el 2 y el 30.
Segundo paso: Se hace una lista completa de números desde el 2 hasta el 30:
Tercer paso: Se cuenta cuántos datos nominales 20 aparecen y por cada uno que aparezca se pone una “rayita” ( / ). Se hace lo mismo
para cada valor:
2 7 8 9 10 12 13 14 15 16
׀ ׀ ׀ ׀ ׀׀׀׀ ׀ ׀׀ ׀׀ ׀׀׀ ׀׀
17 18 19 20 21 22 23 26 27 28
׀׀ ׀׀ ׀׀ ׀ ׀׀ ׀ ׀׀ ׀׀ ׀׀׀ ׀
29 30
׀ ׀׀׀
Tabla de Frecuencia
a) Se divide el rango en la cantidad de intervalos que se desea tener, (por lo general se determinan 5 intervalos de lo
contrario es ideal que sea un número impar por ejemplo 5, 7, 9) obteniéndose así la amplitud o tamaño de cada
intervalo.
Comenzando por el mínimo valor de la variable, que será el extremo inferior del primer intervalo, se suma a este
valor la amplitud para obtener el extremo superior y así sucesivamente.
𝑅𝑎𝑛𝑔𝑜
𝐴=
𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
Se entiende por rango (R) la diferencia que existe entre el valor mayor (VM) y el pequeño (VP) de un conjunto de
datos.
POSIBLE RESPUESTAS
Sexo NOMINAL
RESPUESTAS:
Cuando el investigador necesita información de una variable específica entre diferentes unidades de observación, debe planear la mejor forma de recolección,
clasificarla y establecer cuáles pruebas estadísticas podría utilizar en su análisis.
Una misma variable puede clasificarse de distintas maneras, de acuerdo con sus características, dentro de una determinada investigación. La figura 1 muestra un
diagrama que resume estas clasificaciones y sus relaciones. 8, 9
Estas son:
Variable cualitativa. Es aquella que expresa una característica que no es posible medir ni cuantificar; sólo se puede calificar. Es decir, los posibles valores que
tome la variable (también llamados categorías) no son medibles dado que no implican magnitud (no se expresan en unidades de m edida como metros, años o
decibeles) ni es cuantificable (no podemos decir cuántas veces pasa algo).
En ocasiones, una variable puede tener sólo dos categorías, por lo que se llaman también dicotómicas. Un ejemplo de pregunta que representa la variable que se
va a indagar y sus posibles respuestas son: ¿tuvo fiebre antes de llegar al hospital?: sí o no; ¿cómo está la presión arterial sistólica d e este paciente?: baja,
normal o alta.
Debe tenerse en cuenta que, usualmente, a la hora de almacenar los datos para su posterior análisis, a cada opción de respuesta se le puede asignar un código
numérico. Así, en las variables cualitativas, este número es un resumen de lo que significa cada posible respuesta (o categor ía) de la variable, pero no es una
cantidad. Por ejemplo, al codificar la variable sexo se puede asigna el valor 1 (uno) al encuestado “masculino” y 2 (dos) o 0 (cero) al “femenino”; no por esto la
variable sexo deja de ser cualitativa, ni mucho menos la categoría “1” será más que la “0” o se podrán hacer operaciones c on ellas. Sería muy ingenuo sacar el
promedio de los ceros y unos que codifican la variable sexo de una investigación. Dependiendo del programa que va a ser utili zado para el análisis, generalmente
se prefiere codificar como cero (0) o dos (2) a la ausencia de enfermedad o de exposición a algún factor específico; en cambio, el uno (1) usualmente indica
presencia de enfermedad o antecedente de exposición al factor de riesgo (por ejemplo: no fumador: 0; fumador: 1). En cualquie r situación, si usa una codificación
propia, debe tener claro lo que significa cada código para cada variable.
Una variable que usualmente genera confusión es la que indica el estado clínico de una enfermedad, la cual se clasifica como 0, 1, 2, 3 (o en sus números
romanos correspondientes); aunque es una numeración que implica un gradiente, es arbitraria y representa diferentes niveles de avance no cuantificab les de la
enfermedad en el individuo; una ampliación sobre estos se puede ver en el apartado sobre variables ordinales.
Variable cuantitativa. Es aquella cuyos datos provienen de una característica que permite ser cuantificada o medida (siempre que se mide algo se e xpresa en
unidades de medida); usualmente está definida por un valor numérico según los valores reales de la variable. Po r ejemplo, la edad es cuantitativa cuando se
aclara que el paciente tiene cinco, siete o cien años; o el número de matrimonios que una persona ha tenido en su vida, los c uales son 0, 1, 2 o los que haya
decidido tener.
Variable discreta. Es una variable cuantitativa que sólo permite valores enteros, sin que exista la posibilidad de intermedios entre dos enteros. Por ejemplo, la
variable número de hijos permite decir cero, uno, dos, tres u otro valor, pero siempre es un entero. Es posible llegar a cons iderar a las variables discretas también
como variables cualitativas porque en determinado momento se tiene o no la característica. Por ejemplo: el color de ojos pued e ser azul, verde o café, sin dar la
posibilidad de valores intermedios.
Variable continua. Es una variable cuantitativa que puede tomar cualquier valor, sea entero o fraccionario, entre los valores límites mínimo y máxim o. Por
ejemplo: el peso: 64,3 kilogramos; la estatura: 173.5 centímetros; la temperatura del paciente: 37.5 grados centígrados; el valor del colesterol HDL: 45.5 mg/dL.
Un detalle que permite identificar a las variables continuas es que el valor entre cada unidad es el mismo (hay el mismo kiló metro de diferencia entre medir 45 y
46 km que entre 73.4 y 74.4 km).
Una recomendación importante es que, durante la recolección de datos de las variables, particularmente las continuas o las discretas, el dato se cap ture tal cual
como se genera, crudo, sin agruparlo. Si es necesario formar categorías o grupos, lo mejor es hacerlo durante la fase de análisis. Por ejemplo, en un trabajo se
decidió evaluar en mujeres con resultado indeterminado de la mamografía, si había diferencias en el resultado de la biopsia ( maligna o benigna) según la edad. La
recolección de la información fue realizada a partir de los datos obtenidos por la historia clínica. En estas circunstancias, es mejor recolectar la información sobre
la edad a partir de la historia clínica o del interrogatorio directo a la paciente, tal cual como se halla. Más adelante, dur ante el análisis de los datos, se decidirá qué
es mejor, si utilizar la información de la edad en forma continua o en categorías (por ejemplo, ubicarla en el grupo de 35 añ os o menos). Es posible que resulte
que no hay diferencias importantes en las mujeres al agrupar a priori la edad, pero, al recolectarse en forma cuantitativa pueden explorarse otras formas de
agrupar a las pacientes por edad (por ejemplo, menor o igual a 30 años y más de 30 años) o, simplemente, analizar la edad en forma continua, algo que no se
podría hacer si al momento de recolectar la edad fue incluida en agrupaciones ya definidas. No hacerlo así, es desperdiciar una op ortunidad de análisis con un
potencial de mayor valor y utilidad.
Variable nominal. Es una variable cualitativa en la que sus opciones de respuesta no tienen un orden de importancia definido ni representan un gradiente; es
decir, ninguna posible respuesta es más relevante, buena o mala que otra, aún si se expresan en números. Tal es el caso de la diabetes tipo 1 y diabetes tipo 2,
en las que el número no representa ni una cantidad ni algún tipo de gradiente y pueden presentarse en cualquier orden ya que nin guno denota mayor importancia;
son tan solo caracteres alfanuméricos de igual significado que cualquier otro. Ahora bien, a veces c uando se montan las bases de datos, estas categorías se
recodifican con números, que igualmente solo diferencian una característica de otra pero sin que representen una cantidad o u n orden; por ejemplo: el sexo puede
definirse como hombre (1) y mujer (0), o mujer (1) y hombre (0).
Variable ordinal. En estas variables existe un orden implícito en los datos, a manera de gradiente, aunque este orden no significa que las di stancias entre las
diferentes categorías de la variable sean iguales. Un ejemplo es la clasificación de los estadios clínicos de los tumores, que pueden ser clasificados como estadio
0 (in situ), estadio I (invasor temprano), estadio II (invasor intermedio), estadio III (invasor avanzado) y IV (metástasis a distancia). Esta variable indica severidad
clínica del tumor pero no significa que el estadio IV sea el doble de avanzado que el estadio II, ni que la distancia (o aume nto en severidad) que existe entre
estadio II y III sea la misma que entre estadio III y IV. Otro ejemplo de una variable ordinal es la respuesta del paciente ante una terapia analgésica, esto es,
mejoría total, mejoría parcial, sigue igual o empeora.
Variable interválica. Son datos recolectados en forma cuantitativa pero donde el valor de inflexión entre positivos y negativos (el llamado cero) de la escala es
arbitrario. El mejor ejemplo es la temperatura medida en grados centígrados, donde 0º (cero grados centígrados) no implica au sencia de temperatura.
Variable de razón o proporcional. En éstas, los datos fueron recolectados en forma continua pero el cero de la escala es real; no hay valores posibles bajo ese
punto. Por ejemplo: cero (0) gramos indica la ausencia de peso o al medir temperatura en grados Kelvin, el cero es absoluto.
Variable dependiente. Es la variable principal que se está estudiando y de la que se quiere saber algunas características tales como causas, factores
pronósticos, frecuencia, etc. Usualmente es aquella que está inmersa en el objetivo general o en el título de una investigaci ón. También puede ser llamada
variable de resultado, de salida, desenlace o, simplemente, enfermedad (u otro evento) en estudio.
Variable independiente. Es aquella que puede explicar el porqué del comportamiento de una variable dependiente. También puede llamarse exposición, variable
de explicación, factores de riesgo o factores protectores. Esto se puede ilustrar con un ejemplo. Imaginemos un estudio cuyo objetivo es determinar las causas de
hipertensión arterial en la población de estrato 2 de Bogotá, Colombia. Lo que se quiere sa ber (la variable dependiente) es frecuencia de ausencia de hipertensión
(HTA), así como entender cuáles factores pueden explicar su ocurrencia, como pueden ser tabaquismo, consumo de bebidas alcohó licas, estrés, dieta de esa
población, entre otras (las variables que explican el comportamiento de la dependiente, o sea, las variables independientes). De otra manera:
Obsérvese que la HTA pasó de ser la variable dependiente en el primer estudio a ser variable independiente o de explicación en el segundo. Puede observar
también que a pesar de que las variables dependientes (HTA e IAM) son diferentes, algunas variables independientes son iguale s; es decir, una variable
independiente puede explicar la aparición de más de una enfermedad. Esto es común en la investigación clínica y epidemiológica.
Variable de confusión . Para entender mejor lo que es una variable de confusión, imaginemos un estudio cualquiera en la que se evalúa la posible relación entre
un evento (I) de interés (como una enfermedad o el uso de un servicio de salud) y una exposición (V) que se cree que es un po sible factor de riesgo (o protector).
Es posible que exista una segunda exposición (C) que se conoce que está asociada tanto con I como con V. Por lo tanto, encontrar una asociación entre V e I
puede ser malinterpretada si no se tiene en cuenta la presencia de C, la cual confunde la verdadera relación que existe entre V e I. Por eso a C se le llama
variable de confusión. Un criterio adicional que es importante para definir si una variable es o no un factor de confusión es que no puede encontrarse en la vía
causal entre I y V, es decir, no puede ser una lesión precedente a la enfermedad (I).
Por ejemplo, en un estudio se encontró que a mayor número de hijos, mayor era el riesgo de hipertensión arterial en las mujeres. Los investigado res no se
explicaban esta aparente relación, la cual no había sido informada previamente en la literatura; sin embargo, fue desment ida cuando analizaron el papel que juega
la edad tanto en la probabilidad que una mujer tenga hijos como que sea hipertensa.
Se sabe que a mayor edad hay mayor probabilidad de tener esta patología; también es cierto que la probabilidad de tener hijos aumenta a mayor edad. Cuando
los investigadores analizaron la asociación entre el número de hijos y la presencia de hipertensión arterial pero ajustando p or la edad, se observó que el aparente
mayor riesgo dado por el número de hijos desaparecía. La edad cumple entonces el papel de factor de confusión.
El ajuste o tratamiento de la confusión durante el análisis de los datos se puede lograr por medio de dos métodos llamados es tratificación y regresión; igualmente,
es posible preverla al planear una investigación y usar otras tres estrategias metodológicas, el apareamiento (o emparejamiento), la aleatorización y la restricción
de la población 10. Una explicación más detallada está por fuera del objetivo de este artículo.
Abel y Caín se encontraron después de la muerte de Abel. Caminaban por el desierto y se reconocieron desde lejos, porque los dos eran
muy altos. Los hermanos se sentaron en la tierra, hicieron un fuego y comieron. Guardaban silencio, a la manera de la gente c ansada
cuando declina el día. En el cielo asomaba alguna estrella, que aún no había recibido su nombre. A la luz de las llamas, Caín advirtió en
la frente de Abel la marca de la piedra y dejó caer el pan que estaba por llevarse a la boca y pidió que le fuera perdonado s u crimen.
Abel contestó:
—¿Tú me has matado o yo te he matado? Ya no recuerdo; aquí estamos juntos como antes.
—Ahora sé que en verdad me has perdonado —dijo Caín—, porque olvidar es perdonar. Yo trataré también de olvidar.
Abel dijo despacio:
—Así es. Mientras dura el remordimiento dura la culpa.