Clases de Estadistica Complementada

ESTADISTICA
ES EL CONJUNTO DE HERRAMIENTAS PARA RECOLECTAR,

ORGANIZAR, PRESENTAR, ANALIZAR E INTERPPRETAR
DATOS, CON EL FIN DE OBTENER CONCLUSIONES Y TOMAR
DECISIONES SOBRE DETERMINADOS HECHOS O
FENOMENOS DE ESTUDIO
ESTADISTICA ESTADISTICA ESTADISTICA

DESCRIPTIVA O MATEMATICA INFERENCIAL O
DEDUCTIVA INDUCTIVA
TRATA DE DESCRIBIR O CONSISTE EN LA OBTENCION TRABAJA CON LAS

ANALIZAR ALGUNOS
DE LA INFORMACIO A MUESTRAS Y PRETENDE
CARACTERES DE LOS
PARTIR DE LOS DATOS Y APARTIR DE ELLA INFERIR
INDIVIDUOS O DE UN
GRUPO, SIN EXTRAER LA UTILIZA LAS TECNICAS (EXTRAER JUICIO O
CONCLUSION MATEMATICAS, ANALISIS CONCLUSIONES APARTIR
MATETEMATICAS , ALGEBR DE LOS HECHOS O
LINEAL , ECUACIONES PROORCIONES SEA
DIFERENCIALES, ETC GENERALES O
PARTICULARES
DISCRETAS Toman valores numéricos aislados, por lo que, fijados dos
consecutivos, no pueden tomar ningún valor intermedio.
CUANTITATIVAS
pueden tomar cualquier valor dentro de unos límites, por lo
que, entre dos valores cualesquiera, por próximos que sean,
siempre pueden encontrarse valores intermedios.
CONTINUAS
NOMINALES Son aquellas que establecen la distinción de los elementos en

VARIABLES
las categorías sin implicar orden entre ellas.
Son aquellas que agrupan a los objetos, individuos, en

ORDINALES
categorías ordenadas, para establecer relaciones comparativas.
CUALITATIVAS
Son aquellas que pueden asumir dos valores. (macho o

Dicotómicas hembra)
Son aquellas que pueden asumir más de dos valores. (la

Politómicas especialidad de los profesores matemáticas, física, biología
etc.)
Explica, condiciona, o determina el cambio en los valores de la variable dependiente.
Variable Actúa como factor condicionante de la variable dependiente.

Se le llama también causal o experimental porque es manipulada por el investigador.
Independiente Se utilizan para describir o medir los factores que se supone son la causa o influyen
en el problema.
Por su
Posición en Es la variable que es afectada por la presencia o acción de la variable
una Variable independiente.
Hipótesis Se llama también de efecto o acción condicionada
Dependiente Utilizada para describir o medir el problema estudiado .
o Relación de
Dependencia
Es aquella que se interpone entre la variable independiente y la variable

Variable dependiente.
No es objeto de estudio pero que la presentarse y no ser controlada puede
Interviniente distorsionar los resultados de la investigación.
Puede intensificar o debilitar la relación aparente entre el problema y una
posible causa.
EJEMPLO
¿Cuál es la relación entre tiempo de espera para la atención
y percepción de calidad de atención en el área de consultorios
externos del H.N.D.A. Carrión entre Junio y Julio de 2006?
V. Independiente: Tiempo de espera para la atención

V. Dependiente: Percepción de la calidad de atención
V. Interviniente: Orden de turno
EJEMPLOS DE VARIABLES CUALITATIVA ORDINAL
1. Nivel de pobreza (no pobre, pobre, muy pobre, extremadamente pobre)

2. Categoría de un docente universitario (principal, asociado, auxiliar)
3. escolaridad
4. grado de satisfacción
5. intensidad de dolor
6. grado de enfermedad
7. ocupación
8. numero de alumno sentados en un salón (primera fila, según edad fila ,...última fila )
9. preferencia
10. grado de actitud
El hambre no puede ser medido numéricamente,

El miedo
por tanto, es considerado como una variable
Ésta es una variable cualitativa nominal, ya que cualitativa ordinal. Esta variable únicamente
no puede ser medida numéricamente. El miedo puede ser percibida por la persona que la siente
es una variable que cambia de acuerdo a la y se puede clasificar en mucha, poca o nada,
persona que la siente y fluctúa dependiendo de según la situación o tiempo específico.
la situación en la que se sienta al reaccionar a un
suceso o evento determinado. La belleza
Esta variable es un concepto que únicamente

El hambre
puede ser medido por el individuo que la
interpreta. La belleza es una cualidad que carece Esta variable no puede ser medida de forma
de valor numérico y no puede ser clasificada numérica y se expresa en actitudes y momentos
dentro de un escalafón. Por tanto, es una variable puntuales.
cualitativa nominal.
La utilidad
Estado civil
La variable que determina qué tan útil es un
El estado civil de una persona es una variable objeto es netamente cualitativa. De esta manera,
cualitativa nominal a la que no puede serle
la utilidad es percibida por cada individuo de
asignada un valor numérico. Es un concepto que acuerdo a una situación específica.
no tiene un orden específico establecido.
El tipo de medalla
La felicidad
Ésta es una variable cualitativa ordinal, ya que
Esta variable no puede ser medida de forma
existe una clasificación por categorías que asigna
numérica pues depende del valor que cada
un lugar dentro de una competencia. De esta
persona le asigne. La felicidad es una propiedad
manera las medallas de oro, plata y bronce
que cada individuo siente de manera subjetiva y
denotan el lugar ocupado en una competencia sin
no existe ninguna herramienta para medir el
la necesidad de asignar un valor numérico a los
grado de felicidad que puede llegar a sentir una
resultados.
persona.
La creatividad
La ignorancia
Esta variable es cualitativa ya que la creatividad Cuando se califica un examen con los términos
no puede ser medida numéricamente. De igual aprobado, sobresaliente, aceptable o deficiente,
forma, es un factor que varía de persona a se trata de una variable cualitativa ordinal, ya
persona dependiendo del momento específico en que no se le está asignando un valor numérico al
el que tenga lugar. resultado, pero sí se le está dando un lugar
dentro de una escala de valor (Mendenhall,
La calificación de un examen Beaver, & Beaver, 2009).
EJEMPLO VARIABLE CUALITATIVA NOMINAL

1. Lugar de nacimiento (Lima, Chiclayo, Perú) ·
2. Estado Civil o conyugal (soltero, casado, viudo, divorciado, separado, conviviente) ·
3. Idioma de los habitantes de la tierra (castellano, inglés, francés, italiano, chino mandarín, etc.) ·
4. Religión que profesa (católico, evangélico, musulmán, etc.)
5. grupo sanguíneo.
6. genero
7. nacionalidad
8. marca de un automóvil
9. raza
10. color.
¿son cualitativas o cuantitativas?

1. Tu plato favorito.
2. La estatura de tu mejor amigo.
3. El ancho de la puerta de tu cuarto.
4. El orden de mérito que sacarás este año en el colegio o universidad.
5. El color de tus zapatos.
6. El peso de una lata de café.
EVALUACION
1. Censo anual de los peruanos _______________________

2. Temperaturas en grados Celsius registradas cada hora en un observatorio _______________________
3. Tu comida favorita _______________________
4. Cuántos goles ha marcados tu equipo favorito en la última temporada _______________________
5. El color de los ojos de tus compañeros de clase _______________________
6. Coeficiente intelectual de los alumnos de esta clase _______________________
7. Asignatura favorita _______________________
8. Cuántas acciones se han vendido hoy en la Bolsa _______________________
9. Profesiones militares (tropa, suboficiales, oficiales, jefes, generales) _______________________
10. Duración del viaje en coche a ciudades de España _______________________
11. El diámetro de las ruedas de varios coches _______________________
12. La nacionalidad de una persona _______________________
13. Número de litros de agua contenidos en un depósito _______________________
14. La calificación de un examen (suspenso, aprobado, notable, sobresaliente) _______________________
15. Número de libros en un estante de librería _______________________
16. Suma de puntos tenidos en el lanzamiento de un par de dados _______________________
17. La profesión de una persona _______________________
18. Cuántos alumnos se han matriculado en la Escuela U de Ciencias de la Salud este curs o _______________________
19. La superficie de un edificio _______________________
20. Puesto conseguido en una prueba deportiva (1º, 2º, 3º,) _______________________
21. Número de hijos de 50 familias _______________________
22. Medallas de una prueba deportiva (oro, plata, bronce) _______________________
23. Altura física en centímetros _______________________
24. Estatus laboral (inexperto/semiexperto/experto) _______________________
25. Peso físico en Kilogramos _______________________
26. Sexo _______________________
27. Calidad percibida del cuidado proporcionado (excelente/bueno/suficiente/pobre) _______________________
28. Diagnóstico “sobrecarga del rol del cuidador” _______________________
29. ¿Se puede bañar sólo? _______________________
30. Temperatura corporal _______________________
31. Estado civil _______________________
La muestra En estadística, una muestra es un subconjunto de casos o individuos de una población. En diversas
aplicaciones interesa que una muestra sea una muestra representativa y para ello debe escogerse una técnica de
muestra adecuada que produzca una muestra aleatoria adecuada (se obtiene una muestra sesgada cuyo interés y
utilidad es más limitado dependiendo del grado de sesgo que presente).
Tipo de Muestras Utilizada
Muestreo probabilístico Métodos de muestreo no

probabilísticos
Muestreo aleatorio simple Muestreo por cuotas
Muestreo aleatorio sistemático Muestreo intencional o de

conveniencia
Muestreo aleatorio estratificado Bola de nieve
Muestreo aleatorio por Muestreo Discrecional

conglomerados
I. Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equi probabilidad. Es decir,
aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, con siguientemente,
todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos
aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestr eo probabilísticos
encontramos los siguientes tipos:
1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente:
1) se asigna un número a cada individuo de la población.
2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados co n
una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es
muy grande.
2.- Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en
lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al aza r, y los
elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n -1)k, es decir se toman los individuos de k en k,
siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto
de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población
ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemo s introducir una homogeneidad que no se da en
la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son va rones y
las 5 últimas mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres,
no podría haber una representación de los dos sexos.
3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen
reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estr atos) que
poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el mun icipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estr atos de interés
estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo apl icarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasion es las
dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la poblac ión. (Tamaño geográfico, sexos,
edades...). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos :
Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la
desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.
4.- Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los
elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la
unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones
se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas ge ográficas
suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de
conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertene cientes a
los conglomerados elegidos.
II. Métodos de muestreo no probabilísticos A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude
a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estima ciones inferenciales sobre la
población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la poblaci ón tienen la misma
probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que
la muestra sea representativa.
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de
muestreo no probabilístico, por ejemplo, los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población. Entre
los métodos de muestreo no probabilísticos más utilizados en investigación encontramos:
1.- Muestreo por cuotas:
También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos d e la
población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con
el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condici ones, por
ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que
se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.
2.- Muestreo intencional o de conveniencia:
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión e n la muestra
de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han
marcado tendencias de voto.
También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frec uente de
este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha
frecuencia a sus propios alumnos).
3.- Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se
emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de
enfermos, etc.
4.- Muestreo Discrecional · A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.
Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico
CARACTERISTICAS VENTAJAS INCONVENIENTES

Sencillo y de fácil comprensión.
Aleatorio
Cálculo rápido de medias y varianzas. Requiere que se posea de antemano un listado

simple
Se selecciona una muestra de tamaño n de una población de

completo de toda la población. Cuando se trabaja con
N unidades, cada elemento tiene una probabilidad de
Se basa en la teoría estadística, y por tanto existen muestras pequeñas es posible que no represente a la
inclusión igual y conocida de n/N.
paquetes informáticos para analizar los datos población adecuadamente.
Conseguir un listado de los N elementos de la población

Fácil de aplicar.
Determinar tamaño muestral n.
Sistemático
No siempre es necesario tener un listado de toda la

Si la constante de muestreo está asociada con el
población.
Definir un intervalo k= N/n. fenómeno de interés, las estimaciones obtenidas a
partir de la muestra pueden contener sesgo de
Cuando la población está ordenada siguiendo una
Elegir un número aleatorio, r, entre 1 y k (r= arranque selección
tendencia conocida, asegura una cobertura de
aleatorio).
unidades de todos los tipos.
Seleccionar los elementos de la lista.
En ciertas ocasiones resultará conveniente estratificar la Tiende a asegurar que la muestra represente
muestra según ciertas variables de interés. Para ello adecuadamente a la población en función de unas
Estratificado
debemos conocer la composición estratificada de la variables seleccionadas.

población objetivo a hacer un muestreo. Una vez calculado el Se obtienen estimaciones más precisas Se ha de conocer la distribución en la población de
tamaño muestral apropiado, este se reparte de manera las variables utilizadas para la estratificación.
proporcional entre los distintos estratos definidos en la Su objetivo es conseguir una muestra lo más
población usando una simple regla de tres. semejante posible a la población en lo que a la o las
variables estratificadoras se refiere.
Es muy eficiente cuando la población es muy grande y El error estándar es mayor que en el muestreo
Conglomerad
dispersa. aleatorio simple o estratificado.

Se realizan varias fases de muestreo sucesivas (polietápico)
os
La necesidad de listados de las unidades de una etapa se El cálculo del error estándar es complejo.
No es preciso tener un listado de toda la población, sólo
limita a aquellas unidades de muestreo seleccionadas en la
de las unidades primarias de muestreo.
etapa anterior.
ORDENAR DATOS:
En una escuela se aplica un examen a un grupo de 40 personas y se obtuvieron los siguientes resultados (puntaje):
Primero es necesario ordenar los datos (en forma creciente o decreciente); en este caso se hace en forma decreciente
Primer paso: Se localizan los números más altos y más pequeños: son el 2 y el 30.
Segundo paso: Se hace una lista completa de números desde el 2 hasta el 30:
Tercer paso: Se cuenta cuántos datos nominales 20 aparecen y por cada uno que aparezca se pone una “rayita” ( / ). Se hace lo mismo
para cada valor:
2 7 8 9 10 12 13 14 15 16
‫׀‬ ‫׀‬ ‫׀‬ ‫׀‬ ‫׀׀׀׀‬ ‫׀‬ ‫׀׀‬ ‫׀׀‬ ‫׀׀׀‬ ‫׀׀‬
17 18 19 20 21 22 23 26 27 28
‫׀׀‬ ‫׀׀‬ ‫׀׀‬ ‫׀‬ ‫׀׀‬ ‫׀‬ ‫׀׀‬ ‫׀׀‬ ‫׀׀׀‬ ‫׀‬
29 30
‫׀‬ ‫׀׀׀‬
Tabla de Frecuencia
Xi (Marca de Clase) fi (Frecuencia)

2 1
7 1
8 1
9 1
10 4
12 1
13 2
14 2
15 3
16 2
17 2
18 2
19 2
20 1
21 2
22 1
23 2
26 2
27 3
28 1
29 1
30 3
FORMANDO UNA TABLA CON SUS PROCESOS
Pasos para agrupar datos.
Determinar el rango o recorrido de los datos.
Rango = Valor mayor – Valor menor
Establecer el número de clases (k).
a) Se divide el rango en la cantidad de intervalos que se desea tener, (por lo general se determinan 5 intervalos de lo
contrario es ideal que sea un número impar por ejemplo 5, 7, 9) obteniéndose así la amplitud o tamaño de cada
intervalo.
Comenzando por el mínimo valor de la variable, que será el extremo inferior del primer intervalo, se suma a este
valor la amplitud para obtener el extremo superior y así sucesivamente.
b) Otra forma de calcular la cantidad de intervalos es aplicando los siguientes métodos:
Método Sturges: k = 1 + 3,332 log n

donde:
k= número de clases
n= tamaño muestral
𝑳𝒂 𝒂𝒎𝒑𝒍𝒊𝒕𝒖𝒅 (𝑨) 𝒐 𝒂𝒏𝒄𝒉𝒐 𝒅𝒆 𝒖𝒏 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 𝒆𝒔 𝒍𝒂 𝒅𝒊𝒇𝒆𝒓𝒆𝒏𝒄𝒊𝒂 𝒆𝒏𝒕𝒓𝒆 𝒆𝒍 𝒍𝒊𝒎𝒊𝒕𝒆 𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓 𝒚 𝒆𝒍 𝒍𝒊𝒎𝒊𝒕𝒆 𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓. (𝑹𝒂𝒏𝒈𝒐)𝒆𝒏𝒕𝒓𝒆 𝒆𝒍 𝒏𝒖𝒎𝒆𝒓𝒐 𝒅𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔 (𝑲)
𝑅𝑎𝑛𝑔𝑜
𝐴=
𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
Aplicación con los datos de la tabla:
Rango (R) = Valor mayor – Valor Intervalos (K): Amplitud (A):

menor
k = 1 + 3,332 log n 𝐴=
𝑅𝑎𝑛𝑔𝑜
𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
R = 30 – 2 k = 1 + 3,332 log 40
k = 1 + 3,332 Commented [W1]: (Li + Li+1)/2
R = 28 A = 28/6
(1.6020)
A = 4.6 Commented [W2]: número de veces que aparece repetida
k = 6.338
A≈5 la observación en la recopilación de datos que va dentro del
intervalo
Commented [W3]: frecuencias acumuladas, en cada

dato se
acumula la frecuencia de los datos anteriores.
Frecuencia
Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
Límite inferior Marca de Frecuencia relativa
absoluta absoluta Relativa absoluta Commented [W4]: el resultado de dividir la frecuencia
y superior clase absoluta acumulada
acumulada relativa acumulada porcentual absoluta de un determinado valor entre el número total
porcentual
de datos
Li - Li+1 Xi fi Fi hr Hi hr x 100 % Hr x 100 % Xi. fi
Commented [W5]: Es la frecuencia absoluta entre el total
[ 2–7 > 4.5 1 1 1/40 1/40 (1/40) x100 (1/40) x100 (4.5) (1) de numero de datos.
[ 7 – 12 > 9.5 7 8 7/40 8/40 (7/40) x100 (8/40) x100 (9.5) (7)
Commented [W6]: la suma de frecuencias absolutas
[12 – 17 > 14.5 10 18 10/40 18/40 (10/40) x100 (18/40) x100 (14.5) (10) de todos los valores iguales o inferiores al valor
[ 17 – 22 > 19.5 9 27 9/40 27/40 (9/40) x100 (27/40) x100 (19.5) (9) considerado
[ 22 – 27 > 24.5 5 32 5/40 32/40 (5/40) x100 (32/40) x100 (24.5) (5)
[ 27 – 32 > 29.5 8 40 8/40 40/40 (8/40) x100 (40/40) x100 (29.5) (8)
La organización de datos en tabla de frecuencias (1/2)

Para poder analizar los datos y obtener la información que deseamos a partir de ellos, necesitamos ordenarlos. La forma
común de ordenarlos consiste en construir con ellos la llamada tabla de frecuencia. Esta tabla consiste básicamente en
organizar los datos por grupo, a fin de poder ver:
Procedimiento para elaborar la tabla de frecuencia.
Paso 1: Obtención del rango (R).
Se entiende por rango (R) la diferencia que existe entre el valor mayor (VM) y el pequeño (VP) de un conjunto de
datos.
R = VM – VP Una forma práctica para llevar a cabo este paso es la siguiente:

Los datos se recogen por hileras y por columnas hasta formar un rectángulo.
POSIBLE RESPUESTAS
Altura física en centímetros DE RAZÓN
Estatus laboral (inexperto/semiexperto/experto) ORDINALES

Peso físico en Kilogramos DE RAZÓN
Sexo NOMINAL
Calidad percibida del cuidado proporcionado (excelente/bueno/suficiente/pobre) ORDINAL
Diagnóstico “sobrecarga del rol del cuidador” NOMINAL
¿Se puede bañar sólo? NOMINAL
Temperatura corporal DE INTERVALO
Estado civil NOMINA
RESPUESTAS:
Censo anual de los españoles CUANTITATIVA-DISCRETA

Temperaturas en grados Celsius registradas cada hora en un observatorio CUANTITATIVA- CONTINUAS
Tu comida favorita CUALITATIVA-NOMINAL
Cuántos goles ha marcados tu equipo favorito en la última temporada CUANTITATIVA-DISCRETAS
El color de los ojos de tus compañeros de clase CUALITATIVA- NOMINAL
Coeficiente intelectual de los alumnos de esta clase CUANTITATIVA- CONTINUAS
Asignatura favorita CUALITATIVA-NOMINAL
Cuántas acciones se han vendido hoy en la Bolsa CUANTITATIVA-DISCRETAS
Profesiones militares (tropa, suboficiales, oficiales, jefes, generales) CUALITATIVAS-ORDINALES
Duración del viaje en coche a ciudades de España CUANTITATIVA-CONTINUAS
El diámetro de las ruedas de varios coches CUANTITATIVA-CONTINUAS
La nacionalidad de una persona CUALITATIVA-NOMINAL
Número de litros de agua contenidos en un depósito CUALITATIVA-CONTINUAS
La calificación de un examen (suspenso, aprobado, notable, sobresaliente) CUALITATIVA-ORDINALES
Número de libros en un estante de librería CUANTITATIVA-DISCRETA
Suma de puntos tenidos en el lanzamiento de un par de dados CUANTITATIVA-DISCRETA
La profesión de una persona CUALITATIVA-NOMINAL
Cuántos alumnos se han matriculado en la Escuela U de Ciencias de la Salud este curso CUANTITATIVAS-DISCRETAS
La superficie de un edificio CUANTITATIVA-CONTINUAS
Puesto conseguido en una prueba deportiva (1º, 2º, 3º,…) CULITATIVAS-ORDINALES
Número de hijos de 50 familias CUANTITATIVA-DISCRETAS
Medallas de una prueba deportiva (oro, plata, bronce) CUALITATIVA-ORDINALES
CLASIFICACIÓN DE LAS VARIABLES
Cuando el investigador necesita información de una variable específica entre diferentes unidades de observación, debe planear la mejor forma de recolección,
clasificarla y establecer cuáles pruebas estadísticas podría utilizar en su análisis.
Una misma variable puede clasificarse de distintas maneras, de acuerdo con sus características, dentro de una determinada investigación. La figura 1 muestra un
diagrama que resume estas clasificaciones y sus relaciones. 8, 9
Estas son:
1. Según su naturaleza, en cualitativas o cuantitativas

2. Según los valores (continuidad) que toma, en discretas y continuas
3. Según la escala de medición, en nominal, ordinal, interválica y de razón (o proporcional)
4. Según la función desempeñada, en dependiente, independiente y de confusión.
Variable cualitativa. Es aquella que expresa una característica que no es posible medir ni cuantificar; sólo se puede calificar. Es decir, los posibles valores que
tome la variable (también llamados categorías) no son medibles dado que no implican magnitud (no se expresan en unidades de m edida como metros, años o
decibeles) ni es cuantificable (no podemos decir cuántas veces pasa algo).
En ocasiones, una variable puede tener sólo dos categorías, por lo que se llaman también dicotómicas. Un ejemplo de pregunta que representa la variable que se
va a indagar y sus posibles respuestas son: ¿tuvo fiebre antes de llegar al hospital?: sí o no; ¿cómo está la presión arterial sistólica d e este paciente?: baja,
normal o alta.
Debe tenerse en cuenta que, usualmente, a la hora de almacenar los datos para su posterior análisis, a cada opción de respuesta se le puede asignar un código
numérico. Así, en las variables cualitativas, este número es un resumen de lo que significa cada posible respuesta (o categor ía) de la variable, pero no es una
cantidad. Por ejemplo, al codificar la variable sexo se puede asigna el valor 1 (uno) al encuestado “masculino” y 2 (dos) o 0 (cero) al “femenino”; no por esto la
variable sexo deja de ser cualitativa, ni mucho menos la categoría “1” será más que la “0” o se podrán hacer operaciones c on ellas. Sería muy ingenuo sacar el
promedio de los ceros y unos que codifican la variable sexo de una investigación. Dependiendo del programa que va a ser utili zado para el análisis, generalmente
se prefiere codificar como cero (0) o dos (2) a la ausencia de enfermedad o de exposición a algún factor específico; en cambio, el uno (1) usualmente indica
presencia de enfermedad o antecedente de exposición al factor de riesgo (por ejemplo: no fumador: 0; fumador: 1). En cualquie r situación, si usa una codificación
propia, debe tener claro lo que significa cada código para cada variable.
Una variable que usualmente genera confusión es la que indica el estado clínico de una enfermedad, la cual se clasifica como 0, 1, 2, 3 (o en sus números
romanos correspondientes); aunque es una numeración que implica un gradiente, es arbitraria y representa diferentes niveles de avance no cuantificab les de la
enfermedad en el individuo; una ampliación sobre estos se puede ver en el apartado sobre variables ordinales.
Variable cuantitativa. Es aquella cuyos datos provienen de una característica que permite ser cuantificada o medida (siempre que se mide algo se e xpresa en
unidades de medida); usualmente está definida por un valor numérico según los valores reales de la variable. Po r ejemplo, la edad es cuantitativa cuando se
aclara que el paciente tiene cinco, siete o cien años; o el número de matrimonios que una persona ha tenido en su vida, los c uales son 0, 1, 2 o los que haya
decidido tener.
Variable discreta. Es una variable cuantitativa que sólo permite valores enteros, sin que exista la posibilidad de intermedios entre dos enteros. Por ejemplo, la
variable número de hijos permite decir cero, uno, dos, tres u otro valor, pero siempre es un entero. Es posible llegar a cons iderar a las variables discretas también
como variables cualitativas porque en determinado momento se tiene o no la característica. Por ejemplo: el color de ojos pued e ser azul, verde o café, sin dar la
posibilidad de valores intermedios.
Variable continua. Es una variable cuantitativa que puede tomar cualquier valor, sea entero o fraccionario, entre los valores límites mínimo y máxim o. Por
ejemplo: el peso: 64,3 kilogramos; la estatura: 173.5 centímetros; la temperatura del paciente: 37.5 grados centígrados; el valor del colesterol HDL: 45.5 mg/dL.
Un detalle que permite identificar a las variables continuas es que el valor entre cada unidad es el mismo (hay el mismo kiló metro de diferencia entre medir 45 y
46 km que entre 73.4 y 74.4 km).
Una recomendación importante es que, durante la recolección de datos de las variables, particularmente las continuas o las discretas, el dato se cap ture tal cual
como se genera, crudo, sin agruparlo. Si es necesario formar categorías o grupos, lo mejor es hacerlo durante la fase de análisis. Por ejemplo, en un trabajo se
decidió evaluar en mujeres con resultado indeterminado de la mamografía, si había diferencias en el resultado de la biopsia ( maligna o benigna) según la edad. La
recolección de la información fue realizada a partir de los datos obtenidos por la historia clínica. En estas circunstancias, es mejor recolectar la información sobre
la edad a partir de la historia clínica o del interrogatorio directo a la paciente, tal cual como se halla. Más adelante, dur ante el análisis de los datos, se decidirá qué
es mejor, si utilizar la información de la edad en forma continua o en categorías (por ejemplo, ubicarla en el grupo de 35 añ os o menos). Es posible que resulte
que no hay diferencias importantes en las mujeres al agrupar a priori la edad, pero, al recolectarse en forma cuantitativa pueden explorarse otras formas de
agrupar a las pacientes por edad (por ejemplo, menor o igual a 30 años y más de 30 años) o, simplemente, analizar la edad en forma continua, algo que no se
podría hacer si al momento de recolectar la edad fue incluida en agrupaciones ya definidas. No hacerlo así, es desperdiciar una op ortunidad de análisis con un
potencial de mayor valor y utilidad.
Variable nominal. Es una variable cualitativa en la que sus opciones de respuesta no tienen un orden de importancia definido ni representan un gradiente; es
decir, ninguna posible respuesta es más relevante, buena o mala que otra, aún si se expresan en números. Tal es el caso de la diabetes tipo 1 y diabetes tipo 2,
en las que el número no representa ni una cantidad ni algún tipo de gradiente y pueden presentarse en cualquier orden ya que nin guno denota mayor importancia;
son tan solo caracteres alfanuméricos de igual significado que cualquier otro. Ahora bien, a veces c uando se montan las bases de datos, estas categorías se
recodifican con números, que igualmente solo diferencian una característica de otra pero sin que representen una cantidad o u n orden; por ejemplo: el sexo puede
definirse como hombre (1) y mujer (0), o mujer (1) y hombre (0).
Variable ordinal. En estas variables existe un orden implícito en los datos, a manera de gradiente, aunque este orden no significa que las di stancias entre las
diferentes categorías de la variable sean iguales. Un ejemplo es la clasificación de los estadios clínicos de los tumores, que pueden ser clasificados como estadio
0 (in situ), estadio I (invasor temprano), estadio II (invasor intermedio), estadio III (invasor avanzado) y IV (metástasis a distancia). Esta variable indica severidad
clínica del tumor pero no significa que el estadio IV sea el doble de avanzado que el estadio II, ni que la distancia (o aume nto en severidad) que existe entre
estadio II y III sea la misma que entre estadio III y IV. Otro ejemplo de una variable ordinal es la respuesta del paciente ante una terapia analgésica, esto es,
mejoría total, mejoría parcial, sigue igual o empeora.
Variable interválica. Son datos recolectados en forma cuantitativa pero donde el valor de inflexión entre positivos y negativos (el llamado cero) de la escala es
arbitrario. El mejor ejemplo es la temperatura medida en grados centígrados, donde 0º (cero grados centígrados) no implica au sencia de temperatura.
Variable de razón o proporcional. En éstas, los datos fueron recolectados en forma continua pero el cero de la escala es real; no hay valores posibles bajo ese
punto. Por ejemplo: cero (0) gramos indica la ausencia de peso o al medir temperatura en grados Kelvin, el cero es absoluto.
Variable dependiente. Es la variable principal que se está estudiando y de la que se quiere saber algunas características tales como causas, factores
pronósticos, frecuencia, etc. Usualmente es aquella que está inmersa en el objetivo general o en el título de una investigaci ón. También puede ser llamada
variable de resultado, de salida, desenlace o, simplemente, enfermedad (u otro evento) en estudio.
Variable independiente. Es aquella que puede explicar el porqué del comportamiento de una variable dependiente. También puede llamarse exposición, variable
de explicación, factores de riesgo o factores protectores. Esto se puede ilustrar con un ejemplo. Imaginemos un estudio cuyo objetivo es determinar las causas de
hipertensión arterial en la población de estrato 2 de Bogotá, Colombia. Lo que se quiere sa ber (la variable dependiente) es frecuencia de ausencia de hipertensión
(HTA), así como entender cuáles factores pueden explicar su ocurrencia, como pueden ser tabaquismo, consumo de bebidas alcohó licas, estrés, dieta de esa
población, entre otras (las variables que explican el comportamiento de la dependiente, o sea, las variables independientes). De otra manera:
HTA = tabaquismo + alcohol + edad + respuesta al estrés + obesidad + tipo de dieta + … .

Ahora, imagínese otro estudio que se hace en forma casi simultánea en la misma población y en el que se busca determinar las causas de otra enfermedad
cardiovascular, el infarto agudo del miocardio (IAM); en éste se recolectan como variables independientes a la edad y los antecedentes de hipertensión, diabetes y
tabaquismo. Se podría generar una expresión similar a la anterior:
IAM = edad + HTA + diabetes + tabaquismo + tipo de dieta + alcohol + … .
Obsérvese que la HTA pasó de ser la variable dependiente en el primer estudio a ser variable independiente o de explicación en el segundo. Puede observar
también que a pesar de que las variables dependientes (HTA e IAM) son diferentes, algunas variables independientes son iguale s; es decir, una variable
independiente puede explicar la aparición de más de una enfermedad. Esto es común en la investigación clínica y epidemiológica.
Variable de confusión . Para entender mejor lo que es una variable de confusión, imaginemos un estudio cualquiera en la que se evalúa la posible relación entre
un evento (I) de interés (como una enfermedad o el uso de un servicio de salud) y una exposición (V) que se cree que es un po sible factor de riesgo (o protector).
Es posible que exista una segunda exposición (C) que se conoce que está asociada tanto con I como con V. Por lo tanto, encontrar una asociación entre V e I
puede ser malinterpretada si no se tiene en cuenta la presencia de C, la cual confunde la verdadera relación que existe entre V e I. Por eso a C se le llama
variable de confusión. Un criterio adicional que es importante para definir si una variable es o no un factor de confusión es que no puede encontrarse en la vía
causal entre I y V, es decir, no puede ser una lesión precedente a la enfermedad (I).
Por ejemplo, en un estudio se encontró que a mayor número de hijos, mayor era el riesgo de hipertensión arterial en las mujeres. Los investigado res no se
explicaban esta aparente relación, la cual no había sido informada previamente en la literatura; sin embargo, fue desment ida cuando analizaron el papel que juega
la edad tanto en la probabilidad que una mujer tenga hijos como que sea hipertensa.
Se sabe que a mayor edad hay mayor probabilidad de tener esta patología; también es cierto que la probabilidad de tener hijos aumenta a mayor edad. Cuando
los investigadores analizaron la asociación entre el número de hijos y la presencia de hipertensión arterial pero ajustando p or la edad, se observó que el aparente
mayor riesgo dado por el número de hijos desaparecía. La edad cumple entonces el papel de factor de confusión.
El ajuste o tratamiento de la confusión durante el análisis de los datos se puede lograr por medio de dos métodos llamados es tratificación y regresión; igualmente,
es posible preverla al planear una investigación y usar otras tres estrategias metodológicas, el apareamiento (o emparejamiento), la aleatorización y la restricción
de la población 10. Una explicación más detallada está por fuera del objetivo de este artículo.
Abel y Caín se encontraron después de la muerte de Abel. Caminaban por el desierto y se reconocieron desde lejos, porque los dos eran
muy altos. Los hermanos se sentaron en la tierra, hicieron un fuego y comieron. Guardaban silencio, a la manera de la gente c ansada
cuando declina el día. En el cielo asomaba alguna estrella, que aún no había recibido su nombre. A la luz de las llamas, Caín advirtió en
la frente de Abel la marca de la piedra y dejó caer el pan que estaba por llevarse a la boca y pidió que le fuera perdonado s u crimen.
Abel contestó:
—¿Tú me has matado o yo te he matado? Ya no recuerdo; aquí estamos juntos como antes.
—Ahora sé que en verdad me has perdonado —dijo Caín—, porque olvidar es perdonar. Yo trataré también de olvidar.
Abel dijo despacio:
—Así es. Mientras dura el remordimiento dura la culpa.

Clases de Estadistica Complementada

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Clases de Estadistica Complementada

Diunggah oleh

Hak Cipta:

Format Tersedia

ESTADISTICA

ES EL CONJUNTO DE HERRAMIENTAS PARA RECOLECTAR,

ESTADISTICA ESTADISTICA ESTADISTICA

TRATA DE DESCRIBIR O CONSISTE EN LA OBTENCION TRABAJA CON LAS

NOMINALES Son aquellas que establecen la distinción de los elementos en

Son aquellas que agrupan a los objetos, individuos, en

Son aquellas que pueden asumir dos valores. (macho o

Son aquellas que pueden asumir más de dos valores. (la

Variable Actúa como factor condicionante de la variable dependiente.

Es aquella que se interpone entre la variable independiente y la variable

V. Independiente: Tiempo de espera para la atención

1. Nivel de pobreza (no pobre, pobre, muy pobre, extremadamente pobre)

El hambre no puede ser medido numéricamente,

Esta variable es un concepto que únicamente

EJEMPLO VARIABLE CUALITATIVA NOMINAL

¿son cualitativas o cuantitativas?

1. Censo anual de los peruanos _______________________

Tipo de Muestras Utilizada

Muestreo probabilístico Métodos de muestreo no

Muestreo aleatorio simple Muestreo por cuotas

Muestreo aleatorio sistemático Muestreo intencional o de

Muestreo aleatorio por Muestreo Discrecional

1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente:

1) se asigna un número a cada individuo de la población.

Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.

1.- Muestreo por cuotas:

2.- Muestreo intencional o de conveniencia:

3.- Bola de nieve:

Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico

CARACTERISTICAS VENTAJAS INCONVENIENTES

Cálculo rápido de medias y varianzas. Requiere que se posea de antemano un listado

Se selecciona una muestra de tamaño n de una población de

Conseguir un listado de los N elementos de la población

No siempre es necesario tener un listado de toda la

debemos conocer la composición estratificada de la variables seleccionadas.

dispersa. aleatorio simple o estratificado.

Xi (Marca de Clase) fi (Frecuencia)

FORMANDO UNA TABLA CON SUS PROCESOS

Pasos para agrupar datos.

Determinar el rango o recorrido de los datos.

Rango = Valor mayor – Valor menor

Establecer el número de clases (k).

b) Otra forma de calcular la cantidad de intervalos es aplicando los siguientes métodos:

Método Sturges: k = 1 + 3,332 log n

Aplicación con los datos de la tabla:

Rango (R) = Valor mayor – Valor Intervalos (K): Amplitud (A):

Commented [W3]: frecuencias acumuladas, en cada

La organización de datos en tabla de frecuencias (1/2)

Procedimiento para elaborar la tabla de frecuencia.

Paso 1: Obtención del rango (R).

R = VM – VP Una forma práctica para llevar a cabo este paso es la siguiente:

Altura física en centímetros DE RAZÓN

Estatus laboral (inexperto/semiexperto/experto) ORDINALES

Calidad percibida del cuidado proporcionado (excelente/bueno/suficiente/pobre) ORDINAL

Diagnóstico “sobrecarga del rol del cuidador” NOMINAL

¿Se puede bañar sólo? NOMINAL

Temperatura corporal DE INTERVALO

Estado civil NOMINA

Censo anual de los españoles CUANTITATIVA-DISCRETA

CLASIFICACIÓN DE LAS VARIABLES

1. Según su naturaleza, en cualitativas o cuantitativas

HTA = tabaquismo + alcohol + edad + respuesta al estrés + obesidad + tipo de dieta + … .

IAM = edad + HTA + diabetes + tabaquismo + tipo de dieta + alcohol + … .

Anda mungkin juga menyukai