2017 I Introduccin
1. Introduccin
Conceptos de estadstica y recoleccin de datos.
La estadstica se ha convertido en el lenguaje matemtico para las ciencias y teoras del pensamiento. Te ayuda a
sacar conclusiones o tomar decisiones ahorrando tiempo, dinero y energa de cualquier fenmeno de estudio (mbito
profesional y acadmico). Estos apuntes corresponden a 15 mdulos diseados para 3 cursos de estadstica:
Los cursos tratan exclusivamente el enfoque clsico, paramtrico y los ejemplos estn basados en estudios
observacionales (de medicin) y tericos con fines de aprendizaje. El curso tiene enfoque pragmtico.
Estadstica
Inferencial Son tcnicas para interpretar e
inferir una poblacin a partir de
Se usa cuando la poblacin a muestras, ayuda a tomar
estudiar es muy grande o desiciones y se basa en la
infinita probabilidad.
Poblacin finita: cuando los miembros o elementos de una poblacin tienen un lmite de medidas u
observaciones contables.
Poblacin infinita: cuando los miembros o elementos de una poblacin son infinitas, no tienen un
lmite de medidas u observaciones. En ocasiones, algunas poblaciones son tan grandes, que
conviene manejarlas como infinitas (depender de la experiencia de la persona).
Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin
Nominal:
{Caf, azul, rojo} {BCN, DF, NL...}
Cualitativa
(atributo) Ordinal:
{Grande, mediana, chica} {Alto, bajo}
Variable
Discreta:
Cuantitativa 2 hijos, 10 fsiles, 3 pelotas
(numrica)
Continua:
23.4 C, 3.4 g, 3.7 g, $32.65
La variable cualitativa nominal describe o nombra a un elemento de una poblacin. Por ejemplo el
color del cabello o lugar de procedencia de un individuo. La variable ordinal incorpora una posicin
ordenada o clasificacin de las variables cualitativas. Por ejemplo el nivel de calidad de un producto
en alto, medio y bajo.
Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin
Parmetro: Valor numrico que resume todos los datos de una poblacin entera. Por ejemplo la
media poblacional (), la varianza (2) y la desviacin estndar poblacional ().
Estadstico: Valor numrico que resume los datos muestrales. Por ejemplo la media muestral ( ), la
varianza (s2) y la desviacin estndar muestral (s).
En los dos tipos de estudio, es posible medir numrica o cualitativamente a los elementos muestrales
que pueden ser objetos, eventos o personas. Al procedimiento de adquirir variables de lo que
expresa una persona se le llama encuesta.
Ya sea que realices un estudio observacional experimental debes tener en cuenta la exactitud y
precisin de la toma de datos.
La exactitud se refiere a que tanto nos aproximamos del valor real cuando medimos una variable. La
precisin se refiere a qu tanto vara un valor cuando lo medimos varias veces a travs del mismo
procedimiento, es la dispersin de un procedimiento para un mismo valor. Por ejemplo, si queremos
medir una temperatura real de 20 C y un termmetro A arroja constantemente 20 C ste es preciso
y exacto. S el termmetro B variara constantemente entre 18 y 22 C y el C vara ente 19 y 21 C el
C es ms preciso que B, pero ninguno de stos tan exacto como el termmetro A.
Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin
Las variables tienen una variacin natural (por ejemplo cuando forman una distribucin normal). La
mensurabilidad de la variabilidad es el objetivo de la estadstica. S tu estudio necesita cierto grado
de exactitud, debers tener en cuenta la mensurabilidad de tu variable (precisin y exactitud) segn
el procedimiento y/o instrumentos de medicin. Con poca exactitud y precisin se obtendra un
sesgo en los resultados.
LA RECOLECCIN DE DATOS.
Una vez que tengas definido el tipo de estudio, investigacin o anteproyecto (pregunta, problema
o hiptesis) con previo marco terico estudiado, objetivos y metodologa dada, se procede a
recolectar datos.
DISEO DE MUESTREO.
Hay dos tipos de diseos muestrales: las muestras dirigidas (no probabilsticas) y las probabilsticas.
Muestras dirigidas: muestras que se seleccionan sobre la base de juzgarse tpicas o buenas de
cada persona. Este tipo de muestreo no es un procedimiento estadstico aceptable. Una prctica
comn es cuando las personas elijen realizar una encuesta por ejemplo en internet (muestras
voluntarias). Otra modalidad es cuando el interesado selecciona objetos o gente bajo su criterio por
la comodidad o cercana de los elementos muestrales (muestra de conveniencia), provocando una
falta de cobertura de la poblacin real. Las muestras dirigidas estn en principio sesgadas.
Muestras voluntarias
Las muestras dirigidas estarn
Mtodos de muestreo siempre sesgadas. No son
dirigido
procedimientos formales.
Muestras de conveniencia
Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin
Muestras probabilsticas: muestras en las que los elementos a seleccionar se extraen sobre la base
de la probabilidad (aleatoriamente). Cada elemento en una poblacin tiene cierta posibilidad de ser
seleccionado como parte de la muestra. Es un procedimiento estadstico formal.
Los mtodos para obtener muestras probabilsticas comnmente son los siguientes:
Muestras
probabilsticas Muestro aleatorio
Mtodo de estratificado (MAE)
muestreo
Muestreo por
No aceptable
conglomerados (cluster)
estadsticamente (MC)
Cmo logro que mi muestra sea representativa de la poblacin? Tomando muestras aleatorias,
donde la muestra debe tener caractersticas proporcionales a la poblacin. La representatividad
la puedes alcanzar con diferentes tcnicas aleatorias.
1) Uso de urnas.
2) Tabla de nmeros aleatorios.
3) Genera nmeros en tu calculadora con la tecla shift +N+RAN.
4) Por medio de una aplicacin (App) desde tu mvil.
5) Con un software (como Excel, Matlab, Minitab, R) pginas web. Random Lite
Aplicacin gratuita
para celular
MTODOS PROBABILSTICOS SENCILLOS.
Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin
Es un diseo muestral en el que los elementos de una poblacin o marco se tratan igual y no hay
subdivisiones.
Muestreo aleatorio simple (MAS): Es la muestra seleccionada de tal forma que todo elemento en la
poblacin (o marco muestral) tiene la misma probabilidad de ser elegido. Las muestras se obtienen
al muestrear con reemplazo en poblaciones finitas y sin reemplazo en poblaciones infinitas. Toma
muestras con reemplazo en poblaciones finitas y sin reemplazo en poblaciones infinitas.
Muestreo aleatorio sistemtico (MS): Muestra en la que se selecciona a cada k-simo elemento de
N
la poblacin o marco muestral a partir de un primer elemento. Donde el elemento k= , N=
n
poblacin y n= al tamao de la muestra. Por ejemplo, si deseamos seleccionar 5 muestras (n=5) en
un poblacin N=100, k ser 20. Posteriormente se elige con un MAS entre el 0 y 20 para determinar
el primer elemento y a partir de ste, se le suma k sistemticamente. S el MAS arroja el nmero 4,
entonces se muestrear los siguientes 5 elementos {424.44.64.84}.
Ejercicio: Realice un MAS en el saln y obtenga n=3 y b) realice un MS con muestras de una playa.
Diseo muestral en el que los elementos del marco o poblacin se subdividen y la muestra se elige
en ms de una etapa aleatoriamente. Cuando la poblacin es muy grande, con frecuencia se
subdivide sobre la base de ciertos criterios. Estos criterios se deben definir y justificar. Las
subpoblaciones resultantes se llaman estratos. Cada estrato se puede manejar por un MAS o MS.
Muestreo aleatorio estratificado (MAE): Muestra que se obtiene al estratificar la poblacin o marco
muestral y posteriormente se seleccionan los elementos de cada estrato con un MAS o MS. Por lo
general, las subdivisiones suelen darse de manear natural. Por ejemplo s caracterizaras las rocas de
4 volcanes diferentes y tienes un mximo de 80 muestras disponibles, la estratificacin natural sera
tomar 20 muestras de cada volcn. Pero, en el caso de que uno de los 4 volcanes sea 100 veces ms
grande que los otros, conviene hacer estratos proporcionales.
Muestreo por conglomerados ( clster) (MC): Muestra que se obtiene al estratificar la poblacin o
marco muestral y posteriormente se seleccionan algunos estratos de manera aleatoria tomando
todos los elementos dentro del estrato seleccionado. Se puede usar un MAS o MS para elegir los
estratos.
Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin
TAMAO DE MUESTRA.
Cuntas muestras debo tomar para mi estudio? No hay un nmero especfico porque depende de
muchos factores: costos, tiempos, objetivos, riesgos, Etc. Sin embargo una respuesta puede ser
toma todas las posibles, entre ms muestras tomes es mejor siempre que sean al azar.
Siempre que tomes muestras tendrs manera de justificar por qu decidiste ese nmero. Por
ejemplo, s cada muestra te cuesta 5 mil pesos, posiblemente quieras usar las menos posibles. Si tu
muestra tarda 3 meses en arrojar un resultado, quizs deberas tomar pocas muestras.
Por el momento, es recomendable tomar al menos 30 muestras hasta propiciar una distribucin
normal en los datos muestrales.
Cuanto tengas pocas muestras (por ejemplo menos de 15) debes usar tcnicas de estadstica NO
paramtrica (son temas fuera del presente curso). En estadstica paramtrica se utilizan frmulas
basadas en distribuciones de probabilidad donde se asume un nivel de confianza, un error mximo
y un tamao de muestra vinculados todos a la vez, por ejemplo:
( 2 )
n=( )2 donde Z( ) es el nivel de confianza que quieres trabajar y E es el error mximo deseado.
2
El detalle de la ecuacin es tener la 2 (varianza poblacional) de los datos, generalmente no la
tenemos por lo cual es posible estimarla.
Javier.urcadiz@gmail.com