Semestre I-2018
Antecedentes
Esta tarea evalúa los contenidos vistos en las clases 1 y 2, y en el práctico 1. Específicamente se
trata de técnicas de análisis de datos, que se enmarcan en la rama de la estadística denominada
estadística descriptiva. El análisis de un conjunto de datos comienza siempre con un resumen
gráfico y numérico. Mientras más complicado es el conjunto de datos, más importante es manejar
formas efectivas de visualizarlos e identificar patrones clave. Tal como vimos en las clases y
práctico, los datos crudos pueden registrarse en tablas y luego trabajados en un computador
utilizando una hoja de cálculo (ej. Microsoft Excel) u otro medio. Entonces, este módulo tiene
como objetivo que los estudiantes desarrollen y/o refuercen su capacidad de:
Forme pareja con un compañero/a de curso y remita un informe escrito que contenga las siguientes
actividades:
1. Seleccione una variable cualitativa (ej. Color de ojos, tipo de pelo, sexo, etc.) y dos
variables cuantitativas de su interés (ej. Estatura y peso, edad y estatura, etc.). Justifique
porqué eligió cada variable e indique en qué escala se mide cada tipo de datos (ej. nominal,
ordinal, de intervalo o de razón). Se espera que usted trabaje con variables de interés en el
área de la bioingeniería y/o biotecnología. 1,5 puntos
2. Identifique la población de interés (ej. Estudiantes curso de biometría año 2018) y realice
un muestreo (selección de individuos) registrando sus observaciones (ej. Color de pelo,
estatura y peso). Considere un tamaño de muestra de al menos 30 individuos/objetos e
indique cómo realizó el muestreo. 1 punto.
3. Tabule y presente las observaciones recolectadas usando tablas de data cruda (ej. Cada
individuo muestreado, su color de ojos, estatura y peso). Luego para cada variable presente
tablas de frecuencia (absoluta, relativa y acumulada). 1,5 puntos.
4. Para cada variable elija una representación visual (gráfico) adecuada para el tipo de datos.
Describa qué información puede extraer desde cada gráfico. 1,5 puntos.
5. Para las dos variables cuantitativas, entregue una tabla resumen conteniendo el promedio,
la varianza, la desviación estándar y el coeficiente de variación considerando: a) el total de
datos (ej. Estatura de todos los individuos) y b) comparando dos categorías (ej. Estatura de
estudiantes con ojos de color café versus la de estudiantes con ojos de color negro).
Comente sus resultados (ej. ¿Qué grupo tiene mayor estatura promedio? ¿En qué grupo la
estatura es más variable?). Además, grafique la variable cuantitativa 1 versus la variable
cuantitativa 2 usando un gráfico de dispersión. ¿Qué indica el gráfico? 1,5 puntos.
6. Confeccione su informe en un procesador de texto (ej. Microsoft word), incluyendo las
tablas y figuras solicitadas. Identifique a los autores del informe en la primera página.
7. Fecha de entrega miércoles 11 de abril de 2018, hasta las 13:00.
8. Enviar los informes (word o pdf) y consultas a seneira@udec.cl.
Aspectos importantes de considerar para su informe
Antes de recolectar los datos debemos identificar la unidad o unidad muestral (ej. Un individuo,
un objeto, etc.). La población o universo de unidades es el total de unidades. En estadística nos
concentramos en la recolección de valores de la característica (o conteos de un rasgo cualitativo)
evaluada en cada unidad de la población. Este conjunto se denomina población estadística o
simplemente población. Rara vez se puede conocer la población, por lo que tomamos una muestra
desde ella. La muestra (o el conjunto de datos muestreados) es un subconjunto de valores que son
recolectados en el marco de una investigación y está constituida por las mediciones registradas en
las unidades que son efectivamente observadas. Entonces, la población es el objetivo de nuestra
investigación y aprendemos de ella tomando una muestra.
2.2. Gráficos
Confeccione gráficos auto-explicativos, entregando una leyenda con una breve descripción de la
fuente de los datos. Siempre etiquete los ejes y establezca las unidades de medida. Marque las
escalas y entregue una clave si es necesario. Escoja las escalas de cada uno de los ejes de modo
que sean convenientes y aseguren el uso de la mayor parte de la superficie del gráfico. Esté atento
a lo engañoso que puede resultar el gráfico si no se incluye el origen. No usar los productos por
defecto (EXCEL, R u otro), se puede (y debe) mejorar sustancialmente la presentación cambiando
los estilos de líneas, el tamaño de los puntos, etc. Por ejemplo, mantenga grillas y etiquetas sólo si
mejoran el contenido de la información (normalmente no es el caso). Evite gráficos
“amontonados”, en su lugar use más de un gráfico si el mensaje que se quiere transmitir es
complicado.
4.3. Construir las clases anotando los límites de cada una de ellas
Conociendo el valor mínimo en nuestra muestra empezamos el primer intervalo en ese valor que
es el límite inferior de esa clase. El límite superior se obtiene de sumar al límite inferior la amplitud
del intervalo. Construya una tabla como la siguiente:
4.4. Determinar el número de datos que están incluidos en cada una de las clases (frecuencia
de clase)
Cuente el número de observaciones que caen en cada una de las clases de frecuencia. En Excel
este conteo puede realizarse automáticamente utilizando análisis de datos -> Histograma.
Usando las definiciones y/o ecuaciones presentadas en clase, calcule la media aritmética, la
mediana y la moda. Calcule también la varianza, la desviación estándar y el coeficiente de
variación. Compare sus resultados al calcular estas medidas usando las funciones de Excel. Ej.
‘=media()’; ‘=moda()’; ‘mediana()’; ‘=var()’; ‘=desvest()’. Recuerde que en cada función debe
indicar entre paréntesis el conjunto de datos que estamos analizando.