Anda di halaman 1dari 3

TRABAJO ESTADISTICA DOCUMENTACION

Se trata de un trabajo, voluntario, sobre datos reales. Se realiza en grupos de 4


alumnos, y su duracin es anual. Se valora con hasta 1 punto sobre la nota final.
Dicha suma se har efectiva siempre que en ambos exmenes parciales (o en el
examen final) el alumno/a haya obtenido al menos un cuatro; en otro caso, la
calificacin ser necesariamente Suspenso, independientemente de la realizacin
del trabajo. Sin embargo, la nota obtenida en el trabajo se podr guardar para la
convocatoria de Septiembre.

Habr al menos tres revisiones del trabajo:


1.- Mes de Diciembre: los datos ya deben haber sido recogidos.
2.- Mes de Enero: la primera parte del trabajo (estudio descriptivo de los datos)
debe haber sido completada.
3.- Mes de Junio: la segunda parte del trabajo (anlisis de los datos recogidos
mediante contrastes de hiptesis, y tcnicas de anlisis multivariante) debe haber
sido completada.
IMPORTANTE: para que el trabajo sea tomado en consideracin, cada grupo
deber haberse sometido a las tres revisiones reseadas arriba, y haber recibido
el visto bueno en cada una de ellas. En la primera revisin los grupos
aportarn las encuestas recogidas; en la segunda, el Estudio Descriptivo; en la
tercera, el trabajo completo.

El objetivo del trabajo es describir con la mayor exactitud posible a los usuarios
de una biblioteca de Alcal, o de otra poblacin madrilea. Con este fin, cada
grupo confeccionar una hoja/encuesta, en la que se recogern (de forma
annima) los siguientes datos:
-

Sexo (Varn/Hembra)
Edad
Nivel de estudios (Sin estudios; ESO o similar; Bachillerato o similar;
Licenciado; Doctor).
Hbito de Lectura (0.- muy escaso; 1.- escaso; 2.- medio; 3.- alto; 4.muy alto).
Aficin al cine (0.- muy escaso; 1.- escaso; 2.- medio; 3.- alto; 4.- muy
alto).
Razn por la que se acude a la biblioteca (estudiar; prstamo de libros;
ambas).
Nmero medio de libros que sueles leer mensualmente.
Aficin a la pintura (0.- muy escaso; 1.- escaso; 2.- medio; 3.- alto; 4.muy alto).
Nmero medio de ocasiones en que sueles acudir al cine, mensualmente.
Nmero medio de ocasiones en que sueles acudir a exposiciones o
conferencias, mensualmente.
Renta mensual, aproximada (para los que trabajen, el sueldo medio; para
los que an dependan de sus padres, la media aproximada de los sueldos
de los padres).

Se requerir un tamao muestral mnimo de 60 datos, tomados en al menos


cinco das distintos (un mximo de 12 cada da), sin que haya personas
repetidas. En este sentido, en cada hoja/encuesta deber constar la fecha en la
que fue rellenada.
En el trabajo que se entregar en el mes de Junio, debern constar las siguientes
secciones:
1) Breve descripcin de la Biblioteca objeto de estudio: poblacin y barrio en la
que est ubicada, breve descripcin del entorno socioeconmico y de las
caractersticas de la Biblioteca.
2) Breve descripcin del estudio estadstico: poblacin (el conjunto de usuarios
de la biblioteca), tamao muestral, tcnica de muestreo utilizada, variables
registradas (las anteriormente reseadas), nivel de significacin admitido
para el contraste de hiptesis, y cualquier otro dato que se considere
relevante.
3) Estudio descriptivo de los datos: de cada una de las variables reseadas
anteriormente, se adjuntar una ficha en la que deben constar: el tipo de
variable (categrica, cuantitativa continua, cuantitativa discreta); tabla de
frecuencias (agrupada en intervalos, en los casos de Edad y Renta);
principales parmetros de centralizacin (media, moda, mediana) y de
dispersin (varianza, desviacin tpica, coeficiente de variacin, cuartiles);
datos atpicos; grfico de barras o histograma; grfico de sectores. Para
aquellas variables numricas cuyo grfico sugiera una distribucin
aproximadamente normal, un intervalo de confianza para la media (al 95%),
y los intervalos en los que cabe esperar encontrar al 75% y al 90% de la
poblacin, respectivamente.
4) Contraste de hiptesis: se utilizarn los contrastes de hiptesis que se
consideren apropiados para evaluar las siguientes cuestiones; en el trabajo
deber researse el contraste de hiptesis que se ha utilizado, el p-valor
obtenido, y la conclusin, adems de los grficos y/o diagramas que se
consideren convenientes.
a.- Cules de las variables numricas estudiadas siguen una distribucin
normal? Para aquellas que no lo sean, puedes conjeturar alguna otra
distribucin que se ajuste a ellas?
b.- Puede admitirse que la edad media de los usuarios de esa biblioteca es
inferior a 20 aos? Y a 25? Y a 30 aos?
c.- Puede admitirse que las edades medias de los hombres y de las mujeres
que acuden a esa biblioteca son similares?
d.- Puede admitirse que la mediana de la variable Aficin a la Pintura es
superior a 2?
e.- Hay diferencias significativas entre sexos, en cuanto a hbito de lectura?
(para contestar a esta pregunta, construye adems un diagrama de
contingencia).

f.- Hay relacin entre el hbito de lectura, y la aficin al cine? Y entre el


nivel de estudios y el hbito de lectura? (para contestar a esta pregunta,
construye adems diagramas de contingencia).
g.- Hay relacin entre la renta media, y el hbito de lectura? Y entre la
renta media, y el nivel de estudios? (Comprueba las hiptesis del modelo que
utilices). Qu porcentaje de variabilidad logras explicar?
h.- Aplica un ANOVA multifactorial sin interaccin para explicar la variable
Renta a partir de los factores: Sexo, Nivel de Estudios, y Aficin al Cine.
Cules resultan significativos? Aplica un modelo con interaccin para
estudiar la existencia de interacciones entre los factores. (Comprueba las
hiptesis del modelo que utilices)
i.- Estudia la existencia de correlacin lineal entre las variables Nmero
medio de libros ledos mensualmente, y Aficin al Cine. Idem entre las
variables Renta y Nmero medio de libros. Para ello, calcula los
coeficientes de correlacin lineal de Pearson y Spearman, y analiza los
contrastes que proporciona Statgraphics. En caso de obtener evidencia de
correlacin lineal, aporta la ecuacin del modelo; en caso de no obtenerla,
trata de encontrar un modelo ms apropiado; asimismo, indica el porcentaje
de variabilidad explicada con el modelo.
j.- Utiliza un modelo de regresin lineal mltiple para predecir la variable
Nmero medio de libros ledos mensualmente, a partir de las variables
Hbito de lectura, Edad", Aficin al cine, Aficin a la pintura,
Renta. Puede eliminarse algn parmetro? En tu opinin, es un buen
modelo? Justifica tu respuesta a partir de distintos clculos.
5) Anlisis multivariante: utiliza tcnicas de anlisis multivariante para
responder a las siguientes cuestiones:
A.-Cuntas componentes principales debes tomar para retener al menos el
85% de la variabilidad contenida en los datos?. Interpreta, si te es posible,
alguna de esas componentes principales.
B.- Cules son las variables ms influyentes a la hora de predecir el valor
de la variable Hbito de Lectura? (utiliza un Anlisis Discriminante).
C:- Utiliza tcnicas de Anlisis Cluster para distinguir grupos significativos
entre los usuarios de la biblioteca, e interpreta los grupos que obtienes.
Para cada una de estas cuestiones, se resear la tcnica utilizada, los
clculos y grficos que se consideren ms relevantes, y la conclusin.
6) Conclusiones: a partir de la informacin recogida en todos los puntos
anteriores, se trata de dar una descripcin lo ms exacta posible de los
usuarios de la biblioteca, destacando los aspectos que se consideren ms
relevantes (diferencias por sexos, por nivel de estudios, por niveles de renta,
relaciones entre variables, etc.)

Anda mungkin juga menyukai