Anda di halaman 1dari 3

Estadstica para investigadores: Todo lo que siempre quiso

saber
Mdulo 4: Anlisis de la relacin entre dos variables cualitativas: Test Chi
cuadrado
EXPLICACIN DE TAREA: De una investigacin hipottica planteada ya en la
tarea p2p del mdulo 2, se dan los resultados del anlisis estadstico y se os
pide responder RAZONADAMENTE a una serie de preguntas relacionadas con la
investigacin (ms abajo).

PLANTEAMIENTO Y OBJETIVO:
Tomamos datos de la siguiente publicacin:
"Using Cigarette Data for an Introduction to Multiple Regression", by Lauren Mcintyre in
Volume 2, Number 1, of the Journal of Statistics Education.
Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido
de alquitrn y nicotina de los cigarrillos vienen acompaados por incrementos en el
monxido de carbono emitido al fumar. Partimos de estos datos y nos planteamos el
siguiente objetivo:

PARTE 1. Comience con una inspeccin grfica de las nubes de puntos. Genere un
breve informe (tmese el espacio que necesite, pero sea breve) sobre la relacin entre el
monxido de carbono y cada una de las variables explicativas, a partir de las
correspondientes nubes de puntos que se adjuntan. Dganos, a partir de la inspeccin
visual de las nubes, cul de las variables parece ms relacionada con el monxido y si la
relacin parece similar para los dos tipos de tabaco, Rubio y Negro.
-

Grfica monxido de carbono / alquitrn: La grfica a simple vista es la que ms


relacin representa entre las variables, ya que los puntos se presentan a una
distancia similar entre unos y otros. Hay mayor presencia de tabaco rubio. Se
puede concluir que hay una relacin estocstica, lineal directa, ya que al aumentar
los valores en X aumentan los valores en Y. Tambin identificamos outliers.

Grfica Monxido de Carbono/ Nicotina: Similar al caso del alquitrn. Puntos ms


dispersos y distantes, relacin estocstica, lineal y directa. Presencia de outliers.

Monxido de Carbono/ Peso: La grfica representa una relacin independiente ya


que los puntos se presentan en una nube, sin ningn orden. Se puede concluir que
las variables son independendientes o que presentan una relacin no lineal a
confirmar con el estudio de la covarianza.

Parte 2. Bsqueda de modelos que nos permitan estimar la cantidad de MONXIDO de


CARBONO, a partir de las variables Alquitrn, Nicotina y Peso del cigarrillo.

a. Realice un breve informe sobre los modelos y su representatividad, a la vista de


los resultados que se adjuntan: Interprete el coeficiente de determinacin R 2 y el
coeficiente de regresin, en cada modelo y dganos cul le parece ms adecuado y
porqu.

Modelo MA: Coeficiente de determinacin 91%. Relacin significativamente estadstica, ya


que el p valor es menor de 0.05. Se asume relacin entre los variables, y hay un alto poder
de ajuste o una gran bondad de ajuste de ese modelo.
Modelo MN: Coeficiente de determinacin 93%; el mayor de los tres presentados en el
ejercicio. Es el que mejor representa la relacin entre las variable s, debido a su gran
bondad de ajuste. Es estadsticamente significativo, ya que su p valor es <0.05, por lo que
asumimos relacin entre las variables.

Modelo MP: Coeficiente de determinacin 46%. De los tres presentados, es el que ms


riesgo corre al asumir que ambas variables estn relacionada s, por su mayor nivel de
significacin. An as asumiramos relacin de las variables, ya q el p valor es <0.05. No
obstante, es el peor modelo, ya que su bondad de ajuste es inferior al 50%.

Si en vez de tres modelos simples ajustsemos un solo modelo con las tres variables,
fjese lo que pasa.

b. Dganos brevemente qu ha cambiado con respecto a la situacin del apartado


anterior, a la vista de las nuevas significaciones, y a qu cree que se debe.
El modelo de la nicotina sera el mejor model o, ya que su p valor es menor de 0.05,
por lo que asumimos relacin de variables. Lo contrario sucede con variables como
alquitrn o peso, ya que su significacin es mayor que 0.05.
Segn el criterio de los mnimos cuadrados, la recta ajustada y=a+bX. Al ajustar la
recta el coeficiente de regresin se ha modificado. El p valor de nicotina, es
significativamente diferente de 0, lo que implica que es el modelo en el cual X tiene
capacidad de describir Y. En los otros casos, a nivel poblacional, no se puede
realizar esa relacin.

Anda mungkin juga menyukai