Anda di halaman 1dari 4

Compartiendo maneras de ilustrar los

conceptos estadsticos complejos


Los mejores profesores de introduccin a la estadstica saben que el simple hecho de
memorizar la forma de realizar los procedimientos no es suficiente: los estudiantes deben
entender qu significan realmente sus resultados.

A lo largo de 15 aos de docencia, la Dra. Julie Belock, una profesora de Salem State
University, ha desarrollado varios proyectos estudiantiles que exploran el sentido detrs de
las tcnicas estadsticas. En una ponencia que present durante la XXV Conferencia
Internacional Anual sobre Tecnologa en Matemticas Universitarias, Belock aborda tres de
los conceptos que los estudiantes consideran ms complicados, explicndolos con Minitab
Statistical Software.

Utilizo el software de Minitab en estos proyectos por su facilidad de uso y porque produce
grficas excelentes, que ayudan a los estudiantes a interpretar y presentar sus trabajos,
escribe Belock.

Intervalos de confianza

En estadstica, estimamos las caractersticas de las poblaciones analizando un subconjunto


de individuos, lo que se conoce como una muestra. Pero cuando se utilizan datos muestrales
para estimar un parmetro poblacional, como la media, es muy poco probable que se
calcule con exactitud el parmetro real. Un intervalo de confianza es un rango en que es
probable que se halla ese valor real, de manera que aunque no se puede proporcionar el
valor exacto, se puede decir con confianza que la media real se encuentra dentro de ese
rango.

Los intervalos de confianza se miden segn sus niveles de confianza, y es esto lo que
suele confundir a los estudiantes. Con frecuencia, ellos presuponen que un intervalo de
confianza de 90% tiene una probabilidad de 90% de incluir la media real. Sin embargo, lo
que el nivel de confianza realmente indica es la probabilidad de seleccionar aleatoriamente
una muestra cuyo intervalo de confianza contenga el parmetro real. Una vez que se
calcula un intervalo de una muestra en particular, este o contiene la media real o no la
contiene, explica Belock. Ya no hay nada aleatoria al respecto!.

Los alumnos de Belock comprueban esto por s mismos al utilizar Minitab para simular un
gran nmero de muestras aleatorias y generar intervalos de confianza para cada una.
Cuando calculan el porcentaje de intervalos de confianza que contienen el parmetro
verdadero, los estudiantes se percatan de que este porcentaje se aproxima al nivel de
confianza.
En el ejemplo anterior, los estudiantes pueden ver que cada uno de estos intervalos de
confianza de 90% o bien incluye la media real o no la incluye y que 17 de los 20
(aproximadamente el 90%) s contienen la media real de 100.

Valores p

Belock utiliza una estrategia similar para ilustrar el concepto de valor p, la probabilidad de
obtener un resultado al menos tan extremo como el de los datos de su muestra simplemente
en virtud de las probabilidades. La profesora utiliza un ejemplo en el cual el 39% de los
estudiantes de una muestra dice que ir directamente a una escuela de postgrado, mientras
que datos anteriores revelan que aproximadamente el 35% de todos los estudiantes va
directamente a la escuela de postgrado. Indica esta muestra que la proporcin de
estudiantes que va directamente a la escuela de postgrado ha aumentado?

Una prueba Z de 1 proporcin calcular el valor p del resultado de 39% de la muestra. Pero
primero, los estudiantes de Belock intentan obtener el valor p de otra manera. Generan 100
muestras aleatorias simuladas a partir de una poblacin en la que el 35% de los estudiantes
va directamente a la escuela de postgrado. Luego determinan qu porcentaje de esas
muestras da como resultado valores al menos tan altos como 39%. Cuando los estudiantes
comparan esta frecuencia con un valor p generado usando la prueba de 1 proporcin, notan
que el resultado es muy similar, y logran entender con claridad lo que representa el valor p.

Diagnsticos de regresin

Una ecuacin de regresin modela la relacin entre dos o ms variables. Una grfica de
dispersin grafica las variables de regresin una en funcin de la otra, de manera que se
pueda visualizar la correlacin. Una grfica de residuos es una herramienta diagnstica para
un anlisis de regresin que permite visualizar lacantidad de la variacin de los datos que la
regresin no puede explicar, una idea que suele ser difcil de entender para los estudiantes.

Una grfica de dispersin muestra un patrn si los datos estn correlacionados. Pero una
grfica de residuos no mostrar un patrn si el modelo de regresin provee un ajuste
adecuado. Para ver cmo funciona esto, los alumnos de Belock utilizan datos reales sobre
los osos (tomados de un conjunto incluido en la carpeta de datos de muestra de Minitab)
para crear varias grficas de dispersin. Algunas de las grficas muestran una fuerte
correlacin lineal, mientras otras no. Cuando los estudiantes hacen regresiones lineales con
datos que no estn correlacionados, el resultado es una grfica de residuos mala, lo que
indica que la regresin provee un ajuste deficiente.

La regresin que se muestra en la grfica de lnea ajustada de arriba es un ajuste deficiente


y produce una grfica de residuos con un patrn claramente curvo.

Despus, los estudiantes hacen la regresin con variables que estn correlacionadas y
modifican su anlisis para refinar an ms el ajuste de la regresin. A medida que lo hacen,
todos los patrones en los residuos desaparecen y terminan con una grfica de residuos
aleatoriamente dispersa que indica un ajuste adecuado.

Una regresin que se ajusta adecuadamente a los datos produce una grfica de residuos sin
patrones como la que se muestra arriba.
Conclusin

Estos ejercicios han demostrado ser tiles para los estudiantes de todos los niveles, destaca
Belock. Los estudiantes se mantienen activamente involucrados en el proceso de
aprendizaje debido al enfoque prctico, y al usar Minitab para los clculos y las grficas,
los estudiantes pueden concentrarse en los conceptos.

Minitab funciona mejor que otros programas para estas actividades en particular debido a
varios factores, escribe Belock, entre ellos la facilidad de uso, las grficas claras y las
opciones adecuadas, como la capacidad de generar y mostrar mltiples intervalos de
confianza simultneamente.

Las lecciones de Belock, con instrucciones paso a paso, se detallan en Addressing


Challenging Statistical Topics with Minitab (Abordando temas estadsticos complejos con
Minitab),una ponencia presentada en la XXV Conferencia Internacional Anual sobre
Tecnologa en Matemticas Universitarias.

Anda mungkin juga menyukai