Anda di halaman 1dari 8

1.

La Estadística inferencial

Llamada también inferencia estadística, la cual consiste en llegar a obtener


conclusiones o generalizaciones que sobrepasan los límites de los conocimientos
aportados por un conjunto de datos. Busca obtener información sobre la población
basándose en el estudio de los datos de una muestra tomada a partir de ella, así
por ejemplo:

A través de la inferencia esta rama de la estadística abarca métodos y


procedimientos con los cuales deducir determinada información con respecto a
una población, las hipótesis son una clave importante y fundamental de esta
estadística. Para comprenderlo de formas sencilla, la estadística inferencial utiliza
una pequeña muestra de la población y a partir de ella llega a una conclusión
probable de la misma.

Por ejemplo: Teniendo los datos concretos de afectación de una población


determinada por una o varias enfermedades puntuales, los epidemiólogos y
especialistas en salud pública pueden llegar a conclusiones respecto a qué
medidas públicas son necesarias para evitar que dichas enfermedades se
esparzan y contribuir a su erradicación.

2. Estimación de parámetros por intervalos de confianza

La estimación indica que a partir de lo observado en una muestra se


generaliza dicho resultado muestral a la población total, de modo que lo estimado
es el valor generalizado a la población. Consiste en la búsqueda del valor de los
parámetros poblacionales objeto de estudio. Puede ser puntual o por intervalo de
confianza:

- Puntual: cuando buscamos un valor concreto.

- Intervalo de confianza: cuando determinamos un intervalo, dentro del cual


se supone que va a estar el valor del parámetro que se busca con una cierta
probabilidad.
Una buena forma de empezar la Inferencia estadística es hacerlo mediante
los Intervalos de confianza, porque aunque sean procedimientos inferenciales,
mantienen una importante conexión con la descriptiva.

Un intervalo de confianza es un rango de valores, derivado de los


estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de
población desconocido. Debido a su naturaleza aleatoria, es poco probable que
dos muestras de una población en particular produzcan intervalos de confianza
idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un
determinado porcentaje de los intervalos de confianza resultantes incluiría el
parámetro de población desconocido.

En este caso, la línea negra horizontal representa el valor fijo de la media


desconocida de la población, µ. Los intervalos de confianza azules verticales que
se sobreponen a la línea horizontal contienen el valor de la media de la población.
El intervalo de confianza rojo que está completamente por debajo de la línea
horizontal no lo contiene. Un intervalo de confianza de 95% indica que 19 de 20
muestras (95%) de la misma población producirán intervalos de confianza que
contendrán el parámetro de población.

Se utiliza el intervalo de confianza para evaluar la estimación del parámetro


de población. Por ejemplo, un fabricante desea saber si la longitud media de los
lápices que produce es diferente de la longitud objetivo. El fabricante toma una
muestra aleatoria de lápices y determina que la longitud media de la muestra es
52 milímetros y el intervalo de confianza de 95% es (50,54). Por lo tanto, usted
puede estar 95% seguro de que la longitud media de todos los lápices se
encuentra entre 50 y 54 milímetros.
El intervalo de confianza se determina calculando una estimación de punto
y luego determinando su margen de error.

Estimación de punto
Este valor individual estima un parámetro de población usando los datos de
la muestra.

Margen de error
Cuando se utiliza estadísticos para estimar un valor, es importante recordar
que, sin importar lo bien que esté diseñado el estudio, la estimación está sujeta a
error de muestreo aleatorio. El margen de error cuantifica este error e indica la
precisión de la estimación.

3. Contraste de hipótesis

Los contrastes de hipótesis son técnicas que permiten simplificar el modelo


matemático bajo análisis. frecuentemente el contraste de hipótesis recurre al uso
de estadísticos muestrales. También determinan si es aceptable, partiendo de
datos muestrales, que la característica o el parámetro poblacional estudiado tome
un determinado valor o esté dentro de unos determinados valores.

Los métodos de contraste de hipótesis tienen como objetivo comprobar si


determinado supuesto referido a un parámetro poblacional, o a parámetros
análogos de dos o más poblaciones, es compatible con la evidencia empírica
contenida en la muestra. los supuestos que se establecen respecto a los
parámetros se llaman hipótesis paramétricas. para cualquier hipótesis
paramétrica, el contraste se basa en establecer un criterio de decisión, que
depende en cada caso de la naturaleza de la población, de la distribución de
probabilidad del estimador de dicho parámetro y del control que se desea fijar a
priori sobre la probabilidad de rechazar la hipótesis contrastada en el caso de ser
ésta cierta.
En todo contraste intervienen dos hipótesis. la hipótesis nula (ho) es aquella
que recoge el supuesto de que el parámetro toma un valor determinado y es la
que soporta la carga de la prueba. la decisión de rechazar la hipótesis nula, que
en principio se considera cierta, está en función de que sea o no compatible con la
evidencia empírica contenida en la muestra. el contraste clásico permite controlar
a priori la probabilidad de cometer el error de rechazar la hipótesis nula siendo
ésta cierta; dicha probabilidad se llama nivel de significación del contraste ( )y
suele fijarse en el 1%, 5% o 10%.

4. Tipos de pruebas de significación estadística

Son procedimientos que facilitan decidir si una Hipótesis nula se rechaza o


no se rechaza. La aplicación de estas pruebas parte del supuesto de que se ha
utilizado un diseño de muestreo probabilístico (al azar, sistemático, estratificado o
conglomerados) para obtener la información muestral que permita tomar
decisiones estadísticas.

Una prueba de significancia usa datos para resumir evidencia sobre una
hipótesis comparando estimaciones muestrales de parámetros con valores
predichos por las hipótesis.

 Prueba de significancia

Cinco partes de una prueba de significancia

1. Supuestos
– sobre los tipos de datos (cuantitativos, categóricos),
– métodos de muestreo (aleatorio),
– distribución de la población (binaria, normal),
– tamaño de muestra (grande?)

2. Hipótesis
– Hipótesis nula (H0): Afirmación que parámetro(s) toma(n) valor(es)
determinado(s) (Generalmente: “no efecto”)
– Hipótesis alternativa (Ha): establece que valores del parámetro caen
en algún rango alternativo de valores (un “efecto”)

Prueba estadística: Compara datos con lo que la hip. Nula H0


predice, a menudo encontrando el número de errores estándar entre
la estimación muestral y el valor del parámetro en H0

4. Valor-p (P): Una medida de probabilidad de evidencia sobre H0,


dando la probabilidad (bajo el supuesto de que H0 es verdadera) que la estadística
de prueba sea igual al valor observado o uno incluso un valor más extremo en la
dirección predicha por Ha.

– Entre más pequeño el valor-p, más fuerte la evidencia contra H0.

5. Conclusión:
– Si no se necesita una decisión, reportar e interpretar el valor-p
– Si se necesita una decisión, seleccionar el punto de corte (como 0.05
ó 0.01) y rechazar H0 si el valor-p ≤ ese valor
– El nivel mínimo más comúnmente aceptado es 0.05, y se dice que la
prueba es significativa a un nivel de 0.05 si el valor-p ≤ 0.05.
– Si el valor-p no es lo suficientemente pequeño, no rechazamos H 0
(entonces, H0 es no necesariamente verdardera, pero sí plausible)
– Proceso es análago al sistema judicial Americano
– H0: Acusado es inocente
– Ha: Acusado es culpable

 Prueba de significancia para la media


1. Supuestos: Aleatorización, variable cuantitativa, distribución de la población
normal
2. Hipótesis nula: H0: µ = µ0 donde µ0 es un valor determinado para la media
poblacional (típicamente “no efecto” o “sin cambios” del estándar)

Hipótesis alternativa: Ha: µ  µ0 (alternativa de dos-lados


incluye ambos > y < valores de la nula)

3. Estadística de prueba: El número de errores estándar que la media


muestral cae del valor de H0

y  0
t where se  s / n
se

— Cuando H0 es verdadera, la dist. muestral de la estadística de


prueba-t tiene una distribución t con df = n - 1.

4. Valor-p: Bajo el supuesto que H0 es verdadera, la probabilidad que la


prueba estadística sea igual al valor observado o incluso un valor más
extremo (es decir, más grande en valor absoluto), provee más fuerza en la
evidencia contra H0
– Esta es una probabilidad de dos-colas, para una Ha de dos-lados

5. Conclusión: Reportar e interpretar valor-p. Si es necesario, tomar


una decisión sobre H0.

Ejemplo: Estudio de anorexia (anteriormente visto)

• Peso medido antes y después del periodo de tratamiento

y = peso al final – peso al inicio

• En capítulos anteriores, encontramos IC para la media poblacional de y con


base en n=17 niñas recibiendo “terapia familiar”, con los datos

y = 11.4, 11.0, 5.5, 9.4, 13.6, -2.9, -0.1, 7.4, 21.5, -5.3,
-3.8, 13.4, 13.1, 9.0, 3.9, 5.7, 10.7

Hay evidencia de que la terapia familiar tenga un efecto?

• Sea µ = media del cambio en peso poblacional


• Probar H0: µ = 0 (no efecto) contra Ha: µ  0.
• Datos tienen

---------------------------------------------------------------------------------------

Variable N Mean Std.Dev. Std. Error Mean

weight_change 17 7.265 7.157 1.736

----------------------------------------------------------------------------------------

Recordar que el error estándar (se) se obtiene con

se  s / n  7.157/ 17  1.736

• Prueba estadística (df = 16):


• Valor-p: P = 2P(t > 4.2) = 0.0007
– Nota que tabla t (Tabla B, p. 593) nos dice que P(t > 3.686) = 0.001,
entonces la prueba estadística t = 3.686 (ó -3.686) tendría valor-p =
0.002
– Interpretación: Si H0 fuera verdadera, habría una probabilidad =
0.0007 de obtener una media muestral de al menos 4.2 errores
estándar del valor 0 de la nula.

Conclusión: Evidencia muy fuerte que la media población difere de 0.


(Específicamente, parece que µ > 0, como fue sugerido por el IC del 95% CI (3.6,
10.9)
Equivalencia entre los resultados de
la prueba de significancia y el intervalo de confianza

• Cuando el valor-p ≤ 0.05 en una prueba de dos-lados, un intervalo de


confianza del 95% para µ no contiene el valor de H0 de µ (tal como 0)
• Cuando valor-p > 0.05 en una prueba de dos-lados, un intervalo de
confianza del 95% necesariamente contiene el valor de H0 de µ

(Esto es cierto para pruebas de dos-lados)

• Un intervalo de confianza tiene más información acerca del valore real de µ

5. Análisis multivariante

El Análisis Multivariante es el conjunto de métodos estadísticos cuya


finalidad es analizar simultáneamente conjuntos de datos multivariantes en el
sentido de que hay varias variables medidas para cada individuo ú objeto
estudiado. Su razón de ser radica en un mejor entendimiento del fenómeno objeto
de estudio obteniendo información que los métodos estadísticos univariantes y
bivariantes son incapaces de conseguir