• Conocer los conceptos básicos sobre los cuales se sustenta la teoría estadística
CIENCIA Resumen/
Presentación
ENCARGADA Evaluando la
DE: confiabilidad y
riesgos asociados
a las
conclusiones
Información Análisis /
Recolección Interpreta
Cuantitativa ción
RAMAS DE LA ESTADÍSTICA
Descriptiva
Descriptiva Inferencial
• Resumen, descripción y • Proceso de extrapolación de
presentación de la resultados
información • Muestra ->población
• Paso inicial en un análisis • Estimación de intervalos y
estadístico (Análisis pruebas de hipótesis
exploratorio) • Conclusiones con sustento
• Construcción de cuadros, científico para toma de
tablas y gráficos para la decisiones en base a la
representación visual de información de la muestra
resultados
CONCEPTOS BÁSICOS
• Ejemplos: • Ejemplos:
• Un lote de producción de • Una computadora i7 producida
computadoras i7 de la fábrica Z en la fábrica Z
• Conjunto de pacientes que • Un paciente recibiendo un
reciben el tratamiento médico A determinado tratamiento médico
A
CONCEPTOS BÁSICOS
VARIABLES CUALITATIVAS
Representación gráfica
VARIABLES CUALITATIVAS
• Para representar gráficamente la distribución de frecuencias de una variable
cualitativa se utilizan las barras y los sectores circulares.
• Si trabajamos con variables nominales, las categorías pueden ser colocadas en
cualquier orden. En el caso de variables ordinales las categorías deberán ser
colocadas en orden
8%
26%
55% 45%
66%
VARIABLES CUANTITATIVAS
• Para representar gráficamente la distribución de frecuencias de una variable
cuantitativa continua se utilizan los Histogramas o Histogramas de frecuencia.
• No hay separación entre las barras ya que representan intervalos continuos
Curva de la
Distribución de la
variable “edad”
Representación gráfica
VARIABLES CUANTITATIVAS
• Para representar gráficamente la distribución de frecuencias de una variable
cuantitativa discreta se utilizan los gráficos de varas.
Representación tabular
TABLAS DE FRECUENCIAS
Representación tabular
TABLAS DE FRECUENCIAS
• Reúne las frecuencias observadas de una serie de datos o categorías de datos, las
frecuencias absolutas, frecuencias absolutas acumuladas, frecuencia relativa y
relativa acumulada.
• Nos da información sobre la distribución de la variable
Distribución de la
variable
MEDIDAS DE TENDENCIA CENTRAL
• Se dice que estos números son “representativos” porque resumen todas las
observaciones en un solo número e informan sobre el comportamiento general del
conjunto de datos
MEDIA ARITMÉTICA / PROMEDIO
𝒏
𝟏 𝑿𝟏 + 𝑿𝟐 + ⋯ + 𝑿𝒏
ഥ=
𝑿 𝑿𝒊 =
𝒏 𝒏
𝒊=𝟏
MODA
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
USOS DE LAS MEDIDAS DE T. CENTRAL
Cuartiles
24
DESVIACIÓN ESTÁNDAR
11 12 13 14 15 16 17 18 19 20 21
Media = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21
DESVIACIÓN ESTÁNDAR
COEFICIENTE DE VARIACIÓN (CV)
𝑠
𝐶𝑉 = × 100
𝑋ത
COEFICIENTE DE VARIACIÓN (CV)
Aplicaciones del CV
• Entre el 15% y 20% precisión regular y por lo tanto se debe utilizar con
precaución
• Mayor del 20% indica que la estimación es poco precisa y por lo tanto se
recomienda utilizarla sólo con fines descriptivos no concluyentes
COVARIANZA
La covarianza mide la relación lineal entre dos variables. Aunque la covarianza es
similar a la correlación entre dos variables, difieren de las siguientes maneras:
• Los coeficientes de correlación están estandarizados. Por lo tanto, una relación
lineal perfecta da como resultado un coeficiente de 1. La correlación mide tanto
la fuerza como la dirección de la relación lineal entre dos variables.
• Los valores de covarianza no están estandarizados. Por consiguiente, la
covarianza puede ir desde infinito negativo hasta infinito positivo. Por lo tanto, el
valor de una relación lineal perfecta depende de los datos. Puesto que los datos
no están estandarizados, es difícil determinar la fuerza de la relación entre las
variables.
La covarianza nos indica la dirección de la relación entre las variables. Los valores de
covarianza positivos indican que los valores por encima del promedio de una variable
están asociados con los valores por encima del promedio de la otra variable y los
valores por debajo del promedio están asociados de manera similar
COVARIANZA
Nos brinda una medida de cuánto dos variables cambian
linealmente juntas
La covarianza para N valores de 2 variables X e Y se calcula
mediante la siguiente fórmula:
OBJETIVOS DEL MÓDULO Estadística Aplicada
• Diferenciar los componentes y los pasos a seguir para ejecutar una prueba de
hipótesis
• Estimación puntual
• Estimación del valor de un parámetro por medio de un único valor
• Sería el resultado del estimador en una muestra especifica
• Inconveniente: NO es posible precisar el grado de aproximación
• Media muestral 𝑿
ഥ
𝒏
𝟏 𝑿𝟏 + 𝑿𝟐 + ⋯ + 𝑿𝒏
ഥ
𝑿 = 𝑿𝒊 =
𝒏 𝒏
𝒊=𝟏
estima a
ഥ
𝑿 𝝁
• Variancia muestral 𝒔𝟐
𝒏
𝟏 ഥ )𝟐 + (𝑿𝟐 −𝑿
(𝑿𝟏 −𝑿 ഥ )𝟐 + ⋯ + (𝑿𝒏 −𝑿
ഥ )𝟐
𝟐
𝒔 = ഥ) =
(𝑿𝒊 −𝑿 𝟐
𝒏−𝟏 𝒏−𝟏
𝒊=𝟏
estima a
𝒔𝟐 𝝈𝟐
ESTIMADORES – PARÁMETROS
• Proporción
• Número de unidades que poseen la característica en la muestra / el tamaño de
muestra (n)
𝒏
𝟏 𝒂𝟏 + 𝒂𝟐 + ⋯ + 𝒂𝒏
𝒑 = 𝒂𝒊 =
𝒏 𝒏
𝒊=𝟏
𝒑 estima a 𝝅
INTERVALO DE CONFIANZA
• Estimación del parámetro mediante un conjunto de valores contenidos en un
intervalo obtenido de la información en la muestra
Intervalo de Confianza
• Donde:
• (1-α)x100%: Nivel de confianza
• α: Nivel de significancia (probabilidad de no alcanzar la precisión deseada)
• LIC: Límite inferior de confianza
• LSC: Límite superior de confianza
IC PARA LA MEDIA
• Lo usaremos para construir un intervalo de confianza acerca de la media de una
variable cuantitativa, por ejm: Ingreso mensual de los hogares beneficiarios, Tiempo
invertido en corte de leña.
• En el caso que realicemos inferencia con muestras aleatorias grandes (tamaño >
30unidades), consideramos 2 situaciones
Límite
• Si se conoce la variancia poblacional (𝜎 2 )
superior de
Límite inferior confianza
de confianza
𝝈 𝝈
𝑰𝑪(𝝁) 𝟏−𝜶 𝟏𝟎𝟎%
ഥ−
= 𝑿 𝒁 𝟏−𝜶ൗ𝟐
ഥ+
;𝑿 𝒁 𝟏−𝜶ൗ𝟐
𝒏 𝒏
• Si no se conoce la variancia poblacional (𝜎 2 )
𝒔 𝒔
𝑰𝑪(𝝁) ഥ−
= 𝑿 𝒁 𝜶 ; ഥ
𝑿 + 𝒁 𝟏−𝜶ൗ𝟐
• Si no se conoce la𝟏−𝜶 𝟏𝟎𝟎% poblacional (𝜎 2 )𝟏− ൗ
variancia 𝒏 𝟐 𝒏
Error estándar
del estimador
IC PARA LA MEDIA
DISTRIBUCIÓN NORMAL ESTÁNDAR (Z)
Muestras grandes
n>30: Z
Muestras pequeñas
n<30: t de Student
IC PARA LA PROPORCIÓN
Lo usaremos cuando necesitemos construir un intervalo de confianza para una
proporción o porcentaje poblacional, por ejemplo: el porcentaje de hogares con cocina a
gas, fumadoras,
𝒑 𝟏−𝒑 𝒑 𝟏−𝒑
𝑰𝑪(𝝅) 𝟏−𝜶 𝟏𝟎𝟎% = 𝒑 − 𝟏. 𝟗𝟔 ; 𝒑 + 𝟏. 𝟗𝟔
𝒏 𝒏
IC PARA LA VARIANCIA
Para la construcción de un intervalo de confianza para la variancia 𝜎 2 , basado en una
muestra aleatoria de tamaño n
(𝒏 − 𝟏)𝒔𝟐 (𝒏 − 𝟏)𝒔𝟐
𝑰𝑪(𝝈 ) 𝟏−𝜶 𝟏𝟎𝟎% = ;
𝝌 𝟏−𝜶ൗ ,𝒏−𝟏 𝝌 𝜶ൗ ,𝒏−𝟏
𝟐 𝟐
• Hipótesis nula / planteada: Es el supuesto que se hace respecto al valor del parámetro
en estudio que se validará con la evidencia muestral
• Procedimiento
• Formular hipótesis nula y alternativa
• Elegir el nivel de significación (α=0.05, α=0.1, α=0.01)
• Seleccionar la prueba estadística apropiada
• Calcular el estadístico de prueba
• Comparar el estadístico con la Región de rechazo
• Decidir la aceptación o rechazo de la Hp
• Concluir
PRUEBA DE HIPOTESIS PARA LA MEDIA
• En el caso que realicemos inferencia con muestras aleatorias grandes (tamaño >
30unidades), consideramos el siguiente estadístico
ഥ − 𝝁𝟎
𝑿
𝒁𝒄 = 𝒔 ~ 𝑁(0,1)
𝒏
𝒑 − 𝝅𝟎
𝒁𝒄 = ~ 𝑁(0,1)
𝝅𝟎 (𝟏 − 𝝅𝟎 )
𝒏
Realidad
Decisión 𝑯𝟎 es verdadera 𝑯𝟎 es falsa
Ena variable aleatoria puede tomarse como una cantidad cuyo valor no es fijo pero
puede tomar diferentes valores; la distribución de probabilidad se usa para describir
la probabilidad de que se den los diferentes valores. En términos formales una
variable aleatoria es una función definida sobre un espacio de probabilidad.
Los valores posibles de una variable aleatoria pueden representar los posibles
resultados de un experimento aún no realizado, o los posibles valores de una
cantidad cuyo valor actualmente es incierto
TIPOS DE VARIABLES ALEATORIAS
Variable Aleatoria discreta:
Una variable aleatoria es discreta si el número de valores posibles
de la variable es un número finito ó infinito numerable.
El dominio de la variable aleatoria X es el espacio muestral y el
rango es un subconjunto de números reales denotado por Rx.
En otras palabras, una variable aleatoria es discreta si su rango Rx
es un conjunto finito ó infinito numerable.
Variable Aleatoria Continua:
Valores posibles de la variable es un número infinito no numerable o
cuando el rango de X (Rx) es un intervalo de los números reales.
Ejemplo: Sea X la variable aleatoria que representa la altura de
arboles de bolaina.
FUNCION DE PROBABILIDAD
VALOR ESPERADO DE UNA VARIABLE
ALEATORIA DISCRETA
𝐸 𝑋 = 𝜇 = 𝑥𝑖 . 𝑃(𝑋 = 𝑥𝑖 )
𝑖=1
Propiedades :
1. E[k] = k ; k es constante
2. E[X ± a] = E[X] ± a ; a es constante
3. E[aX] = a E[X] ; a es constante
4. E[aX + b] = a E[X] + b ; a,b constantes
VARIANCIA DE UNA VARIABLE ALEATORIA
DISCRETA
X una v.a. discreta con función de probabilidad f(x), la variancia de X se
define por:
𝜎 2 = 𝑉 𝑥 = 𝐸 (𝑥 − 𝜇)2 = 𝑥𝑖 − 𝜇 𝑃(𝑋 = 𝑥𝑖 )
𝑖=1
𝜎 2 = 𝑉 𝑥 = 𝐸 𝑋 2 − 𝜇2
Propiedades
1. V(k) = 0
2. V(X ± a) = V[X]
3. V(aX) = a²V(X)
4. V(aX + b) = a²V(X)
k, a, b son constantes.
ESPERANZA DE UNA V.A. CONTINUA.
Definición .- Sea X una V.A. continua con función de densidad f(x), entonces
el valor esperado (media) de la V.A. X se define por:
∞
𝜇 = 𝐸 𝑋 = න 𝑥𝑓 𝑥 𝑑𝑥
−∞
Las propiedades para la esperanza de una v.a. continua son las mismas
que para la v.a. discreta.
1. E[k] = k
2. E[X ± a] = E[X] ± a
3. E[aX] = a E[X]
4. E[aX + b] = a E[X] + b
k, a, b son constantes
VARIANCIA DE UNA VARIABLE ALEATORIA
CONTINUA
X una v.a. continua con función de densidad f(x), la variancia de X se define
por:
∞
𝜎 2 = 𝑉 𝑥 = 𝐸 (𝑥 − 𝜇)2 = න (𝑥 − 𝜇)2 𝑓 𝑥 𝑑𝑥
−∞
Propiedades
1. V(k) = 0
2. V(X ± a) = V[X]
3. V(aX) = a²V(X)
4. V(aX + b) = a²V(X)
k, a, b son constantes.
ESPERANZA CONDICIONAL
En teoría de la probabilidad, una esperanza condicional de una variable aleatoria
(también conocido como valor esperado condicional o media condicional) es el
valor esperado de dicha variable respecto a una distribución de probabilidad
condicional.
𝑒 −𝛼 𝛼 𝑥
𝑃 𝑋=𝑥 = 𝑥 = 0,1,2,3 …
𝑥!
Media: 𝐸 𝑋 =𝛼
Varianza: 𝑉 𝑋 = 𝛼
DISTRIBUCION DE POISSON
La variable x así definida es una V.A.D. distribuida como Poisson Con la función de
probabilidad dada anteriormente.
Casos:
- Número de manchas por metro cuadrado de cierto objeto. Son eventos discretos
porque se puede encontrar 0,1,2 ó muchas más manchas en un metro cuadrado.
El metro cuadrado es la unidad de medida y es un intervalo continuo porque tiene
infinitos puntos.
- El número de vehículos que llegan a una estación de servicio durante una hora en
un día determinado. Los eventos son 0, 1, 2,.... vehículos. El intervalo continuo es
1 hora.
DISTRIBUCION NORMAL
Definición .- Sea X una v.a. continua con media μ y variancia ²,luego esta variable se
distribuye como variable Normal si tiene la siguiente función de densidad:
Características:
1. La curva f(x) es de forma acampanada y tiene asíntotas al eje de las abscisas.
2. Es simétrica respecto a la recta vertical X=μ
3. Presenta una relación entre media "μ" y desviación estandar σ
Si μ=1 , σ²=1; entonces la variable tiene una distribución normal
estandar.
TEOREMA DEL LIMITE CENTRAL
El teorema describe la distribución de la media de una muestra aleatoria proveniente
de una población con varianza finita.
Cuando el tamaño de la muestra es lo suficientemente grande, la distribución de las
medias sigue aproximadamente una distribución normal.
El teorema se aplica independientemente de la forma de la distribución de la
población. Muchos procedimientos estadísticos comunes requieren que los datos
sean aproximadamente normales.
La importancia de este teorema es que nada se dice de la forma de distribución de
f(x). Cualquiera que sea la distribución con variancia finita, la media muestral tendrá
una distribución cercana a la normal cuando la muestra sea grande.
DISTRIBUCIÓN DE WEIBULL
Propiedades de la distribución
1.Si tomamos β = 1 tenemos una distribución Exponencial.
𝒙−𝜷
𝒙−𝜷 ∓ 𝜶
𝒆(∓ 𝜶 − 𝒆 )
𝒇 𝑿 =
𝜶
El signo negativo es usado para valores máximos y el positivo para valores mínimos
DISTRIBUCIÓN DE GUMBEL
Haciendo el cambio de variable a y
𝑥−𝛽
𝑦=
𝛼
La función de densidad quedaría
∓𝒚
𝒇 𝒚 = 𝒆(∓𝒚 − 𝒆 )
−𝒆𝒚
𝑭 𝒚 =𝟏−𝒆
DISTRIBUCIÓN DE GUMBEL
Los parámetros Alfa uy Beta de la distribución, estimados a través del método de
momentos quedan expresados en función de la desviación estándar y media
muestral:
𝑠
𝛼=
1.283 𝛽 = 𝑋ത − 0.45𝑠
DISTRIBUCIÓN DE FRECHET
La distribución de Fréchet es un caso especial de la distribución de valores
extremos generalizada. Su función de distribución es
−𝛼
𝐹 𝑥 = 𝑒 −𝑥 ,𝑥 > 0
Donde α>0 es el parámetro de forma. Puede generalizarse para incluir
un parámetro de localización m y escala s>0 quedando entonces de la
forma
𝑥−𝑚 −𝛼
−( )
𝐹 𝑥 =𝑒 𝑠 , 𝑠𝑖 𝑥 > 𝑚
Cuando α tiende a infinito la función de Frechet tiende hacia la de Gumbel.
La función de frechet produce un ajuste con un crecimiento mucho más rápido en
función del tiempo comparado al modelo de Gumbel
En la hidrología, se utiliza la distribución de Fréchet para analizar variables aleatorias
como valores máximos de la precipitación y la descarga de ríos,2 y además para
describir épocas de sequía.
DISTRIBUCIÓN DE FRECHET