Anda di halaman 1dari 76

OBJETIVOS DEL MÓDULO Estadística Básica

• Conocer la definición y ramas de la Estadística

• Conocer los conceptos básicos sobre los cuales se sustenta la teoría estadística

• Identificar los tipos de variable y sus características respectivas

• Conocer la representación gráfica de variables según su tipo

• Identificarla distribución de la variable a partir de la representación gráfica

• Conocer y aplicar con las medidas de tendencia central

• Conocer y aplicar las principales medidas de dispersión y de posición


¿QUÉ ES LA ESTADÍSTICA?
• Usualmente, se asocia a la estadística con cualquier tipo de información o datos de
carácter numérico

• La Estadística desarrolla procesos que tienen como objetivo alcanzar un mayor


conocimiento de una realidad desconocida sobre la cual se desea tomar
decisiones

• Para nuestras actividades de investigación nos ayudará a controlar y analizar la


información cuantitativa para dar respuesta a diversas inquietudes que sean de
nuestro interés, como:

• ¿Los resultados registrados en los estudios brindan suficiente evidencia para


afirmar que se tendrían resultados similares si se hubiese tomado toda la
información posible (Censo)?
¿QUÉ ES LA ESTADÍSTICA?

CIENCIA Resumen/
Presentación
ENCARGADA Evaluando la
DE: confiabilidad y
riesgos asociados
a las
conclusiones

Información Análisis /
Recolección Interpreta
Cuantitativa ción
RAMAS DE LA ESTADÍSTICA

Descriptiva
Descriptiva Inferencial
• Resumen, descripción y • Proceso de extrapolación de
presentación de la resultados
información • Muestra ->población
• Paso inicial en un análisis • Estimación de intervalos y
estadístico (Análisis pruebas de hipótesis
exploratorio) • Conclusiones con sustento
• Construcción de cuadros, científico para toma de
tablas y gráficos para la decisiones en base a la
representación visual de información de la muestra
resultados
CONCEPTOS BÁSICOS

Población (𝑵=Tamaño de la Unidad elemental


población)
• Elemento o individuo que posee
• Conjunto de todas las unidades la característica que se quiere
que tienen una característica en estudiar y, por tanto, pertenece a
común que se busca estudiar. la población

• Ejemplos: • Ejemplos:
• Un lote de producción de • Una computadora i7 producida
computadoras i7 de la fábrica Z en la fábrica Z
• Conjunto de pacientes que • Un paciente recibiendo un
reciben el tratamiento médico A determinado tratamiento médico
A
CONCEPTOS BÁSICOS

Muestra (𝒏=tamaño de muestra)


•Es cualquier subconjunto de unidades elementales elegidas de una población. De
manera general, se clasifican en:

Muestras aleatorias: Muestras no aleatorias:

• Unidades seleccionadas • Unidades seleccionadas Para que una muestra


mediante algún criterio mediante criterios no sea representativa
probabilísico probabilísicos debe ser obtenida al
azar. Su tamaño y
elementos deben ser
• Permiten generalizar a la • NO permiten generalizar a seleccionados
población la poblaciòn mediante un método
de muestreo
CONCEPTOS BÁSICOS

Variable (𝑿) Observación (𝑿𝒊 )


• Factor o característica con • Es el dato registrado, producto
interés de ser medida en la de la apreciación de una
investigación característica en una unidad
• Puede tomar distintos valores elemental
entre los individuos de una
población • Ejemplos:
• 74 años, como la edad de un
• Frecuencia de uso de internet ama de casa beneficiariade
• Precio que estaría dispuesto a Qaliwarma
pagar por una cocina • Bueno, como la observación
del estado de la cocina
CONCEPTOS BÁSICOS
• Continuas: Infinitos valores posibles. Expresadas como
Variables números reales
cuantitativas • Ejm: Peso de leña usado para cocinar al mes, Precio, lectura
de humedad(%), temperatura
Se expresan en forma
numérica y tiene sentido • Discretas: Expresadas como números enteros
realizar operaciones
matemáticas con ellas • Ejm: Número de personas que comieron en el hogar

• Clasifican a la unidad elemental como poseedora de cierta


cualidad/propiedad/atributo
Variables cualitativas • Ordinales Si sus valores se pueden ordenar
(categóricas) • Ejm: Grado de satisfacción
No se expresan
numéricamente • Nominales: Si sus valores no se pueden ordenar
• Ejm: Sexo, Tenencia de auto
Representación gráfica

VARIABLES CUALITATIVAS
Representación gráfica

VARIABLES CUALITATIVAS
• Para representar gráficamente la distribución de frecuencias de una variable
cualitativa se utilizan las barras y los sectores circulares.
• Si trabajamos con variables nominales, las categorías pueden ser colocadas en
cualquier orden. En el caso de variables ordinales las categorías deberán ser
colocadas en orden

Género Nivel socioeconómico

8%

26%
55% 45%
66%

NSE B NSE C NSE D


Representación gráfica

VARIABLES CUANTITATIVAS
• Para representar gráficamente la distribución de frecuencias de una variable
cuantitativa continua se utilizan los Histogramas o Histogramas de frecuencia.
• No hay separación entre las barras ya que representan intervalos continuos

Curva de la
Distribución de la
variable “edad”
Representación gráfica

VARIABLES CUANTITATIVAS
• Para representar gráficamente la distribución de frecuencias de una variable
cuantitativa discreta se utilizan los gráficos de varas.
Representación tabular

TABLAS DE FRECUENCIAS
Representación tabular

TABLAS DE FRECUENCIAS
• Reúne las frecuencias observadas de una serie de datos o categorías de datos, las
frecuencias absolutas, frecuencias absolutas acumuladas, frecuencia relativa y
relativa acumulada.
• Nos da información sobre la distribución de la variable

Distribución de la
variable
MEDIDAS DE TENDENCIA CENTRAL

Indicadores de cómo se centralizan o agrupan los datos alrededor del centro


de la distribución

• Sirven para representar, describir y resumir la información por medio de indicadores

• Se dice que estos números son “representativos” porque resumen todas las
observaciones en un solo número e informan sobre el comportamiento general del
conjunto de datos
MEDIA ARITMÉTICA / PROMEDIO

La media aritmética o promedio de un conjunto de observaciones es igual a


la suma de sus valores entre el número de observaciones

 Todo conjunto de datos tiene un valor medio.

 Al evaluar la media se incluyen todos los valores.

 La media aritmética es el centro de gravedad o punto La media aritmética


de equilibrio de un conjunto de datos queda fuertemente
afectada por valores
 Un conjunto de valores sólo tiene una media extremos

𝒏
𝟏 𝑿𝟏 + 𝑿𝟐 + ⋯ + 𝑿𝒏
ഥ=
𝑿 ෍ 𝑿𝒊 =
𝒏 𝒏
𝒊=𝟏
MODA

La moda de un conjunto de observaciones se define como el valor o categoría


que ocurre con mayor frecuencia

 Se aplica tanto para información cualitativa como


cuantitativa

 Pueden haber varias modas No se ve afectada por


valores extremos:
 Puede no existir una moda. muy grandes o muy
pequeños

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

Moda = 8 Sin Moda


MEDIANA

Punto medio de los datos después de ordenarlos de menor a mayor, o de


mayor a menor

 La misma cantidad de valores se encuentra por arriba


de la mediana que por debajo de ella

 Es decir, el 50% de valores son menores a la mediana y


el otro 50% mayores que esta No se ve afectada por
valores extremos:
muy grandes o muy
 La mediana es única para cada conjunto de datos
pequeños

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Mediana = 5 Mediana = 5
USOS DE LAS MEDIDAS DE T. CENTRAL

Media Mediana Moda

• Cuando no hay • Cuando se desee • Cuando se desee


valores extremos conocer el valor que conocer la
ocupa posición observación más
• Cuando se tenga que central frecuente
calcular otras
medidas como la • Cuando hay valores • Cuando se trabaja
desviación estándar extremos que con variables
afectan la media cualitativas
MEDIDAS DE POSICIÓN

Cuartiles

Medidas de Posición: Indicadores de cómo se ubican o distribuyen los datos de la


muestra.

25% 25% 25% 25%


 Q1   Q2   Q3 
Observación Observación
Menor Mayor

• Primer cuartil : 25% de valores por debajo


• Segundo cuartil = Percentil 50 = Mediana
• Tercer cuartil : 75% de valores por debajo

24
DESVIACIÓN ESTÁNDAR

Mide la dispersión de los datos desde la media, es decir, la distancia media


entre los datos y el valor del promedio (media)

 Mientras mayor sea la desviación estándar (o la


varianza), mayor será la dispersión o variabilidad de
los datos respecto a la media

 Esta expresada en las mismas unidades que la


variable original Numéricamente es
igual a la raíz
cuadrada de la
ഥ )𝟐 + (𝑿𝟐 −𝑿
ഥ )𝟐 + ⋯ + (𝑿𝒏 −𝑿
ഥ )𝟐 variancia
(𝑿𝟏 −𝑿
𝑠=
𝒏−𝟏
DESVIACIÓN ESTÁNDAR
Media = 15.5
s = .9258

11 12 13 14 15 16 17 18 19 20 21
Media = 15.5
s = 3.338

11 12 13 14 15 16 17 18 19 20 21
DESVIACIÓN ESTÁNDAR
COEFICIENTE DE VARIACIÓN (CV)

Medida de dispersión relativa que se define como la división de la desviación


estándar entre la media aritmética de un conjunto de observaciones

 Se usa para comparar la dispersión de 2 o más


conjuntos de datos medidos en diferentes unidades

 Cuando se tiene un CV > 50% indica alta dispersión


de los datos y poca representatividad de la media Los valores de la
variable en análisis
debes ser positivos o
 Si el CV de tiempo de cocinado con CM es 10% y
nulos, pero no
con fogón es 30%, entonces los tiempos de cocción negativos para poder
con CM tienen menor variabilidad, son más hacer uso del CV
homogéneos que con el fogón

𝑠
𝐶𝑉 = × 100
𝑋ത
COEFICIENTE DE VARIACIÓN (CV)
Aplicaciones del CV

• El coeficiente de variación se utiliza para comparar conjuntos de datos


pertenecientes a poblaciones distintas
• El coeficiente de variación nos permite tener una medida de dispersión que
elimine las posibles distorsiones de las medias de dos o más poblaciones.

• Imaginemos por ejemplo que queremos medir el peso de los escarabajos y


el de los hipopótamos. El peso de los escarabajos se mide en gramos o
miligramos y el peso de los hipopótamos por lo general se mide en
toneladas. Si para nuestra medición convertimos el peso de los escarabajos
a toneladas para que ambas poblaciones estén en la misma escala, utilizar
la desviación estándar como medida de dispersión no sería lo adecuado.
COEFICIENTE DE VARIACIÓN (CV)
Criterios recomendados

• Hasta del 7%, es muy precisa

• Entre el 8 y el 14% significa que existe una precisión aceptable

• Entre el 15% y 20% precisión regular y por lo tanto se debe utilizar con
precaución

• Mayor del 20% indica que la estimación es poco precisa y por lo tanto se
recomienda utilizarla sólo con fines descriptivos no concluyentes
COVARIANZA
La covarianza mide la relación lineal entre dos variables. Aunque la covarianza es
similar a la correlación entre dos variables, difieren de las siguientes maneras:
• Los coeficientes de correlación están estandarizados. Por lo tanto, una relación
lineal perfecta da como resultado un coeficiente de 1. La correlación mide tanto
la fuerza como la dirección de la relación lineal entre dos variables.
• Los valores de covarianza no están estandarizados. Por consiguiente, la
covarianza puede ir desde infinito negativo hasta infinito positivo. Por lo tanto, el
valor de una relación lineal perfecta depende de los datos. Puesto que los datos
no están estandarizados, es difícil determinar la fuerza de la relación entre las
variables.

La covarianza nos indica la dirección de la relación entre las variables. Los valores de
covarianza positivos indican que los valores por encima del promedio de una variable
están asociados con los valores por encima del promedio de la otra variable y los
valores por debajo del promedio están asociados de manera similar
COVARIANZA
Nos brinda una medida de cuánto dos variables cambian
linealmente juntas
La covarianza para N valores de 2 variables X e Y se calcula
mediante la siguiente fórmula:
OBJETIVOS DEL MÓDULO Estadística Aplicada

• Comprender los fundamentos de la Inferencia estadística

• Conocer los tipos de estimación de parámetros

• Entender el significado de los intervalos de confianza y pruebas de hipótesis

• Conocer las principales dsityribuciones de probabilidad relacionadas con la


inferencia (Normal, T de Student, Chi cuadrado)

• Construir intervalos de confianza para la media, proporción y varianza

• Diferenciar los componentes y los pasos a seguir para ejecutar una prueba de
hipótesis

• Realizar pruebas de hipótesis para la media y proporción poblacional


INFERENCIA ESTADÍSTICA
ESTIMACIÓN DE PARÁMETROS
• Parámetro
• Función de todas las observaciones de una población.
• Incógnita que el investigador busca estimar
• Tiene un valor único
Ejm: Media poblacional (𝝁)

La Estimación es el proceso de aproximación de los valores de un parámetro(s) a


través de un:
• Estimador/ Estadístico
• Función que depende de las observaciones muestrales
• Su valor puede variar entre distintas muestras
Ejm:
ഥ)
Media muestral (𝑿
TIPOS DE ESTIMACIÓN

• Estimación puntual
• Estimación del valor de un parámetro por medio de un único valor
• Sería el resultado del estimador en una muestra especifica
• Inconveniente: NO es posible precisar el grado de aproximación

• Estimación por intervalos


• Estimación del parámetro mediante un conjunto de valores contenidos en un
intervalo obtenido de la información en la muestra
• Nos brinda un valor de establecido confianza de contener el verdadero valor
del parámetro
• Interpretación: “El intervalo (a;b) nos da un 95% de confianza de contener el
verdadero valor del parámetro x”-ejemplo ficticio-
ESTIMADORES – PARÁMETROS

• Media muestral 𝑿

𝒏
𝟏 𝑿𝟏 + 𝑿𝟐 + ⋯ + 𝑿𝒏

𝑿 = ෍ 𝑿𝒊 =
𝒏 𝒏
𝒊=𝟏

estima a

𝑿 𝝁
• Variancia muestral 𝒔𝟐

𝒏
𝟏 ഥ )𝟐 + (𝑿𝟐 −𝑿
(𝑿𝟏 −𝑿 ഥ )𝟐 + ⋯ + (𝑿𝒏 −𝑿
ഥ )𝟐
𝟐
𝒔 = ഥ) =
෍(𝑿𝒊 −𝑿 𝟐
𝒏−𝟏 𝒏−𝟏
𝒊=𝟏

estima a
𝒔𝟐 𝝈𝟐
ESTIMADORES – PARÁMETROS

• Proporción
• Número de unidades que poseen la característica en la muestra / el tamaño de
muestra (n)

𝒏
𝟏 𝒂𝟏 + 𝒂𝟐 + ⋯ + 𝒂𝒏
𝒑 = ෍ 𝒂𝒊 =
𝒏 𝒏
𝒊=𝟏

𝒂𝒊 = 𝟏. 𝑠𝑖 𝑙𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑎𝑙 𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎


𝒂𝒊 = 𝟎. 𝑠𝑖 𝑙𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑎𝑙 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎

Los valores de p varían en el rango de 0 a 1 si se expresan en una escala de 100, se tiene el


porcentaje (%) de unidades con la característica de interés

𝒑 estima a 𝝅
INTERVALO DE CONFIANZA
• Estimación del parámetro mediante un conjunto de valores contenidos en un
intervalo obtenido de la información en la muestra

• Da información sobre el error de la estimación

• Proporciona un grado de confianza para determinar donde se ubica el parámetro de


la población.

Intervalo de Confianza

Límite de Confianza Límite de Confianza


Inferior Superior
Estimador de la
Muestra
NIVEL DE CONFIANZA
• Expresa la probabilidad de alcanzar la precisión deseada
• Es fijado por el investigador
• Los valores típicos (pero no únicos) suelen ser: 95%, 99% y 90% de confianza
• Conocido también como coeficiente de confianza
• Su principal aplicación está en los intervalos de confianza

𝑰𝑪 𝟏−𝜶 𝟏𝟎𝟎% = 𝑷 𝑳𝑰𝑪 < 𝑷𝒂𝒓á𝒎𝒆𝒕𝒓𝒐 < 𝑳𝑺𝑪 = 𝟏 − 𝛂

• Donde:
• (1-α)x100%: Nivel de confianza
• α: Nivel de significancia (probabilidad de no alcanzar la precisión deseada)
• LIC: Límite inferior de confianza
• LSC: Límite superior de confianza
IC PARA LA MEDIA
• Lo usaremos para construir un intervalo de confianza acerca de la media de una
variable cuantitativa, por ejm: Ingreso mensual de los hogares beneficiarios, Tiempo
invertido en corte de leña.
• En el caso que realicemos inferencia con muestras aleatorias grandes (tamaño >
30unidades), consideramos 2 situaciones

Límite
• Si se conoce la variancia poblacional (𝜎 2 )
superior de
Límite inferior confianza
de confianza
𝝈 𝝈
𝑰𝑪(𝝁) 𝟏−𝜶 𝟏𝟎𝟎%
ഥ−
= 𝑿 𝒁 𝟏−𝜶ൗ𝟐
ഥ+
;𝑿 𝒁 𝟏−𝜶ൗ𝟐
𝒏 𝒏
• Si no se conoce la variancia poblacional (𝜎 2 )
𝒔 𝒔
𝑰𝑪(𝝁) ഥ−
= 𝑿 𝒁 𝜶 ; ഥ
𝑿 + 𝒁 𝟏−𝜶ൗ𝟐
• Si no se conoce la𝟏−𝜶 𝟏𝟎𝟎% poblacional (𝜎 2 )𝟏− ൗ
variancia 𝒏 𝟐 𝒏
Error estándar
del estimador
IC PARA LA MEDIA
DISTRIBUCIÓN NORMAL ESTÁNDAR (Z)

Muestras grandes
n>30: Z

DISTRIBUCIÓN NORMAL / T DE STUDENT

Muestras pequeñas
n<30: t de Student
IC PARA LA PROPORCIÓN
Lo usaremos cuando necesitemos construir un intervalo de confianza para una
proporción o porcentaje poblacional, por ejemplo: el porcentaje de hogares con cocina a
gas, fumadoras,

• p es el estimador muestral de la proporción (porcentaje) poblacional, entonces el


intervalo con (1-α)100% de confianza sería:
LIC LSC
𝒑 𝟏−𝒑 𝒑 𝟏−𝒑
𝑰𝑪(𝝅) 𝟏−𝜶 𝟏𝟎𝟎% = 𝒑−𝒁 𝟏−𝜶ൗ𝟐 ;𝒑+ 𝒁 𝟏−𝜶ൗ𝟐
𝒏 𝒏

• El valor de Z para un nivel de confianza de 95% es 1.96, entonces el intervalo en


este caso quedaría:

𝒑 𝟏−𝒑 𝒑 𝟏−𝒑
𝑰𝑪(𝝅) 𝟏−𝜶 𝟏𝟎𝟎% = 𝒑 − 𝟏. 𝟗𝟔 ; 𝒑 + 𝟏. 𝟗𝟔
𝒏 𝒏
IC PARA LA VARIANCIA
Para la construcción de un intervalo de confianza para la variancia 𝜎 2 , basado en una
muestra aleatoria de tamaño n

• s² es el estimador muestral de la variancia poblacional, entonces el intervalo con (1-


α)100% de confianza sería:

(𝒏 − 𝟏)𝒔𝟐 (𝒏 − 𝟏)𝒔𝟐
𝑰𝑪(𝝈 ) 𝟏−𝜶 𝟏𝟎𝟎% = ;
𝝌 𝟏−𝜶ൗ ,𝒏−𝟏 𝝌 𝜶ൗ ,𝒏−𝟏
𝟐 𝟐

Percentil 1-α/2 de la Percentil α/2 de la


Distribución Chi Distribución Chi
cuadrado con (n-1) cuadrado con (n-1)
grados de libertad grados de libertad

Para obtener el intervalo de confianza para la desviación estándar (σ) se debe


aplicar raíces cuadradas a los límites de confianza para la varianza
IC PARA LA VARIANCIA
DISTRIBUCIÓN CHI CUADRADO
PRUEBA DE HIPÓTESIS

Procedimiento de inferencia estadística para aceptar o rechazar una


hipótesis, basado en la evidencia muestral y la teoría de la probabilidad

• Hipótesis: Cualquier afirmación o suposición acerca de la distribución de


probabilidad de la población o del valor que puede tomar un parámetro de la
población en estudio

• La afirmación suele estar basada en alguna creencia o experiencia pasada

• Será contrastada con la evidencia que obtengamos a través de la información


contenida en la muestra.
TIPOS DE HIPÓTESIS

• Hipótesis nula / planteada: Es el supuesto que se hace respecto al valor del parámetro
en estudio que se validará con la evidencia muestral

• Ejm: Suponga que desea probar si la concentración promedio de CO es igual a


3ppm. Entonces la Hipótesis nula sería
• 𝑯𝒐 : 𝝁 = 𝟑 La hipótesis nula siempre contiene el signo igual

• Hipótesis alternativa: Es la suposición contraria, que se debe aceptar en caso la


hipótesis nula sea rechazada

• En nuestro ejemplo la hipótesis alterna, es que la media sea distinta de 3


• 𝑯𝟏 : 𝝁 ≠ 3 Prueba de hipótesis bilateral

• Si se quisiera probar si la concentración de CO es mayor que 3, la hipótesis


alterna sería:
• 𝑯𝟏 : 𝝁 > 3 Prueba de hipótesis unilateral o de una cola (derecha)
COMPONENTES Y PASOS
• Las pruebas de hipótesis comprenden 4 componentes principales:
• Hipótesis nula
• Hipótesis alternativa
• Estadístico de prueba
• Regla de decisión / Región de rechazo

• Procedimiento
• Formular hipótesis nula y alternativa
• Elegir el nivel de significación (α=0.05, α=0.1, α=0.01)
• Seleccionar la prueba estadística apropiada
• Calcular el estadístico de prueba
• Comparar el estadístico con la Región de rechazo
• Decidir la aceptación o rechazo de la Hp
• Concluir
PRUEBA DE HIPOTESIS PARA LA MEDIA
• En el caso que realicemos inferencia con muestras aleatorias grandes (tamaño >
30unidades), consideramos el siguiente estadístico
ഥ − 𝝁𝟎
𝑿
𝒁𝒄 = 𝒔 ~ 𝑁(0,1)
𝒏

Regla de decisión: Depende de Hipótesis alternante

• 𝑯 𝟏 : 𝝁 > 𝜇0 ó 𝑯 𝟏 : 𝝁 < 𝜇0 𝑺𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎 si 𝒁𝒄 > 𝒁(𝟏−𝜶)

• 𝑯𝟏 : 𝝁 ≠ 3 𝑺𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎 si 𝒁𝒄 > 𝒁(𝟏−𝜶Τ𝟐)

Si se tiene una muestra n<30, se debe utilizar la distribución T


para contrastar la hipótesis
PRUEBA DE HIPOTESIS PARA LA PROPORCION
• La proporción muestral tiene una distribución normal estándar, por lo tanto el
estadístico de prueba sería

𝒑 − 𝝅𝟎
𝒁𝒄 = ~ 𝑁(0,1)
𝝅𝟎 (𝟏 − 𝝅𝟎 )
𝒏

Regla de decisión: Depende de Hipótesis alternante

• 𝑯𝟏 : 𝜋 > 𝜋0 ó 𝑯 𝟏 : 𝜋 < 𝜋0 𝑺𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎 si 𝒁𝒄 > 𝒁(𝟏−𝜶)

• 𝑯𝟏 : 𝜋 ≠ 3 𝑺𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎 si 𝒁𝒄 > 𝒁(𝟏−𝜶Τ𝟐)


TIPOS DE ERRORES
• Cuando se establece una Hp. puede ser verdadera o falsa, mientras que nuestra
decisión puede ser aceptar Hp o rechazar Hp. Esto conduce a las siguientes
posibilidades de tomar una decisión correcta o errada

Realidad
Decisión 𝑯𝟎 es verdadera 𝑯𝟎 es falsa

Aceptación de 𝑯𝟎 Decisión correcta Error Tipo II

Rechazo de 𝐇𝟎 Error Tipo I Decisión correcta


VARIABLE ALEATORIA: DEFINICION
Una variable aleatoria es una función que asigna un valor, usualmente numérico, al
resultado de un experimento aleatorio. Por ejemplo, los posibles resultados de tirar
un dado dos veces: (1, 1), (1, 2), etc. o un número real (p.e., la temperatura máxima
medida a lo largo del día en una ciudad concreta).

Ena variable aleatoria puede tomarse como una cantidad cuyo valor no es fijo pero
puede tomar diferentes valores; la distribución de probabilidad se usa para describir
la probabilidad de que se den los diferentes valores. En términos formales una
variable aleatoria es una función definida sobre un espacio de probabilidad.

Los valores posibles de una variable aleatoria pueden representar los posibles
resultados de un experimento aún no realizado, o los posibles valores de una
cantidad cuyo valor actualmente es incierto
TIPOS DE VARIABLES ALEATORIAS
Variable Aleatoria discreta:
Una variable aleatoria es discreta si el número de valores posibles
de la variable es un número finito ó infinito numerable.
El dominio de la variable aleatoria X es el espacio muestral y el
rango es un subconjunto de números reales denotado por Rx.
En otras palabras, una variable aleatoria es discreta si su rango Rx
es un conjunto finito ó infinito numerable.
Variable Aleatoria Continua:
Valores posibles de la variable es un número infinito no numerable o
cuando el rango de X (Rx) es un intervalo de los números reales.
Ejemplo: Sea X la variable aleatoria que representa la altura de
arboles de bolaina.
FUNCION DE PROBABILIDAD
VALOR ESPERADO DE UNA VARIABLE
ALEATORIA DISCRETA

𝐸 𝑋 = 𝜇 = ෍ 𝑥𝑖 . 𝑃(𝑋 = 𝑥𝑖 )
𝑖=1

Propiedades :
1. E[k] = k ; k es constante
2. E[X ± a] = E[X] ± a ; a es constante
3. E[aX] = a E[X] ; a es constante
4. E[aX + b] = a E[X] + b ; a,b constantes
VARIANCIA DE UNA VARIABLE ALEATORIA
DISCRETA
X una v.a. discreta con función de probabilidad f(x), la variancia de X se
define por:

𝜎 2 = 𝑉 𝑥 = 𝐸 (𝑥 − 𝜇)2 = ෍ 𝑥𝑖 − 𝜇 𝑃(𝑋 = 𝑥𝑖 )
𝑖=1

𝜎 2 = 𝑉 𝑥 = 𝐸 𝑋 2 − 𝜇2
Propiedades
1. V(k) = 0
2. V(X ± a) = V[X]
3. V(aX) = a²V(X)
4. V(aX + b) = a²V(X)
k, a, b son constantes.
ESPERANZA DE UNA V.A. CONTINUA.
Definición .- Sea X una V.A. continua con función de densidad f(x), entonces
el valor esperado (media) de la V.A. X se define por:


𝜇 = 𝐸 𝑋 = න 𝑥𝑓 𝑥 𝑑𝑥
−∞

Las propiedades para la esperanza de una v.a. continua son las mismas
que para la v.a. discreta.
1. E[k] = k
2. E[X ± a] = E[X] ± a
3. E[aX] = a E[X]
4. E[aX + b] = a E[X] + b
k, a, b son constantes
VARIANCIA DE UNA VARIABLE ALEATORIA
CONTINUA
X una v.a. continua con función de densidad f(x), la variancia de X se define
por:


𝜎 2 = 𝑉 𝑥 = 𝐸 (𝑥 − 𝜇)2 = න (𝑥 − 𝜇)2 𝑓 𝑥 𝑑𝑥
−∞

Propiedades

1. V(k) = 0
2. V(X ± a) = V[X]
3. V(aX) = a²V(X)
4. V(aX + b) = a²V(X)
k, a, b son constantes.
ESPERANZA CONDICIONAL
En teoría de la probabilidad, una esperanza condicional de una variable aleatoria
(también conocido como valor esperado condicional o media condicional) es el
valor esperado de dicha variable respecto a una distribución de probabilidad
condicional.

El concepto de esperanza condicional es extremadamente importante en la teoría


de la medida de Andréi Kolmogórov -medida teórica definición de la teoría de
probabilidades. De hecho, el propio concepto de probabilidad condicional es en
realidad definida en términos de esperanza condicional. En el caso de una variable
aleatoria se define sobre un espacio de probabilidad discreto las "condiciones" se
toman sobre una partición de dicho espacio de probabilidad. Esta definición se
puede generalizar a cualquier espacio de probabilidad mediante la teoría de la
medida.
DISTRIBUCION DE POISSON
La distribución de Poisson se deduce de un proceso de Poisson o como el límite de la
distribución binomial. Una variable aleatoria X que toma valores en los enteros no
negativos tiene distribución Poisson si:

𝑒 −𝛼 𝛼 𝑥
𝑃 𝑋=𝑥 = 𝑥 = 0,1,2,3 …
𝑥!

x: Número de eventos discretos en "t" unidades de medida.


α: es el número esperado o promedio de eventos discretos en
una unidad de medida.
e: 2.71828 (base del logaritmo neperiano)

Media: 𝐸 𝑋 =𝛼
Varianza: 𝑉 𝑋 = 𝛼
DISTRIBUCION DE POISSON
La variable x así definida es una V.A.D. distribuida como Poisson Con la función de
probabilidad dada anteriormente.

Casos:
- Número de manchas por metro cuadrado de cierto objeto. Son eventos discretos
porque se puede encontrar 0,1,2 ó muchas más manchas en un metro cuadrado.
El metro cuadrado es la unidad de medida y es un intervalo continuo porque tiene
infinitos puntos.

- El número de tubérculos infectados en un lote.

- El número de vehículos que llegan a una estación de servicio durante una hora en
un día determinado. Los eventos son 0, 1, 2,.... vehículos. El intervalo continuo es
1 hora.
DISTRIBUCION NORMAL
Definición .- Sea X una v.a. continua con media μ y variancia ²,luego esta variable se
distribuye como variable Normal si tiene la siguiente función de densidad:

Características:
1. La curva f(x) es de forma acampanada y tiene asíntotas al eje de las abscisas.
2. Es simétrica respecto a la recta vertical X=μ
3. Presenta una relación entre media "μ" y desviación estandar σ
Si μ=1 , σ²=1; entonces la variable tiene una distribución normal
estandar.
TEOREMA DEL LIMITE CENTRAL
El teorema describe la distribución de la media de una muestra aleatoria proveniente
de una población con varianza finita.
Cuando el tamaño de la muestra es lo suficientemente grande, la distribución de las
medias sigue aproximadamente una distribución normal.
El teorema se aplica independientemente de la forma de la distribución de la
población. Muchos procedimientos estadísticos comunes requieren que los datos
sean aproximadamente normales.
La importancia de este teorema es que nada se dice de la forma de distribución de
f(x). Cualquiera que sea la distribución con variancia finita, la media muestral tendrá
una distribución cercana a la normal cuando la muestra sea grande.
DISTRIBUCIÓN DE WEIBULL

Se trata de un modelo continuo asociado a variables del tipo tiempo de


vida, tiempo hasta que un mecanismo falla, etc. La función de densidad de
este modelo viene dada por:

que, como vemos, depende de dos parámetros: α > 0 y β > 0, donde:


α :parámetro de escala
β : parámetro de forma (lo que proporciona una gran flexibilidad a este
modelo).
La función de distribución se obtiene por la integración de la función de
densidad y vale:
DISTRIBUCIÓN DE WEIBULL

Propiedades de la distribución
1.Si tomamos β = 1 tenemos una distribución Exponencial.

1.Su esperanza vale:

3.Su varianza vale:


DISTRIBUCIÓN DE WEIBULL
Ejm:
Se sabe que la distribución del tiempo transcurrido antes que se de un fallo
en sistema hidráulico viene dada por una Weibull con parámetros α=2 y
β=0.5.
Calcular su esperanza y varianza.
DISTRIBUCIÓN DE GUMBEL
En teoría de probabilidad y estadística la 'distribución de Gumbel (1891-1966) es
utilizada para modelar la distribución del máximo (o el mínimo), por lo que se usa
para calcular valores extremos. La aplicabilidad potencial de la distribución de
Gumbel para representar los máximos se debe a la teoría de valores extremos que
indica que es probable que sea útil si la muestra de datos tiene una distribución
normal o exponencial.

𝒙−𝜷
𝒙−𝜷 ∓ 𝜶
𝒆(∓ 𝜶 − 𝒆 )
𝒇 𝑿 =
𝜶

El signo negativo es usado para valores máximos y el positivo para valores mínimos
DISTRIBUCIÓN DE GUMBEL
Haciendo el cambio de variable a y
𝑥−𝛽
𝑦=
𝛼
La función de densidad quedaría

∓𝒚
𝒇 𝒚 = 𝒆(∓𝒚 − 𝒆 )

La función de distribución acumulada:

−𝒆𝒚
𝑭 𝒚 =𝟏−𝒆
DISTRIBUCIÓN DE GUMBEL
Los parámetros Alfa uy Beta de la distribución, estimados a través del método de
momentos quedan expresados en función de la desviación estándar y media
muestral:

𝑠
𝛼=
1.283 𝛽 = 𝑋ത − 0.45𝑠
DISTRIBUCIÓN DE FRECHET
La distribución de Fréchet es un caso especial de la distribución de valores
extremos generalizada. Su función de distribución es

−𝛼
𝐹 𝑥 = 𝑒 −𝑥 ,𝑥 > 0
Donde α>0 es el parámetro de forma. Puede generalizarse para incluir
un parámetro de localización m y escala s>0 quedando entonces de la
forma

𝑥−𝑚 −𝛼
−( )
𝐹 𝑥 =𝑒 𝑠 , 𝑠𝑖 𝑥 > 𝑚
Cuando α tiende a infinito la función de Frechet tiende hacia la de Gumbel.
La función de frechet produce un ajuste con un crecimiento mucho más rápido en
función del tiempo comparado al modelo de Gumbel
En la hidrología, se utiliza la distribución de Fréchet para analizar variables aleatorias
como valores máximos de la precipitación y la descarga de ríos,2 y además para
describir épocas de sequía.
DISTRIBUCIÓN DE FRECHET

Anda mungkin juga menyukai