Contenido
Estadística
Rama de las matemáticas que se encarga de recopilar, organizar, y procesar datos con el fin de inferir las
características de la población objetivo
Información recopilada a través de los datos recabados.
Población: Población
Conjunto de todos los posibles elementos sujeto que intervienen en un
experimento o en un estudio Muestra
Muestra
Un conjunto de medidas u observaciones tomadas a partir de una población
dada. Es un subconjunto de la población.
Tipos o clases de Estadística:
•Descriptiva
•Inferencial
Estadística Descriptiva
Es la técnica que se va a encargar de la recopilación, presentación, tratamiento y análisis de los datos, con el objetivo
de resumir, describir las características de un conjunto de datos y por lo general toman forma de tablas y gráficas.
Estadística Inferencial:
Técnica mediante la cual se sacan conclusiones o generalizaciones acerca de parámetros de una población basándose
en el estadígrafo o estadígrafos de una muestra de población
Parámetro:
Son las caracteristicas medibles en una poblacion completa. Se le asigna un simbolo representado por una letra
griega
Estadístico
Es la medida de una característica relativa a una muestra. La mayoria de los estadísticos muestrales se encuentran
por medio de una formula y suelen asignarseles nombres simbolicos que son letras latinas
Cuantitativa
Utiliza la recoleccion de datos para probar hipótesis y responder a preguntas de investigacion. Confía en la medición
numerica
Cualitativa
Se utiliza para descubrir y refinar preguntas de investigacion y tiene un enfoque mas holístico
Medicion
Atraves de este se obtienen los datos . Es el proceso por el cual asignamos una categoria (o un valor) a una variable,
para determinada unidad de analisis
Escala nominal
Son variables numericas cuyos valores representan una categoria o identifican un grupo de pertenencia. Este tipo de
catiables solo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La
asignacion de los valores se realiza en forma aleatoria por lo que no cuenta con un orden lógico
Escala ordinal
Son variables numericaas cuyos valores representan una categoria o identifican un grupo de pertenencia contando
con un orden lógico. Este tipo de variable nos permite establecer relaciones de igualdad/desigualdad y a su vez
podemos identificar si una categoria es mayor o menor que otra
Escala de intervalo
Son variables numericas cuyos valores representan magnitudes y la distancia entre los numeros de su escala es igual.
Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de
sus valores y medir la distancia existente entre cada valor de la escala. Las variables de intervalo carecen de un cero
absoluto, por lo que operaciones como la multiplicacion y la division no son realizables
Escala de razón
Las variables de razon poseen las mismas caracteristicas de las variables de intervalo con la diferencia que cuentan
con un cero absoluto, es decir el valor cero representa la ausencia total de medida, por lo que se puede realizar
cualqueir operación aritmetica. Este tipo de variable permite el nivel mas alto de medicion
MEDIDAS DE POSICIÓN
Las medidas de posicion dividen un conjunto de datos en grupos con elmismo numero de individuos. Los datos deben
estar ordenados de menor a mayor. Son: Cuartiles, Deciles y Percentiles
Cuartil: Son los 3 valores de la variable que dividen a un conjunto de datos en 4 partes iguales
Deciles: Son los 9 valores que dividen la serie de datos en 10 partes iguales
Percentiles: Son los 99 valores que deviden la serie de datos en 100 partes iguales
MEDIDAS DE DISPERSION
Nos informan sobre cuanto se alejan del centro los valores de la distribucion son:
•Rango o recorrido: Es la diferencia entre el mayor y el menor de los datos de una distribucion estadistica
•Desviacion Media. Diferencia entre cada valor de la variable estadistica y la media aritemetica
•Desviacion media para datos agrupados
•Varianza
•Desviacion típica
Prueba de hipótesis
Procedimiento basado en la evidencia muestral y la teoria de probabilidad, se emplea para determinar si la hipotesis
es una afirmacion razonable. Se realiza en 5 pasos:
Mapa Conceptual
Representa de modo gráfico las relaciones existentes entre conceptos ayudandonos a comprender mejor el contenido
del texto.
Se establecen las relaciones entre los conceptos centrales del texto, y se marcan las palabras clave. Nos permite tener
todas las ideas centrales de un texto a la vista
MEDIDAS DE PUNTO
Son aquellas que se trabajan con los atributos o categorias de las variables cualitativas con el objeto de sacar
proporciones razones o porcentajes que representan estos atributos o categorias en una muestra o poblacion. Es una
proporcion de la categoria. Solo se usa con la cariable cualitativa.
Ejercicio
Estas medidas se trabajan según como esten agrupados los datos, para lo cual las dividemos en 3 categorias.
a. Seres simples (S.S.)
b.Distribución simple de frecuencias (DSF)
c.Datos Agrupados (DA)
Los datos se trabaja como series simples si se manejan menos de 30 si el rango de datos esta entre 30 y 59 se manejara
la distribucion simple de frecuencias y si el numero de datos es mayor o igual a 60 se agruparan los datos
Media
Es una medida de tendencia central que tiene las características siguientes:
a. Es única, esto quiere decir que en una distribucion de datos existe unicamente una media
b.Se ve afectada por valores extremos, ya sea muy alto o muy bajo, esto quiere decir que valores muy altos o muy bajos
pueden variar significativamente el valor de la media
= ∑ observaciones/n
Donde: = Media, ∑= Sumatoria y n= cantidad de datos observados
Si la media viene de una muestra donde “n” es del tamaño de la muestra el símbolo que la representará es:
Si la media viene de una población, donde “N” es el tamaño de la muestra el símbolo que le representará es:
µ
EJEMPLO1
MEDIA EN DISTRIBUCION SIMPLE DE FRECUENCIAS (DSF)
EJEMPLO2
MEDIA EN DATOS AGRUPADOS
Para calcular la media en datos agrupados se necesita calcular las marcas de clase, las cuales se determinan
promediando el limite inferior del intervalo con el limite superior, luego las frecuencias se multiplican por cada una
de las marcas, estos resultados se suman y se dividen dentro del numero de observaciones (tamaño de muestra o
población)
n= Muestra N= Población
Marcas de clase: (Xi= Lim inf + Lim Sup)/2
Estadístico = De Muestra
Parámetro= De Población
EJEMPLO3
MEDIANA
Mediana en Series Simples (S.S.) La mediana es una medida de tendencia central que divide a la distribución en dos
partes iguales
Características:
a.) Unicidad (es única)
b.) No es afectada por sus valores extremos
EJEMPLO4
MEDIANA EN DATOS AGRUPADOS
Límites reales
Los límites reales o verdaderos de una clase son aquéllos que se obtienen restándole media unidad de medida al
límite aparente inferior de una clase y sumándole media unidad de medida al límite superior aparente de las
diferentes clases, es decir, son valores no observables de la variable en estudio, puesto que no lo registra la unidad
utilizada.
MODA EN SERIES SIMPLE (S.S.)
La moda consiste en el dato que mayor frecuencia tiene en una distribucion y tiene las siguientes
caracteristicas:
a)No existe unicidad, pues puede haber mas de 1 moda, si una distribucion tiene 2 modas es llamada
bimodal, si tiene mas de 2 es llamada multimodal
b)El valor de la moda no se ve afectada por valores extremos
Para calcular la media en series simples, se ordenan estos (datos) y se calcula su frecuencia, la
frecuencia mayor nos dará la pauta para elegir el valor modal
EJEMPLO6
MODA EN DISTRIBUCION SIMPLE DE FRECUENCIA
El valor de la moda es el dato que tiene mayor frecuencia
EJEMPLO7
MODA EN DA
Para calcular la moda en D.A. utilizamos la formula siguiente:
Moda = LRi + (A1/(A1+A2))i
Donde:
LRi: Limite Real inferior
A1: Frecuencia Modal – f anterior
A2: frecuencia modal – f posterior
i: Amplitud del intervalo
EJEMPLO8
ARREGLO DE DATOS AGRUPADOS
Para el arreglo de datos agrupados se utilizara la regla de Strugers la cual permitira agrupar datos en
intervalos
Cuartil:
Divide la distribución en 4 partes iguales
Decil:
Divide la distribución en 10 partes iguales, por lo tanto hay que 9 deciles
Percentil:
Divide la distribucion en 100 partes iguales
Q2 = D5 = P50 Mediana
Q2= Cuartil 2
D5= Decil 5
P50= Percentil 50
EJEMPLO9
EJEMPLO9
EJEMPLO9
FORMULAS PARA ENCONTRAR LA POSICION
EJEMPLO 11
EJEMPLO13
DESVIACION ESTANDAR EN DISTRIBUCION SIMPLE DE FRECUENCIAS
EJEMPLO14
DESVIACION ESTANDAR EN DATOS AGRUPADOS
EJEMPLO15
PROBABILIDAD
Sucesos Favorables/sucesos totales
ESPACIO MUESTRAL
Es el conjunto que contiene todo lo que puede suceder en un evento.
EJEMPLO 1
EJEMPLO 2
Describa el espacio muestral (S) de lanzar una moneda 2 veces
S{ CC, CE, EC, EE }
P(C)= ½= 0.5=50% P(E)= ½=0.5=50%
EXPERIMENTANDO (A POSTERIORI)
EVENTOS INDEPENDIENTES
Un evento es independiente si la probabilidad de que ocurra un evento anterior no incide o no alterará
de ninguna manera al evento posterior.
Los siguientes ejemplos muestran eventos independientes, pero que son a su vez mutuamente
excluyentes, tal y como es arrojar la moneda 3 veces y el de la extracción sin reemplazo hecha 3 veces
en una urna que contiene bolas amarillas y rojas.
EJEMPLO
Una urna contiene 6 bolas rojas y 3 amarillas. Se hacen 3 extracciones
sin reemplazo. Dibuje el diagrama del árbol para este experimento
RRR=5/21 AAA=11/84
RRA= 5/28 AAR= 1/14
RAA= 1/14 ARR= 5/28
RAR= 5/28 ARA= 1/14
EJEMPLO
EJEMPLO
Sean los eventos A1 y A2 y P(A1)=0.6 y P(A2)=0.40 y la P(A1ᴗA2)= 0.8 son independientes A1 y A2?
COEFICIENTE DE CORRELACION:
Describe la intensidad entre 2 conjuntos de variables. El valor de coeficiente de correlacion, puede tomar
valores desde -1 hasta 1, indicando que mientras mas cercano a 1 sea el valor del coeficiente de relacion en
cualqueir direccion, mas fuerte sera la asociacion lineal entre las 2 variables. Mientras mas cercano a 0 sea el
coeficiente de correlacion indicara que mas debil es la asiciacion entre ambas variables si es = 0, se concluirá
que no existe relacion lineal alguna entre ambas variables.
EJEMPLO16
El vicepresidente de una empresa de productos quimicos y de manufactura de fibra piensa que las
utilidades anuales dependa de lo que invierta en investigacion y desarrollo. L nuevo presidente
ejecutivo no esta de acuerdo con el y ha pedido datos. He aquí los datos correspondientes a 6 años.
El vicepresidente solicita al departamento de estadistica lo siguiente:
a.El diagrama de dispersion
b.La ecuacion de regresion
c.Las utilidades para el año 2008 si se tiene presupuestado gastar 8 millones
d.La interpretacion de la pendiente de la recta
e.Interprete el coeficiente de correlación
EJEMPLO16
EJEMPLO16
EJEMPLO16
EJEMPLO16
TABLA DE CORRELACION
RELACION TIPO DE
CORRELACION
0 No existe
0<r<=0.40 Mala
0.40<r<=0.80 Regular
0.80<r<=0.99 Buena
1 Excelente
EJEMPLO 16b
La tabla muestra las respectivas alturas x,y de una muestra de 12 padres y sus hijos primogenitos.
a.Construya un diagrama de dispersión
b.Encontrar la ecuacion de la recta
c.Determine si se trata de un caso directametne proporcional o inversamente proporcional
d.Si el padre mide 1.80m cuanto medira el hijo?
e.Que tan buena relacion existe entre las variables?
Ejemplo 16b
Ejemplo 16b
Ejemplo 16b
DISTRIBUCION NORMAL
La distribucion normal es una de las distribuciones mas importantes en toda la estadistica, ya que
gracias a ella pueden resolverse problemas relacionados por la probabilidad en cualquier situacion
desde el punto de vista economico, de ingenieria, administrativo, medico, etc. Las siguientes son
algunas de las caracteristicas mas importantes de la distribucion normal:
1.Es simetrica respecto a su media µ, la curva hacia cualquiera de los lados de µ es una imagen de
espejo de la del otro lado.
2.La media, mediana y moda son iguales
3.El area total bajo la curva sobre el eje de las x´s es una unidad de area, esta caracteristica se deduce
del hecho de que la distribucion normal es una distribucion de probabilidad, debido a la simetri aya
mencionada, el 50% del area esta a la derecha de la perpendicular que va a la derecha y el otro 50%
esta a la izquierda
4.Si se levantan perpendiculares a una distancia de una desviacion estandar desde la media hacia
ambos lados, el area delimitada por esas perpendiculares, el eje de la x y la curva sera de un 68% del
area total, aproximadamente. Si los limites laterales se extienden a 2 desviaciones estandar en ambos
lados de la media estara incluida aproximadamente el 95% del area, y extendiendolos a una distancia
de 3 desviaciones estandar, aproximadamente el 99% del area total estara englobada (abarcada
La formula de la distribución normal, fue publicada por Abraham de Moure el 12 de noviembre de
1733, la formula es:
f(x)= [(1/√2ᴨ σ)]e-(x-µ)^2/2 σ^2
Para encontrar z: Buscar en la tabla el 1.4 (para el caso anterior), y en las columnas 0.03 asi se
encuentra el 1.43 y el numero encontrado es el área tras esa línea.
Ejemplos
Ejemplos
Ejemplos
Ejemplos
PROBLEMAS DONDE SE APLICA LA DISTRIBUCION NORMAL
La media de los pesos de 500 estudiantes de un colegio es 151 lbs. Y la desviacion tipica es de 15 libras.
Suponiendo que los pesos se distribuyen normalmente. Hallar cuantos estudiantes pesan:
Entre 120-155 lbs
Z= 120-151 = -2.07
15
Z= 155-151 = 0.27
15
Y ahora se hace el procedimiento normal:
Z= 0.27= 0.6064
Z= -2.07= 0.0192 (-)
0.5872 Este es el area dentro de -2.07 y 0.27
Ensayo de Bernoulli
No. 2: La probabilidad de éxito se denota por la letra “P” y la probabilidad de fracaso es “q”. Esto
quiere decir que q= 1-p
La distribucion biomial analiza toda variable aleatoria asociada con valores discretos, binomial quiere
decir dos resultados, solo se nos puede dar 2 posibles mutuamente excluyentes, por ejemplo: Vida y
muerte, el genero femenino y masculino
Los ensayos independientes no quiere decir que no importa el 1er. Resultado ya que el situiente no
afecta el siguiente ensayo
Ejemplo
Se dice que el 29% de adultos en USA beben licor regularmente. Encuentre las probabilidades
asociadas a este fenómeno
ppp= 0.0244
ppq= 0.0597
pqp= 0.0597
pqq= 0.1462
qpp= 0.0597
qqp= 0.1462
qqq= 0.3579
1.000
x= Cantidad de personas que beben
p= 0.29
c. p(x>=2)
p(x>=2)= p(x=2)+p(x=3)
p(x>=2)= 0.1791+0.0244
p(x>=2)= 0.2035
p= (x=x)= nCxpxqn-x
Esta disribucion discreta es llamada asi en honor del matematico frances Denis Poisson quien tiene
amplio reconocimiento por la publicacion de un trabajo en 1837.
La distribucion se explica de la siguiente forma:
Si x es el numero de ocurrencias de algun evento aleatorio en un intervalo de espacio o tiempo (o
algun volumen de materia), la probabilidad de que x ocurra es dada por:
F(x)= e- ƛ ƛx
x!
x= 0,1,2…
e es la constante 2.7183
Proceso de Poisson
Los siguientes puntos describen el proceso de Poisson
No. 3 La probabilidad de una sola ocurrencia del evento de un intervalo dado es proporcional a la
dimension del intervalo
Una caracteristica es que la media y la varianza son iguales. La distrinucion de Pisson se emplea
cuando cuentan los eventos distribuidos al azar en espacio o tiempo.
Ejemplo
El administrador de un hospital analiza los casos varios de urgencia durante un periodo de varios años
y concluyo que se distributen de acuerdo a la ley de posson. Los rgistros del hospital revelan que los
casos de urgencia del hospital revelan que los casos de urgencia promedian 3 por dia durante ese
periodo. Si el administrador tiene razon respecto a la distribucion de poisson, calcular la (p) de:
c.f(x=3)+f(x=4)
(2.7183)^-3*3^3 + (2.7183)^-3*3^4 = 0.22+0.1680= 0.388
3! 4!
DISTRIBUCION HIPERGEOMETRICA
Propiedaes
n N
r
N-r
Definicion: N, n, r, S:
f(x)=
ANEXO
http://www.fileden.com/files/2012/11/10/3365433/TABLAS%20PARA%20NUMEROS%20ALEATORIOS
%20BINOMIAL%2C%20POISSON%2C%20HIPERGEOMETRICA.pdf