Notas de clase de Estadística

NOTAS DE CLASE
Docente
Jorge Mario Martı́nez Conde
Universidad de Córdoba
Facultad de Ciencias Básicas
Departamento de Matemática y Estadı́stica
Programa de Estadı́stica
Monterı́a 2015
Bioestadı́stica Jorge Mario Martı́nez
Contenido
1. Introducción a la Estadı́stica 3
1.1. Conceptos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. División de la Estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Tipos de Variables Estadı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1. Variable Cualitativa: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2. Variable Cuantitativa: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.3. Escalas de Medición: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Formas de Presentación y Organización de la Información . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.1. Datos no Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.2. Datos Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4. Presentación Mediante Graficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.1. Gráfico de Barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.2. Gráfico de Circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.3. Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.4. Polı́gono de Frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.5. Ojiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.6. Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2. Estadı́stica Descriptiva 11
2.1. Medidas de tendencia Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.1. Media Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.2. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2. Medidas de Dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.1. Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.3. Desviación Estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.4. Coeficiente de Variación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3. Medidas de Posición no Centrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.1. Cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.2. Deciles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.3. Percentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4. Medidas de Forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.1. Asimetrı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.2. Curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3. Probabilidad 17
3.1. Conceptos de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.1.1. Espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.1.2. Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.3. Intersección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.4. Unión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.5. Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.6. Diferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2. Conteo de puntos de la muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.1. Principio multiplicativo o Regla del producto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.2. Variaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2.3. Técnicas de Conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2.4. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2.5. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.3. Definición de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.4. Probabilidad Marginal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.5. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.6. Eventos Estadisticamente Independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.7. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1
4. Analisis Regresión 26
4.1. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.2. Coeficiente de Correlación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3. Coeficiente de Determinación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.4. Regresion Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5. Inferencia Estadı́stica 29
5.1. Una Sola Muestra: Estimación de la media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.1.1. Intervalo de Confianza de µ con σ 2 Conocida ó n grande (n ≥ 30) . . . . . . . . . . . . . . . . 29
2
1. Introducción a la Estadı́stica
La estadı́stica se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar
los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrı́nseca de los mismos; ası́ como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
Las aplicaciones más importantes en el campo de la estadı́stica se relacionan con:
Recolección de datos.
Registro y presentación de la información.
Formulación de modelos.
Pruebas de hipótesis.
Diseños de experimentos.
Cuando los datos que se analizan proceden de las ciencias biológicas o médicas, se utiliza el termino Bioestadı́stica
para diferenciar esta aplicación particular de las herramientas y conceptos de la estadı́stica general.
1.1. Conceptos Básicos
Población: Una población es el conjunto de todos los elementos a los que se somete a un estudio estadı́stico
Individuo: Un individuo o unidad estadı́stica es cada uno de los elementos que componen la población.
Muestra: Una muestra es un conjunto representativo de la población de referencia, el número de individuos de
una muestra es menor que el de la población.
Muestreo: El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y
representativa de la población.
Dato: Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadı́stico. Si lanzamos una
moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
Variable Estadı́stica: Una variable estadı́stica es cada una de las caracterı́sticas o cualidades que poseen los
individuos de una población.
1.1.1. División de la Estadı́stica
La estadı́stica se divide en dos grandes ramas de estudio: Estadı́stica descriptiva y Estadı́stica inferencial.
Estadı́stica descriptiva: La estadı́stica descriptiva se encarga de la recolección, clasificación y descripción de
datos muestrales o poblacionales, para su interpretación y análisis, que resumen y presentan la información
contenida en ellos.
Estadı́stica inferencial: La inferencia estadı́stica es el conjunto de métodos y técnicas que permiten inducir, a
partir de la información empı́rica proporcionada por una muestra, cual es el comportamiento de una determinada
población con un riesgo de error medible en términos de probabilidad.
1.2. Tipos de Variables Estadı́sticas
1.2.1. Variable Cualitativa:
Son aquellas que describen cualidades de los elementos, pueden ser Nominal u Ordinal.
Nominal: Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de
orden. Ej: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo, el tipo
de sangre, cuyas modalidades o categorı́as son: O, A, B, AB; estado civil, tipo de religión, raza.
Ordinal: Son las que, aunque sus modalidades son de tipo no numérica, es posible establecer un orden entre
ellas. Ej: La nota en un examen: Insuficiente, aprobado, notable, sobresaliente.
3
1.2.2. Variable Cuantitativa:
Son las que tienen por modalidades cantidades numéricas con las que podemos hacer operaciones aritméticas. Dentro
de este tipo de variables podemos distinguir dos grupos:Las discretas o continuas.
Discreta: Resultan de conteos y el resultado es un número entero, es decir no admite valores intermedios entre
dos valores especı́ficos. Ej: El número de hijos posibles 0, 1, 2, 3, . . .
Continua: Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Ej:
podemos obtener la altura de 4 mujeres medidas en cm: 1,50, 1,51, 1,52, 1,53, . . ..
1.2.3. Escalas de Medición:
La medición hace referencia a la asignación de números a las caracterı́sticas objeto de estudio.

Escala de Intervalos: La escala de intervalos es una escala más especializada que la nominal y la ordinal, en
el sentido de que no solo es posible ordenar las mediciones, sino que también se conoce la distancia entre las
observaciones cualesquiera. Aquı́ no hay un punto cero único. Ej: la escala en la que se mide la temperatura; no
es posible decir que 30◦ es doble de frió que 60◦ , ya que depende de la escala (grados Celsius o Fahrenheit).
Otros ejemplos son pérdida auditiva en decibeles y coeficiente intelectual en puntaje.
Escala de Razón: Es el nivel más alto de las escalas de mediciones y se caracteriza por el hecho de que se
puede determinar tanto la igualdad de razones como la de intervalos. Existe un punto cero único. Por ejemplo:
altura, peso, longitud, velocidad, área, volumen.
1.3. Formas de Presentación y Organización de la Información
Existen dos formas básicas para la representación de la información recolectada, a través de tablas o cuadros estadı́sti-
cos y a través de un gráfico. Una tabla o cuadro estadı́stico es una representación en forma ordenada de la variación
de un fenómeno, clasificado bajo uno o más variables. Puede ser simple (clasificación bajo una variable) o compuesto
(clasificación bajo dos o más variables).
Ejemplo 1. Una encuesta realizada a 12 fumadores para determinar el número de cigarrillos que encienden (fuman)
en un dı́a corriente arrojó los siguientes resultados:
3 7 5 10
5 8 10 8
5 3 10 5
Sea X : el número de cigarrillos que encienden un fumador, Tipo de variable: Cuantitativa discreta.
Ejemplo 2. Los siguientes datos corresponden a un muestreo de ruido ambiental del nivel de presión sonora, medida
en decibeles en diferentes estaciones de la ciudad de Monterı́a durante el dı́a
63.7 75.0 74.1 69.4 64.6

66.9 76.3 73.7 76.5 60.5
66.8 75.0 71.0 57.3 65.1
Sea X : el ruido ambiental del nivel de presión sonora,Tipo de variable: Cuantitativa continua.
Ejemplo 3. Distribución de frecuencias para el número de vehı́culos que llegan a un taller automotor en un dı́a dado
Frec. Frec. Abs. Frec. Rel

Valor Frec. Rel.
Abs. Acum. Acum.
de ci hi
fi Fi Fi
3 3 0.100 3 0.100
4 4 0.133 7 0.233
5 7 0.233 14 0.467
7 2 0.067 16 0.533
8 7 0.233 23 0.767
10 5 0.167 28 0.933
12 2 0.067 30 1.000
Total 30 1 - -
4
1.3.1. Datos no Agrupados
Consideremos una población estadı́stica de n individuos, descrita según un carácter o variable c cuyas modalidades
han sido agrupadas en un número k de clases, que denotamos mediante c1 , c2 , . . . , cn . Para cada una de las clases
ci , i = 1, . . . , k, introducimos las siguientes magnitudes:
Frecuencia Absoluta: La Frecuencia absoluta de la clase ci , Corresponde a la cantidad de veces que se repite un
dato. Denotamos este valor por fi
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por n.
f1 + f2 + · · · + fn = n
Frecuencia Relativa : La frecuencia relativa de la clase ci , es el cociente entre la frecuencia absoluta fi de un

determinado valor y el número total de datos.
La frecuencia relativa se puede expresar en tantos por ciento y se representa por hi .
fi
hi =
n
La suma de las frecuencias relativas es igual a 1.
Frecuencia Absoluta Acumulada : Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales
al valor considerado. Se representa por Fi
j
X
Fi = f 1 + f 2 + . . . + f i = fj
i=1
Frecuencia Relativa Acumulada: La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de
un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
Se representa por Hi
j
X
Hi = h1 + h2 + . . . + hi = hj
i=1
Llamaremos distribución de frecuencias al conjunto de clases junto a las frecuencias correspondientes a cada una de
ellas. Una tabla estadı́stica sirve para presentar de forma ordenada las distribuciones de frecuencias. Su forma general
es la siguiente:
Ejemplo 4. Datos no agrupados
Frec. Frec. Abs. Frec. Rel

Mod ci Frec. Rel.
Abs. Acum. Acum.
hi
fi Fi Hi
f1
c1 f1 h1 = n
F1 = f 1 H 1 = h1
f2
c2 f2 h2 = n
F2 = f1 + f2 H 2 = h1 + h2
.. .. .. .. ..
. . . . .
fj
cj fj hj = n
F j = f 1 + . . . + f j H j = h1 + . . . + hj
.. .. .. .. ..
. . . . .
fn
cn fn hn = n
Fn = f1 + . . . + fn Hn = h1 + . . . + hn
Total n 1 - -
5
Ejemplo 5. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
ci fi hi Fi Hi
27 1 0.03 1 0.03
28 2 0.07 3 0.10
29 6 0.19 9 0.29
30 7 0.23 16 0.52
31 8 0.26 24 0.77
32 3 0.10 27 0.87
33 3 0.10 30 0.97
34 1 0.03 31 1
Total 31 1 - -
1.3.2. Datos Agrupados
Cuando el tamaño de la muestra es considerable o grande y los datos numéricos son muy diversos, conviene agrupar
los datos de tal manera que permita establecer patrones, tendencias o regularidades de los valores observados.
Pasos para Construir Intervalos de Frecuencia

1. Determinar la cantidad de intervalos apropiada
La selección del número adecuado de intervalos y los lı́mites entre ellos dependen del criterio o experiencia de
quien realiza el estudio. Sin embargo, existen reglas empı́ricas para calcular el número de intervalos; la más
empleada es la Regla de Sturges, cuya expresión es:
K = 1 + 3,3 Log n
Donde: K = Número de intervalos el cual siempre debe ser un número entero y n = Número de datos
2. Calcular el rango de los datos
Se obtiene de la diferencia entre el dato mayor y el dato menor. Se representa con la letra R.
R = Xmax − Xmin
3. Obtención de la amplitud que tendrá cada intervalo.
Se encuentra dividiendo el rango por el número de intervalos
R
A=
K
4. Construcción de los intervalos
Las dos caracteres mencionadas anteriormente se logran construyendo intervalos cerrados por la izquierda y
abiertos por la derecha; esto se simboliza a través del uso de corchetes y paréntesis respectivamente. Por razones
naturales, el último intervalo será cerrado por ambos extremos. El primer intervalo se construye de la siguiente
manera: Habrá de iniciar con el dato menor, el cual será el extremo inferior del intervalo; el otro extremo se
obtiene de la suma del dato menor y la amplitud, con este mismo valor iniciamos el segundo intervalo, del cual
el segundo extremo se encuentra sumando al valor anterior la amplitud y este proceso se repite sistemáticamente
hasta completar el total de intervalos indicado por la regla elegida, por ejemplo la de Sturges.
Intervalos de Clase Son los intervalos en los que se agrupan y ordenan los valores observados. Cada uno de estos
intervalos está delimitado (acotado) por dos valores extremos que les llamamos lı́mites.
6
Los valores extremos o lı́mites de intervalo Los intervalos de clase deben estar definidos por lı́mites que
permitan identificar plenamente si un dato pertenece a uno u otro intervalo. Estos lı́mites son los valores extremos de
cada intervalo.
Lı́mite Inferior: Es el valor menor de cada intervalo, se denota por Li
Lı́mite Superior: Es el número mayor de cada intervalo, se denota por Ls
También será muy útil conocer y calcular la Marca de Clase (Mc ) de cada intervalo: Se refiere al Punto Medio del
intervalo y a través de él representaremos a todo el intervalo y una de las maneras de calcularla es promediando los
valores lı́mite de cada intervalo, su fórmula es:
Li + Ls
Mc =
2
Ejemplo 6. Un grupo de investigadores pertenecientes a la secretarı́a de seguridad pública, tomó una muestra aleatoria
de las velocidades (km/h) registradas por 30 vehı́culos en el trayecto a Cerete, con el fin de establecer nuevos lı́mites
máximos de velocidad para una carretera. La muestra arrojo los datos siguientes:
90, 99, 104, 99, 119, 98, 95, 112, 95, 120, 100, 90, 116, 96, 114, 108, 98, 118, 100, 106, 114, 100, 112, 106, 100,
115, 111, 105, 114, 97
Ahora llevamos a la práctica los pasos descritos anteriormente para la construcción de los intervalos.
1. obtendremos el número de intervalos que vamos a utilizar, para lo cual empleamos la Regla de Sturges
K = 1 + 3,3 log(30) = 1 + 3,3(1,4771212547) = 1 + 4,87 = 5,87 ≈ 6
2. calculamos el rango de variación,

R = 120 − 90 = 30
3. obtenemos la amplitud de cada intervalo de clase como sigue:

30
A= =5
6
4. Los corchetes expresan que el valor extremo se incluye en el intervalo y los paréntesis dan a entender que el valor
extremo del intervalo no se incluye en el.
Li − Ls fi hi Fi Hi Mc (Xi )
[90 − 95) 2 0.07 2 0.07 92.5
[95 − 100) 8 0.27 10 0.34 97.5
[100 − 105) 5 0.17 15 0.51 102.5
[105 − 110) 4 0.13 19 0.64 107.5
[110 − 115) 6 0.20 25 0.84 112.5
[115 − 120] 5 0.16 30 1.00 117.5
Total 30 1.00
1.4. Presentación Mediante Graficos
Los gráficos son muy útiles como apoyos e incluso sustitutos de las tablas o distribuciones y como una herramienta
para el análisis de los datos, lo que los convierte en el medio más efectivo para la presentación, descripción, resumen
y análisis de la información.
Presentación de Datos: Después de la Organización de los datos y su presentación en Tablas Estadı́sticas, la

información contenida en una tabla estadı́stica también se puede presentar mediante gráficas, siendo las más comunes
para variables discretas (datos no agrupados) las de: Barras y circulares o de pastel; y para variables continuas (datos
agrupados) el histograma, polı́gono de frecuencias y ojiva. Estos gráficos no son los únicos para la presentación y
análisis de datos estadı́sticos, pero si los más comunes y utilizados.
7
1.4.1. Gráfico de Barras
Es un método gráfico que consta de dos ejes: Uno horizontal, en el que se representan los valores (Eje de los datos)
utilizando barras verticales en forma rectangular y de la misma amplitud, y un eje vertical, en el cual la frecuencia
representa la altitud que tendrá la barra rectangular (Eje de las frecuencias)
Temperaturas Maximas
8
6
Frecuencias
4
2
0
27 28 29 30 31 32 33 34
Temperaturas
1.4.2. Gráfico de Circular
Este gráfico se utiliza fundamentalmente, para representar distribuciones de frecuencias relativas (es decir, porcentajes
o proporciones)
Temperaturas Maximas
19%
23%
6%
3%
3%
10%
26%
10%
1.4.3. Histograma
Es una gráfica en forma de barras que consta de dos ejes, uno horizontal, llamado eje de la variable en observación,
en donde situamos la base de una serie de rectángulos o barras contiguas; es decir, que no van separadas, y que se
rotula con los lı́mites inferiores de cada clase o intervalo excepto el último que deberá llevar también el lı́mite superior,
centradas en la marca de clase. Y un eje vertical llamado eje de las frecuencias, en donde se miden las alturas que
vienen dadas por la frecuencia del intervalo que representa. Todos los intervalos deben tener la misma longitud.
8
Velocidades Registradas
8 10
Frecuencias
6
4
2
0
90 95 100 105 110 115 120
Km/h
1.4.4. Polı́gono de Frecuencia
Es una gráfica del tipo de las gráficas de lı́neas trazadas sobre las marcas de clase, (de ahı́ el nombre de polı́gono), y
se traza uniendo con segmentos de recta, de izquierda a derecha, las parejas ordenadas que se forman, al considerar
como abscisa la marca de clase (eje horizontal) y como ordenada la frecuencia del intervalo representado (eje vertical);
la primera y última parejas ordenadas se unen mediante un segmento de recta al eje horizontal, con las que serı́an la
marca de clase anterior y posterior respectivamente si estas existieran. Este tipo de gráfico adquiere mayor importancia
cuando se quiere mostrar en un mismo gráfico más de una distribución o una clasificación cruzada de una variable
continua con una discreta, situación que no se puede observar en uno de los gráficos presentados anteriormente por la
forma de construcción del mismo gráfico.
Velocidades Registradas Velocidades Registradas

10
8 10
8
Frecuencias
Frecuencias
6
6
4
4
2
2
0
90 95 100 110 120 1 2 3 4 5 6

Km/h Km/h
1.4.5. Ojiva
Es un gráfico que igual al histograma y polı́gono de frecuencias se utiliza para el análisis y representación de variables
continuas, sólo que en vez de utilizar las frecuencias absolutas, por sus caracterı́sticas se construye uniendo con
segmentos de recta, de izquierda a derecha, las parejas ordenadas que se forman, al considerar como abscisa los lı́mites
superiores de cada intervalo (eje horizontal) y como ordenada las frecuencias relativas acumuladas hasta cada intervalo
representado (eje vertical). Existen dos tipos de ojivas, las llamadas de mayor que, iniciando en la frecuencia más alta
1 hacia la más baja 0 y las llamadas de menor que, iniciando en la frecuencia más baja 0 hacia la más alta 1.
El gráfico ojiva representa mayor importancia cuando se trata de comparar las observaciones de una misma carac-
terı́stica en dos experimentos distintos, ya que no se puede ejecutar comparaciones sobre frecuencias absolutas, es
necesario una comparación sobre frecuencias relativa; además permite ver cuántas observaciones se hallan por arriba
o debajo de ciertos valores establecidos.
9
Velocidades Registradas
1.0
Frecuencias Relativas Acumuladas
0.8
0.6
0.4
0.2
0.0
1 2 3 4 5 6
Km/h
1.4.6. Boxplot
Una forma útil de representar la variabilidad de los datos es de manera gráfica, utilizando el diagrama de cajas o
boxplot, el cual se construye a partir de los cuartiles.
Este tipo de gráfico también llamado box and whisker plot, o simplemente boxplot, facilita la lectura sobre localización,
variabilidad, simetrı́a y presencia de datos atı́picos (outliers según la literatura estadı́stica inglesa). El boxplot consiste
en una caja y guiones con una linea a través de la caja que representa la mediana (segundo cuartil Q2 ). El extremo
inferior de la caja es el primer cuartil Q1 y el superior es el tercer cuartil Q3 . El bigote superior se extiende desde
el tercer cuartil hasta la observación más grande que es menor o igual que Q3 + 1,5x(Q3 − Q1 ). El bigote inferior se
extiende hasta la observación más pequeña que es mayor o igual que Q1 − 1,5x(Q3 − Q1 ).
Las observaciones que están por fuera de estos lı́mites se clasifican como datos atı́picos y se ubican en el diagrama.
Para construir el diagrama de caja siga los siguientes pasos:

Dibujar y marcar un eje de medida vertical (eje de coordenadas).
Construir un rectángulo cuyo borde inferior se ubica en el cuartil inferior (Q1 ) y cuyo borde superior se ubica
en el cuartil superior (Q3 ).
Dibujar un segmento de recta horizontal dentro de la caja justo en el segundo cuartil (mediana).
Prolongar una recta (el bigote) desde el extremo superior de la caja hasta la observación más grande que es
menor o igual que Q3 + 1,5x(Q3 − Q1 ).
Prolongar una recta (el otro bigote) desde el extremo inferior de la caja hasta la observación más pequeña que
es mayor o igual que Q1 − 1,5 × (Q3 − Q1 )
10
Temperaturas Maximas Temperaturas Maximas
140
100 105 110 115 120

130
120
110
100
95
90
2. Estadı́stica Descriptiva 90
Son valores que caracterizan las observaciones de un conjunto de datos. Estas medidas de resumen pueden ser de
centralidad, dispersion o variabilidad, posición y forma
2.1. Medidas de tendencia Central
Las medida de tendencia central de un conjunto de datos es la disposición de estos para agruparse al rededor del centro
o de ciertos valores numéricos.
2.1.1. Media Aritmética
Matemáticamente, la media aritmética se define como la suma de los valores observados dividida entre el número de
observaciones.
Datos no Agrupados Sean x1 , x2 . . . , xn los valo- Datos Agrupados Cuando la variable está agru-
res de una variable X, de una muestra de tamaño n. pada en una distribución de frecuencias, la media
La media aritmética x se define como: aritmética se calcula por la fórmula:
n n
x1 + x2 + . . . + xn 1X X1 f1 + X2 f2 + . . . + Xn fn 1X
x= = xi x= = Xi fi
n n i=1 n n i=1
Ejemplo 7.
31
31
32 + 31 + · · · + 29 944
X 92,5 × 2 + · · · + 117,5 × 5 3170
x=
X
= = = 30, 45 x= = = = 102,26
31 31 i=1
31 31
i=1
El promedio de las temperaturas registradas en el mes de El promedio de las velocidades registradas en el trayecto
julio fue de 30.45 ◦ C a Cerete es de 102,26Km/h
2.1.2. Mediana
La mediana es el elemento central del conjunto de datos, es una medida de posición y hay el mismo número de
observaciones a la derecha y a la izquierda del valor de la mediana.
11
Partiendo de la información bruta, ordenamos los datos ascendente o descendentemente:
Datos no Agrupados Datos Agrupados Si la información esta agrupada

en intervalos iguales, entonces la mediana se calcula
según la siguiente expresión:

X n+1 , si n es impar;
 ( 2 )

Me = X +X
n
− Fi−1
2
 ( n2 ) ( n2 +1) Me = Linf + A
, si n es par.

2 fi
Ejemplo 8. Ordenamos los datos de forma ascendente Datos agrupados

27 28 28 29 29 29 29 29 29 30 30 30 30 30 30 30 31 31 Primero buscamos el Intervalo mediano mediante n2 y
31 31 31 31 31 31 32 32 32 33 33 33 34 este valor debe ser menor o igual a algún Fi , del ejemplo
tenemos que el Im es igual a 30 2
= 15, de esta manera
Datos Impares
tenemos que
Me = 30
Datos pares Supongamos que tenemos 30 datos en el

n 30
ejercicio anterior, quitamos el ultimo dato 2
− Fi−1 2
− 10
Me = Linf + A = 100 + ∗ 5 = 105
27 28 28 29 29 29 29 29 29 30 30 30 30 30 30 30 31 31 fi 5
31 31 31 31 31 31 32 32 32 33 33 33
30 + 30
Me = = 30
2
2.1.3. Moda
Representa el valor o valores que tienen la mayor frecuencia dentro del conjunto de datos. La moda puede o no existir;
en el evento en que exista, puede no ser única, ya que una distribución puede eventualmente tener una o varias modas.
Datos no Agrupados: La moda Mo es el valor que Li Extremo inferior del intervalo modal
más se repite en una distribución de datos. f i Frecuencia absoluta del intervalo modal.
fi−1 Frecuencia absoluta del intervalo anterior al
modal.
fi+1 Frecuencia absoluta del intervalo posterior al
Datos Agrupados: Si los datos están agrupados en
modal.
intervalos iguales, entonces la Moda se calculan con:
fi − fi−1
Mo = Linf + A
(fi − fi−1 ) + (fi − fi+1 )
Ejemplo 9. Datos no Agrupados Datos Agrupados

El valor de la moda para los datos que miden la tempe- Primero calculamos el intervalo modal el cual será el que
ratura en un dia cualquiera es de tenga mayor frecuencia absoluta
En nuestro ejemplo la frecuencia absoluta con mayor fre-
Mo = 31
cuencia se encentra en el intervalo [95 − 100)
(8 − 2)
Mo = 95 + ∗ 5 = 95 + 3,33 = 98,33
(8 − 2) + (8 − 5)
2.2. Medidas de Dispersión
Permiten generar criterios sobre el grado de homogeneidad o heterogeneidad del conjunto de datos que se está anali-
zando, en relación con una medida de centralidad, o con respecto a datos entre sı́.
12
2.2.1. Rango
Diferencia entre al valor máximo y el valor mı́nimo del conjunto de datos y mide la longitud en la cual se encuentran
los datos, en general a mayor longitud mayor dispersión de los datos.
R = X(n) − X(1)
2.2.2. Varianza
La varianza de las observaciones x1 , x2 . . . , xn es, en esencia, el promedio del cuadrado de las diferencias entre cada
observación y la media del conjunto de observaciones. la varianza se denota por:
Datos no Agrupados Datos Agrupados
n n
1 X 1 X
S2 = (xi − x)2 S2 = fi (Xi − x)2
n − 1 i=1 n − 1 i=1
2 1 2 2 79,68 2 1 2 2 2290,23
S = {(27 − 30,45) + · · · + (34 − 30,45) } = = 2,66 S = {(92,5−102,26) +· · ·+(117,5−102,26) } = = 99,58
31 − 1 30 30 − 1 29
2.2.3. Desviación Estándar
La desviación tı́pica es una medida del grado de dispersión de los datos con respecto al valor promedio. Dicho de otra
manera, la desviación estándar es simplemente el promedio o variación esperada con respecto a la media aritmética.
Datos no Agrupados Datos Agrupados
v v
u n u n
u 1 X u 1 X
S=t (xi − x)2 S=t fi (Xi − x)2
n−1 i=1
n − 1 i=1
p
S= 2,66 = 1,63
De esta manera tenemos que los valores están cerca p

o alrededor del valor de la media S= 99,58 = 9,98
2.2.4. Coeficiente de Variación
Permite estimar la relación porcentual entre el valor de la media y la desviación estándar. A medida que se presenta
mayor heterogeneidad en el conjunto de datos, el valor del coeficiente de variación es mayor
S
CV = × 100 %
x
13
2.3. Medidas de Posición no Centrales
Las medidas de posición no centrales son valores que particionan la población o muestra en varios puntos, dando una
descripción más fina, puesto que dan más información del comportamiento de los datos que las medidas de tendencia
central.
Estas medidas indican que porcentaje de datos dentro de una distribución de frecuencias superan estas expresiones
(mitad, 3 partes, 5 partes, diez partes, etc) y facilitan la información sobre la serie de datos que estamos analizando.
Entre las medidas de posición más utilizadas encontramos los cuartiles, deciles y percentiles.
2.3.1. Cuartiles
Datos no Agrupados
Los cuartiles son tres valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente en cuatro
tramos iguales, en los que cada uno de ellos concentra el 25 % de las observaciones. Estos valores son denotados por
Q1 , Q2 , Q3 y se procede de la siguiente forma:
k×n
Qk = , k = 1, 2, 3
4
Datos Agrupados
k×n
Primero buscamos la clase donde se encuentra Qk = 4 , k = 1, 2, 3, en la tabla de frecuencias acumuladas
k×n
4 − Fi−1
Qk = Linf + A k = 1, 2, 3
fi
Li es el lı́mite inferior de la clase donde se encuentra el cuartil.

n es la suma de las frecuencias absolutas.
Fi−1 es la frecuencia acumulada anterior a la clase del cuartil.
A es la amplitud de la clase.
2.3.2. Deciles
Datos no Agrupados
Los deciles son nueve valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente en diez
tramos iguales, en los que cada uno de ellos concentra el 10 % de las observaciones. Estos valores son denotados por
D1 , D2 , . . . Q9 y se procede de la siguiente forma:
k×n
Dk = , k = 1, 2, . . . 9
10
Datos Agrupados
k×n
Primero buscamos la clase donde se encuentra Dk = 4 , k = 1, 2, . . . 9, en la tabla de frecuencias acumuladas
k×n
10 − Fi−1
Dk = Linf + A, k = 1, 2, . . . 9
fi
2.3.3. Percentiles
Datos no Agrupados
Los percentiles son noventa y nueve valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente
en cien tramos iguales, en los que cada uno de ellos concentra el 1 % de las observaciones. Estos valores son denotados
por P1 , P2 , . . . P99 y se procede de la siguiente forma:
14
k×n
Dk = , k = 1, 2, . . . 99
100
Datos Agrupados
k×n
Primero buscamos la clase donde se encuentra Pk = 100 , k = 1, 2, . . . 99, en la tabla de frecuencias acumuladas
k×n
100 − Fi−1
Pk = Linf + A, k = 1, 2, . . . 99
fi
De forma general se tiene que, el 100k-ésimo percentil 0 < k < 1, denotado por pk , es un valor tal que al menos el
100k % de las observaciones son menores o iguales que él y al menos el 100(1 − k) % son mayores o iguales que él.
1. Para datos no agrupados
2. Ordene los datos en forma creciente, es decir, de menor a mayor.
k×n
3. Calcule 4,10,100 , donde n es el número de datos
a) Si Qk , Dk , Pk no es entero aproxı́melo al entero siguiente y esa es la posición del percentil 100k %.
b) Si Qk , Dk , Pk es entero, el percentil 100k % se obtiene promediando las observaciones que ocupan los lugares
k×n k×n
4,10,100 y 4,10,100 + 1
Datos no Agrupados
Ejemplo 12. Ordenamos los datos de forma ascendente
27 28 28 29 29 29 29 29 29 30 30 30 30 30 30 30 31 31 31 31 31 31 31 31 32 32 32 33 33 33 34
Para los datos anteriores, se procede a calcular las medidas de posición no centrales.
Para obtener el primer Cuartil Q1 determinamos el valor de la observación que se encuentra en la posición
1×31
4 = 7, 75 ≈ 8 por tanto Q1 = 29
Para obtener el tercer Cuartil Q3 determinamos el valor de la observación que se encuentra en la posición
3×31
4 = 23,25 ≈ 23 por tanto Q3 = 31
Para obtener el valor del Percentil D4 determinamos el valor de la observación que se encuentra en la posición
4×31
10 = 12,4 ≈ 12 por tanto D4 = 30
17×31
Para obtener el Percentil P17 determinamos el valor de la observación que se encuentra en la posición 100 =
5,27 ≈ 5 por tanto P17 = 29
93×31
Para obtener el Percentil P93 determinamos el valor de la observación que se encuentra en la posición 100 =
28,83 ≈ 29 por tanto P93 = 33
Para concluir tenemos que: El Q1 = 25 % de las temperaturas medidas en un dı́a cualquiera presentan valores menores
o iguales a 29◦ c
Datos Agrupados
Ejemplo 13. Calcular par los datos agrupados los Q3 D7 P88
Li − Ls fi hi Fi Hi Mc (Xi )
[90 − 95) 2 0.07 2 0.07 92.5
[95 − 100) 8 0.27 10 0.34 97.5
[100 − 105) 5 0.17 15 0.51 102.5
[105 − 110) 4 0.13 19 0.64 107.5
[110 − 115) 6 0.20 25 0.84 112.5
[115 − 120] 5 0.16 30 1.00 117.5
Total 30 1.00
15
k×n 3×30
Cuartil - Primero buscamos la clase donde se encuentra Qk = 4 = Q3 = 4 = 22,5 ≈ 23, está clase se
encuentra acumulada en el intervalo [110 − 115)
3×n 3×30
4 − Fi−1 4 − 19 3,5
Q3 = Linf + A = Q3 = 110 + 5 = 110 + 5 = 110 + 2,917 = 112,917 ≈ 113
fi 6 6
k×n 7×30
Decil - Primero buscamos la clase donde se encuentra Dk = 10 = Q7 = 10 = 21, está clase se encuentra
acumulada en el intervalo [110 − 115)
7×n 7×30
10 − Fi−1 10 − 19 2
D7 = Linf + A = Q3 = 110 + 5 = 110 + 5 = 110 + 1,667 = 111,667 ≈ 112
fi 6 6
k×n 88×30
Percentil - Primero buscamos la clase donde se encuentra Pk = 100 = Q88 = 100 = 26,4 ≈ 26 , está clase se
encuentra acumulada en el intervalo [110 − 115)
88×n 88×30
100 − Fi−1 100 − 19 7,4
P88 = Linf + A = P88 = 110 + 5 = 110 + 5 = 110 + 6,1667 = 116,25 ≈ 116
fi 6 6
2.4. Medidas de Forma
Las medidas de forma comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de
de barras de la distribución, con una situación ideal en la que los datos se reparten en igual medida a la derecha y a
la izquierda de la media.
2.4.1. Asimetrı́a
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media
aritmética). Se dice que la asimetrı́a es a la derecha cuando la mayorı́a de los datos se encuentran por encima del valor
de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en
ambos lados de la media y se conoce como asimetrı́a a la izquierda cuando la mayor cantidad de datos se aglomeran
en los valores menores que la media.
El coeficiente de asimetrı́a más preciso es el de Fisher, que se define por:
(xi −x̄)3 ni
P
n
g1 =
s3
Si g1 > 0 la distribución será asimétrica positiva o a derecha
Si g1 = 0 la distribución es simétrica;
Si g1 < 0 la distribución será asimétrica negativa o a izquierda
Distribución Simetrica Simetrica a la derecha Simetrica a la Izquierda

0.8
0.4
0.6
0.6
0.3
Density
Density
Density
0.4
0.4
0.2
0.2
0.2
0.1
0.0
0.0
0.0
−2 0 2 4 0 1 2 3 4 5 6 −5 −4 −3 −2 −1 0
x y z
16
2.4.2. Curtosis
Con estas medidas nos estamos refiriendo al grado de apuntamiento que tiene una distribución; para determinarlo,
emplearemos el coeficiente de curtosis de Fisher.
Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por
medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una
concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).
Cuando la distribución de los datos cuenta con un coeficiente de asimetrı́a (g1 = ±0,5) y un coeficiente de Curtosis
de (g2 = ±0,5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayorı́a de los
procedimientos de la estadı́stica de inferencia se requiere que los datos se distribuyan normalmente.
(xi −x̄)4 ni
P
n
g2 =
s4
Si g2 > 0 la distribución será leptocúrtica o apuntada
Si g2 = 0 la distribución será mesocúrtica o normal
Si g2 < 0 la distribución será platicúrtica o menos apuntada que lo normal.
3. Probabilidad
3.1. Conceptos de Probabilidad
La Probabilidad es la mayor o menor posibilidad de que ocurra un determinado suceso. En otras palabras, su noción
viene de la necesidad de medir o determinar cuantitativamente la certeza o duda de que un suceso dado ocurra o no.
La teorı́a de la probabilidad surge para poder estudiar los, llamados, experimentos aleatorios. Se dice que un experi-
mento es aleatorio si puede dar lugar a varios resultados sin que se pueda predecir con certeza el resultado concreto.
Es decir, al repetir el experimento bajo condiciones similares se obtendrán resultados que, en general, serán diferentes.
Un ejemplo de un experimento aleatorio puede ser la tirada de un dado, ya que no se puede predecir el número que
aparecerán en su cara superior.
3.1.1. Espacio muestral
Al conjunto de todos los resultados posibles de un experimento aleatorio se le llama espacio muestral, que representa-
remos por el sı́mbolo S.
Por ejemplo, en el lanzamiento del dado, el espacio muestral serı́a el conjunto
S1 = (1, 2, 3, 4, 5, 6)
No siempre es posible describir el espacio muestral enumerando sus diferentes elementos. A veces se define por medio
de una condición, o regla, que han de cumplir sus elementos.
Si nos interesamos sólo en si el número es par o impar. el espacio muestral es simplemente
S2 = (par, impar)
Dependiendo del número de resultados posibles del experimento aleatorio, el espacio muestral podrá ser: finito (ej.
resultados de la tirada de un dado), infinito numerable (cuando a cada elemento del espacio se le puede hacer co-
rresponder un número entero sin lı́mite, ej. vida en años de un componente electrónico), e infinito no numerable (ej.
números reales en el intervalo 0 - 1).
Ejemplo 14. Suponga que se seleccionan tres peces de un estanque en forma aleatoria. Cada pez se clasifica como
grande (G) o pequeño (P), Describa el espacio muestral S.
S3 = (GGG, GGP, GP G, P GG, GP P, P GP, P P G, P P P )
17
3.1.2. Evento
Un evento E es un subconjunto del espacio muestral, cuyos miembros tienen un caracterı́stica en común .
Ejemplo 15. En el experimento aleatorio de lanzar un dado, al Evento compuesto E de obtener un número par le
corresponde el siguiente conjunto de puntos del espacio muestral
E = (2, 4, 6).
3.1.3. Intersección
La intersección de dos eventos E1 y E2 , denotada mediante el sı́mbolo E1 ∩ E2 , es el evento que contiene a todos los
elementos que son comunes a E1 y E2 .
Ejemplo 16. Supongan que se tienen los siguientes eventos E1 = {a, b, c} y E2 = {r, s, t}
E1 ∩ E2 = φ
Es decir no tienen elemento en común por lo tanto no pueden ocurrir ambos en forma simultanea.
3.1.4. Unión
La union de dos eventos E1 y E2 , denotada mediante el sı́mbolo E1 ∪E2 , es el evento que contiene a todos los elementos
que pertenecen a E1 A E2 o ambos.
Ejemplo 17. Supongan que se tienen los siguientes eventos E1 = {a, b, c} y E2 = {r, s, t}
E1 ∪ E2 = (a, b, c, r, s, t)
Definicion 3.1. Dos eventos E1 y E2 son Mutuamente Excluyentes o disjuntos si E1 ∩ E2 = φ; es decir, si E1

y E2 no tiene elemento en común.
3.1.5. Complemento
El complemento de un evento E con respecto a S es el subconjunto de todos los elementos de S que no están en E.
0
Denotaremos el complemento de E mediante E .
Ejemplo 18. Considere el evento E de que al lazar un dado de como resultado un 5, entonces tenemos que E = (5),
como su espacio muestral es S = (1, 2, 3, 4, 5, 6) su complemento sera:
0
E = (1, 2, 3, 4, 6).
3.1.6. Diferencia
La diferencia entre dos eventos E1 y E2 , se define como elementos que están en el evento E1 y no están en E2
Ejemplo 19. por ejemplo, si E1 = {a, b, c, d, e} y E2 = {a, e, i, o}, entonces la diferencia de dichos conjuntos es-
tará formada por todos los elementos que estén solamente en A, esto es:
E1 − E2 = (b, c, d)
Teorema 1. Propiedades
1. E ∩ φ = φ
18
2. E ∪ φ = E
0
3. E ∩ E = φ
0
4. E ∪ E = S
0
5. S = φ
0
6. φ = S
0 0
7. (E ) = E
0 0 0
8. (E1 ∩ E2 ) = E1 ∪ E2
0 0 0
9. (E1 ∪ E2 ) = E1 ∩ E2
Ejercicio 3.2. Considere el espacio muestral
S = {cobre, sodio, cinc, nitrogeno, potasio, uranio, oxigeno}
y los eventos
A = {cobre, sodio, cinc}, B = {sodio, nitrogeno, potasio} y C = {oxigeno}
Liste los elementos de los conjuntos que corresponden a los eventos siguientes:
0
A A∪C
0
(A ∩ B 0 ) ∪ C B ∩C
0 0 0
A∩B∩C (A ∪ B ) ∩ (A ∪ C)
Ejemplo 20. Se seleccionan al azar cuatro estudiantes de una clase y se clasifican en masculino y femenino,Liste los
elementos del espacio muestral S1 ; Defina el segundo espacio muestral S2 donde los elementos representan el número
de mujeres seleccionadas
S1 = {F F F F, F F F M, F F M F, F M F F, M F F F, F F M M,
F M F M, F M M F, M M M M, M M M F, M M F M,
M F M M, F M M M, M M F F, M F M F, M F F M }
S2 = {0, 1, 2, 3, 4}
3.2. Conteo de puntos de la muestra
La Combinatoria es la parte de las Matemáticas que estudia las diversas formas de realizar agrupaciones con los
elementos de un conjunto, formándolas y calculando su número. Existen distintas formas de realizar estas agrupaciones,
según se repitan los elementos o no, según se puedan tomar todos los elementos de que disponemos o no y si influye o
no el orden de colocación de los elementos.
3.2.1. Principio multiplicativo o Regla del producto
Si una operación puede suceder de n1 formas y si para cada una de estas se puede llevar a cabo una segunda operación
en n2 formas, y para cada una de las primeras dos se puede realizar una tercera operación n3 y ası́ sucesivamente,
entonces la serie de k operaciones se puede realizar en n1 × n2 ×, . . . ×, nk formas.
Ejemplo 21. Cuantos Puntos muestrales hay en el espacio muestral cuando se lanza una vez un par de dados ?:
A: (dado 1) puede caer de 6 maneras.
B: (dado 2) puede caer de 6 maneras
A y B (dado 1 y dado 2 ) sucede de 6 × 6 = 36 formas posibles
19
Ejemplo 22. ¿Cuantos almuerzos que consisten en una sopa, emparedado, postre y una bebida son posibles si podemos
seleccionar 4 sopas, 3 tipos de emparedados, 5 postres y 4 bebidas ? como n1 = 4, n2 = 3, n3 = 5, n4 = 4
n1 × n2 × n3 × n4 = 4 × 3 × 5 × 4 = 240
Diferentes maneras de elegir un almuerzo
Ejemplo 23. ¿ Cuantos almuerzos que consisten en una sopa, emparedado, postre y una bebida son posibles si podemos
seleccionar 4 sopas, 3 tipos de emparedados, 5 postres y 4 bebidas ? como n1 = 4, n2 = 3, n3 = 5, n4 = 4
n1 × n2 × n3 × n4 = 4 × 3 × 5 × 4 = 240
Diferentes maneras de elegir un almuerzo
3.2.2. Variaciones
Sea un conjunto formado por m elementos distintos. Recibe el nombre de variación de orden n de esos m elementos
(n ≤ m), a todo grupo ordenado formado por n elementos tomados de los m, de tal manera que dos grupos se con-
siderarán distintos si difieren en alguno de sus elementos o bien, si teniendo los mismos, difieren en el orden en que
están colocados. El total de esos grupos ordenados se indica por Vm,n .
Definicion 3.3. Cuando hablamos de repetición y no repetición entendamos lo siguiente si tenemos las letras A y B
y en las cuales importa el orden cuantas letras podemos formas.
con repetición (AA, AB, BA, BB), sin repetición (AB, BA) z
Definicion 3.4. El total de variaciones de orden n que pueden formarse con los m elementos de un conjunto dado
sin repetición, es:
Vm,n = m(m − 1)(m − 2) · · · (m − n + 1)
Ejemplo 24. ¿ Cuántos números de tres cifras diferentes se pueden formar con los dı́gitos que componen el número
24756?
Es importante destacar el hecho de la no repetición de los elementos en las muestras y la importancia del orden.
Aplicando la fórmula para el cálculo y efectuando los mismos obtenemos,
V5,3 = 5(4)(3) = 60
números de tres cifras
Consideremos ahora que hay repetición y que importa el orden en que estén situados los objetos dentro del grupo
Definicion 3.5. En el caso de las variaciones si los elementos se pueden repetir hasta r veces se les denomina
variaciones con repetición y se obtienen por:
Vrn = nr
Ejemplo 25. Se lanza una moneda diez veces y en todos los lanzamientos el resultado es cara, ¿Cual es la probabilidad
de este evento ? ¿ Cual es la probabilidad de que em el decimoprimero lanzamiento el resultado sea cruz ?
10
1
2
20
Ejemplo 26. ¿ Cuantos números de tres cifras se pueden formar con las nueve cifras significativas del sistema decimal?
Al tratarse de números el orden importa y además no dice nada sobre cifras distintas, luego si pueden repetirse.
Por tanto, se pueden formar 729 números:
V39 = 93 = 729
¿ Cuantas palabras distintas de 10 letras (con o sin sentido) se pueden escribir utilizando sólo las dos primeras letras
del alfabeto?
Al tratarse de palabras el orden importa y además como son palabras de 10 letras y sólo tenemos dos para formarlas,
deben repetirse. Por tanto, se pueden formar 1024 palabras.
2
V10 = 210 = 1024
3.2.3. Técnicas de Conteo
Para calcular las probabilidades de varios eventos es necesario contar el número de resultados posibles de un experi-
mento, o contar el número de resultados que son favorables a un evento dado. el proceso de conteo puede simplificarse
mediante el empleo de dos técnicas de conteos denominadas permutaciones y combinaciones.
3.2.4. Permutaciones
Una permutación es un arreglo en un orden particular, de los objetos que forman el conjunto. Por ejemplo, considere
las diferentes formas en que pueden situarse las letras a, b y c. Para la primera posición puede elegirse a cualquiera
de las tres letras; para la segunda se puede escoger a cualquiera de las dos restantes y para la tercera debe seleccionar
la letra que no utilizó. Ası́ que existen 3 × 2 × 1 = 6 maneras en las que pueden arreglarse tres letras. Importa el
Orden AB 6= BA
Definicion 3.6. El número total de permutaciones de n objetos distintos es n! y se define por:
n! = n(n − 1)(n − 2), · · · , (2)(1)
donde 0! = 1
Ejemplo 27. Cuantas palabras diferentes se pueden formas con las letras n, l, o, e; ası́ no tenga sentido
4! = 4(3)(2) = 24
nloe, nleo, nelo, neol, nole noel, lnoe, lneo, leno, leon, lone, loen, elon, elno, enlo, enol, eoln, eonl, olne, olen, oeln,
oenl, onle, onel.
Ahora supongamos que deseamos seleccionar r de esos n elementos,
Definicion 3.7. El número de permutaciones de n objetos distintos tomando r a la vez es, Sin repetición e importa
el orden
n!
Prn =
(n − r)!
Ejemplo 28. Cuantos números de tres cifras se pueden construir con los dı́gitos 1,2,3,4,5,6,7,8,9,0 si ninguno se
puede repetir
10! 10 × 9 × 8 × 7!
P310 = = = 720
(10 − 3)! 7!
números diferentes
21
Ejemplo 29. De cuantas formas puede una organización local de la sociedad Americana de Quı́mica programar a tres
conferencista para tres reuniones diferentes si todos están disponibles en cualquiera de cinco fechas posibles ?
5! 5 × 4 × 3 × 2!
P35 = = = 60
(5 − 3)! 2!
números diferentes
Definicion 3.8. El número de permutaciones distintas de n cosas de las de las que n1 son de una una clase, n2 de
una segunda clase, . . . , nk de una k− ésima clase es con repetición y se calcula con:
n!
Pnn1 ,n2 ,...,nk =
(n1 ! × n2 !×, . . . , nk !)
donde n = n1 + n2 + . . . + nr
Ejemplo 30. ¿Cuantas palabras diferentes, aun sin significado, se pueden formar con las letras de la palabra amorosos?
8 8! (8)(7)(6)(5)(4)(3!)
P1,1,3,1,2 = = = 3360
(1)(1)(3!)(1)(2!) (3!)(2!)
palabras diferentes
Ejemplo 31. ¿De cuantas formas diferentes se pueden arreglar 3 focos rojos, 4 amarillos y 2 azules en una serie de
luces navideña con 9 portalámparas ?
9 9!
P3,4,2 = = 1260
(3!)(4!)(2!)
palabras diferentes
3.2.5. Combinaciones
A cada uno de los arreglos de r elementos obtenidos de un grupo de n elementos (r ≤ n), cuya diferenciación mutua
se deba a los elementos sin importar el orden de colocación de ellos, se le denomina combinación. El número total de
combinaciones se representa por:(no importa el orden, es decir ab es igual a ba, no importa la forma es que se van a
seleccionar ):
En las combinaciones no influye el orden de colocación, dos combinaciones son la misma si contienen los mismos
elementos colocados en distinto orden.
Definicion 3.9. El número de Combinaciones de n objetos distintos tomando r a la vez sin repetición es,
n!
Crn =
(n − r)!r!
Ejemplo 32. ¿De cuantas maneras se puede escoger un comité de 4 hombres de un grupo de 8?
8! 8(7)(6)(5)(4!) 1680
C48 = = = = 70
(8 − 4)!4! (4!)(4!) 24
Ejemplo 33. ¿De cuatro quı́micos y tres fı́sicos encuentre el número de comites que se pueden formar que consistan
en dos quı́micos y un fı́sico ?
El número de formas de seleccionar a dos quı́micos es

4! 4!
C24 = = =6
(4 − 2)!2! (2!)(2!)
El número de formas de seleccionar un fı́sico de tres es

3! 3!
C13 = = =3
(3 − 1)!1! (1!)(2!)
22
Al usar la regla de multiplicación con n1 y n2 podemos formar
n1 n2 = (6)(3) = 18
comites con dos quı́micos y un fı́sico.
Ejercicios Propuestos
1. ¿De cuántas maneras se pueden colocar dos anillos diferentes en la misma mano, de modo que no estén en el
mismo dedo?
2. Al lanzar cinco dados de distintos colores ¿cuántos resultados podemos obtener?
3. Con los números 1,2,3,4,5 y 6:
a) ¿Cuántos números distintos de siete cifras
podrı́amos formar?
b) ¿Podremos numerar a los 3224564 habitantes de una ciudad con esos números?
4. Se lanzan al aire uno tras otro cinco dados equilibrados de seis caras. ¿Cuál es el número de casos posibles?
5. ¿Cuántos números de seis cifras existen que estén formados por cuatro números dos y por dos números tres?
6. Lola tiene 25 bolitas (10 rojas, 8 azules y 7 blancas) para hacerse un collar. Engarzando las 25 bolitas en un
hilo, ¿cuántos collares distintos podrá realizar?
7. ¿Cuántas palabras distintas, con o sin sentido, podremos formar con las letras de la palabra educación? ¿y con
la palabra vacaciones?
8. Un grupo de amigos formado por Raúl, Sonia, Ricardo y Carmen organizan una fiesta, acuerdan que dos de ellos
se encargarán de comprar la comida y las bebidas ¿De cuántas formas posibles puede estar compuesta la pareja
encargada de dicha misión?
9. Una fábrica de helados dispone de cinco sabores distintos (vainilla, chocolate, nata, fresa y cola) y quiere hacer
helados de dos sabores ¿Cuántos tipos de helado podrán fabricar?
10. Un grupo de amigos y amigas se encuentran y se dan un beso para saludarse. Si se han dado en total 21 besos,
¿cuántas personas habı́a?
11. En una carrera de 500 metros participan doce corredores ¿De cuántas maneras pueden adjudicarse las medallas
de oro, plata, bronce?
12. ¿De cuántas formas pueden cubrirse los cargos de presidente, vicepresidente, secretario y tesorero de un club
deportivo sabiendo que hay 14 candidatos?
3.3. Definición de Probabilidad
Para encontrar la probabilidad de un evento E, sumamos todas las probabilidades que se asignan a los puntos mues-
trales en E. Esta suma se denomina probabilidad de E y se denota con P (E)
Definicion 3.10. Sea S cualquier espacio muestral y E cualquier evento de este. se llamara función de probabilidad
sobre el espacio muestral S a P (E) si satisface los siguientes axiomas.
P (E) ≥ 0
P (S) = 1
Si, para todos los eventos E1 , E2 ,E3 . . . , E1 ∩ E2 = φ para toda i 6= j entonces P (E1 ∪ E2 ∪ · · · ), = P (E1 ) +
P (E2 ) + · · ·
Teorema 2. De estos tres axiomas podemos, fácilmente, deducir que:
P (φ) = 0
23
0 ≤ P (E) ≤ 1
0
P (E) = 1 − P (E)
Ejemplo 34. Se lanza dos veces una moneda ¿ Cual es la probabilidad de que ocurra al menos una cara ?
El espacio muestral
S3 = (CC, CS, SC, SS)
, entonces tenemos que el evento sea A la probabilidad de obtener al menos una cara A = (CC, CS, SC, SS), por lo
tanto
1 1 1 3
P (A) = ( + + ) =
4 4 4 4
Ejemplo 35. Se carga un dado de forma que sea dos veces más probable que salga un numero par que uno impar, si
E es el evento de que ocurra un número menor que 4 en un solo lanzamiento del dado, encuentre P (E)
El espacio muestral S3 = (1, 2, 3, 4, 5, 6), ahora asignamos una probabilidad de w a cada número impar y una proba-
bilidad de 2w para cada numero par, como la suma de las probabilidades debe ser igual a 1, tenemos que 9w = 1, o
w = 19 , por ello se asignan probabilidades de 19 y 29 a cada número par e impar , respectivamente
E = {1, 2, 3}
por lo tanto
1 2 1
P (E) = + +
9 9 9
Definicion 3.11. Si un evento puede ocurrir de N maneras, equiprobables y mutuamente excluyentes, de las cuales
n maneras son favorables al evento E; se define probabilidad del evento E como:
n
p(E) =
N
Ejemplo 36. Si por ejemplo, lanzamos un dado cien veces y observamos la presencia del número 2 en 16 veces, cual
es la probabilidad de que salga 2?
16
P (A) =
100
Teorema 3. Si E1 y E2 son dos eventos cualesquiera, entonces
P (E1 ∪ E2 ) = P (E1 ) + P (E2 ) − P (E1 ∩ E2 )
Ejemplo 37. Si la probabilidad de que Paula apruebe matemáticas es 2/3, y la probabilidad de que apruebe inglés es
4/9, si la probabilidad de aprobar ambos cursos es 1/4, ¿ cual es la probabilidad de que paula apruebe al menos uno
de estos cursos ?
Sea M es evento de aprobar matemáticas, E el evento de aprobar inglés, entonces tenemos que
2 4 1 31
P (M ∪ E) = + − =
3 9 4 36
Teorema 4. Si E1 y E2 son mutuamente excluyentes, entonces
P (E1 ∪ E2 ) = P (E1 ) + P (E2 )
Teorema 5. Si E1 , E2 , E3 , . . . , En , son mutuamente excluyentes, entonces
P (E1 ∪ E2 ∪ E3 , ∪ . . . , ∪En ) = P (E1 ) + P (E2 ) + · · · + P (En )
24
Ejemplo 38. ¿Cual es la probabilidad de obtener un total de siete u once cuando se lanza un par de dados?
1 1 2
P (M ∪ E) = + =
6 18 9
Teorema 6. Si E1 , E2 , E3 , . . . , En , es una partición del espacio muestral S, entonces
P (E1 ∪ E2 ∪ E3 , ∪ . . . , ∪En ) =
P (E1 ) + P (E2 ) + · · · + P (En ) = P (S) = 1
Teorema 7. Para tres eventos E1 , E2 y E3
P (E1 ∪ E2 ∪ E3 ) = P (E1 ) + P (E2 ) + P (E2 ) − P (E1 ∩ E2 )

−P (E1 ∩ E3 ) − P (E2 ∩ E3 ) + −P (E1 ∩ E2 ∩ E3 )
0
Teorema 8. Si A y A son dos eventos complementarios, entonces
0
P (A) + P (A ) = 1
Resumen de las propiedades

1. 0 ≤ P (E) ≤ 1
2. P (S) = 1
3. P (φ) = 0
4. P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
5. P (A ∪ B) = P (A) + P (B) si P (A ∩ B) = φ
6. P (A ∪ B ∪ B) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)
7. P (A0 ) = 1 − P (A)
8. Si los eventos son independientes, P (A ∩ B) = P (A)P (B)
9. P (A − B) = P (A ∩ B 0 ) = P (A) − P (A ∩ B)
3.4. Probabilidad Marginal
La probabilida marginal de un evento Ai , es igual a la suma de las probabilidades conjuntas de Ai y Bi , donde la suma
se efectúa sobre todos los eventos de Bj , para determinarla se ignoran una o más caracteristicas del espacio muestral,
de lo antrior se sigue
n
X nij
P (Ai ) =
j=1
n
Supongamos la siguiente tabla, Sea el espacio muestral la población de adultos de la ciudad, que se dividen en
los siguientes eventos disjuntos: Fumador (A1 ) y no fumador (A2 ), Hombre (B1 ) y mujer (B2 ), los eventos pueden
representarse como se muestra a continuación.
Fumadores (A1 ) No fumadores (A2 )

Hombre (B1 ) n11 n12
Mujer (B2 ) n21 n22
si queremos calcular la probabulidad de que suceda un evento en particular, como el número de personas no fumadoras
(A2 ), de esta manera tenemos
n12 + n22
P (A2 ) =
n
25
Luego si deseamos la calcular la probabilidad conjunta de los eventos A1 y B2 la cual esta dada por
nij
P (Ai ∩ Bj ) =
n
se procede a reemplazar los puntos correspondientes a la probbailidad solicitad
n21
P (A1 ∩ B2 ) =
n
Finalmente, supóngase que el interes recae en determinar la probabilidad de un evento Ai , dado que se ha ocurrido el
evento Bj , por ejemplo regresemos a la tabla, supóngase que se ha elegido aleatoriamente una mujer adulta (B2 ) ahora
bien, ¿Cual es la probabilidad de que fume? Una vez más, el argumento descasa sobre la interpretación de frecuencia
relativa. Sin embrago, una vez que el evento ”Mujer”ha ocurrido, éste reemplaza a S como el espacio muestral de
interes. Por lo tanto, la probabilidad de tener un fumador (A1 ) es el número de mujeres que fuman (n1 2) entre el
número total de estas (n1 2 + n2 2), por lo tanto
n12 + n22
P (A1 /B2 ) =
n
Esta recibe el nombre de probabilidad condicional de A1 , dada la ocurrencia de B2
3.5. Probabilidad Condicional
Sean A y B dos eventos cualesqueira que se encuentran en un espacio muestral S de manera que P (B) ≥ 0. La
probabilidad condicional de A al ocurrir el evento B, es el cociente de la probabilidad conjunta de A y B con respecto
a la probabilidad marginal de B; dada esta manera se tiene
P (A ∩ B)
P (A/B) =
P (B)
La relacion puede escribirse como un producto, lo que da como resultado la regla de multiplicación de probabi-
lidades, dada por:
P (A ∩ B) = P (B)P (A/B)
De manera general si existen n alternativas disjuntas B1 ,B2 , · · · ,Bn , la Probabilidad total de un resultado final,
por ejemplo A, esta dado por:
n
X
P (A) = P (Bi )P (A/Bi )
i=1
3.6. Eventos Estadisticamente Independientes
3.7. Teorema de Bayes
4. Analisis Regresión
4.1. Covarianza
La covarianza mide la fuerza de la relación lineal entre dos variables, Es el dato básico para determinar si existe una
dependencia entre ambas variables
La covarianza Sxy es una manera de generalizar la varianza y se define como:
26
n n
1X X
Sxy = (xi − x)(yi − y) = xi yi − nx̄ȳ
n i=1 i=1
Interpretación de la covarianza
Si Sxy > 0 Hay dependencia directa (positiva), es decir, a grandes valores de x corresponden grandes valores de
y.
Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables
estudiadas.
Si Sxy < 0 Hay dependencia inversa o negativa, es decir, a grandes valores de x corresponden pequeños valores
de y.
Si X e Y son independientes, entonces su covarianza es cero, Lo opuesto, sin embargo, generalmente no es cierto:
algunos pares de variables aleatorias tienen covarianza cero pese a que no son independientes
4.2. Coeficiente de Correlación
Es una medida estadı́stica ampliamente utilizada que mide el grado de relación lineal entre dos variables aleatorias.
Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy posible que exista relación entre
ambas variables: mientras más alto sea el alumno, mayor será su peso.
El coeficiente de Correlación rxy se define como:
P
Sxy xi yi − nx̄ȳ
rxy = =qP
Sx Sy ( x2i − nx2 )( yi2 − ny 2 )
P
Interpretación del Coeficiente de Correlación

Notemos que −1 ≤ rxy ≤ 1
Si rxy = 1 Hay una relación positiva perfecta, las dos variables se correlacionan en sentido directo
Si rxy = 0 No existe relación lineal
Si rxy = −1 Hay una relación lineal negativa perfecta, las dos variables se correlacionan en sentido inverso
Ejemplo 39. Con los datos sobre las temperaturas en dos dı́as diferentes en una ciudad, determinar el tipo de
correlación que existe entre ellas.
X 18 17 15 16 14 12 9 15 16 14 16 18
Y 13 15 14 13 9 10 8 13 12 13 10 8
Solucion
X Y X2 Y2 XY
18 13 324 169 234
17 15 289 225 255
15 14 225 196 210
16 13 256 169 208
14 9 196 81 126
12 10 144 100 120
9 8 81 64 72
15 13 225 169 195
16 12 256 144 192
14 13 196 169 182
16 10 256 100 160
18 8 324 64 144
P P P 2 P 2 P
x = 180 y = 138 x = 2772 y = 1650 xy = 2098
x̄ = 15 ȳ = 11, 5
Calculando la covarianza tenemos
Sxy = 2098 − (12)(15)(11, 5) = 28
Existe una posible dependencia positiva entre las variables sobre temperaturas en dos dias diferentes
27
Calculando el coefieciente de correlacion tenemos
28 28
rxy = p = p = 0, 416 (1)
(2772 − (12)(15)2 )(1650 − (12)(11, 5)2 ) (72)(63)
Existe una correlación lineal moderada
4.3. Coeficiente de Determinación
El coeficiente de determinación es una medida estadı́stica que indica cuál es la proporción de la variación total en la
variable dependiente (Y ), que es explicada por el modelo de regresión estimado, es decir, mide la capacidad explicativa
del modelo estimado.
R2 = 0, 17 %
El 17 % de la variabilidad de y puede atribuirse a una relación lineal con x
4.4. Regresion Lineal
Es el estudio de la relación entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de
predicción y una variable Y , llamada dependiente o variable respuesta, y Consiste en encontrar la función lineal que
sirva para modelar la relación entre ellas. presenta la siguiente notación:
Y = α + βo X + e
Estimación de la ecuación de Regresion Lineal

Consiste en determinar los valores de α y βo a partir de la muestra, es decir, encontrar los valores de α y βo con los
datos observados de la muestra. El método de estimación es el de Mı́nimos Cuadrados, mediante el cual se obtiene:
P P P
n Xi Yi − ( xi )( yi )
βo =
n Xi2 − ( x)2
P P
α = Y − βo X
Del ejemplo anterior tenemos que
(138)(2772) − (180)(2098) 4896

βo = = = 5, 67
12(2772) − (180)2 864
α = 15 − (5,67)(11,5) = −50,205
por lo tanto la ecuacion de Regresion lineal es
Y = −50,205 + 5,67X
El valor de b = 5,67 indica el incremento de la variable (Y ), en promedio, por cada centı́metro de aumento en la
variable (X).
28
5. Inferencia Estadı́stica
5.1. Una Sola Muestra: Estimación de la media
5.1.1. Intervalo de Confianza de µ con σ 2 Conocida ó n grande (n ≥ 30)
Si x̄ es la media de una muestra aleatoria de tamaño n de una población con varianza σ 2 , Conocida, un intervalo
de confianza de (1 − α)100 % para µ esta dado por:
σ σ
x̄ − Z1− α2 √ < µ < x̄ + Z1− α2 √ (2)
n n
para muestras n ≥ 30 sin importar la forma de la mayorı́a de las poblaciones, la teorı́a de muestro garantiza buenos
resultados
Ejemplo 1 Se encuentra que la concentración promedio de Zinc que se saca del agua a partir de una muestra de
mediciones de zinc en 36 sitios diferentes es 2,6 gr\ml, Encuentre un intervalo de confianza de 95 % y 99 % para la
concentración media de Zinc en le rio. Suponga que la desviación estándar de la población es de 0,3
Solución
29

Notas de clase de Estadística

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Notas de clase de Estadística

Diunggah oleh

Hak Cipta:

Format Tersedia

NOTAS DE CLASE

1.1. Conceptos Básicos

1.1.1. División de la Estadı́stica

1.2. Tipos de Variables Estadı́sticas

1.2.1. Variable Cualitativa:

1.2.2. Variable Cuantitativa:

1.2.3. Escalas de Medición:

La medición hace referencia a la asignación de números a las caracterı́sticas objeto de estudio.

1.3. Formas de Presentación y Organización de la Información

63.7 75.0 74.1 69.4 64.6

Frec. Frec. Abs. Frec. Rel

1.3.1. Datos no Agrupados

Frecuencia Relativa : La frecuencia relativa de la clase ci , es el cociente entre la frecuencia absoluta fi de un

Ejemplo 4. Datos no agrupados

Frec. Frec. Abs. Frec. Rel

1.3.2. Datos Agrupados

Pasos para Construir Intervalos de Frecuencia

3. Obtención de la amplitud que tendrá cada intervalo.

Se encuentra dividiendo el rango por el número de intervalos

K = 1 + 3,3 log(30) = 1 + 3,3(1,4771212547) = 1 + 4,87 = 5,87 ≈ 6

2. calculamos el rango de variación,

3. obtenemos la amplitud de cada intervalo de clase como sigue:

1.4. Presentación Mediante Graficos

Presentación de Datos: Después de la Organización de los datos y su presentación en Tablas Estadı́sticas, la

1.4.1. Gráfico de Barras

1.4.2. Gráfico de Circular

1.4.4. Polı́gono de Frecuencia

Velocidades Registradas Velocidades Registradas

90 95 100 110 120 1 2 3 4 5 6

Para construir el diagrama de caja siga los siguientes pasos:

Temperaturas Maximas Temperaturas Maximas

100 105 110 115 120

2.1. Medidas de tendencia Central

2.1.1. Media Aritmética

Partiendo de la información bruta, ordenamos los datos ascendente o descendentemente:

Datos no Agrupados Datos Agrupados Si la información esta agrupada

Ejemplo 8. Ordenamos los datos de forma ascendente Datos agrupados

Datos pares Supongamos que tenemos 30 datos en el

Ejemplo 9. Datos no Agrupados Datos Agrupados

2.2. Medidas de Dispersión

Datos no Agrupados Datos Agrupados

Ejemplo 10. Datos no Agrupados Datos Agrupados

2.2.3. Desviación Estándar

Datos no Agrupados Datos Agrupados

Ejemplo 11. Datos no Agrupados Datos Agrupados

De esta manera tenemos que los valores están cerca p

2.2.4. Coeficiente de Variación

2.3. Medidas de Posición no Centrales

Li es el lı́mite inferior de la clase donde se encuentra el cuartil.

2.4. Medidas de Forma

Distribución Simetrica Simetrica a la derecha Simetrica a la Izquierda

3.1. Conceptos de Probabilidad

3.1.1. Espacio muestral

S3 = (GGG, GGP, GP G, P GG, GP P, P GP, P P G, P P P )

Definicion 3.1. Dos eventos E1 y E2 son Mutuamente Excluyentes o disjuntos si E1 ∩ E2 = φ; es decir, si E1

Ejercicio 3.2. Considere el espacio muestral

S = {cobre, sodio, cinc, nitrogeno, potasio, uranio, oxigeno}

3.2. Conteo de puntos de la muestra

3.2.1. Principio multiplicativo o Regla del producto

Diferentes maneras de elegir un almuerzo

Diferentes maneras de elegir un almuerzo

Vm,n = m(m − 1)(m − 2) · · · (m − n + 1)

Aplicando la fórmula para el cálculo y efectuando los mismos obtenemos,