PROBABILIDAD Y ESTADÍSTICA
UNIDAD I:
Calcula y aplica las medidas de tendencia central en el conjunto de datos ( no
agrupados y agrupados ) extraídos de una población o muestra para reconocer su
comportamiento en situaciones reales.
Unidad II:
Calcula y aplica las medidas de dispersión o variabilidad en el conjunto de datos (
no agrupados y agrupados ) extraidos de una población o muestra para reconocer
su comportamiento y la comparación entre ella, en situaciones reales.
Unidad III:
Aplica conceptos y leyes de la probabilidad para la toma de decisiones, cuando
prevalecen condiciones de incertidumbre, en el contexto de la resolución de
problemas de diversas áreas del conocimiento.
UNIDAD I:
Calcula y aplica las medidas de tendencia central en el conjunto de datos ( no
agrupados y agrupados ) extraídos de una población o muestra para reconocer su
comportamiento en situaciones reales.
2.1 Generalidades.
2.2 Rango.
2.3 Cuantiles.
2.4 Desviación Media .
2.5 Desviación Estándar.
2.6 Varianza.
2.7 Coeficiente de variación de Pearson.
UNIDAD III:
Aplica conceptos y leyes de la probabilidad para la toma de decisiones, cuando
prevalecen condiciones de incertidumbre, en el contexto de la resolución de
problemas de diversas áreas del conocimiento.
3.1 Probabilidad.
3.2 Evento.
3.3 Espacio muestral.
3.4 Eventos : mutuamente excluyentes, independientes y dependientes.
3.5 Conjuntos y sus operaciones.
3.6 Axiomas del cálculo de probabilidades.
3.7 Factorial.
3.8 Combinaciones.
3.9 Permutaciones.
3.10 Curva normal.
Es una ciencia que trata de la recopilación, organización, presentación, análisis e
interpretación de datos numéricos con el fin de realizar una toma de decisión más
efectiva.
Chacón: “La ciencia que tiene por objeto el estudio cuantitativo de los colectivos.”
Otros la definen como la expresión cuantitativa del conocimiento dispuesta en
forma adecuada para el escrutinio y análisis.
MUESTRA: “Se llama muestra a una parte de la población a estudiar que sirve
para representarla.” Murria R. Spiegel (1991)
VARIABLES ORDINALES
* Cuando las categorías pueden ser ordenadas según algún criterio, se utiliza la
escala ordinal para medir las variables.
* La escala ordinal exige orden entre las categorías antes de indicar cualquier
medición. Ejemplo: Gravedad de las quemaduras.
* Estas variables tampoco tienen propiedades numéricas, aunque se representen
con números.
VARIABLES CARDINALES
* Posee un nivel científico mas alto, es el de la cuantificación, y a este nivel para
medir escalas asociadas, se emplean los números cardinales, con los cuales se
pueden efectuar operaciones aritméticas.
* Se clasifican en variables discretas y variables continuas.
- Si la variable puede tomar cualesquiera de los todos los valores, teóricamente
posibles, entre dos valores dados, la variable es continua. Ejemplo: Edad
- En caso de que pueda tomar solo valores enteros se dice que la variable es
discreta. Ejemplo: Hijos de familia.
• EJERCICIO 1
• EJERCICIO 2
La teoría del muestreo es el estudio de las relaciones existente entre una población y muestras extraídas
de la misma. Permite estimar cantidades desconocidas de la población como media poblacional y varianza,
por lo regular se llama parámetros poblacionales o simplemente parámetros, Tiene gran interés en muchos
aspectos de la estadística. La teoría de muestreo es también útil para determinar si la diferencias que se
puedan observar entre dos muestras son debidas a la aleatoriedad de las mismas o si por el contrario son
solamente significativas.
En general, un estudio de inferencias, realizados sobre una población mediante muestras extraídas de la
misma, junto con las indicaciones de la exactitud de tales inferencias aplicadas a la teoría de la
probabilidad, se le conoce como inferencia estadística.
Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen
dos técnicas de muestreo estratificado:
Asignación proporcional: el tamaño de cada estrato en la muestra es proporcional a su tamaño en la
población.
Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más
variabilidad. Para ello es necesario un conocimiento previo de la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de
hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta
homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se
tomaría una muestra que contenga también esa misma proporción.
Es una descripción del numero de veces es decir de las frecuencias con que se presentan las
diversas categorías mutuamente excluyentes que corresponden a una variable.
Las distribuciones de frecuencias pueden ser:
CUANTITATIVAS
* Si las variables pertenecen a variables cardinales.
CUALITATIVAS
* Si las variables pertenecen a variable nominal u ordinal.
Cada categoría de la variable se representa por una barra, cuyo largo incluye la
frecuencia. Todas las barras deben ser igual de ancho y pueden estar espaciadas si
las variables son nominales u ordinales. Pueden ser:
• HORIZONTALES
• VERTICALES
• AGRUPADAS
• DIVIDIDAS O APILADAS
GRÁFICO DE PASTEL O CIRCULAR
Es útil para representar porcentajes. Se representan variables nominales y se construye en
una circunferencia que se divide en sectores tales que sus medidas angulares sean
proporcionales a los valores que representa.
EJEMPLO
PICTOGRAMA
Son una forma de representar la información mediante dibujos de los objetos que son
motivo de estudio, con un formato tal que de una idea rápida y visual, de la distribución
de frecuencias.
Son especialmente útiles para fines publicitarios por ser atractivos y de fácil comprensión.
EJEMPLO
GRÁFICA DE LINEAS
Un gráfico que usa puntos conectados por líneas para mostrar cómo cambia el valor de
algo (mientras pasa el tiempo o mientras algo más pasa).
EJEMPLO
OJIVAS
La ojiva es un gráfico asociado a la distribución de frecuencias, es decir, que en ella se
permite ver cuantas observaciones se encuentran por encima o debajo de ciertos valores, en
lugar de solo exhibir los números asignados a cada intervalo.
La ojiva apropiada para información que presente frecuencias mayores que el dato que se
esta comparando tendrá una pendiente negativa y en cambio la que se asigna a valores
menores, tendrá una pendiente positiva.
POLÍGONO DE FRECUENCIAS
Un polígono de frecuencias se forma uniendo los extremos de las barras de un diagrama de
barras mediante segmentos. También se puede realizar trazando los puntos que representan
las frecuencias y uniéndolos mediante segmentos.
HISTOGRAMA DE FRECUENCIAS
Un histograma es una representación gráfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. En el
eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables.
Al descubrir grupos de observaciones, con frecuencia es conveniente resumir la
información con un solo número. Este número que, para tal fin, suele situarse
hacia el centro de la distribución de datos se denomina «medidas o parámetro de
tendencia central o de centralización»
Medidas más conocidas:
a) Media aritmética
b) Mediana
c) Moda
d) Media ponderada
e) Media geométrica
f) Media armónica
Σ: sumatoria
Ƒ: frecuencia
n: número total de datos
x: marca de case
Propiedades de la media aritmética:
* *puede ser calculada en distribuciones con escala relativa.
* *todos los valores son incluidos en el cómputo de la media.
* *una serie de datos solo tiene una media
* *es una medida muy útil para comparar dos o más poblaciones.
EJEMPLO:
Planteamiento Solución
EJERCICIOS:
EJEMPLO:
EJERCICIOS:
Planteamiento ejercicio 1 Solución ejercicio 1
EJEMPLO:
El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de
producción son en (ml): 85.4, 85.3, 84.9, 85.4 y 80. ¿Cuál es la moda de las observaciones?
R= 85.4
EJEMPLO:
Planteamiento Solución
EJERCICIOS:
Planteamiento ejercicio 1 Solución ejercicio 1
EJEMPLO:
Planteamiento Solución
EJERCICIOS:
Obsérvese que la inversa de la media armónica es la media aritmética de los inversos de los
valores de la variable. No es aconsejable en distribuciones de variables con valores pequeños.
Se suele utilizar para promediar variables tales como productividades, velocidades, tiempos,
rendimientos, cambios, etc.
Ventajas e inconvenientes:
- En su cálculo intervienen todos los valores de la distribución.
- Su cálculo no tiene sentido cuando algún valor de la variable toma valor cero.
- Es única.
1.9 Cálculo de datos individuales y agrupados.
Nota :
EJERCICIOS:
Planteamiento ejercicio 1 Solución ejercicio 1
* Planteamiento solución
Al grado en que los datos numéricos tienden a extenderse alrededor de un valor medios se llama variación
o dispersión de datos.
Las medidas de dispersión más empleadas son:
*rango
*desviación media
*rango semiintercuartílico
*rango entre percentiles 10-90
*desviación típica.
Las medidas de dispersión también son conocidas como medidas de variabilidad, muestran la variabilidad
de una distribución, indicando por medio un número, si las diferentes puntuaciones de una variable están
muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será la media.
DECILES : Son nueve valores que dividen la serie de datos en diez partes
iguales ( D1, D2, D3, D4……. D9 )
Q1 Q2 Q3
K1 K2 K3 K4
D1 D2 D3 D4 D5 D6 D7 D8 D9
P1 P10 P20 P30 P40 P50 P60 P70 P80 P90 P99
EJERCICIO:
EJEMPLO:
Planteamiento Solución
EJERCICIOS:
Planteamiento ejercicio 1 Solución ejercicio 1
Ʃ𝒇(𝒙−𝒙෫)𝟐
S= s= desviación típica
𝑵
F: frecuencia
x: Marca de clase
: 𝐦𝐞𝐝𝐢𝐚 𝐚𝐫𝐢𝐭𝐦é𝐭𝐢𝐜𝐚
𝒙
EJEMPLO: N: número total de datos
Planteamiento Solución ejemplo
EJERCICIO:
Planteamiento ejercicio 1 Solución ejercicio 1
http://www.vitutor.com/estadistica/descriptiva/a_15.html
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que
son equivalentes a las anteriores.
Varianza para datos agrupados
Ejercicios de varianza
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Calcular la varianza de la distribución de la tabla:
xi fi xi · fi xi2 · fi
42 1 820 88 050
Coeficiente de variación de Pearson
( CVx )
Indica la relación existente entre la desviación típica de una muestra y su media.
Al dividir la desviación típica por la media se convierte en un valor excento de unidad de medida. Si comparamos la
dispersión en varios conjuntos de observaciones tendrá menor dispersión aquella que tenga menor coeficiente de
variación.
El principal inconveniente, es que al ser un coeficiente inversamente proporcional a la media aritmética, cuando está
tome valores cercanos a cero, el coeficiente tenderá a infinito.
Ejemplo: Calcula la varianza, desviación típica y la dispersión relativa de esta distribución.
Sea x el número de habitaciones que tienen los 8 pisos que forman un bloque de vecinos
X ni
2 2
3 2
5 1
6 3
N= 8
El calculo de probabilidades es un estudio teórico aplicable en situaciones azarosas o
aleatorias.
La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de
resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados
posibles, bajo condiciones suficientemente estables.
El estudio científico de la probabilidad es un desarrollo moderno, los juegos de azar (dados,
cartas, ruletas) muestran que ha habido un interés en cuantificar las ideas de la probabilidad
durante milenios, pero las descripciones matemáticas exactas de utilidad en estos problemas
surgieron mucho después.
Probabilidad es el estudio de experimentos aleatorios o libres de determinación.
s= n° de maneras de que ocurra un suceso
𝑺
P(A)= N= n° total de maneras posibles.
𝑵
S= [1, 2, 3, 4, 5, 6]
𝟏
P(A)=
𝟔
La probabilidad P de u evento A se define como sigue: A puede ocurrir de s maneras entre
un total de n igualmente posibles.
Imaginemos que se lanzan una moneda y un dado
•La probabilidad de un camino es la multiplicación de sus probabilidades.
•La probabilidad de sacar una cara y un tres será ---->
•La probabilidad de un suceso cualquiera es la suma de las probabilidades de los
caminos
•La probabilidad de sacar impar será ---->
Espacio Probabilístico Infinito Contable
Aquel cuyo espacio muestral es discreto infinito contable. Por ejemplo
NOTACIÓN:
A los conjuntos se les representa con las letras mayúsculas A,B,C y a los elementos con letras
minúsculas a,b,c….
En base a la cantidad de elementos que tengan un conjunto, estos se pueden clasificar en
conjuntos finitos e infinitos.
Finitos: tienen un número conocido de elementos, es decir, se encuentran determinados por
su longitud o cantidad. El conjunto de días de la semana.
Infinitos: son aquellos con los cuales no podemos determinar su longitud. El conjunto de los
números reales.
UNIÓN DE CONJUNTOS: sea A y B dos subconjuntos cualesquiera del conjunto universal: la unión de A
y B, es el conjunto de todos los elementos que perteneces a A o pertenecen a B.
* AUB= {x|XEA o XEB}
* A={1, 2, 3, 4, 5}
* B={1, 2, 6, 7}
* AUB= [1, 2, 3, 4, 5, 6, 7]
Primer axioma:
La probabilidad de un suceso A es un numero real entre 0 y 1.
Segundo axioma:
Un suceso de la muestra de todos los sucesos o espacio muestral ocurre con probabilidad 1.
Es decir la probabilidad del espacio muestral es igual a 1
Tercer axioma:
Si A1, A2… son sucesos mutuamente excluyentes (incompatibles dos a dos, disjuntos o de
intersección vacía dos a dos), entonces:
Según este axioma se puede calcular la probabilidad de un suceso compuesto de varias
alternativas mutuamente excluyentes sumando las probabilidades de sus componentes.
Ejemplo
Lanzar un dado, y calcular la probabilidad del evento sale un numero cualesquiera.
Es el producto de los “n” factores consecutivos desde “n” hasta 1. El factorial de
un número se denota por n!.
Vamos a usar letras para los sabores: {b, c, l, f, v}. Algunos ejemplos son
• {c, c, c} (3 de chocolate)
• {b, l, v} (uno de banana, uno de limón y uno de vainilla)
• {b, v, v} (uno de banana, dos de vainilla)
(Y para dejarlo claro: hay n=5 cosas para elegir, y eliges r=3 de ellas.
El orden no importa, ¡y sí puedes repetir!)
Bien, no puedo decirte directamente cómo se calcula, pero te voy a enseñar una
técnica especial para que lo averigües tú mismo.
Ejemplo
Entonces, nuestro ejemplo de bolas de billar (ahora sin orden) es:
16! = 16! = 20,922,789,888,000 = 560
3!(16-3)! 3!×13! 6×6,227,020,800
O lo puedes hacer así:
16×15×14 = 3360 = 560
3×2×1 6
Así que recuerda, haz las permutaciones, después reduce entre "r!"
... o mejor todavía...
¡Recuerda la fórmula!
Es interesante darse cuenta de que la fórmula es bonita y simétrica:
Con otras palabras, elegir 3 bolas de 16 da las mismas combinaciones que elegir
13 bolas de 16.
16! = 16! = 16! = 560
3!(16-3)! 13!(16-13)! 3!×13!
Una permutación es una combinación en donde el orden es importante. La
notación para permutaciones es P(n,r) que es la cantidad de permutaciones de “n”
elementos si solamente se seleccionan “r”.
Ejemplo: Si nueve estudiantes toman un examen y todos obtienen diferente
calificación, cualquier alumno podría alcanzar la calificación más alta. La segunda
calificación más alta podría ser obtenida por uno de los 8 restantes. La tercera
calificación podría ser obtenida por uno de los 7 restantes.
La cantidad de permutaciones posibles sería: P(9,3) = 9*8*7 = 504 combinaciones
posibles de las tres calificaciones más altas.
Normalmente usamos la palabra "combinación" descuidadamente, sin pensar en si el orden
de las cosas es importante. En otras palabras:
"Mi ensalada de frutas es una combinación de manzanas, uvas y bananas": no
importa en qué orden pusimos las frutas, podría ser "bananas, uvas y manzanas" o "uvas,
manzanas y bananas", es la misma ensalada.
"La combinación de la cerradura es 472": ahora sí importa el orden. "724" no
funcionaría, ni "247". Tiene que ser exactamente 4-7-2.
Así que en matemáticas usamos un lenguaje más preciso:
Si el orden no importa, es una combinación.
Si el orden sí importa es una permutación.
¡Así que lo de arriba se podría llamar "cerradura de permutación"!
* Con otras palabras:
* Una permutación es una combinación ordenada.
Hay dos tipos de permutaciones:
Se permite repetir: como la cerradura de arriba, podría ser "333".
Sin repetición: por ejemplo los tres primeros en una carrera. No puedes quedar primero y
segundo a la vez.
Son las más fáciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las
permutaciones posibles son:
n × n × ... (r veces) = nr
(Porque hay n posibilidades para la primera elección, DESPUÉS hay n posibilidades
para la segunda elección, y así.)
Por ejemplo en la cerradura de arriba, hay 10 números para elegir (0,1,...,9) y
eliges 3 de ellos:
10 × 10 × ... (3 veces) = 103 = 1000 permutaciones
Así que la fórmula es simplemente:
nr
donde n es el número de cosas que puedes elegir, y eliges r de ellas
(Se puede repetir, el orden importa)
En este caso, se reduce el número de opciones en cada paso.
Por ejemplo, ¿cómo podrías ordenar 16 bolas de billar?
Después de elegir por ejemplo la "14" no puedes elegirla otra vez.
(n+r-1)!
C ( n, r ) = P ( n, r ) = n^r
r !( n - 1 ) !
COMBINACIONES VS PERMUTACIONES
( Sin repetición ) ( Sin repetición )
n! n!
C ( n, r ) = P ( n, r ) =
( n - r ) !r ! (n-r)!
La curva normal puede utilizarse para describir distribuciones de puntajes, para interpretar la desviación
estándar y para hacer un informe de probabilidades. Veremos que la curva normal es un ingrediente
esencial en la toma de decisiones en estadística, por medio de la cual el investigador social generaliza sus
resultados de muestras a poblaciones.