La característica que se mida en las unidades valores, que son números, se pueden realizar
Ejemplo:
Variable continúa, es aquella variable cuantitativa
que puede tomar cualquier valor en el intervalo Consideremos como una población a los estudiantes
considerado, por ejemplo, salario, tiempo, peso, de educación determinando por lo menos dos
volumen, longitud, etc.. caracteres ser estudiados en dicha población;
La distinción entre variable discreta y continua es
Religión de los estudiantes
más teórica que real. Al utilizar los datos, la variable
Sexo.
siempre resulta discreta, pues toda medición se
expresa sólo en ciertas unidades realmente medibles,
por decir, metros, decímetros, centímetros. Por ORGANIZACIÓN DE DATOS.
ejemplo, es posible que una persona mida 1.6748m,
o, 1.6752m, pero para fines prácticos, redondeando a Vamos a considerar por separado los caso de datos
dos decimales, se considera sólo 1.67m., o, 1.68m cualitativos y cuantitativos.
respectivamente.
Una variable continua puede pues tomar infinitos 1.- Organización de los datos cualitativos:
valores intermedios en un intervalo dado. Para fines
prácticos los valores numéricos de las variables En este caso la agrupación de los datos es muy
continuas siempre son valores aproximados. sencilla y se hace de acuerdo a las modalidades que
presente la variable en estudio. Mediante un conteo
se determina el número de datos (también llamado
5.- MUESTREO: frecuencia) correspondiente a las diferentes
Esto no es más que el procedimiento empleado para categorías de la variable. Este procedimiento es
obtener una o más muestras de una población; el válido para cualquier cantidad de datos.
Fn=f1+f2+f3+…+fn.
Siendo X los distintos valores que puede tomar la 1,11 - 1,20 3 4 10,00% 13,30%
variable.
1,21 - 1,30 3 7 10,00% 23,30%
Siendo n el número de veces que se repite cada
1,31 - 1,40 2 9 6,60% 30,00%
valor.
Siendo f el porcentaje que la repetición de cada 1,41 - 1,50 6 15 20,00% 50,00%
17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47,
Realizar la tabla de distribución de frecuencia con los
39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
datos
4) Hallar el porcentaje del puntaje 19, sí las 7) Una fábrica de coches desea estudiar el
puntuaciones obtenidas por un grupo de en una consumo de un nuevo modelo de coche que
prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, quiere lanzar al mercado. Para ello realiza cien
15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. pruebas echando diez litros de gasolina y viendo
que distancia en kilómetros recorre el coche.
5) Calcular el porcentaje de los hoteles de 4 Los resultados de las pruebas fueron los
7,36 7,29 7,43 7,40 7,36 7,41 f) ¿Qué porcentaje representan las ampolletas que
7,35 7,31 7,26 7,37 7,28 7,37 duraron menos de 310 horas?
7,36 7,35 7,24 7,33 7,42 7,36 g) ¿Qué porcentaje representan las ampolletas que
7,39 7,35 7,45 7,36 7,42 7,40 duraron menos de 325 horas?
7,28 7,38 7,25 7,33 7,34 7,32 10) El siguiente cuadro, se refiere al contenido de
7,33 7,30 7,32 7,30 7,39 7,34 grasa (expresado en libras) de 200 frascos de
7,38 7,39 7,27 7,35 7,35 7,32 Yogur en presentación de 2.5 libras, referidos a
9) Completa la tabla de distribución de frecuencias una muestra aleatoria extraída de un lote de
con los datos correspondientes a la duración en 3.600 frascos correspondientes a la producción
horas de 80 ampolletas fabricadas por una de un mes de la compañía. Elabore la tabla de
industria distribución de frecuencia
Intervalo 0.32 0.24 0.21 0.27 0.35 0.23 0.28 0.32 0.29 0.26
xi fi fac %fi %fac 0.33 0.29 0.2 0.22 0.29 0.27 0.28 0.34 0.26 0.25
de Clases
0.29 0.25 0.24 0.24 0.25 0.23 0.25 0.21 0.25 0.22
290 - 295
0.3 0.23 0.25 0.27 0.26 0.2 0.28 0.31 0.25 0.26
295 - 300
0.18 0.31 0.24 0.25 0.25 0.27 0.17 0.21 0.23 0.28
300 - 305 0.28 0.32 0.2 0.31 0.2 0.32 0.27 0.27 0.25 0.23
305 - 310 0.22 0.23 0.23 0.31 0.27 0.23 0.24 0.26 0.36 0.27
310 - 315 0.2 0.2 0.29 0.27 0.27 0.28 0.21 0.33 0.29 0.24
315 - 320 0.19 0.27 0.21 0.28 0.26 0.27 0.31 0.27 0.25 0.25
320 - 325 0.23 0.31 0.27 0.22 0.29 0.27 0.25 0.28 0.2 0.23
325 - 330 0.19 0.25 0.26 0.28 0.24 0.3 0.24 0.16 0.16 0.27
Totales 0.24 0.27 0.27 0.2 0.23 0.27 0.29 0.29 0.26 0.29
0.34 0.33 0.21 0.27 0.24 0.31 0.28 0.2 0.25 0.26
0.24 0.29 0.25 0.26 0.25 0.21 0.24 0.22 0.26 0.29
0.23 0.24 0.26 0.26 0.24 0.28 0.25 0.27 0.3 0.29
De acuerdo con la tabla anterior, contesta las
0.22 0.28 0.23 0.23 0.22 0.29 0.24 0.25 0.25 0.25
siguientes preguntas… 0.26 0.23 0.27 0.22 0.24 0.29 0.23 0.29 0.31 0.21
0.33 0.23 0.28 0.21 0.22 0.34 0.28 0.32 0.22 0.22
a) ¿Cuántas ampolletas tuvieron una duración entre 0.26 0.36 0.32 0.25 0.25 0.25 0.27 0.27 0.28 0.2
0.24 0.27 0.22 0.27 0.24 0.23 0.3 0.17 0.31 0.26
300 y 305 horas?
b) ¿Cuántas tuvieron una duración menor que 305 11) En la elaboración de envases de plásticos,
horas? primero se elabora la preforma, para la cual se
c) ¿Cuántas tuvieron una duración menor que 320 tienen varios criterios de calidad, uno de ellos es
horas? el peso de la preforma. Para cierto envase se tiene
d) ¿Qué porcentaje representan las ampolletas que que el peso debe estar entre 28.00 ± 0.5g. A
duraron entre 310 y 315 horas? continuación, se muestran los últimos 112 datos
obtenidos mediante una carta de control para esta
variable. Elabore la tabla de distribución de 4.8 4.7 4.7 4.9 4.7 4.6 4.2 5 5.3 4.4
frecuencia. 4.8 4.5 5.1 4.7 5 4.6 5.3 4.9 5 4.5
5.1 5.3 5 5.1 5.3 4.8 5.1 5.2 4.4 5
27.72 28.39 28.21 28.19 28.02 27.92 4.6 5.1 4.9 5.3 5.1 4.9 4.4 5.1 4.7 4.7
27.96 27.94 28.04 28.05 27.81 27.74 4.9 4.6 4.6 5.1 4.5 4.4 4.7 5.2 4.6 5
27.87 27.87 27.82 28.23 27.9 27.91 5 4.2 5.2 5.3 4.1 5.3 5.1 4.6 4.8 5.6
28.02 28 27.99 28.13 28.26 28.1 4.9 4.6 4.8 5 5.1 5.3 4.7 5.2 4.7 5
27.95 27.94 27.81 27.76 27.96 27.84 4.5 5.2 5.1 5.2 4.9 5 4.8 5 5.1 4.5
28.04 28.19 27.89 28.08 28.09 28.02 4.3 5.7 4.1 4.8 5 4.6 4.9 4.9 5 5.2
28.13 27.88 28.11 28.05 28.14 28.11 5 4.5 5 4.9 5 4.5 5.3 4.5 5.3 5.3
27.94 28.19 28.1 27.78 27.63 27.93 4.9 4.4 5 5.1 5.1 4.8 5.3 4.7 5.1 4.9
27.85 27.84 28.12 28.01 27.97 27.88 4.7 4.8 5.6 4.9 5.2 4.4 4.7 4.9 4.6 5
27.97 27.9 27.87 27.94 28.01 28.13
27.89 27.88 28.06 27.91 27.91 27.95
27.95 27.91 27.93 28.07 28.13 27.93 13) En el departamento de ensamble de motores de
28.16 27.94 27.86 27.84 27.7 27.98
27.94 28.07 27.84 27.9 27.87 27.76 una planta automotriz, se tiene que una de las
27.85 27.93 28.22 27.96 27.88 28.08 partes del motor, el árbol de levas, debe tener una
27.85 28.27 27.75 27.98 27.75 27.82
longitud de 600mm (+/-) 2mm para cumplir con
28.08 28.16 28.04 28.05 27.75 27.89
27.74 28.1 28.14 27.91 27.84 28.21 las especificaciones de ingeniería.
28 28.1 28.16 28.16 Hay un problema crónico con la longitud del
árbol de levas, ya que se sale de especificaciones,
12) Con el propósito de mejorar la calidad que se
y crea un problema de reducción del rendimiento
tenía en cuanto al grosor de las láminas 5+- 0.7,
de la línea de producción y altas tasas de re
un grupo implementa un proyecto de mejora
trabajo y desperdicio. El supervisor del
siguiendo la metodología. Varios de los cambios
departamento monitorea esta característica,
implementados fueron relativos a los
durante un mes. Para esto recibe proveedor.
procedimientos empleados durante el proceso ya
Elabore la tabla de distribución de frecuencia.
y la estandarización de los mismos. Para verificar
si el plan tuvo éxito, se eligieron láminas
aleatoriamente y midiendo su grosor. Los 120
datos obtenidos durante tres días se muestran a
continuación: Elabore la tabla de distribución de
frecuencia.
601.6 602.8 598.4 598.2 600.8
599.6 602 598.6 597.2 598.2
600 600.4 598.6 599.4 597.6
599.6 600.2 598 600.6 596.8
597.6 599 602.2 601.6 599.8
599.8 600.2 602.8 603.6 600.2
600 601.8 600.4 600.8 597
600.2 602.8 599.8 596.2 600.4
597.8 602.4 598 596.8 600.4
600.8 600.4 598.2 599.4 601.2
599.4 598 599 598.4 603.6
600.4 600 604.2 600.6 599.4
602.4 598.4 600.8 600.8 596.4
603.8 600.8 598 601.6 602.4
2.- Histograma.
598.4 603.4 602.2 599.2 604.2
600.6 601.6 600.2 601 601.2
600 601.6 597.6 602.2 603.6 Los histogramas de frecuencias son gráficas que
603.4 599.4 601.4 601.2 602.2 representan un conjunto de datos que se emplean
600.4 599.8 599.8 601.8 597.6 para representar datos de una variable cuantitativa.
599 599 599.6 602 600.8
En el eje horizontal o de las abscisas se representan
los valores tomados por la variable, en el caso de que
GRAFICOS: los valores considerados sean continuos la forma de
representar los valores es mediante intervalos de un
Generalmente se parte de la información
mismo tamaño llamados clases. En el eje vertical se
representada en tablas antes de poder llevar a cabo el
representan los valores de las frecuencias de los
aspecto gráfico. La representación más
datos. Las barras que se levantan sobre la horizontal
común utilizada en la estadística descriptiva se
y hasta una altura que representa la frecuencia. Un
encuentra la siguiente:
punto importante en el manejo de la información bajo
1.- Gráfico de Barras. el uso de histogramas es el hecho de poder comparar,
bajo un proceso en control, que a medida que se
Se utiliza para representar datos cualitativos y
crecen las clase tiene aproximadamente la forma de
cuantitativos, con datos de tipo discreto. En el eje x
una campana centrada, que como veremos
se representan los datos ordenados en clases mientras
posteriormente, es la de una de las distribuciones más
que en el eje y se pueden representar frecuencias
importantes conocidas como frecuencia normal o
absolutas o relativas.
gaussiana.
También se puede realizar trazando los puntos que
representan las frecuencias y uniéndolos
mediante segmentos.
X F
61 5
64 18
67 42
70 27
73 8
10.-
1.- LA MEDIA ARITMÉTICA
152,5 3 La media aritmética. o simplemente media. de un
157,5 6 conjunto de N números (no agrupados) XI; X2; X3
162,5 12 ••• XN se denota por 𝑋̅(léase "X barra") y se define
167,5 18 por
172,5 25
177,5 17 𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑁
𝑋̅ =
𝑁
182,5 10
187,5 7
Ejemplo: La media aritmética de los números 8, 3,
192,5 4
5, 12 y 10 es.
197,5 1
Para datos agrupados si los números XI, X2, X3, ...
75 2
2.- LA MEDIANA
90 3
Otra medida de tendencia central, utilizada
PRIMERA PRÁCTICA CALIFICADA principalmente en estadística no paramétrica sino en
la posición central que ocupa en el orden de su
MEDIDAS DE TENDENCIA CENTRAL. magnitud, dividiendo la información en dos partes
Las medidas de tendencia central, llamadas así iguales, dejando igual número de datos por encima y
información, son de gran importancia en el manejo Cuando los datos no están Agrupados en
Intervalos.
Partiendo de la información, ordenamos los datos
ascendente o descendentemente: La Mediana Cuando la Información se Encuentra
se define Agrupada en Intervalos
Mediana = 𝑀𝑒 = 𝑋𝑛+1 si n es impar ó Si la información esta agrupada en intervalos iguales,
2
𝑋𝑛 +𝑋𝑛
+1
2 2
Mediana= 𝑀𝑒 = 2 Entonces la mediana.
𝑋12 + 𝑋12+1
2 2
𝑀𝑒 =
2 n / 2 Fme 1
𝑋6 +𝑋7 15+17 Xmed Li A
𝑀𝑒 = = = 16 fme
2 2
6
6.625 ( 0.22 ) 6.735 pu lg adas
40 / 2 14 6 6
6.625 ( 0.22 ) 6.7265
13
MEDIDAS DE POSICIÓN.
3.- Moda: A veces es importante conocer cuál es el Son también medidas de posición ya que, de todas
valor que más prevalece en el conjunto de datos. El maneras ocupan un lugar dentro de la información.
valor que ocurre con más frecuencia se le conoce 1 CUARTILES
como moda. La moda es la medida de tendencia Las cuartillas o cuartiles son valores posicionales que
central especialmente útil para describir mediciones dividen la información en cuatro partes iguales, el
de tipo ordinal, de intervalos y nominal. primer cuartil deja el 25% de la información por
debajo de él, y el 75% por encima, el segundo cuartil,
d1
X mod Li A al igual que la mediana, divide la información en dos
d1 d 2 ,
partes iguales, y por último el tercer cuartil deja el
La fórmula solo se usara para datos agrupados. 75% por debajo de sí, y el 25% por encima.
Gráficamente:
fmo fmo 1
d1 =
fmo fmo 1 Se necesita, entonces calcular tres cuartiles ya que
d2 =
Donde: la cuarta queda automáticamente determinada.
2.- QUINTILES
Los quintiles o quintillas dividen la información en 450 g. De una partida, representativa de los
cinco partes iguales, agrupándolas en porcentajes de mangos que recibe normalmente, se ha obtenido
20, 40, 60, y 80 por ciento, en consecuencia debemos la distribución de frecuencias siguientes:
calcular cuatro parámetros.
𝑛𝑘 Peso (gr) Num de mangos
− 𝐹𝑘−1
𝑄𝑘 = 𝐿𝐼 + [ 5 ] 𝑥𝐴 250 – 300 3
𝑓𝑘
300 – 350 10
K=1; 2; 3; 4.
350 – 400 15
400 – 450 25
Del ejercicio anterior determinar el tercer quintil k=3
450 – 500 32
40 ∗ 3
− 14 500 – 550
𝑄1 = 6.625 + [ 5
20
] 𝑥0.22 = 6.794
13
550 - 600 19
600 – 650 4
650 – 700 2
a) 64,23
K=1; 2; 3; …; 10.
b) 67,35
Determinar el primer decil.
c) 42
40 ∗ 1
−2 d) 65,32
𝑄1 = 6.185 + [ 10 ] 𝑥0.22 = 6.273
5 e) 68
3) El valor medio o central de una serie ordenada
de valores es:
16) En la elaboración de envases de plásticos, 17) Con el propósito de mejorar la calidad que se
primero se elabora la preforma, para la cual se tenía en cuanto al grosor de las láminas 5+- 0.7,
tienen varios criterios de calidad, uno de ellos es un grupo implementa un proyecto de mejora
el peso de la preforma. Para cierto envase se siguiendo la metodología. Varios de los cambios
tiene que el peso debe estar entre 28.00 ± 0.5g. implementados fueron relativos a los
A continuación, se muestran los últimos 112 procedimientos empleados durante el proceso ya
datos obtenidos mediante una carta de control y la estandarización de los mismos. Para
para esta variable. Determinar las medidas de verificar si el plan tuvo éxito, se eligieron
tendencia central. láminas aleatoriamente y midiendo su grosor.
Los 120 datos obtenidos durante tres días se
muestran a continuación: Determinar las
medidas de tendencia central.
601.6 602.8 598.4 598.2 600.8
599.6 602 598.6 597.2 598.2
4.8 4.7 4.7 4.9 4.7 4.6 4.2 5 5.3 4.4 600 600.4 598.6 599.4 597.6
4.8 4.5 5.1 4.7 5 4.6 5.3 4.9 5 4.5 599.6 600.2 598 600.6 596.8
5.1 5.3 5 5.1 5.3 4.8 5.1 5.2 4.4 5 597.6 599 602.2 601.6 599.8
4.6 5.1 4.9 5.3 5.1 4.9 4.4 5.1 4.7 4.7 599.8 600.2 602.8 603.6 600.2
4.9 4.6 4.6 5.1 4.5 4.4 4.7 5.2 4.6 5 600 601.8 600.4 600.8 597
600.2 602.8 599.8 596.2 600.4
5 4.2 5.2 5.3 4.1 5.3 5.1 4.6 4.8 5.6
597.8 602.4 598 596.8 600.4
4.9 4.6 4.8 5 5.1 5.3 4.7 5.2 4.7 5
600.8 600.4 598.2 599.4 601.2
4.5 5.2 5.1 5.2 4.9 5 4.8 5 5.1 4.5
599.4 598 599 598.4 603.6
4.3 5.7 4.1 4.8 5 4.6 4.9 4.9 5 5.2 600.4 600 604.2 600.6 599.4
5 4.5 5 4.9 5 4.5 5.3 4.5 5.3 5.3 602.4 598.4 600.8 600.8 596.4
4.9 4.4 5 5.1 5.1 4.8 5.3 4.7 5.1 4.9 603.8 600.8 598 601.6 602.4
4.7 4.8 5.6 4.9 5.2 4.4 4.7 4.9 4.6 5 598.4 603.4 602.2 599.2 604.2
600.6 601.6 600.2 601 601.2
600 601.6 597.6 602.2 603.6
18) En el departamento de ensamble de motores de 603.4 599.4 601.4 601.2 602.2
una planta automotriz, se tiene que una de las 600.4 599.8 599.8 601.8 597.6
599 599 599.6 602 600.8
partes del motor, el árbol de levas, debe tener
una longitud de 600mm (+/-) 2mm para cumplir
con las especificaciones de ingeniería.
MEDIDAS DE VARIABILIDAD.
Hay un problema crónico con la longitud del
árbol de levas, ya que se sale de especificaciones,
Para medir el grado de dispersión de una variable,
y crea un problema de reducción del rendimiento
se utilizan principalmente los siguientes
de la línea de producción y altas tasas de re
indicadores:
trabajo y desperdicio. El supervisor del
Rango o recorrido
departamento monitorea esta característica,
Varianza y desviación típica o estándar
durante un mes. Para esto recibe proveedor.
Coeficiente de variabilidad.
Determinar las medidas de tendencia central.
la dispersión, entre diferentes muestras que posean una tabla de distribución simétrica de
El coeficiente de variabilidad tiene en cuenta el valor ingreso per cápita en dólares de 150 familias.
de la media aritmética, para establecer un número X4= 7000, f3= 24, h 1= 0,08, k = 7, H 4= 0,62,
relativo, que hace comparable el grado de dispersión f1X1 = 48000. Determine las medidas de
X f Nº preguntas Nº de alumnos
68 1 0-10 10
69 3 10-15 20
70 2 15-20 60
71 8 20-23 100
72 3 23-25 70
73 2 25-30 30
74 1 30-40 10
Li Ls Xi f i Fi X i f i
880 TEORÍA DE PROBABILIDAD
1950
Definición:
35 1800
La probabilidad es una medida numérica de la
13
posibilidad de que ocurra un evento. Por tanto, las
200)
probabilidades son una medida del grado de
4 70
incertidumbre asociado con cada uno de los eventos
previamente enunciados. Si cuenta con las
probabilidades, tiene la capacidad de determinar la elemento del espacio muestral se denomina también
posibilidad de ocurrencia que tiene cada evento. punto muestral. Esto es, el espacio muestral se
describe. Si el espacio muestral tiene un número
Experimento aleatorio finito de elementos es posible enlistar a todos estos,
y si el número de elementos es grande o infinito el
Definición. Un experimento aleatorio es todo espacio muestral se describirá mediante un
proceso que consiste de la ejecución de un acto (o enunciado o regla.
prueba) una o más veces, cuyo resultado en cada
prueba depende del azar y en consecuencia no se Ejemplo:
puede predecir con certeza A continuación se dan algunos experimentos
En estadística la palabra experimento se utiliza para aleatorios y sus correspondientes espacios
describir un proceso que genera un conjunto de datos muéstrales:
cualitativos o cuantitativos. En la mayoría de los 1) El experimento aleatorio de lanzar un dado y
casos, los resultados del experimento dependen del observar el resultado obtenido, es de una sola prueba,
azar, por lo tanto no pueden pronosticarse con cuyo espacio muestral se puede escribir como el
exactitud. siguiente conjunto de puntos muéstrales:
Por ejemplo, son experimentos aleatorios: lanzar un Q = {1,2, 3 ,4 , 5, 6 }.
dado y observar el resultado, contar objetos
defectuosos producidos diariamente por cierto 2) El experimento aleatorio de lanzar una moneda 3
proceso, aplicar una encuesta para obtener opiniones, veces, consiste de 3 pruebas, cuyo espacio muestral
etc. puede escribirse como el conjunto de ternas
ordenadas.
Espacio muestral A= {ccc, ccs, csc, scc, ssc, scs, css, sss}.
Definición. Se denomina espacio muestral al
conjunto que consiste de todos los resultados ¿Cómo se mide la probabilidad?
posibles de un experimento aleatorio. Este conjunto Uno de los métodos más utilizados es aplicando la
se denotará por. Regla de Laplace: define la probabilidad de un
Si el espacio muestral tiene un número finito de suceso como el cociente entre casos favorables y
elementos es posible enlistar a todos estos, y si el casos posibles.
número de elementos es grande o infinito el espacio
muestral se describirá mediante un enunciado o P(A) = Casos favorables / casos posibles
regla.
Probabilidad de un suceso
Cada resultado posible de un experimento aleatorio La probabilidad de un suceso, S, indica el grado de
es un elemento del espacio muestral. A cada posibilidad de que ocurra dicho suceso. Se expresa
mediante un número comprendido entre 0 y 1, entre Dos sucesos son independientes entre sí, si la
0% y 100% y lo escribimos P(S) ocurrencia de uno de ellos no afecta para nada a la
Si P(S) está próximo a 0 el suceso es poco probable ocurrencia del otro:
y será más probable cuanto más se aproxime a 1, que
Ejemplo: el suceso estatura de los alumnos de una
es la probabilidad del suceso seguro, P(E)=1.
clase y el color del pelo son independientes: el que
Una probabilidad es una medida de la posibilidad que
un alumno sea más o menos alto no va a influir en el
tiene un suceso de ocurrir.
color de su cabello, ni viceversa.
Dentro de los sucesos posibles vamos a distinguir: Para que dos sucesos sean independientes tienen
que verificar al menos una de las
tiene la misma probabilidad que los demás: P (B/A) = P (B) es decir, que la probabilidad de
Por ejemplo: cuando lanzamos una moneda, el que se de el suceso B, condicionada a que
suceso "cara" tiene las mismas probabilidades que el previamente se haya dado el suceso A, es
suceso "cruz". exactamente igual a la probabilidad de B.
Por lo tanto:
1) DISTRIBUSIÓN BINOMIAL.
2) DISTRIBUCIÓN DE POISSON
Es frecuente que en control de calidad se den
Una tercera distribución de probabilidades discretas
variables del tipo “pasa, no pasa”.
se llama distribución de probabilidad e Poisson, por
Por ejemplo, un artículo cumple con especificaciones
Simeon Poisson, quien la describió en 1837. La
o no, una pieza resiste cierta fuerza o no, una lámpara
distribución se puede aplicar en muchos casos donde
enciende o no. Un experimento aleatorio donde los
intervienen observaciones por unidad de tiempo: por
posibles resultados de cada ensayo son: “éxito” o
ejemplo, contar automóviles que llegan a una caseta
“fracaso” se conoce como experimento
de autopista en intervalos de 1 min, la cantidad de
Bernoulli. Un experimento aleatorio que consiste en
descomposturas de una máquina en 1 día y la
una secuencia de n ensayos
cantidad de clientes que entran a un almacén en
Bernoulli donde además se cumple que:
intervalos de 5 minutos. También se puede aplicar
1. Los ensayos son independientes.
esa distribución a casos acerca de observaciones por
2. La probabilidad de éxito en cada ensayo, denotada
unidad de cantidad; por ejemplo contar las no
por p, permanece constante.
conformidades de tejido en 1000 m2 de tela, la
Entonces este experimento recibe el nombre de
cantidad de no conformidades por número de
experimento binomial. La variable aleatoria X, que es
peticiones de servicio por semana, y la cuenta de
igual al número de ensayos donde el resultado es un
remaches no conformes en un vehículo recreativo.
éxito, tiene una distribución binomial (n, p). La
En cada una de las situaciones anteriores hay muchas
función de probabilidades de X es,
oportunidades iguales e independientes para la
ocurrencia de un evento. Cada remache en un
vehículo recreativo tiene igual oportunidad de ser no
conformidad; sin embargo, sólo habrá unas pocas no
conformidades en los cientos de remaches. La
distribución de Poisson también se aplica cuando n representación gráfica es la curva de distribución
es bastante grande y p0 es pequeña. normal también denominada campana de Gauss en
La fórmula de la distribución de Poisson es: honor del renombrado científico alemán Carl
Friedrich Gauss a quien se le atribuye erróneamente
su invención pero que sin duda la usó frecuentemente
para analizar fenómenos astronómicos con éxito.
90 − 80 10
Como se deduce de este último apartado, no existe z= = 14 = 0.71 =
14
75 − 80 −5
una única distribución normal, sino una familia de z= = = −0.36 =
14 14
distribuciones con una forma común, diferenciadas
por los valores de su media y su varianza. De entre p(75 ≤ x ≤ 90) = 0.7611 – 0.3594 = 0.4017
todas ellas, la más utilizada es la distribución
normal estándar, que corresponde a una
distribución de media 0 y varianza 1. Así, la
expresión que define su densidad se puede obtener,
resultando:
75 80 90
μ
a). 25% b). 96% c). 36% distribución de probabilidad normal y la desviación
d). 40% e). N.A. 8.- En 2004 y 2005, el costo medio anual para asistir
a una universidad privada en Estados Unidos era de
5.- Los montos de dinero que se piden en las
$20,082. Suponga que las distribuciones de los
solicitudes de préstamos en Down River Federal
costos anuales se rigen por una distribución de
Savings tiene una distribución normal, una media de
probabilidad normal y que la desviación estándar es
$70,000 y una desviación estándar de $20,000. Esta
de $4,500. El 95% de los estudiantes de
mañana se recibió una solicitud de préstamo. ¿Cuál
universidades privadas paga menos de ¿Qué
es la probabilidad de que El monto solicitado sea de
cantidad?
$80,000 o superior?
a).27,462. b). 10,289.4 c). 1000
a). 30.8% b).-25.8% c). 12.7
d). 32451 e). N.A
d).- 48.6 e). 50%
9.- En el último año, el peso de los recién nacidos
6.- Los montos de dinero que se piden en las
tiene una media de 3000 gr. y desviación estándar de
solicitudes de préstamos en Down River Federal
140 gr. ¿Cuál será la probabilidad de que la media de
Savings tiene una distribución normal, una media de
una muestra de 100 recién nacidos sea superior a
$70,000 y una desviación estándar de $20,000. ¿Esta
3030 gr
mañana se recibió una solicitud de préstamo El
monto solicitado oscile entre $65,000 y $80,000? a). 18.4% b). 98.4% c) 15%
a). 19% b). 12% c). 29% d). 54.6% e). N.a.
de sujetos que componen la muestra extraída de una el que se aceptó y se rechazó la hipótesis que se
población, necesarios para que los datos obtenidos quiere investigar en alguna investigación anterior o
FORMULAS.
Z es el nivel de confianza.
N es el tamaño de la población.
Z es el nivel de confianza.
E es la precisión o el error.
p es la variabilidad positiva.
Cuando una población es infinita. 2. Una máquina llena cajas con cierto cereal. El
supervisor desea conocer con un error de estimación
de máximo 0,1 y un nivel de confianza del 90%, una
media estimada del peso. Como la varianza era
desconocida se procedió a escoger una muestra
Donde. piloto. Los resultados fueron los siguientes: 11,02,
11,14, 10,78, 11,59, 11,58, 11,19, 11,71, 11,27,
El nivel de confianza 1o seguridad (1-a). El
10,93, 10,94. ¿Cuántas cajas debe escoger para que
nivel de confianza prefijado da lugar a un
se cumplan los requisitos propuestos?
coeficiente (Za). Para una seguridad del 95%
= 1.96; para una seguridad del 99% = 2.58. 3. Se desea hacer una encuesta para determinar la
proporción de familias que carecen de medios
Una idea de la varianza S2 o también σ2 de la
económicos para atender los problemas de salud.
distribución de la variable cuantitativa que se
Existe la impresión de que esta proporción está
supone existe en la población.
próxima a 0,35. Se desea determinar un intervalo de
confianza del 95% con un error de estimación de 005.
d: Es la precisión o el error.
¿De qué tamaño debe tomarse la muestra? (Sol.
Y= a + Bx
Ejemplo de r:
01.- Se llevó a cabo un estudio acerca de la cantidad
de azúcar refinada mediante un cierto proceso a
varias temperaturas diferentes. Los datos se
codificaron y se registraron en el cuadro siguiente.
Periodo Ventas
(x) (y)
1 600
2 1550
3 1500
4 1500
12 4900
04.- Tratemos de resolver otro problema. ¿Se ha
puesto a reflexionar si es verdad que los opuestos se
atraen? Todos hemos estado ante parejas en las que
03.- Datos: Calcular el pronóstico para los meses de
sus miembros parecen ser muy diferentes entre sí.
enero, febrero y marzo del año siguiente.
¿Pero esto es lo usual? ¿Qué fomenta la atracción: las
Enero 68 diferencias o las similitudes? Un psicólogo social
Febrero 55 abordó este problema pidiendo a 15 estudiantes que
Marzo 63 respondieran un cuestionario relacionado con un sus
Abril 82 actitudes hacia una amplia gama de temas. Tiempo
Mayo 87 después les mostró las “actitudes” de un extraño
Junio 63 hacia los mismos temas y les pidió que evaluaran su
Julio 77 agrado o inclinación por el extraño y si,
Agosto 78 probablemente, disfrutarían el trabajar con él. En
Septiembre 62 realidad, las “actitudes” del extraño fueron
Octubre 78 elaboradas por el experimentador y variaron de
Noviembre 74 sujeto a sujeto, con respecto a la proporción de
Sonido
(db) Presion
a).- Calcúlala recta de regresión para predecir el
60 1
numero de gérmenes por cm3 en función del tiempo.
63 0
65 1
70 2
70 5 1,5 117,4
70 1 1,5 117,1
80 4 1,5 106,2
80 6 2 131,9
80 2 2 146,9
80 3 2,2 146,8
85 5 2,4 133,9
89 4 2,5 111
90 6 2,5 123
90 8 2,8 125,1
90 4 2,8 145,1
90 5 3 134,3
94 7 3 144,5
100 9 3,2 143,7
100 7 3,3 146,9
100 6
a) Representar gráficamente los datos y
Donde X representa la presión sonora en dB, e Y el comentar los resultados.
aumento de la presión sanguínea en mmHg. b) Hallar el coeficiente de correlación.
c) Ajustar un modelo de regresión lineal.
1) Realizar un diagrama de dispersión de Y frente a
Predecir la resistencia de una caja
X.
fabricada con pulpa cuya concentración
es 2.3.
2) Realizar el modelo de regresión lineal simple.