Anda di halaman 1dari 49

I.

-ESTADÍSTICA: inferencia estadística, se requiere conocer los


métodos de la estadística descriptiva.
1.- COMCEPTO:

La estadística es comúnmente considerada como una


2.-POBLACIÓN:
colección de hechos numéricos expresados en
términos de una relación sumisa, y que han sido Definición. En forma general, en estadística; se
recopilados a partir de otros datos numéricos, denomina población, a un conjunto de elementos
(que consiste de personas, objetos, etc.), que
Definición. En este texto básico, definimos la
contienen una o más características observables de
estadística, como la ciencia que nos proporciona un
naturaleza cualitativa o cuantitativa que se pueden
conjunto de métodos, técnicas o procedimientos
medir en ellos.
para:
A cada elemento de una población se denomina
 Recopilar.
unidad elemental o unidad estadística.
 Organizar (clasificar, agrupar),
 Presentar. Por ejemplo, los empleados de una empresa en un día

 Analizar. “laborable, constituyen una población en la que cada


empleado (unidad estadística), tiene muchas
Datos con el fin de describirlos o de realizar
características a ser observadas, como por ejemplo:
generalizaciones válidas.
sexo, estado civil, lugar de procedencia, grado de
Se denomina estadística descriptiva, al conjunto de instrucción, etc. (características cualitativas), o
métodos estadísticos que se relacionan con el número de hijos, ingresos mensuales,
resumen y descripción de los datos, como tablas, etc.(características cuantitativas).
gráficas, y el análisis mediante algunos cálculos.
El resultado de medir una característica observable
Se denomina estadística inferencial al conjunto de de una unidad elemental, se denomina dato
métodos con los que se hacen la generalización o la estadístico o valor observado o simplemente
inferencia sobre una población utilizando una observación.
muestra.
Por otra parte, la población; viene definida por la
La inferencia puede contener conclusiones que tarea o investigación estadística a realizarse. Y como
pueden no ser ciertas en forma absoluta, por lo que la medición o conteo de la característica especificada
es necesario que éstas sean dadas con una medida de por la investigación se hace a cada unidad elemental,
confiabilidad que es la probabilidad. se puede considerar a la población como la totalidad
de valores posibles de una característica particular
Estas dos partes de la estadística no son mutuamente
especificada por la investigación estadística. En este
excluyentes, ya que, para utilizar los métodos de la
sentido la población consiste de un conjunto de datos
estadísticos que se reúnen de acuerdo con la la misma posibilidad de ser seleccionada para la
formulación de una investigación estadística o con la muestra.
definición de la población específica.
Estadística: Se denomina estadística a una medida
Parámetro: Se denomina parámetro a una medida descriptiva que resuma una característica de la
descriptiva que resuma una característica de la muestra, tal como la media (𝑥̅ )) o la varianza (s2)
población, tal como la media (𝑥̅ ) o la varianza (𝜎 2 ), calculada a partir de los datos observados de una
calculada a partir de los datos observados de toda la muestra aleatoria.
población
Es importante tener en cuenta, si el análisis
Tipos de población: Por el número de elementos que estadístico se está haciendo con una muestra o con
la componen, la población se clasifica en finita o una población. En ambos casos las medidas
infinita. La población es finita si tiene un número descriptivas son las mismas. Para diferenciarlos, los
finito de elementos. En caso contrario la población es parámetros de la población, se representan por letras
infinita. En la práctica una población finita con un griegas.
número grande de elementos se considera como una
Ejercicio:
población infinita.

Clasificar si es muestra o población.

3.- MUESTRA: a. Las elecciones en Puerto Rico.


b. El salario de 20 empleados de una enorme
Después de definir la investigación estadística a
compañía.
realizar, se debe decidir entre investigar toda la
c. Hacer una encuesta a 100 personas que
población o sólo una parte de ella. El primer
entraron a una tienda de los 896 que entraron
procedimiento es denominado censo y el segundo es
a dicha tienda, en un día.
llamado muestreo.
d. Hacer un estudio con todos los envejecientes
Definición. Se denomina muestra a una parte de la de un asilo.
población seleccionada de acuerdo con un plan o
regla, con el fin de obtener información acerca de la 1.- Determinar el número de profesionales a

población de la cual proviene. encuestar en una región donde se estima en 4500 el


número de ellos. El objetivo del estudio es
La muestra debe ser seleccionada de manera que sea determinar entre otras cosas, la intencionalidad de
representativa de la población. Un método de seguir estudios de maestría, con una prueba piloto de
selección de muestras representativas es al azar 20 profesionales, se determinó que la proporción de
simple, esto es cada elemento de la población tiene profesionales con afán de continuar sus estudios era
del 25%. La confiabilidad del estudio, dado que sus
resultados serán validados con otras fuentes se y mujer, la característica "peso en kilogramos" tiene
definió en el 95%, el error es 6%, dependiendo de infinitos valores.
los costos se definirá cual tamaño seleccionar. Definición: Se denomina variable estadística a una
2.- Se quiere obtener una muestra sistemática que característica definida en la población por la tarea o
seleccione egresados de un programa de la investigación estadística, que puede tomar dos o más
Universidad de Antioquia que tiene 1200 de ellos. La valores (cualidades o números).
variable clave del estudio es dicotómica y se aduce Se representa por una letra del alfabeto. Por ejemplo,
que la proporción es del 25%, además, se quiere un en la población constituida por los empleados de la
error del 4% y una confiabilidad del 96%. universidad, algunas variables estadísticas definidas
3.- Una Institución de Salud tiene 6100 empleados, en ésta población son:
se quiere determinar cómo es el clima laboral en la X: "sexo". Valores: Masculino, Femenino
organización, usando una confiabilidad del 95%, un Y: "estado civil". Valores: Soltero, casado, viudo,
error admisible de 5% y considerando que la divorciado
proporción de empleados no satisfechos es del 30%.
Calcule el número de empleados a consultar por CLASIFICACIÓN DE VARIABLES.
categoría, si se tiene en cuenta, que las diferentes Las variables se clasifican en cualitativas y
categorías de empleados que pueden influir en la cuantitativas. Las variables cuantitativas se clasifican
opinión de los trabajadores, tienen la siguiente en discretas y continuas
distribución: Contabilidad y Costos 80 empleados,
Administración 150, operativos 5600, seguridad 180 Variable cualitativa, es la característica cuyos
y otros cargos 90. valores se expresan en escalas nominal u ordinal, por
4.- Encuentre el tamaño de muestra para cada ejemplo, sexo, profesión, estado civil, orden de
categoría de usuario, si se desea una confiabilidad del méritos, etc. Con sus valores, que son cualidades, no
95% y un error del 5%, además, se sabe que la se pueden realizar operaciones aritméticas.
proporción de usuarios satisfechos en el último
estudio fue de 0.75. Variable cuantitativa, es la característica cuyos
valores se expresan en escalas de intervalo o de
razón, por ejemplo, temperatura, número de hijos,
4.- VARIABLES
ingresos mensuales, tiempo de vida útil, etc.. Con sus

La característica que se mida en las unidades valores, que son números, se pueden realizar

elementales de una población definida por la tarea operaciones aritméticas.


estadística, tiene diversos valores de naturaleza Las variables cuantitativas, a su vez, se clasifican en:
cualitativa o cuantitativa. Por ejemplo, la discretas, y continuas.

característica "sexo" tiene dos modalidades: hombre


Variable discreta, es aquella variable cuantitativa procede a la selección de los elementos de la muestra
que puede tomar sólo ciertos valores en un intervalo aunque hay muchos diseños de la muestra.
considerado y no admite ningún valor entre dos
Al tomar varias muestras de una población, las
valores consecutivos fijos. Generalmente, es una
estadísticas que calculamos para cada muestra no
variable cuyos valores se obtienen por conteo
necesariamente serían iguales, y lo más probable es
(números naturales). Por ejemplo, una familia puede
que variaran de una muestra a otra.
tener 0.1.2....hijos, pero no algún valor intermedio.

Ejemplo:
Variable continúa, es aquella variable cuantitativa
que puede tomar cualquier valor en el intervalo Consideremos como una población a los estudiantes
considerado, por ejemplo, salario, tiempo, peso, de educación determinando por lo menos dos
volumen, longitud, etc.. caracteres ser estudiados en dicha población;
La distinción entre variable discreta y continua es
 Religión de los estudiantes
más teórica que real. Al utilizar los datos, la variable
 Sexo.
siempre resulta discreta, pues toda medición se
expresa sólo en ciertas unidades realmente medibles,
por decir, metros, decímetros, centímetros. Por ORGANIZACIÓN DE DATOS.
ejemplo, es posible que una persona mida 1.6748m,
o, 1.6752m, pero para fines prácticos, redondeando a Vamos a considerar por separado los caso de datos
dos decimales, se considera sólo 1.67m., o, 1.68m cualitativos y cuantitativos.
respectivamente.
Una variable continua puede pues tomar infinitos 1.- Organización de los datos cualitativos:
valores intermedios en un intervalo dado. Para fines
prácticos los valores numéricos de las variables En este caso la agrupación de los datos es muy
continuas siempre son valores aproximados. sencilla y se hace de acuerdo a las modalidades que
presente la variable en estudio. Mediante un conteo
se determina el número de datos (también llamado
5.- MUESTREO: frecuencia) correspondiente a las diferentes

Esto no es más que el procedimiento empleado para categorías de la variable. Este procedimiento es

obtener una o más muestras de una población; el válido para cualquier cantidad de datos.

muestreo es una técnica que sirve para obtener una o


más muestras de población. Ejemplo de Organización de los datos
cualitativos.
Este se realiza una vez que se ha establecido un
marco muestral representativo de la población, se
1) En un estudio sobre las personas que ejercen
cargos directivos en una empresa, se realizaron 15 un tratamiento, nivel socioeconómico, intensidad
entrevistas y en relación al Genero se obtuvo la de consumo de alcohol, días de la semana, meses
siguiente información: del año. A pesar de este orden jerárquico no es
f, f, m, m, f, m, m, m, f, f, m, f, f, m, f posible obtener valoración numérica lógica entre
dos valores.
Agrupando los datos de acuerdo a su categoría se
2.- Organización de los datos cuantitativos:
obtiene.
Para organizar y agrupar datos de tipo cuantitativo
discretos o continuos, se utiliza un procedimiento
Genero Personas
similar, pero más laborioso, al utilizado con los
Masculino 7 datos cualitativos.
Vamos a utilizar la información correspondiente a
Femenino 8 la edad de 15 estudiantes.
12, 14, 10, 15, 16, 12, 14, 18, 20, 19, 19, 18, 12, 15,
total 15
17

un primer intento de organizar esos datos puede


El procedimiento utilizado es intuitivo y una vez consistir en ordenarlos de menor a mayor tal como
resumida la información de esta manera se facilita se presenta a continuación
la interpretación. 10, 12, 12, 12, 14, 14, 15, 15, 16, 17, 18, 18, 19, 19,
20.
Las variables cualitativas pueden agruparse en
Este ordenamiento de los datos nos permite saber
variables nominales u ordinales.
que la edad mínima es 10 y la máxima es 20.
 Variable nominal: Cuando los datos otra cosa que podemos hacer, dado que algunos datos
correspondan a una variable cualitativa que se se repiten, es agruparlos formando una columna
agrupa sin ninguna jerarquía entre sí, como por donde aparezcan los valores diferentes de la edad,
ejemplo: nombres de personas, de ordenados de menor a mayor y al lado de cada edad
establecimientos, raza, grupos sanguíneos, el número de niños que tienen esa edad.
estado civil. Edad estudiantes
Estas variables no tienen ningún orden inherente 10 1
a ellas ni un orden de jerarquía. 12 3

 Variable ordinal, Si las categorías o valores que 14 2

adopte una variable cualitativa poseen un orden, 15 2

secuencia o progresión natural esperable, como 16 1

por ejemplo: grados de desnutrición, respuesta a 17 1


18 2 En una distribución de frecuencia podemos
19 2 distinguir los siguientes elementos:
20 1 a) Intervalos de clase o clases: que consiste en
total 15 intervalos de valores ordenados en forma
ascendente y que cubren todos los datos
Según los tipos de variables cuantitativas son.
disponibles.
b) Límites de clase: Son los extremos de la clase o
Variable cuantitativa discreta
intervalo, el extremo inferior o valor menor del
Cuando solo pueden tomar un número finito o a lo
intervalo se denomina límite inferior de la clase
sumo numerable de valores, con los cuales es
y el extremo superior se denomina límite
posible establecer una correspondencia biunívoca
superior se denotan por Li y Ls para la clase i-
con el conjunto de los números enteros o
esima.
subconjuntos propios de este. Ejemplos:
c) marca de clase: para una clase específica, se
 Cantidad de alumnos de un grupo, de un grado o
define la marca de clase, mi, como el punto de
de una escuela (30; 218; 500…)
media de esa clase, es decir, S la semi-suma de
 Cantidad de libros de una biblioteca (10 000,
los limites inferior y superior de la clase.
345 876. 2 345 098…) 𝐿𝑖 + 𝐿𝑠
𝑚𝑖 =
 Número de viajes realizados por un ómnibus (0; 2
1; 3; 6…
d) Amplitud de clase (o longitud de clase o
Variable cuantitativa continúa tamaño de clase o anchura de clase) se obtiene
Una variable continua es aquella que puede tomar haciendo la diferencia entre el límite superior y
valores comprendidos entre dos números, es decir el límite inferior de la clase. Se denota por “A”.
puede tomar cualquier valor de un intervalo real. e) Frecuencia absoluta de clase: Es el número de
Ejemplos: observaciones contenidas o incluidas en la clase.
 Estatura de un grupo de personas También se le conoce como frecuencia de clase
 Cantidad de lluvia caída en una región en y se denota por Fi
una época o tiempo determinado
 Volumen de agua en una presa en metros Si denotamos por n el número total de datos, se

cúbicos cumple que:

 Tiempo que puede durar cualquier proceso


∑𝒌𝒊=𝟏 𝒇𝒊= n

Siendo k el número de clases de la distribución de


2.1.- Elementos de una distribución de frecuencias.
frecuencias
f) Frecuencia relativa de una clase: se obtiene La frecuencia relativa acumulada de una clase
dividiendo la frecuencia absoluta de la clase representa la proporción de datos que son menores
f i entre el número total de observaciones n. se que el límite superior de la clase considerada.
denota por fri
Reglas y recomendaciones generales para
fri=f1/n siempre se cumple que ∑𝑘𝑖=1 𝑓𝑟 𝑖= 1
construir una distribución de frecuencia:
La frecuencia relativa de una clase representa la
proporción de datos contenidos en esa clase.
a) De determina el valor máximo y mínimo de los
g) Frecuencia acumulada de una clase: se
datos y se calcula la diferencia entre valores, la
obtiene sumando las frecuencias absolutas d
cual se denomina rango o recorrido de la variable
todas las clases anteriores a ella y la frecuencia
y se denota por R, en nuestro ejemplo R=20-
absoluta de la clase considerada. Se denota por
10=10
Fi
b) Se determina el número de clases y las
F1= f1
amplitudes de clase, si se conoce de antemano el
F2=f2+f1 número de clases K, dividiendo el rango entre el
número de clase se obtiene la amplitud.
F3= f1+f1+f3

Fn=f1+f2+f3+…+fn.

La frecuencia acumulada de la última clase de la


distribución de frecuencias coincide con el número
total de datos n.

La frecuencia acumulada de una clase cualquiera se


interpreta como el número de datos que están por
debajo o que son inferiores al valor representado por
el límite superior de la clase considerada y que por
supuesto son mayores que el valor representado por
el límite inferior de la primera clase.

h) Frecuencia relativa de una clase: se obtiene


dividiendo la correspondiente frecuencia
acumulada Fi entre el número total de datos.
“S” denota por Fri fri ; fri=fi/ n.
Practica de clase: d) Cualitativa, Cuantitativa continúa. , Cuantitativa
continua., Cuantitativa discreta, Cualitativa.
1. De las siguientes variables indica cuáles son
e) Cualitativa, Cuantitativa continúa. , Cuantitativa
discretas y cuales continúas.
discreta., Cuantitativa continua, Cualitativa
1 Número de acciones vendidas cada día en la Bolsa
2 Temperaturas registradas cada hora en un 3. Indica que variables son cualitativas y cuales
observatorio. cuantitativas:
3 Período de duración de un automóvil.
1. Comida Favorita
4 El diámetro de las ruedas de varios coches.
2 Profesión que te gusta.
5 Número de hijos
3 Número de goles marcados por tu equipo favorito
a) Discreta, Continua, Continua, Continua, Discreta
en la última temporada.
b) Continua, Continua, Continua, Continua,
4 Número de alumnos de tu Instituto.
Discreta.
5 El color de los ojos de tus compañeros de clase.
c) Discreta, Continúa, Continua, Continua,
a) cualitativa, cualitativa, cuantitativa, cuantitativa,
Continua.
cualitativa.
d) Discreta, discreta, Continua, Continua, Discreta.
b) cuantitativa, cualitativa, cuantitativa, cuantitativa,
e) NA
cualitativa.
c) cuantitativa, cuantitativa, cuantitativa,
2. Clasificar las siguientes variables en cualitativas
cuantitativa, cualitativa.
y cuantitativas discretas o continuas.
d) cuantitativa, cualitativa, cuantitativa, cuantitativa,
1 La nacionalidad de una persona. cuantitativa
2 Número de litros de agua contenidos en un e) NA
depósito.
3 Número de libro en un estante de librería.
4 Suma de puntos tenidos en el lanzamiento de un
par de dados.
5 La profesión de una persona.
a) Cualitativa, Cuantitativa continúa. , Cuantitativa
discreta., Cuantitativa discreta, Cualitativa.
b) Cuantitativa, Cuantitativa continúa. , Cuantitativa
discreta., Cuantitativa discreta, Cualitativa.
c) Cualitativa, Cuantitativa discreta. , Cuantitativa
discreta., Cuantitativa discreta, Cualitativa.
DISTRIBUCIÓN DE FRECUENCIA 1,24 1 12 3,30% 40,00%
1,25 2 14 6,60% 46,60%
La distribución de frecuencia es la representación 1,26 3 17 10,00% 56,60%

estructurada, en forma de tabla, de toda la 1,27 3 20 10,00% 66,60%


1,28 4 24 13,30% 80,00%
información que se ha recogido sobre la variable que
1,29 3 27 10,00% 90,00%
se estudia.
1,3 3 30 10,00% 100,00%

Variable Frecuencias Frecuencias relativas


absolutas
(Valor) Simple Acumulad Simple Acumulada
Distribuciones de frecuencia agrupada
a
X1 n1 n1 f1 = n1 / f1
En lugar de ello, preferimos agrupar los datos por
n
intervalos, con lo que la información queda más
X2 n2 n1 + n2 f2 = n2 / f1 + f2
n resumida (se pierde, por tanto, algo de información),
... ... ... ... ... pero es más manejable e informativa:
Xn-1 nn-1 n1 + n2 +.. fn-1 f1 + f2 +..+f
+ nn-1 = nn- n-1 Estatura Frecuencias Frecuencias
1/n absolutas relativas
Xn nn Sn fn = nn Sf Cm Simp Acum Simple Acum
/n 1,01 - 1,10 1 1 3,30% 3,30%

Siendo X los distintos valores que puede tomar la 1,11 - 1,20 3 4 10,00% 13,30%
variable.
1,21 - 1,30 3 7 10,00% 23,30%
Siendo n el número de veces que se repite cada
1,31 - 1,40 2 9 6,60% 30,00%
valor.
Siendo f el porcentaje que la repetición de cada 1,41 - 1,50 6 15 20,00% 50,00%

valor supone sobre el total 1,51 - 1,60 4 19 13,30% 63,30%

1,61 - 1,70 3 22 10,00% 73,30%

Si presentamos esta información estructurada 1,71 - 1,80 3 25 10,00% 83,30%


obtendríamos la siguiente tabla de frecuencia:
1,81 - 1,90 2 27 6,60% 90,00%

Variable Frecuencias Frecuencias relativas 1,91 - 2,00 3 30 10,00% 100,00


absolutas %
(Valor) Simple Acumulada Simple Acumulada
1,2 1 1 3,30% 3,30% Como hacer un cuadro de distribución de
1,21 4 5 13,30% 16,60% frecuencia.
1,22 4 9 13,30% 30,00%
1,23 2 11 6,60% 36,60%
1. De la muestra de los datos que se tengan se In = [ X min + (n-1)A; X min + nA]
determina primero al AMPLITUD TOTAL (R),
restando al valor más alto el más pequeño.
Ejercicios para desarrollar.
R= Xmax – Xmin
1) Una prestigiosa frutería tiene como norma
2. Seguidamente determinamos el número de clasificar los mangos según su tamaño, de cara a
CLASES (k) así: la venta, en superiores y normales. Los
superiores son aquellos cuyo peso es superior a
k = 1 + 3,3 log (n)
450 g. De una partida, representativa de los
Donde n es la cantidad de datos de la muestra. mangos que recibe normalmente, se ha obtenido
la distribución de frecuencias siguientes:
K se debe de redondear, para tener un número de
clases completas.
Peso (gr) Num de mangos
3. Ahora, la AMPLITUD (A) de las clases dividiendo 250 – 300 3
la amplitud total entre el número de clases. c=R/k 300 – 350 10
350 – 400 15
Si la división A = R /k no es exacta en el número de
400 – 450 25
decimales de los datos, entonces, el número A se
450 – 500 32
aproxima por exceso de manera que se cubra todo el
rango, esto es de manera que kA > R . 500 – 550 20
550 - 600 19
Si los datos son enteros, A es entero, si los datos 600 – 650 4
tienen un decimal, A tiene un decimal, etc. Por
650 – 700 2
ejemplo, si los datos tienen dos decimales y si

R / k =5.3416, se elige A = 5.35. (no 5.34).  Un exquisito aristócrata ha acordado con el


frutero quedarse con los mangos cuyo peso sea
Determinar los extremos de los intervalos de la
superior a 625 gramos. ¿Qué porcentaje de
siguiente manera:
mangos se destinarán a este aristócrata?
I1 = [X min; X min + A]  El frutero compra la partida de mangos a 300
pts el kg. Los normales se venden a 600 pts/kg,
I2= [ X min + A; X min + 2A]
os superiores a 800 pts /kg, mientras que el
I3 = [ X min + 2A ; X min + 3A] aristócrata se os deja a 700 pts/kg. ¿Cuánto
espera ganar este frutero es esta partida?
I4 = [ X min + 3A; X min + 4A]
2) Calcular el total de la muestra, sí las
… calificaciones de alumnos en Matemáticas han
sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 52.45 50.43 37.75 51.83 73.81 61.07 35.81 57.28
48.7 65.85 75.85 36.95 75.55 69.01 61.48 65.59
5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3,
44.41 41.89 34.75 59.89 59.45 67.63 89.12 69.48
6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 63.69 70 66 55.99 49.68 46.5 67.47 64.4
7. 84.59 40.71 50.24 61.39 85.72 45.31 46.72 61.75
55.64 55.91 46.68 66.52 59.17 66.31 35.88 28.63
47.01 71.36 78.64 41.72 72.64 41.46 49 48.17
3) Calcular el total de la muestra, si los 40 alumnos 79.43 67.66 53.32 49.01 29.48 41.13 30.25 33.41
48.24 57.88 55.26 84.66 48.66 10.5 60.95 38.42
de una clase han obtenido las siguientes 74.24 60.73 56.16 86.07 90.57 53.75 76.58 68.63
puntuaciones, sobre 50, en un examen de Física. 51.18 74.58 58.71 48.04 67.12 41.83 61.03 58.27
61.98 4.307 41.54 62.22 51.27 82.92 34.18 37.65
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 80.5 35.34 44.72 37.4

17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47,
Realizar la tabla de distribución de frecuencia con los
39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
datos

4) Hallar el porcentaje del puntaje 19, sí las 7) Una fábrica de coches desea estudiar el

puntuaciones obtenidas por un grupo de en una consumo de un nuevo modelo de coche que

prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, quiere lanzar al mercado. Para ello realiza cien

15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. pruebas echando diez litros de gasolina y viendo
que distancia en kilómetros recorre el coche.

5) Calcular el porcentaje de los hoteles de 4 Los resultados de las pruebas fueron los

estrellas, si el número de estrellas de los hoteles siguientes:

de una ciudad viene dado por la siguiente serie:


85 90 91 88 91 91 86 92 90 89
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 91 87 88 88 90 90 89 90 90 89
2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. 91 87 90 84 91 88 90 88 88 88
92 90 90 90 93 90 89 92 91 92
89 88 91 89 90 90 88 90 89 86
90 88 88 94 91 90 92 87 90 91
6) Un fabricante de neumáticos ha recabado, de los 92 88 92 92 88 89 88 91 89 91
91 88 88 92 89 87 88 88 91 88
diferentes concesionarios, información sobre la
89 90 93 89 91 92 89 85 86 91
cantidad de miles de kilómetros recorridos por 89 87 88 88 93 90 95 89 92 89
un modelo concreto de esos neumáticos hasta
Realizar la tabla de distribución de frecuencia con los
que se ha producido un pinchazo o un reventón
datos
del neumático. Los concesionarios la han
proporcionado los siguientes datos: 8) La tabla siguiente muestra longitudes en cm. de
42 tornillos. Construir una distribución (tabla)
de frecuencia, utilizando intervalos de clases
adecuados. ¿Señala también la marca de clase e) ¿Qué porcentaje representan las ampolletas que
en cada caso? duraron entre 300 y 325 horas?

7,36 7,29 7,43 7,40 7,36 7,41 f) ¿Qué porcentaje representan las ampolletas que
7,35 7,31 7,26 7,37 7,28 7,37 duraron menos de 310 horas?
7,36 7,35 7,24 7,33 7,42 7,36 g) ¿Qué porcentaje representan las ampolletas que
7,39 7,35 7,45 7,36 7,42 7,40 duraron menos de 325 horas?
7,28 7,38 7,25 7,33 7,34 7,32 10) El siguiente cuadro, se refiere al contenido de
7,33 7,30 7,32 7,30 7,39 7,34 grasa (expresado en libras) de 200 frascos de
7,38 7,39 7,27 7,35 7,35 7,32 Yogur en presentación de 2.5 libras, referidos a
9) Completa la tabla de distribución de frecuencias una muestra aleatoria extraída de un lote de
con los datos correspondientes a la duración en 3.600 frascos correspondientes a la producción
horas de 80 ampolletas fabricadas por una de un mes de la compañía. Elabore la tabla de
industria distribución de frecuencia

Intervalo 0.32 0.24 0.21 0.27 0.35 0.23 0.28 0.32 0.29 0.26
xi fi fac %fi %fac 0.33 0.29 0.2 0.22 0.29 0.27 0.28 0.34 0.26 0.25
de Clases
0.29 0.25 0.24 0.24 0.25 0.23 0.25 0.21 0.25 0.22
290 - 295
0.3 0.23 0.25 0.27 0.26 0.2 0.28 0.31 0.25 0.26
295 - 300
0.18 0.31 0.24 0.25 0.25 0.27 0.17 0.21 0.23 0.28
300 - 305 0.28 0.32 0.2 0.31 0.2 0.32 0.27 0.27 0.25 0.23
305 - 310 0.22 0.23 0.23 0.31 0.27 0.23 0.24 0.26 0.36 0.27
310 - 315 0.2 0.2 0.29 0.27 0.27 0.28 0.21 0.33 0.29 0.24
315 - 320 0.19 0.27 0.21 0.28 0.26 0.27 0.31 0.27 0.25 0.25
320 - 325 0.23 0.31 0.27 0.22 0.29 0.27 0.25 0.28 0.2 0.23
325 - 330 0.19 0.25 0.26 0.28 0.24 0.3 0.24 0.16 0.16 0.27
Totales  0.24 0.27 0.27 0.2 0.23 0.27 0.29 0.29 0.26 0.29
0.34 0.33 0.21 0.27 0.24 0.31 0.28 0.2 0.25 0.26
0.24 0.29 0.25 0.26 0.25 0.21 0.24 0.22 0.26 0.29
0.23 0.24 0.26 0.26 0.24 0.28 0.25 0.27 0.3 0.29
De acuerdo con la tabla anterior, contesta las
0.22 0.28 0.23 0.23 0.22 0.29 0.24 0.25 0.25 0.25
siguientes preguntas… 0.26 0.23 0.27 0.22 0.24 0.29 0.23 0.29 0.31 0.21
0.33 0.23 0.28 0.21 0.22 0.34 0.28 0.32 0.22 0.22
a) ¿Cuántas ampolletas tuvieron una duración entre 0.26 0.36 0.32 0.25 0.25 0.25 0.27 0.27 0.28 0.2
0.24 0.27 0.22 0.27 0.24 0.23 0.3 0.17 0.31 0.26
300 y 305 horas?
b) ¿Cuántas tuvieron una duración menor que 305 11) En la elaboración de envases de plásticos,
horas? primero se elabora la preforma, para la cual se
c) ¿Cuántas tuvieron una duración menor que 320 tienen varios criterios de calidad, uno de ellos es
horas? el peso de la preforma. Para cierto envase se tiene
d) ¿Qué porcentaje representan las ampolletas que que el peso debe estar entre 28.00 ± 0.5g. A
duraron entre 310 y 315 horas? continuación, se muestran los últimos 112 datos
obtenidos mediante una carta de control para esta
variable. Elabore la tabla de distribución de 4.8 4.7 4.7 4.9 4.7 4.6 4.2 5 5.3 4.4
frecuencia. 4.8 4.5 5.1 4.7 5 4.6 5.3 4.9 5 4.5
5.1 5.3 5 5.1 5.3 4.8 5.1 5.2 4.4 5
27.72 28.39 28.21 28.19 28.02 27.92 4.6 5.1 4.9 5.3 5.1 4.9 4.4 5.1 4.7 4.7
27.96 27.94 28.04 28.05 27.81 27.74 4.9 4.6 4.6 5.1 4.5 4.4 4.7 5.2 4.6 5
27.87 27.87 27.82 28.23 27.9 27.91 5 4.2 5.2 5.3 4.1 5.3 5.1 4.6 4.8 5.6
28.02 28 27.99 28.13 28.26 28.1 4.9 4.6 4.8 5 5.1 5.3 4.7 5.2 4.7 5
27.95 27.94 27.81 27.76 27.96 27.84 4.5 5.2 5.1 5.2 4.9 5 4.8 5 5.1 4.5
28.04 28.19 27.89 28.08 28.09 28.02 4.3 5.7 4.1 4.8 5 4.6 4.9 4.9 5 5.2
28.13 27.88 28.11 28.05 28.14 28.11 5 4.5 5 4.9 5 4.5 5.3 4.5 5.3 5.3
27.94 28.19 28.1 27.78 27.63 27.93 4.9 4.4 5 5.1 5.1 4.8 5.3 4.7 5.1 4.9
27.85 27.84 28.12 28.01 27.97 27.88 4.7 4.8 5.6 4.9 5.2 4.4 4.7 4.9 4.6 5
27.97 27.9 27.87 27.94 28.01 28.13
27.89 27.88 28.06 27.91 27.91 27.95
27.95 27.91 27.93 28.07 28.13 27.93 13) En el departamento de ensamble de motores de
28.16 27.94 27.86 27.84 27.7 27.98
27.94 28.07 27.84 27.9 27.87 27.76 una planta automotriz, se tiene que una de las
27.85 27.93 28.22 27.96 27.88 28.08 partes del motor, el árbol de levas, debe tener una
27.85 28.27 27.75 27.98 27.75 27.82
longitud de 600mm (+/-) 2mm para cumplir con
28.08 28.16 28.04 28.05 27.75 27.89
27.74 28.1 28.14 27.91 27.84 28.21 las especificaciones de ingeniería.
28 28.1 28.16 28.16 Hay un problema crónico con la longitud del
árbol de levas, ya que se sale de especificaciones,
12) Con el propósito de mejorar la calidad que se
y crea un problema de reducción del rendimiento
tenía en cuanto al grosor de las láminas 5+- 0.7,
de la línea de producción y altas tasas de re
un grupo implementa un proyecto de mejora
trabajo y desperdicio. El supervisor del
siguiendo la metodología. Varios de los cambios
departamento monitorea esta característica,
implementados fueron relativos a los
durante un mes. Para esto recibe proveedor.
procedimientos empleados durante el proceso ya
Elabore la tabla de distribución de frecuencia.
y la estandarización de los mismos. Para verificar
si el plan tuvo éxito, se eligieron láminas
aleatoriamente y midiendo su grosor. Los 120
datos obtenidos durante tres días se muestran a
continuación: Elabore la tabla de distribución de
frecuencia.
601.6 602.8 598.4 598.2 600.8
599.6 602 598.6 597.2 598.2
600 600.4 598.6 599.4 597.6
599.6 600.2 598 600.6 596.8
597.6 599 602.2 601.6 599.8
599.8 600.2 602.8 603.6 600.2
600 601.8 600.4 600.8 597
600.2 602.8 599.8 596.2 600.4
597.8 602.4 598 596.8 600.4
600.8 600.4 598.2 599.4 601.2
599.4 598 599 598.4 603.6
600.4 600 604.2 600.6 599.4
602.4 598.4 600.8 600.8 596.4
603.8 600.8 598 601.6 602.4
2.- Histograma.
598.4 603.4 602.2 599.2 604.2
600.6 601.6 600.2 601 601.2
600 601.6 597.6 602.2 603.6 Los histogramas de frecuencias son gráficas que
603.4 599.4 601.4 601.2 602.2 representan un conjunto de datos que se emplean
600.4 599.8 599.8 601.8 597.6 para representar datos de una variable cuantitativa.
599 599 599.6 602 600.8
En el eje horizontal o de las abscisas se representan
los valores tomados por la variable, en el caso de que
GRAFICOS: los valores considerados sean continuos la forma de
representar los valores es mediante intervalos de un
Generalmente se parte de la información
mismo tamaño llamados clases. En el eje vertical se
representada en tablas antes de poder llevar a cabo el
representan los valores de las frecuencias de los
aspecto gráfico. La representación más
datos. Las barras que se levantan sobre la horizontal
común utilizada en la estadística descriptiva se
y hasta una altura que representa la frecuencia. Un
encuentra la siguiente:
punto importante en el manejo de la información bajo
1.- Gráfico de Barras. el uso de histogramas es el hecho de poder comparar,
bajo un proceso en control, que a medida que se
Se utiliza para representar datos cualitativos y
crecen las clase tiene aproximadamente la forma de
cuantitativos, con datos de tipo discreto. En el eje x
una campana centrada, que como veremos
se representan los datos ordenados en clases mientras
posteriormente, es la de una de las distribuciones más
que en el eje y se pueden representar frecuencias
importantes conocidas como frecuencia normal o
absolutas o relativas.
gaussiana.
También se puede realizar trazando los puntos que
representan las frecuencias y uniéndolos
mediante segmentos.

3.- Gráfico Circular.

Este tipo de diagramas puede ser de dos tipo, se


puede considerar una figura geométrica en la que la
información se distribuye dentro de la figura como
puede ser una dona o un anillo en el que cada porción PRÁCTICA DE GRÁFICOS.
dentro de la figura representa la información
porcentual del total de datos. La segunda opción es Graficar los siguientes gráficos en cada uno de los
la utilización de pasteles en los que una porción del cuadros.
pastel determinada por sectores individuales la
1.-
información para ese sector específico.

X F
61 5
64 18
67 42
70 27
73 8

4.- Polígonos de frecuencias: 2.-

Un polígono de frecuencias se forma uniendo X f

los extremos de las barras de un diagrama de 14,21 15

barras mediante segmentos. 16,21 10


18,21 1
20,21 4 6.-
22,21 5
X f
24,21 12
24 6
26,21 1
40 2
3.- 56 8
72 6
X f
88 3
55 8
65 10 7.-
75 16
Xi f
85 14
40,85 12
95 10
42,35 11
105 5
43,85 7
115 2
45,35 17
4.- 46,85 3
48,35 10
X f
49,85 5
43 3
45 5 8.-
47 7
EDADES f
49 19
3 1
51 7
4 1
53 5
6 3
55 4
7 2
5.- 8 1
10 1
X f
11 2
110 8
130 15 9.-
150 12
X f
170 13
68 1
190 18
69 3
210 4
70 2 de las técnicas estadísticas, sin embargo, su
71 8 interpretación no debe hacerse aisladamente de las
72 3 medidas de dispersión, ya que la representabilidad de
73 2 ellas está asociada con el grado de concentración de
74 1 la información.

10.-
1.- LA MEDIA ARITMÉTICA
152,5 3 La media aritmética. o simplemente media. de un
157,5 6 conjunto de N números (no agrupados) XI; X2; X3
162,5 12 ••• XN se denota por 𝑋̅(léase "X barra") y se define
167,5 18 por
172,5 25
177,5 17 𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑁
𝑋̅ =
𝑁
182,5 10
187,5 7
Ejemplo: La media aritmética de los números 8, 3,
192,5 4
5, 12 y 10 es.
197,5 1
Para datos agrupados si los números XI, X2, X3, ...

11.- XK ocurren f1, f2, f3,…, fK veces. Respectivamente (es


decir, con frecuencias f1, f2, f3,…, fK).la media
Xi f aritmética es.
15 6 𝑋1 ∗ 𝑓1 + 𝑋2 ∗ 𝑓2 + 𝑋3 ∗ 𝑓3 + ⋯ + 𝑋𝑁 ∗ 𝑓𝑁
𝑋̅ =
30 4 𝑛 (𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎)

45 3 Ejemplo: Si 5, 8. 6 Y 2 ocurren con frecuencias 3.

60 5 2.4 Y 1, en ese orden su media aritmética es.

75 2
2.- LA MEDIANA
90 3
Otra medida de tendencia central, utilizada
PRIMERA PRÁCTICA CALIFICADA principalmente en estadística no paramétrica sino en
la posición central que ocupa en el orden de su
MEDIDAS DE TENDENCIA CENTRAL. magnitud, dividiendo la información en dos partes

Las medidas de tendencia central, llamadas así iguales, dejando igual número de datos por encima y

porque tienden a localizarse en el centro de la por debajo de ella.

información, son de gran importancia en el manejo Cuando los datos no están Agrupados en
Intervalos.
Partiendo de la información, ordenamos los datos
ascendente o descendentemente: La Mediana Cuando la Información se Encuentra
se define Agrupada en Intervalos
Mediana = 𝑀𝑒 = 𝑋𝑛+1 si n es impar ó Si la información esta agrupada en intervalos iguales,
2

𝑋𝑛 +𝑋𝑛 entonces la mediana se calcula según la siguiente


+1
2 2
Mediana = 𝑀𝑒 = si n es par. expresión:
2

En el ejercicio de los cigarrillos, consumidos por un 𝑛


− 𝐹𝑚𝑒−1
fumador tenemos lunes 18, martes 21, miércoles 22, 𝑀𝑒 = 𝐿𝐼 + [2 ] 𝑥𝐴
𝑓𝑚𝑒
jueves 21, viernes 20, sábado 19, y domingo 19.
Donde:
Ordenando ascendentemente:
 Li = límite real inferior de la clase que
contiene a la mediana.
1° 2° 3° 4° 5° 6° 7°
18; 19; 19; 20; 21; 21; 22  Fme-1 = sumatoria de las frecuencias

Como n es impar, entonces anteriores a la clase en donde se encuentra la


mediana.
𝑀𝑒 = 𝑋𝑛+1 𝑀𝑒 = 𝑋7+1

2 2
fme = frecuencia de la clase en donde se
𝑀𝑒 = 𝑋4 = 20
encuentra la mediana.
Veamos cuando “n” es par:
 A = amplitud real de la clase en donde se
Consumo mensual de agua, en m3, por la fábrica de
encuentra la mediana.
confecciones “la hilacha”.
Enero= 10,. . . . Mayo= 14, . . . . Septiembre= 18,
LI LS x fs Fa frs Fra
Febrero= 12, Junio= 19, Octubre= 22,
5.965 6.185 6.075 2 2 0.05 0.05
Marzo= 15, Julio= 17, Noviembre= 15,
6.185 6.405 6.295 5 7 0.125 0.175
Abril= 18, Agosto= 18, Diciembre= 13
6.405 6.625 6.515 7 14 0.175 0.350
6.625 6.845 6.735 13 27 0.325 0.675
1° 2° 3° 4° 5° 6°
6.845 7.065 6.955 7 34 0.175 0.850
10; 12; 13; 14; 15; 15
7.065 7.285 7.175 6 40 0.15 1.000
7° 8° 9° 10° 11° 12°
17; 18; 18; 18; 19; 22; 40 1.000

𝑋𝑛 +𝑋𝑛
+1
2 2
Mediana= 𝑀𝑒 = 2 Entonces la mediana.
𝑋12 + 𝑋12+1
2 2
𝑀𝑒 =
2  n / 2  Fme  1
𝑋6 +𝑋7 15+17 Xmed  Li   A
𝑀𝑒 = = = 16  fme 
2 2
 6 
 6.625   ( 0.22 )  6.735 pu lg adas
 40 / 2  14  6  6
 6.625   ( 0.22 )  6.7265
 13 
MEDIDAS DE POSICIÓN.
3.- Moda: A veces es importante conocer cuál es el Son también medidas de posición ya que, de todas
valor que más prevalece en el conjunto de datos. El maneras ocupan un lugar dentro de la información.
valor que ocurre con más frecuencia se le conoce 1 CUARTILES
como moda. La moda es la medida de tendencia Las cuartillas o cuartiles son valores posicionales que
central especialmente útil para describir mediciones dividen la información en cuatro partes iguales, el
de tipo ordinal, de intervalos y nominal. primer cuartil deja el 25% de la información por
debajo de él, y el 75% por encima, el segundo cuartil,
 d1 
X mod  Li   A al igual que la mediana, divide la información en dos
 d1  d 2  ,
partes iguales, y por último el tercer cuartil deja el
La fórmula solo se usara para datos agrupados. 75% por debajo de sí, y el 25% por encima.
Gráficamente:

fmo  fmo  1
d1 =
fmo  fmo  1 Se necesita, entonces calcular tres cuartiles ya que
d2 =
Donde: la cuarta queda automáticamente determinada.

 fmo = frecuencia de la clase que contiene 𝑛𝑘


− 𝐹𝑘−1
𝑄𝑘 = 𝐿𝐼 + [ 4 ] 𝑥𝐴
a la moda. 𝑓𝑘
 fmo-1= frecuencia de la clase anterior a la
que contiene a la moda.
k : Orden del cuartil k = 1,2,3
 fmo+1= frecuencia de la clase posterior a la
LI: Límite inferior del intervalo que contiene el
que contiene a la moda.
cuartil
 A = amplitud real de la clase que contiene Fk-1: Frecuencia acumulada hasta el intervalo
a la moda. anterior al que contiene el cuartil
fk : Frecuencia del intervalo que contiene el cuartil
Del ejercicio anterior. n : Número de observaciones.
Del ejercicio anterior determinar el primer cuartil
k=1; división del 25%.
 d1  40 ∗ 1
X mod  Li   A −7
 d1  d 2  𝑄1 = 6.405 + [ 4 ] 𝑥0.22 = 6.499
7

2.- QUINTILES
Los quintiles o quintillas dividen la información en 450 g. De una partida, representativa de los
cinco partes iguales, agrupándolas en porcentajes de mangos que recibe normalmente, se ha obtenido
20, 40, 60, y 80 por ciento, en consecuencia debemos la distribución de frecuencias siguientes:
calcular cuatro parámetros.
𝑛𝑘 Peso (gr) Num de mangos
− 𝐹𝑘−1
𝑄𝑘 = 𝐿𝐼 + [ 5 ] 𝑥𝐴 250 – 300 3
𝑓𝑘
300 – 350 10
K=1; 2; 3; 4.
350 – 400 15
400 – 450 25
Del ejercicio anterior determinar el tercer quintil k=3
450 – 500 32
40 ∗ 3
− 14 500 – 550
𝑄1 = 6.625 + [ 5
20
] 𝑥0.22 = 6.794
13
550 - 600 19
600 – 650 4
650 – 700 2

3.- DECILES  Cuáles son las medidas de tendencia central.


Similarmente, los deciles o decillas dividen la
información en diez partes iguales, en cantidades 2) Sea una distribución estadística que viene dada
porcentuales de 10 en 10. por la siguiente tabla: ¿La moda es?
𝑛𝑘 X 61 64 67 70 73
− 𝐹𝑘−1
𝑄𝑘 = 𝐿𝐼 + [10 ] 𝑥𝐴 F 5 18 42 27 8
𝑓𝑘

a) 64,23
K=1; 2; 3; …; 10.
b) 67,35
Determinar el primer decil.
c) 42
40 ∗ 1
−2 d) 65,32
𝑄1 = 6.185 + [ 10 ] 𝑥0.22 = 6.273
5 e) 68
3) El valor medio o central de una serie ordenada
de valores es:

PRÁCTICA CALIFICADA. a) La media

1) Una prestigiosa frutería tiene como norma b) La mediana.


clasificar los mangos según su tamaño, de cara a c) La moda.

la venta, en superiores y normales. Los d) TA


superiores son aquellos cuyo peso es superior a e) NA
c) La media de una serie de valores individuales
4) La moda: de la siguiente serie de números: 5, 3, d) La media de una distribución de frecuencia
6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4. e) NA
a) 4,8 9) El valor medio o central de una serie ordenada
b) 5,8 de valores es:
c) 5 a) La media
d) 6 b) La mediana.
e) NA c) La moda.
d) TA
5) Calcular la media: de la siguiente serie de e) NA
números 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4,
8, 2, 5, 4. 10) Determinar las medidas de tendencia central.
a) 4,8 Intervalo Fi
b) 5,8 150-155 3
c) 5 155-160 6
d) 6 160-165 12
e) NA 165-170 18
6) Calcular las medidas de tendencia centra 170-175 25
PESO [50,60) [60,70) [70,80) [80,90) 175-180 17
[90,100) [100,110) [110,120) 180-185 10
Frecuencia 8 10 16 14 185-190 7
10 5 2 190-195 4
195-200 1
7) Un valor individual que ocurre más
frecuentemente en una serie se denomina
11) Un investigador estaba realizando un estudio
a) La media.
sobre el ingreso per cápita mensual de una cierta
b) La mediana
cantidad de familias en EEUU, pero
c) La moda.
accidentalmente dio vuelta la taza de café sobre
d) El rango medio.
su informe, perdiendo algunos datos. Después
e) NA
de secar la hoja de papel, se podían distinguir de
una tabla de distribución simétrica de
8) En la fórmula X = (X1 + X2 + X3 + .......... + Xi)
frecuencias la siguiente información sobre el
/ n, es usada para calcular:
ingreso per cápita en dólares de 150 familias.
a) Mediana de los datos agrupados.
X4= 7000, f3= 24, h 1= 0,08, k = 7, H 4= 0,62,
b) La moda de los datos agrupados
f1X1 = 48000. Determine las medidas de Determinar las medidas de tendencia central.
tendencia central y las medidas de dispersión. 14) La tabla siguiente muestra longitudes en cm. de
12) Un fabricante de neumáticos ha recabado, de los 42 tornillos. Determinar las medidas de
diferentes concesionarios, información sobre la tendencia central., utilizando intervalos de
cantidad de miles de kilómetros recorridos por clases adecuados. ¿Señala también la marca de
un modelo concreto de esos neumáticos hasta clase en cada caso?
que se ha producido un pinchazo o un reventón 7,36 7,29 7,43 7,40 7,36 7,41
del neumático. Los concesionarios la han 7,35 7,31 7,26 7,37 7,28 7,37
proporcionado los siguientes datos: 7,36 7,35 7,24 7,33 7,42 7,36
52.45 50.43 37.75 51.83 73.81 61.07 35.81 57.28 7,39 7,35 7,45 7,36 7,42 7,40
48.7 65.85 75.85 36.95 75.55 69.01 61.48 65.59
7,28 7,38 7,25 7,33 7,34 7,32
44.41 41.89 34.75 59.89 59.45 67.63 89.12 69.48
63.69 70 66 55.99 49.68 46.5 67.47 64.4 7,33 7,30 7,32 7,30 7,39 7,34
84.59 40.71 50.24 61.39 85.72 45.31 46.72 61.75 7,38 7,39 7,27 7,35 7,35 7,32
55.64 55.91 46.68 66.52 59.17 66.31 35.88 28.63
47.01 71.36 78.64 41.72 72.64 41.46 49 48.17
79.43 67.66 53.32 49.01 29.48 41.13 30.25 33.41 15) El siguiente cuadro, se refiere al contenido de
48.24 57.88 55.26 84.66 48.66 10.5 60.95 38.42
74.24 60.73 56.16 86.07 90.57 53.75 76.58 68.63 grasa (expresado en libras) de 200 frascos de
51.18 74.58 58.71 48.04 67.12 41.83 61.03 58.27 Yogur en presentación de 2.5 libras, referidos a
61.98 4.307 41.54 62.22 51.27 82.92 34.18 37.65
80.5 35.34 44.72 37.4 una muestra aleatoria extraída de un lote de
3.600 frascos correspondientes a la producción
Determinar las medidas de tendencia central. de un mes de la compañía. Determinar las
13) Una fábrica de coches desea estudiar el medidas de tendencia central.
consumo de un nuevo modelo de coche que
quiere lanzar al mercado. Para ello realiza cien
pruebas echando diez litros de gasolina y viendo
que distancia en kilómetros recorre el coche.
Los resultados de las pruebas fueron los
siguientes:
85 90 91 88 91 91 86 92 90 89
91 87 88 88 90 90 89 90 90 89
91 87 90 84 91 88 90 88 88 88
92 90 90 90 93 90 89 92 91 92
89 88 91 89 90 90 88 90 89 86
90 88 88 94 91 90 92 87 90 91
92 88 92 92 88 89 88 91 89 91
91 88 88 92 89 87 88 88 91 88
89 90 93 89 91 92 89 85 86 91
89 87 88 88 93 90 95 89 92 89
0.32 0.24 0.21 0.27 0.35 0.23 0.28 0.32 0.29 0.26 27.72 28.39 28.21 28.19 28.02 27.92
0.33 0.29 0.2 0.22 0.29 0.27 0.28 0.34 0.26 0.25 27.96 27.94 28.04 28.05 27.81 27.74
0.29 0.25 0.24 0.24 0.25 0.23 0.25 0.21 0.25 0.22
27.87 27.87 27.82 28.23 27.9 27.91
0.3 0.23 0.25 0.27 0.26 0.2 0.28 0.31 0.25 0.26
28.02 28 27.99 28.13 28.26 28.1
0.18 0.31 0.24 0.25 0.25 0.27 0.17 0.21 0.23 0.28
0.28 0.32 0.2 0.31 0.2 0.32 0.27 0.27 0.25 0.23
27.95 27.94 27.81 27.76 27.96 27.84
0.22 0.23 0.23 0.31 0.27 0.23 0.24 0.26 0.36 0.27 28.04 28.19 27.89 28.08 28.09 28.02
0.2 0.2 0.29 0.27 0.27 0.28 0.21 0.33 0.29 0.24 28.13 27.88 28.11 28.05 28.14 28.11
0.19 0.27 0.21 0.28 0.26 0.27 0.31 0.27 0.25 0.25 27.94 28.19 28.1 27.78 27.63 27.93
0.23 0.31 0.27 0.22 0.29 0.27 0.25 0.28 0.2 0.23 27.85 27.84 28.12 28.01 27.97 27.88
0.19 0.25 0.26 0.28 0.24 0.3 0.24 0.16 0.16 0.27 27.97 27.9 27.87 27.94 28.01 28.13
0.24 0.27 0.27 0.2 0.23 0.27 0.29 0.29 0.26 0.29
27.89 27.88 28.06 27.91 27.91 27.95
0.34 0.33 0.21 0.27 0.24 0.31 0.28 0.2 0.25 0.26
27.95 27.91 27.93 28.07 28.13 27.93
0.24 0.29 0.25 0.26 0.25 0.21 0.24 0.22 0.26 0.29
28.16 27.94 27.86 27.84 27.7 27.98
0.23 0.24 0.26 0.26 0.24 0.28 0.25 0.27 0.3 0.29
27.94 28.07 27.84 27.9 27.87 27.76
0.22 0.28 0.23 0.23 0.22 0.29 0.24 0.25 0.25 0.25
0.26 0.23 0.27 0.22 0.24 0.29 0.23 0.29 0.31 0.21
27.85 27.93 28.22 27.96 27.88 28.08
0.33 0.23 0.28 0.21 0.22 0.34 0.28 0.32 0.22 0.22 27.85 28.27 27.75 27.98 27.75 27.82
0.26 0.36 0.32 0.25 0.25 0.25 0.27 0.27 0.28 0.2 28.08 28.16 28.04 28.05 27.75 27.89
0.24 0.27 0.22 0.27 0.24 0.23 0.3 0.17 0.31 0.26 27.74 28.1 28.14 27.91 27.84 28.21
28 28.1 28.16 28.16

16) En la elaboración de envases de plásticos, 17) Con el propósito de mejorar la calidad que se
primero se elabora la preforma, para la cual se tenía en cuanto al grosor de las láminas 5+- 0.7,
tienen varios criterios de calidad, uno de ellos es un grupo implementa un proyecto de mejora
el peso de la preforma. Para cierto envase se siguiendo la metodología. Varios de los cambios
tiene que el peso debe estar entre 28.00 ± 0.5g. implementados fueron relativos a los
A continuación, se muestran los últimos 112 procedimientos empleados durante el proceso ya
datos obtenidos mediante una carta de control y la estandarización de los mismos. Para
para esta variable. Determinar las medidas de verificar si el plan tuvo éxito, se eligieron
tendencia central. láminas aleatoriamente y midiendo su grosor.
Los 120 datos obtenidos durante tres días se
muestran a continuación: Determinar las
medidas de tendencia central.
601.6 602.8 598.4 598.2 600.8
599.6 602 598.6 597.2 598.2
4.8 4.7 4.7 4.9 4.7 4.6 4.2 5 5.3 4.4 600 600.4 598.6 599.4 597.6
4.8 4.5 5.1 4.7 5 4.6 5.3 4.9 5 4.5 599.6 600.2 598 600.6 596.8
5.1 5.3 5 5.1 5.3 4.8 5.1 5.2 4.4 5 597.6 599 602.2 601.6 599.8
4.6 5.1 4.9 5.3 5.1 4.9 4.4 5.1 4.7 4.7 599.8 600.2 602.8 603.6 600.2
4.9 4.6 4.6 5.1 4.5 4.4 4.7 5.2 4.6 5 600 601.8 600.4 600.8 597
600.2 602.8 599.8 596.2 600.4
5 4.2 5.2 5.3 4.1 5.3 5.1 4.6 4.8 5.6
597.8 602.4 598 596.8 600.4
4.9 4.6 4.8 5 5.1 5.3 4.7 5.2 4.7 5
600.8 600.4 598.2 599.4 601.2
4.5 5.2 5.1 5.2 4.9 5 4.8 5 5.1 4.5
599.4 598 599 598.4 603.6
4.3 5.7 4.1 4.8 5 4.6 4.9 4.9 5 5.2 600.4 600 604.2 600.6 599.4
5 4.5 5 4.9 5 4.5 5.3 4.5 5.3 5.3 602.4 598.4 600.8 600.8 596.4
4.9 4.4 5 5.1 5.1 4.8 5.3 4.7 5.1 4.9 603.8 600.8 598 601.6 602.4
4.7 4.8 5.6 4.9 5.2 4.4 4.7 4.9 4.6 5 598.4 603.4 602.2 599.2 604.2
600.6 601.6 600.2 601 601.2
600 601.6 597.6 602.2 603.6
18) En el departamento de ensamble de motores de 603.4 599.4 601.4 601.2 602.2
una planta automotriz, se tiene que una de las 600.4 599.8 599.8 601.8 597.6
599 599 599.6 602 600.8
partes del motor, el árbol de levas, debe tener
una longitud de 600mm (+/-) 2mm para cumplir
con las especificaciones de ingeniería.
MEDIDAS DE VARIABILIDAD.
Hay un problema crónico con la longitud del
árbol de levas, ya que se sale de especificaciones,
Para medir el grado de dispersión de una variable,
y crea un problema de reducción del rendimiento
se utilizan principalmente los siguientes
de la línea de producción y altas tasas de re
indicadores:
trabajo y desperdicio. El supervisor del
 Rango o recorrido
departamento monitorea esta característica,
 Varianza y desviación típica o estándar
durante un mes. Para esto recibe proveedor.
 Coeficiente de variabilidad.
Determinar las medidas de tendencia central.

1.- RANGO O RECORRIDO


Es la medida de dispersión más sencilla ya que solo
considera los dos valores extremos de una colección
de datos, sin embargo, su mayor utilización está en
el campo de la estadística no paramétrica.
R = Xmax – Xmin
Xmax, Xmin son el máximo y el mínimo valor de la
variable X, respectivamente.
PRÁCTICA DE MEDIDAS DE TENDEMCIA
2.- VARIANZA. CENTRAL Y DISPERCIÓN:
La varianza es uno de los parámetros más
importantes en estadística paramétrica, se puede 1) Determinar las medidas de dispersión
decir que, teniendo conocimiento de la varianza de Intervalo Fi
una población, se ha avanzado mucho en el 150-155 3
conocimiento de la población misma. 155-160 6
Numéricamente definimos la varianza, como 160-165 12
desviación cuadrática media de los datos con 165-170 18
respecto a la media aritmética, 170-175 25
Para datos no agrupados: 175-180 17
180-185 10
∑𝑚 ̅ 2
1 (𝑋𝑖 + 𝑋 ) 185-190 7
2
𝑆 =
𝑛−1 190-195 4
Para datos agrupados. 195-200 1
∑𝑚
1 (𝑋𝑖+ 𝑋̅)2 ∗ 𝑓𝑖
𝑆2 =
𝑛−1
2) Un investigador estaba realizando un estudio
DESVIACIÓN ESTANDAR: sobre el ingreso per cápita mensual de una cierta
𝟐 cantidad de familias en EEUU, pero
𝑺 = √𝑺𝟐
accidentalmente dio vuelta la taza de café sobre

COEFICIENTE DE VARIABILIDAD su informe, perdiendo algunos datos. Después

Generalmente interesa establecer comparaciones de de secar la hoja de papel, se podían distinguir de

la dispersión, entre diferentes muestras que posean una tabla de distribución simétrica de

distintas magnitudes o unidades de medida. frecuencias la siguiente información sobre el

El coeficiente de variabilidad tiene en cuenta el valor ingreso per cápita en dólares de 150 familias.

de la media aritmética, para establecer un número X4= 7000, f3= 24, h 1= 0,08, k = 7, H 4= 0,62,

relativo, que hace comparable el grado de dispersión f1X1 = 48000. Determine las medidas de

entre dos o más variables, y se define como: dispersión.


3) Un fabricante de neumáticos ha recabado, de los
𝑆 diferentes concesionarios, información sobre la
𝐶𝑉 = ∗ 100
𝑋̅ cantidad de miles de kilómetros recorridos por
un modelo concreto de esos neumáticos hasta
que se ha producido un pinchazo o un reventón
del neumático. Los concesionarios la han clases adecuados. ¿Señala también la marca de
proporcionado los siguientes datos: clase en cada caso?
52.45 50.43 37.75 51.83 73.81 61.07 35.81 57.28 7,36 7,29 7,43 7,40 7,36 7,41
48.7 65.85 75.85 36.95 75.55 69.01 61.48 65.59
44.41 41.89 34.75 59.89 59.45 67.63 89.12 69.48 7,35 7,31 7,26 7,37 7,28 7,37
63.69 70 66 55.99 49.68 46.5 67.47 64.4 7,36 7,35 7,24 7,33 7,42 7,36
84.59 40.71 50.24 61.39 85.72 45.31 46.72 61.75
7,39 7,35 7,45 7,36 7,42 7,40
55.64 55.91 46.68 66.52 59.17 66.31 35.88 28.63
47.01 71.36 78.64 41.72 72.64 41.46 49 48.17 7,28 7,38 7,25 7,33 7,34 7,32
79.43 67.66 53.32 49.01 29.48 41.13 30.25 33.41 7,33 7,30 7,32 7,30 7,39 7,34
48.24 57.88 55.26 84.66 48.66 10.5 60.95 38.42
74.24 60.73 56.16 86.07 90.57 53.75 76.58 68.63
7,38 7,39 7,27 7,35 7,35 7,32
51.18 74.58 58.71 48.04 67.12 41.83 61.03 58.27
61.98 4.307 41.54 62.22 51.27 82.92 34.18 37.65
80.5 35.34 44.72 37.4 6) El siguiente cuadro, se refiere al contenido de
grasa (expresado en libras) de 200 frascos de
Determinar las medidas de dispersión Yogur en presentación de 2.5 libras, referidos a
una muestra aleatoria extraída de un lote de
4) Una fábrica de coches desea estudiar el 3.600 frascos correspondientes a la producción
consumo de un nuevo modelo de coche que de un mes de la compañía. Determinar las
quiere lanzar al mercado. Para ello realiza cien medidas de dispersión
pruebas echando diez litros de gasolina y viendo 0.32 0.24 0.21 0.27 0.35 0.23 0.28 0.32 0.29 0.26
que distancia en kilómetros recorre el coche. 0.33 0.29 0.2 0.22 0.29 0.27 0.28 0.34 0.26 0.25
0.29 0.25 0.24 0.24 0.25 0.23 0.25 0.21 0.25 0.22
Los resultados de las pruebas fueron los
0.3 0.23 0.25 0.27 0.26 0.2 0.28 0.31 0.25 0.26
siguientes: 0.18 0.31 0.24 0.25 0.25 0.27 0.17 0.21 0.23 0.28
0.28 0.32 0.2 0.31 0.2 0.32 0.27 0.27 0.25 0.23
85 90 91 88 91 91 86 92 90 89
0.22 0.23 0.23 0.31 0.27 0.23 0.24 0.26 0.36 0.27
91 87 88 88 90 90 89 90 90 89
0.2 0.2 0.29 0.27 0.27 0.28 0.21 0.33 0.29 0.24
91 87 90 84 91 88 90 88 88 88
0.19 0.27 0.21 0.28 0.26 0.27 0.31 0.27 0.25 0.25
92 90 90 90 93 90 89 92 91 92
0.23 0.31 0.27 0.22 0.29 0.27 0.25 0.28 0.2 0.23
89 88 91 89 90 90 88 90 89 86
0.19 0.25 0.26 0.28 0.24 0.3 0.24 0.16 0.16 0.27
90 88 88 94 91 90 92 87 90 91
0.24 0.27 0.27 0.2 0.23 0.27 0.29 0.29 0.26 0.29
92 88 92 92 88 89 88 91 89 91
0.34 0.33 0.21 0.27 0.24 0.31 0.28 0.2 0.25 0.26
91 88 88 92 89 87 88 88 91 88
0.24 0.29 0.25 0.26 0.25 0.21 0.24 0.22 0.26 0.29
89 90 93 89 91 92 89 85 86 91
0.23 0.24 0.26 0.26 0.24 0.28 0.25 0.27 0.3 0.29
89 87 88 88 93 90 95 89 92 89 0.22 0.28 0.23 0.23 0.22 0.29 0.24 0.25 0.25 0.25
0.26 0.23 0.27 0.22 0.24 0.29 0.23 0.29 0.31 0.21
Determinar las medidas de dispersión 0.33 0.23 0.28 0.21 0.22 0.34 0.28 0.32 0.22 0.22
0.26 0.36 0.32 0.25 0.25 0.25 0.27 0.27 0.28 0.2
0.24 0.27 0.22 0.27 0.24 0.23 0.3 0.17 0.31 0.26
5) La tabla siguiente muestra longitudes en cm. de
42 tornillos. Determinar las medidas de
7) En la elaboración de envases de plásticos,
tendencia central., utilizando intervalos de
primero se elabora la preforma, para la cual se
tienen varios criterios de calidad, uno de ellos es muestran a continuación: Determinar las
el peso de la preforma. Para cierto envase se medidas de tendencia central.
tiene que el peso debe estar entre 28.00 ± 0.5g.
A continuación, se muestran los últimos 112
4.8 4.7 4.7 4.9 4.7 4.6 4.2 5 5.3 4.4
datos obtenidos mediante una carta de control
4.8 4.5 5.1 4.7 5 4.6 5.3 4.9 5 4.5
para esta variable. Determinar las medidas de 5.1 5.3 5 5.1 5.3 4.8 5.1 5.2 4.4 5
dispersión 4.6 5.1 4.9 5.3 5.1 4.9 4.4 5.1 4.7 4.7
4.9 4.6 4.6 5.1 4.5 4.4 4.7 5.2 4.6 5
5 4.2 5.2 5.3 4.1 5.3 5.1 4.6 4.8 5.6
27.72 28.39 28.21 28.19 28.02 27.92
4.9 4.6 4.8 5 5.1 5.3 4.7 5.2 4.7 5
27.96 27.94 28.04 28.05 27.81 27.74
27.87 27.87 27.82 28.23 27.9 27.91
4.5 5.2 5.1 5.2 4.9 5 4.8 5 5.1 4.5
28.02 28 27.99 28.13 28.26 28.1
4.3 5.7 4.1 4.8 5 4.6 4.9 4.9 5 5.2
27.95 27.94 27.81 27.76 27.96 27.84 5 4.5 5 4.9 5 4.5 5.3 4.5 5.3 5.3
28.04 28.19 27.89 28.08 28.09 28.02 4.9 4.4 5 5.1 5.1 4.8 5.3 4.7 5.1 4.9
28.13 27.88 28.11 28.05 28.14 28.11 4.7 4.8 5.6 4.9 5.2 4.4 4.7 4.9 4.6 5
27.94 28.19 28.1 27.78 27.63 27.93
27.85 27.84 28.12 28.01 27.97 27.88
9) En el departamento de ensamble de motores de
27.97 27.9 27.87 27.94 28.01 28.13
27.89 27.88 28.06 27.91 27.91 27.95 una planta automotriz, se tiene que una de las
27.95 27.91 27.93 28.07 28.13 27.93 partes del motor, el árbol de levas, debe tener
28.16 27.94 27.86 27.84 27.7 27.98
27.94 28.07 27.84 27.9 27.87 27.76 una longitud de 600mm (+/-) 2mm para cumplir
27.85 27.93 28.22 27.96 27.88 28.08 con las especificaciones de ingeniería.
27.85 28.27 27.75 27.98 27.75 27.82
Hay un problema crónico con la longitud del árbol
28.08 28.16 28.04 28.05 27.75 27.89
27.74 28.1 28.14 27.91 27.84 28.21 de levas, ya que se sale de especificaciones, y crea
28 28.1 28.16 28.16 un problema de reducción del rendimiento de la
línea de producción y altas tasas de re trabajo y
8) Con el propósito de mejorar la calidad que se
desperdicio. El supervisor del departamento
tenía en cuanto al grosor de las láminas 5+- 0.7,
monitorea esta característica, durante un mes. Para
un grupo implementa un proyecto de mejora
esto recibe proveedor. Determinar las medidas de
siguiendo la metodología. Varios de los cambios
dispersión
implementados fueron relativos a los
procedimientos empleados durante el proceso ya
y la estandarización de los mismos. Para
verificar si el plan tuvo éxito, se eligieron
láminas aleatoriamente y midiendo su grosor.
Los 120 datos obtenidos durante tres días se
601.6 602.8 598.4 598.2 600.8 48,1 46,0 48,2 45,9 42,1
599.6 602 598.6 597.2 598.2 44,8 49,8 45,6 45,7 47,8
600 600.4 598.6 599.4 597.6
49,2 41,1 42,6 41,2 45,5
599.6 600.2 598 600.6 596.8
597.6 599 602.2 601.6 599.8 41,4 45,2 45,8 41,9 44,0
599.8 600.2 602.8 603.6 600.2 45,6 48,6 48,6 42,2 46,5
600 601.8 600.4 600.8 597
46,3 46,8 49,4 40,5 40,6
600.2 602.8 599.8 596.2 600.4
597.8 602.4 598 596.8 600.4 40,6 45,8 45,1 40,5 40,1
600.8 600.4 598.2 599.4 601.2 48,7 43,9 42,6 48,5 40,4
599.4 598 599 598.4 603.6
43,7 44,2 47,6 42,1 49,8
600.4 600 604.2 600.6 599.4
602.4 598.4 600.8 600.8 596.4 40,9 42,8 44,6 45,9 44,7
603.8 600.8 598 601.6 602.4
598.4 603.4 602.2 599.2 604.2 12) Determinar las medidas de dispersión.
600.6 601.6 600.2 601 601.2
600 601.6 597.6 602.2 603.6 94,3 93,0 95,5 95,3 92,4
603.4 599.4 601.4 601.2 602.2 94,4 92,8 93,2 93,6 95,5
600.4 599.8 599.8 601.8 597.6 92,9 93,6 95,7 93,8 94,8
599 599 599.6 602 600.8
93,6 92,7 91,6 93,6 93,7
94,2 95,7 94,7 94,3 92,7
10) Determinar las medidas de dispersión.
94,5 96,2 95,4 93,7 91,9
94,7 92,7 95,0 93,0 92,9
247,9 223,2 233,7 246,7 227,6
93,7 92,7 93,3 94,6 96,4
235,2 231,3 239,0 242,7 249,8
94,1 93,7 94,2 93,7 94,0
242,2 224,7 228,6 246,9 243,2
93,9 93,6 94,6 92,3 94,0
227,0 240,1 249,8 228,3 243,6
247,6 233,6 241,7 222,1 241,4
13) Determinar las medidas de dispersión.
231,4 247,2 234,3 234,1 229,4
71,8 73,1 72,6 70,2 71,2
237,2 248,1 224,6 248,5 223,7
71,1 74,3 70,5 74,2 73,4
226,1 231,7 230,6 221,7 231,8
71,5 71,9 71,1 74,6 74,4
228,7 228,7 235,3 224,4 246,2
70,6 73,9 74,9 73,2 70,4
233,2 225,0 249,3 234,7 229,7
71,6 74,0 74,8 74,7 70,5
230,6 248,3 242,9 225,2 245,6
74,9 70,3 74,7 73,0 74,0
74,4 72,7 74,4 70,2 74,3
11) Determinar las medidas de dispersión.
72,7 72,0 72,5 75,0 71,5
42,3 49,3 45,2 42,6 40,6
70,8 74,7 74,4 73,6 74,1
42,3 46,0 44,7 40,8 42,9
44,4 44,5 48,8 43,2 48,5
14) Determinar las medidas de dispersión
Intervalo Fi 17) Las ganancias diarias de los establecimientos de
150-155 3 un centro comercial se presentan en una tabla de
155-160 6 frecuencias con 6 intervalos de clase y se sabe
160-165 12 que: la mínima ganancia es de $6, el rango es
165-170 18 36, el promedio de ganancias diarias es $25.14,
170-175 25 el 50% de los establecimientos ganan más de
175-180 17 25.58 dólares diarios, H2=0.15, F2=120,
180-:85-190 7 h3=0.25, H5=0.93, f4=304, f2=2f1. Reconstruir la
190-195 4 distribución de todas las frecuencias y hallar la
195-200 1 ganancia más frecuente y la ganancia promedio.

15) Determinar las medidas de dispersión. 18) Determinar su varianza

X f Nº preguntas Nº de alumnos
68 1 0-10 10
69 3 10-15 20
70 2 15-20 60
71 8 20-23 100
72 3 23-25 70

73 2 25-30 30

74 1 30-40 10

16) Dado el siguiente cuadro estadístico con ancho SEMANA 11

de clase constante igual a 20. Determine las


medidas de dispersión. PRIMER EXAMEN PARCIAL

Li  Ls  Xi f i Fi X i f i
880 TEORÍA DE PROBABILIDAD

1950
Definición:
35 1800
La probabilidad es una medida numérica de la
13
posibilidad de que ocurra un evento. Por tanto, las
200)
probabilidades son una medida del grado de
4 70
incertidumbre asociado con cada uno de los eventos
previamente enunciados. Si cuenta con las
probabilidades, tiene la capacidad de determinar la elemento del espacio muestral se denomina también
posibilidad de ocurrencia que tiene cada evento. punto muestral. Esto es, el espacio muestral se
describe. Si el espacio muestral tiene un número
Experimento aleatorio finito de elementos es posible enlistar a todos estos,
y si el número de elementos es grande o infinito el
Definición. Un experimento aleatorio es todo espacio muestral se describirá mediante un
proceso que consiste de la ejecución de un acto (o enunciado o regla.
prueba) una o más veces, cuyo resultado en cada
prueba depende del azar y en consecuencia no se Ejemplo:
puede predecir con certeza A continuación se dan algunos experimentos
En estadística la palabra experimento se utiliza para aleatorios y sus correspondientes espacios
describir un proceso que genera un conjunto de datos muéstrales:
cualitativos o cuantitativos. En la mayoría de los 1) El experimento aleatorio de lanzar un dado y
casos, los resultados del experimento dependen del observar el resultado obtenido, es de una sola prueba,
azar, por lo tanto no pueden pronosticarse con cuyo espacio muestral se puede escribir como el
exactitud. siguiente conjunto de puntos muéstrales:
Por ejemplo, son experimentos aleatorios: lanzar un Q = {1,2, 3 ,4 , 5, 6 }.
dado y observar el resultado, contar objetos
defectuosos producidos diariamente por cierto 2) El experimento aleatorio de lanzar una moneda 3
proceso, aplicar una encuesta para obtener opiniones, veces, consiste de 3 pruebas, cuyo espacio muestral
etc. puede escribirse como el conjunto de ternas
ordenadas.
Espacio muestral A= {ccc, ccs, csc, scc, ssc, scs, css, sss}.
Definición. Se denomina espacio muestral al
conjunto que consiste de todos los resultados ¿Cómo se mide la probabilidad?
posibles de un experimento aleatorio. Este conjunto Uno de los métodos más utilizados es aplicando la
se denotará por. Regla de Laplace: define la probabilidad de un
Si el espacio muestral tiene un número finito de suceso como el cociente entre casos favorables y
elementos es posible enlistar a todos estos, y si el casos posibles.
número de elementos es grande o infinito el espacio
muestral se describirá mediante un enunciado o P(A) = Casos favorables / casos posibles
regla.
Probabilidad de un suceso
Cada resultado posible de un experimento aleatorio La probabilidad de un suceso, S, indica el grado de
es un elemento del espacio muestral. A cada posibilidad de que ocurra dicho suceso. Se expresa
mediante un número comprendido entre 0 y 1, entre Dos sucesos son independientes entre sí, si la
0% y 100% y lo escribimos P(S) ocurrencia de uno de ellos no afecta para nada a la
Si P(S) está próximo a 0 el suceso es poco probable ocurrencia del otro:
y será más probable cuanto más se aproxime a 1, que
Ejemplo: el suceso estatura de los alumnos de una
es la probabilidad del suceso seguro, P(E)=1.
clase y el color del pelo son independientes: el que
Una probabilidad es una medida de la posibilidad que
un alumno sea más o menos alto no va a influir en el
tiene un suceso de ocurrir.
color de su cabello, ni viceversa.

Dentro de los sucesos posibles vamos a distinguir: Para que dos sucesos sean independientes tienen
que verificar al menos una de las

Suceso igual de probable: es aquel resultado que siguientes condiciones:

tiene la misma probabilidad que los demás: P (B/A) = P (B) es decir, que la probabilidad de
Por ejemplo: cuando lanzamos una moneda, el que se de el suceso B, condicionada a que
suceso "cara" tiene las mismas probabilidades que el previamente se haya dado el suceso A, es
suceso "cruz". exactamente igual a la probabilidad de B.

Ejemplo: la probabilidad de que al tirar una


Suceso muy probable: es aquel resultado que tiene
moneda salga cara (suceso B), condicionada a que
muchas probabilidades de darse:
haga buen tiempo (suceso A), es igual a la propia
Por ejemplo: en una bolsa con 100 bolitas numeradas
probabilidad del suceso B.
del 1 al 100, el suceso "sacar una bola con un número
entre 1 y 98" tiene muchas probabilidades de ocurrir. P (A/B) = P (A) es decir, que la probabilidad de que
se de el suceso A, condicionada a que previamente
Suceso poco probable: es aquel resultado que tiene se haya dado el suceso B, es exactamente igual a la
muy pocas probabilidades de darse: probabilidad de A.
Por ejemplo: en una bolsa con 100 bolitas, 99 blanca
Ejemplo: la probabilidad de que al tirar una moneda
y 1 negra, el suceso "sacar la bola negra" tiene pocas
salga cara (suceso B), condicionada a que haga buen
probabilidades de ocurrir.
tiempo (suceso A), es igual a la propia probabilidad
del suceso B.
Si un suceso es imposible entonces P(S) = 0
Si un suceso es cierto entonces P(S) = 1 PROBABILIDAD CONDICIONAL.

Las probabilidades condicionadas se calculan una


SUCESOS SON INDEPENDIENTES vez que se ha incorporado información adicional a la
situación de partida:
Ejemplo: se tira un dado y sabemos que la P (A) = 1/2
probabilidad de que salga un 2 es 1/6 (probabilidad a
P (B/A) = (1/6) / (1/2) = 1/3
priori). Si incorporamos nueva información (por
ejemplo, alguien nos dice que el resultado ha sido un 2º ejemplo:

número par) entonces la probabilidad de que el En un estudio sanitario se ha llegado a la conclusión


resultado sea el 2 ya no es 1/6. de que la probabilidad de que una persona sufra

Las probabilidades condicionadas se calculan problemas coronarios (suceso B) es el 0,10

aplicando la siguiente fórmula: (probabilidad a priori).

Además, la probabilidad de que una persona sufra


problemas de obesidad (suceso A) es el 0,25 y la
probabilidad de que una persona sufra a la vez
O
problemas de obesidad y coronarios (suceso
intersección de A y B) es del 0,05.

Calcular la probabilidad de que una persona sufra


problemas coronarios si está obesa (probabilidad
Donde:
condicionada P(B/A)).
 P (B/A) es la probabilidad de que se de el suceso
B condicionada a que se haya dado el suceso A.
 P (B L A) o (B Ո A) es la probabilidad del suceso P (B L A) = 0,05

simultáneo de A y de B P (A) = 0,25


 P (A) es la probabilidad a priori del suceso A
P (B/A) = 0,05 / 0,25 = 0,20
En el ejemplo que hemos visto:
Ejemplo:
P (B/A) es la probabilidad de que salga el número 2
Se sabe que el 50% de la población fuma y que el
(suceso B) condicionada a que haya salido un
10% fuma y es hipertensa. ¿Cuál es la probabilidad
número par (suceso A).
de que un fumador sea hipertenso?
P (B L A) es la probabilidad de que salga el dos y
A = {ser hipertenso} B = {ser fumador}
número par.
AÇB = {ser hipertenso y fumador}
P (A) es la probabilidad a priori de que salga un p(A|B) = 0,10/0,50 = 0,20
número par.

Por lo tanto:

P (B L A) = 1/6 Definición, experimento aleatorio


Suceso, espacio muestral, tipos de suceso
Probabilidad de un suceso
Probabilidad con sucesos independientes
Probabilidad condicional La media y la
distribución
estándar de
la distribución son:
SEMANA 13

DISTRIBUCIÓN CON VARIABLES


DISCRETAS

1) DISTRIBUSIÓN BINOMIAL.
2) DISTRIBUCIÓN DE POISSON
Es frecuente que en control de calidad se den
Una tercera distribución de probabilidades discretas
variables del tipo “pasa, no pasa”.
se llama distribución de probabilidad e Poisson, por
Por ejemplo, un artículo cumple con especificaciones
Simeon Poisson, quien la describió en 1837. La
o no, una pieza resiste cierta fuerza o no, una lámpara
distribución se puede aplicar en muchos casos donde
enciende o no. Un experimento aleatorio donde los
intervienen observaciones por unidad de tiempo: por
posibles resultados de cada ensayo son: “éxito” o
ejemplo, contar automóviles que llegan a una caseta
“fracaso” se conoce como experimento
de autopista en intervalos de 1 min, la cantidad de
Bernoulli. Un experimento aleatorio que consiste en
descomposturas de una máquina en 1 día y la
una secuencia de n ensayos
cantidad de clientes que entran a un almacén en
Bernoulli donde además se cumple que:
intervalos de 5 minutos. También se puede aplicar
1. Los ensayos son independientes.
esa distribución a casos acerca de observaciones por
2. La probabilidad de éxito en cada ensayo, denotada
unidad de cantidad; por ejemplo contar las no
por p, permanece constante.
conformidades de tejido en 1000 m2 de tela, la
Entonces este experimento recibe el nombre de
cantidad de no conformidades por número de
experimento binomial. La variable aleatoria X, que es
peticiones de servicio por semana, y la cuenta de
igual al número de ensayos donde el resultado es un
remaches no conformes en un vehículo recreativo.
éxito, tiene una distribución binomial (n, p). La
En cada una de las situaciones anteriores hay muchas
función de probabilidades de X es,
oportunidades iguales e independientes para la
ocurrencia de un evento. Cada remache en un
vehículo recreativo tiene igual oportunidad de ser no
conformidad; sin embargo, sólo habrá unas pocas no
conformidades en los cientos de remaches. La
distribución de Poisson también se aplica cuando n representación gráfica es la curva de distribución
es bastante grande y p0 es pequeña. normal también denominada campana de Gauss en
La fórmula de la distribución de Poisson es: honor del renombrado científico alemán Carl
Friedrich Gauss a quien se le atribuye erróneamente
su invención pero que sin duda la usó frecuentemente
para analizar fenómenos astronómicos con éxito.

Donde e = 2.718 y ! es el símbolo factorial, además


la media y la varianza para esta distribución son μ =
λ y σ 2 = λ.
A manera de ejemplo, en una empresa se reciben en
promedio 5 quejas diarias por mal servicio.
Si el número de quejas por día se distribuye Poisson
con λ = 5, ¿cuál es la probabilidad de no recibir
quejas en un día? Esto se obtiene con:
f (0; 5) = e−5 (5)0/0! = 0.007 Una distribución normal se caracteriza por:
Esta probabilidad de 0.007 es muy baja, por lo que 1. Los valores de las mediciones tienden a agruparse
en realidad sería muy raro que en un día no se alrededor de un punto central, la media
recibiera ninguna queja. 2. La representación de los datos es simétrica a
ambos lados de la media
SEMANA 14 Y 15 3. Las desviaciones estándares quedan situadas a
igual distancia unas de otras
3) DISTRIBUCIÓN NORMAL. 4. La proporción de mediciones situada entre la
media y las desviaciones es una constante en la que:
La distribución normal es una distribución de  La media ± 1 * desviación estándar = cubre
probabilidad de variable continua que describe los el 68,3% de los casos
datos que se agrupan en torno a un valor central.  La media ± 2 * desviación estándar = cubre
Todo proceso en el que solo existan causas aleatorias el 95,5% de los casos.
de variación sigue una ley de distribución normal.  La media ± 3 * desviación estándar = cubre
Esta condición que aparece con frecuencia en el 99,7% de los casos.
fenómenos naturales (de ahí que se la denomine
“normal”), puede obtenerse en los procesos Podemos analizar el comportamiento de los procesos
industriales si los procesos se llevan a un esta do en gráficos y determinar su efectividad tomando como
el que solo existen causas comunes de variación. La base su grado de aproximación a la curva de
distribución normal a partir de los datos generados y Calcule la probabilidad de un valor localizado entre
la creación de histogramas que permitan la 75.0 y 90.0.
comparación con curva de distribución normal.

90 − 80 10
Como se deduce de este último apartado, no existe z= = 14 = 0.71 =
14
75 − 80 −5
una única distribución normal, sino una familia de z= = = −0.36 =
14 14
distribuciones con una forma común, diferenciadas
por los valores de su media y su varianza. De entre p(75 ≤ x ≤ 90) = 0.7611 – 0.3594 = 0.4017
todas ellas, la más utilizada es la distribución
normal estándar, que corresponde a una
distribución de media 0 y varianza 1. Así, la
expresión que define su densidad se puede obtener,
resultando:

75 80 90
μ

Es importante conocer que, a partir de cualquier


PRÁCTICA CALIFICADA DE
variable X que siga una distribución , se
DISTRIBUCIÓN NORMAL.
puede obtener otra característica Z con una
distribución normal estándar, sin más que efectuar la 1.- Un proceso industrial produce tornillos cuyos
transformación: diámetros tienen una distribución normal con media
y desviación estándar iguales a 0.498 y 0.002
respectivamente. Si las especificaciones requieren
que el diámetro sea igual a 0.500 ± 0.004 centímetros
Se utiliza la desviación
¿qué fracción de la población será inaceptable?
promedio, cuando se
tiene la muestra. a). 0.81 b). 0.16 c). 0.84
𝜎𝑥
𝜎𝑥̅ =
√𝑛 d). 0.58 e). 1

2).- El 40% de los animales de un rodeo son de raza


Ejemplo; si:
A y el resto, de raza B. El peso de los animales de la
raza A sigue una distribución normal con media 250
µ = 80 x−𝜇
z= kg y varianza 400 kg². El peso de los animales de la
σ = 14 𝜎
raza B sigue una distribución normal con media 270
kg y desvío típico 30 kg. ¿Qué porcentaje de 7.- Entre las ciudades de Estados Unidos con una
animales tiene peso superior a 240? población de más de 250,000 habitantes, la media del
tiempo de viaje de ida al trabajo es de 24.3 minutos.
a). 0.81 b). 0.1 c). 0.6
El tiempo de viaje más largo pertenece a la ciudad de
d). 0.7 | e). 0.781
Nueva York, donde el tiempo medio es de 38.3
3.- se tiene µ = 80; σ = 14 Calcule la probabilidad de
minutos. Suponga que la distribución de los tiempos
un valor de 75. ó menor.
de viaje en la ciudad de Nueva York tiene una

a). 25% b). 96% c). 36% distribución de probabilidad normal y la desviación

d). 15e). 10% estándar es de 7.5 minutos, ¿Qué porcentaje de viajes


consumen entre 30 y 35 minutos?
4.- se tiene µ = 80; σ = 14 Calcule la probabilidad de
un valor localizado entre 55.0 y 70.0. a). 19.65% b). 14.5% c)10%

a).10% b).20% c). 30% d). 56.8% e). 89%

d). 40% e). N.A. 8.- En 2004 y 2005, el costo medio anual para asistir
a una universidad privada en Estados Unidos era de
5.- Los montos de dinero que se piden en las
$20,082. Suponga que las distribuciones de los
solicitudes de préstamos en Down River Federal
costos anuales se rigen por una distribución de
Savings tiene una distribución normal, una media de
probabilidad normal y que la desviación estándar es
$70,000 y una desviación estándar de $20,000. Esta
de $4,500. El 95% de los estudiantes de
mañana se recibió una solicitud de préstamo. ¿Cuál
universidades privadas paga menos de ¿Qué
es la probabilidad de que El monto solicitado sea de
cantidad?
$80,000 o superior?
a).27,462. b). 10,289.4 c). 1000
a). 30.8% b).-25.8% c). 12.7
d). 32451 e). N.A
d).- 48.6 e). 50%
9.- En el último año, el peso de los recién nacidos
6.- Los montos de dinero que se piden en las
tiene una media de 3000 gr. y desviación estándar de
solicitudes de préstamos en Down River Federal
140 gr. ¿Cuál será la probabilidad de que la media de
Savings tiene una distribución normal, una media de
una muestra de 100 recién nacidos sea superior a
$70,000 y una desviación estándar de $20,000. ¿Esta
3030 gr
mañana se recibió una solicitud de préstamo El
monto solicitado oscile entre $65,000 y $80,000? a). 18.4% b). 98.4% c) 15%

a). 19% b). 12% c). 29% d). 54.6% e). N.a.

d). 35% e). N.A


10. En una ciudad se estima que la temperatura b) El valor de x a la derecha del cual caería el 15%
máxima en el mes de junio sigue una distribución de las medias calculadas de muestras aleatorias de
normal, con media 23° y desviación típica 5°. tamaño nueve.
Calcular el número de días del mes en los que se
14.- Un investigador científico reporta que unos
espera alcanzar máximas entre 21° y 27°.
ratones vivirán un promedio de 40 meses cuando sus
a). 12 b) 2 c) 25
dietas se restringen drásticamente y después se
d). 13 e). 35
enriquecen con vitaminas y proteínas. Suponga que
11. Una empresa lleva a cabo una prueba para
las vidas de tales ratones se distribuyen normalmente
seleccionar nuevos empleados. Por la experiencia
con una desviación estándar de 6.3 meses, encuentre
de pruebas anteriores, se sabe que las puntuaciones
la probabilidad de que un ratón dado viva más de 32
siguen una distribución normal de media 80 y
meses.
desviación típica 25. ¿Qué porcentaje de candidatos
obtendrá entre 75 y 100 puntos? 15.- Se regula una máquina despachadora de refresco
a).16,4 % b).6,4 % c).36,74 % para que sirva un promedio de 200 mililitro por vaso.
d).15,7 % e).65,74 % Si la cantidad de bebida se distribuye normalmente
12.- El tiempo que el cajero de un banco con servicio con una desviación estándar igual a 15 mililitros.
en el automóvil atiende a un cliente es una variable
a) ¿qué fracción de los vasos contendrán más de 224
aleatoria con media μ = 3.2 minutos y una desviación
mililitros?
estándar σ = 1.6 minutos. Si se observa una muestra
aleatoria de 64 clientes, encuentre la probabilidad de b) ¿cuál es la probabilidad de que un vaso contenga
que su tiempo medio con el cajero sea: entre 191 y 209 mililitros?

a) a lo más 2.7 minutos; c) ¿cuántos vasos probablemente se derramarán si se


utilizan vasos de 230 mililitros para las siguientes
b) más de 3.5 minutos;
1000 bebidas?
c) al menos 3.2 minutos, pero menos de 3.4 minutos.
d) ¿por debajo de qué valor obtendremos 25% de las
13.- La vida media de una máquina para hacer pasta bebidas más pequeñas?
es de siete años, con una desviación estándar de un
16) La vida promedio de cierto tipo de motor
año. Suponga que las vidas de estas máquinas siguen
pequeño es 10 años con una desviación estándar de
aproximadamente una distribución normal,
dos años. El fabricante reemplaza gratis todos los
encuentre:
motores que fallen dentro del tiempo de garantía. Si
a) La probabilidad de que la vida media de una está dispuesto a reemplazar sólo 3% de los motores
muestra aleatoria de nueve de estas máquinas caiga que fallan, ¿de qué duración debe ser la garantía que
entre 6.4 y 7.2 años;
ofrezca? Suponga que la duración de un motor sigue los resultados obtenidos. Esto quiere decir que un
una distribución normal. porcentaje del 100% equivale a decir que no existe
ninguna duda para generalizar tales resultados, pero
también implica estudiar a la totalidad de los casos
de la población.

El error o porcentaje de error equivale a elegir una


probabilidad de aceptar una hipótesis que sea falsa
como si fuera verdadera, o la inversa: rechazar a
SEMANA 16 hipótesis verdadera por considerarla falsa. Al igual
SEGUNDA PRÁCTICA. que en el caso de la confianza, si se quiere eliminar
el riesgo del error y considerarlo como 0%, entonces
SEMANA 17 la muestra es del mismo tamaño que la población, por
lo que conviene correr un cierto riesgo de
TAMAÑO DE LA MUESTRA equivocarse.

En Estadística el tamaño de la muestra es el número La variabilidad es la probabilidad (o porcentaje) con

de sujetos que componen la muestra extraída de una el que se aceptó y se rechazó la hipótesis que se

población, necesarios para que los datos obtenidos quiere investigar en alguna investigación anterior o

sean representativos de la población. en un ensayo previo a la investigación actual. El


porcentaje con que se aceptó tal hipótesis se
Para calcular el tamaño de una muestra hay que denomina variabilidad positiva y se denota por p, y
tomar en cuenta tres factores: el porcentaje con el que se rechazó se la hipótesis es
la variabilidad negativa, denotada por q.
 El porcentaje de confianza con el cual se
Hay que considerar que p y q son complementarios,
quiere generalizar los datos desde la muestra
es decir, que su suma es igual a la unidad: p+q=1.
hacia la población total.
Además, cuando se habla de la máxima variabilidad,
 El porcentaje de error que se pretende aceptar en el caso de no existir antecedentes sobre la
al momento de hacer la generalización. investigación (no hay otras o no se pudo aplicar una
prueba previa), entonces los valores de variabilidad
 El nivel de variabilidad que se calcula para es p=q=0.5.
comprobar la hipótesis.
SUPUESTOS

La confianza o el porcentaje de confianza es el El tamaño de la muestra depende de tres aspectos:


porcentaje de seguridad que existe para generalizar
1) Error permitido Hay que tomar nota de que debido a que la
variabilidad y el error se pueden expresar por medio
2) Nivel de confianza estimado
de porcentajes, hay que convertir todos esos valores
a proporciones en el caso necesario.
3) Carácter finito o infinito de la población.
También hay que tomar en cuenta que el nivel de
Las fórmulas generales para determinar el tamaño
confianza no es ni un porcentaje, ni la proporción que
de la muestra son las siguientes:
le correspondería, a pesar de que se expresa en

Para poblaciones infinitas (más de 100,000 términos de porcentajes. El nivel de confianza se

habitantes) obtiene a partir de la distribución normal estándar,


pues la proporción correspondiente al porcentaje de
Para poblaciones finitas (menos de 100,000 confianza es el área simétrica bajo la curva normal
habitantes) que se toma como la confianza, y la intención es
buscar el valor Z de la variable aleatoria que
corresponda a tal área.

TAMAÑO DE MUESTRA PARA UNA En el caso de que sí se conozca el tamaño de la


PORPORCION. población entonces se aplica la siguiente fórmula:

FORMULAS.

Vamos a presentar dos fórmulas, siendo la primera


la que se aplica en el caso de que no se conozca con Donde:
precisión el tamaño de la población, y es.
n es el tamaño de la muestra.

Z es el nivel de confianza.

Donde: p es la variabilidad positiva.

n es el tamaño de la muestra. q es la variabilidad negativa.

N es el tamaño de la población.
Z es el nivel de confianza.
E es la precisión o el error.
p es la variabilidad positiva.

La ventaja sobre la primera fórmula es que, al


q es la variabilidad negativa.
conocer exactamente el tamaño de la población, el

E es la precisión o error. tamaño de la muestra resulta con mayor precisión y


se pueden incluso ahorrarse recursos y tiempo para 2. Es necesario estimar entre 10.000 establos, el
la aplicación y desarrollo de una investigación. número de vacas lecheras por establo con un error de
estimación de 4 y un nivel de confianza del 95%.
TAMAÑO DE MUESTRA PARA DETERMINAR Sabemos que la varianza es 1.000. ¿Cuántos establos
LA MEDIA DE UNA POBLACIÓN deben visitarse para satisfacer estos requerimientos?

Cuando una población es infinita. 2. Una máquina llena cajas con cierto cereal. El
supervisor desea conocer con un error de estimación
de máximo 0,1 y un nivel de confianza del 90%, una
media estimada del peso. Como la varianza era
desconocida se procedió a escoger una muestra
Donde. piloto. Los resultados fueron los siguientes: 11,02,
11,14, 10,78, 11,59, 11,58, 11,19, 11,71, 11,27,
 El nivel de confianza 1o seguridad (1-a). El
10,93, 10,94. ¿Cuántas cajas debe escoger para que
nivel de confianza prefijado da lugar a un
se cumplan los requisitos propuestos?
coeficiente (Za). Para una seguridad del 95%
= 1.96; para una seguridad del 99% = 2.58. 3. Se desea hacer una encuesta para determinar la
proporción de familias que carecen de medios
 Una idea de la varianza S2 o también σ2 de la
económicos para atender los problemas de salud.
distribución de la variable cuantitativa que se
Existe la impresión de que esta proporción está
supone existe en la población.
próxima a 0,35. Se desea determinar un intervalo de
confianza del 95% con un error de estimación de 005.
 d: Es la precisión o el error.
¿De qué tamaño debe tomarse la muestra? (Sol.

Cuando una población es finita. N=350).

4. Un productor de semillas desea saber con un error


de estimación del 1% el porcentaje de semillas que
germinan en la granja de su competidor. ¿Qué
tamaño de muestra debe tomarse para obtener un
Ejercicios para una población. nivel de confianza del 95%?(Sol. Como no tenemos
ninguna estimación de la proporción, tomaremos 0´5
1.- ¿A cuántas personas de una población de 15.000
y así obtenemos n=9.604)
habitantes tendría que estudiarse para conocer la
prevalencia de diabetes? Seguridad = 95 %; 5. Se desea realizar una encuesta entre la población
Precisión = 3 %. juvenil de una determinada localidad para determinar
la proporción de jóvenes que estaría a favor de una
nueva zona de ocio. El número de jóvenes de dicha
población es N=2.000. Determinar el tamaño de
Regresión lineal:
muestra necesario para estimar la proporción de
estudiantes que están a favor con un error de
La primera forma del estudio de la asociación entre
estimación de 0, 05 y un nivel de confianza del
las variables X e Y es la regresión, que consiste en
95%.(Sol. Como no nos dan ninguna estimación de
determinar una relación funcional (recta de
la proporción, tomaremos 0´5. El valor de n es 322).
regresión) entre ellas, con el fin de que se pueda
predecir el valor de una variable en base a la otra. La
6.- Un biólogo quiere estimar el peso promedio de
variable que se va predecir se denomina variable
los ciervos cazados en el estado de Maryland. Un
dependiente y la variable que es la base de la
estudio anterior de diez ciervos cazados mostró que
predicción se denomina variable independiente.
la desviación estándar de sus pesos es de 12.2 libras.
¿Qué tan grande debe ser una muestra para que el La segunda forma del estudio de la asociación entre
biólogo tenga el 95% de confianza de que el error de las variables X e Y, es denominada correlación, que
estimación es a lo más de 4 libras? consiste en determinar la variación conjunta de las
dos variables, su grado de relación, y su sentido
7.- Una empresa eléctrica fabrica focos que tienen
(positivo o negativo). La medida del grado de
una duración aproximadamente normal con una
relación se denomina coeficiente o índice de
desviación estándar de 40 horas. ¿De qué tamaño se
correlación. El cuadrado del índice de correlación se
necesita una muestra si se desea tener 96% de
denomina coeficiente de determinación.
confianza que el media real esté dentro de 10 horas
del media real? En este capítulo haremos un estudio descriptivo de la
regresión lineal en el sentido que, la ecuación de
8.- ¿Qué tan grande debe de seleccionarse una
regresión lineal que se determina será válida, si hay
muestra para tener un intervalo de confianza de 95%
la seguridad de que existe un alto grado de
con un margen de error de 10? Suponga que la
correlación entre las variables indicado por el
desviación estándar poblacional es 40.
coeficiente de determinación.

9.- En un estudio el valor planeado para la proporción


Diagrama de dispersión
poblacional es p* = 0.35. ¿De qué tamaño se debe
tomar la muestra para dar un intervalo de confianza Sean (x1 , y1) , (x2 , y2), …, ( xn , yn) n valores de la
de 95% con un margen de error de 0.05? variable bidimensional ( X ,Y ) , observados en una
muestra, donde los xi son los valores de la variable X
y los yi son los valores de la variable Y.
SEMANA 18 19

REGRESIÓN Y CORRELACIÓN LINEAL.


Los métodos estadísticos descriptivos son válidos en Que mejor se ajuste a los valores de la muestra, con
cada variable, es decir cada variable tiene media, el fin de poder predecir o estimar Y (variable
desviación estándar, etc. Lo nuevo aquí es que con dependiente) a partir de X (variable independiente).
estos datos en pareja se puede medir la dispersión El proceso de predecir o estimar Y a partir de la
conjunta con respecto a las medias (𝑥̅ , 𝑦̅) mediante variable X , es la regresión.
la covarianza. Hallar la función lineal Y = a + bX , consiste en
determinar los valores de a y b a partir de los datos
Definición. Se denomina diagrama de dispersión o
de la muestra.
nube de puntos, a la gráfica de los valores (xi, yi) de
las variables X e Y en el sistema cartesiano.
a
 y  b x
n
y = a + bx (1)
n xy   x y
b
Coeficiente o índice de correlación n x²   x ²

Definición. El coeficiente de correlación lineal de Interpretación del coeficiente de regresión b


Pearson de n pares de valores (x1 , y1) , (x2 , y2), …, El coeficiente b es la pendiente o el coeficiente de
( xn , yn) de una variable bidimensional (x , y ) es el la regresión lineal. La constante a es la ordenada en
número abstracto r: el origen.
 Si b > 0 , entonces, la tendencia lineal es
Interpretación:
creciente, es decir, a mayores valores de X
Si r = 1, se dice que hay una correlación perfecta corresponden mayores valores de Y.
positiva. También, a menores valores de X
Si r = -1, se dice que hay una correlación perfecta corresponden menores valores de Y.
negativa.  Si b < 0 , entonces, la tendencia lineal es
Si r = 0, se dice que no hay correlación entre las dos decreciente, es decir, a mayores valores de X
variables corresponden menores valores de Y.
También, a menores valores de X
Regresión lineal simple. corresponden mayores valores de Y.
 Si b = 0 , entonces, Y = a . Luego, Y
Dados n pares de valores (x1 , y1) , (x2 , y2), …, ( xn ,
permanece estacionario para cualquier valor
yn) de una variable bidimensional ( X , Y ) . La
de X. En este caso se dice que, no hay
regresión lineal simple de Y con respecto a X ,
regresión.
consiste en determinar la ecuación de la recta:

Y= a + Bx
Ejemplo de r:
01.- Se llevó a cabo un estudio acerca de la cantidad
de azúcar refinada mediante un cierto proceso a
varias temperaturas diferentes. Los datos se
codificaron y se registraron en el cuadro siguiente.

a) Determine la ecuación de regresión lineal.

b) Calcule la cantidad promedio de azúcar refinada


que se produce cuando la temperatura codificada es
1.75.

02.- Pronostique las ventas para los periodos 13, 14


y 15 si las ventas de los 12 periodos anteriores son
los que se indican a continuación.

Periodo Ventas
(x) (y)

1 600

2 1550

3 1500

4 1500

Ejercicios Desarrollados: 5 2400


6 3100 Agosto 86
Septiembre 85
7 2600
Octubre 89
8 2900 Noviembre 91
Diciembre 103
9 3800
Enero
10 4500 Febrero
Marzo
11 4000

12 4900
04.- Tratemos de resolver otro problema. ¿Se ha
puesto a reflexionar si es verdad que los opuestos se
atraen? Todos hemos estado ante parejas en las que
03.- Datos: Calcular el pronóstico para los meses de
sus miembros parecen ser muy diferentes entre sí.
enero, febrero y marzo del año siguiente.
¿Pero esto es lo usual? ¿Qué fomenta la atracción: las
Enero 68 diferencias o las similitudes? Un psicólogo social
Febrero 55 abordó este problema pidiendo a 15 estudiantes que
Marzo 63 respondieran un cuestionario relacionado con un sus
Abril 82 actitudes hacia una amplia gama de temas. Tiempo
Mayo 87 después les mostró las “actitudes” de un extraño
Junio 63 hacia los mismos temas y les pidió que evaluaran su
Julio 77 agrado o inclinación por el extraño y si,
Agosto 78 probablemente, disfrutarían el trabajar con él. En
Septiembre 62 realidad, las “actitudes” del extraño fueron
Octubre 78 elaboradas por el experimentador y variaron de
Noviembre 74 sujeto a sujeto, con respecto a la proporción de

Diciembre 62 actitudes similares que hubo entre el extraño y el

Enero 74 individuo que participó en el experimento. De esa

Febrero 80 manera, se obtuvieron datos, para cada sujeto a sus

Marzo 96 actitudes y la atracción que sintió hacia un extraño,

Abril 74 basada en las actitudes de este último hacia los

Mayo 71 mismos temas. Si los iguales se atraen, entonces


debería existir una relación directa entre la atracción
Junio 71
hacia un extraño y la proporción de actitudes
Julio 66
similares. Los datos se presentan en la tabla Entre
mayor sea la atracción, más alto será el puntaje. El 10 16
puntaje de atracción máximo es de 14. Calcule el 15 32
coeficiente de correlación r de Pearson * para 20 48
determinar si existe una relación directa entre la 22 56
similitud de actitudes y el grado de atracción. 30 64
32 80
ESTUDIANT PROPORCIÓ ATRACCIÓ
E N DE NY
NÚMERO ACTITUDES a) ¿ Existe relación lineal entre las ventas de la
SIMILARES empresa y sus gastos en publicidad? Razona la
X respuesta.
1 0.30 8.9
b) Obtener las rectas de regresión mínimo cuadrático.
2 0.44 9.3
3 0.67 9.6 c)¿ Qué volumen de ventas de la empresa se podría
4 0.00 6.2 esperar en un año que se gaste de publicidad 60000
5 0.50 8.8 soles? ¿Y para un gasto en publicidad de 200000
6 0.15 8.1 soles?
7 0.58 9.5
06.- Una empresa de manufacturas basa las
8 0.32 7.1
predicciones de sus ventas anuales en los resultados
9 0.72 11.0
oficiales de la demanda total en la industria. A
10 1.00 11.7
continuación se dan los datos de demanda total y las
11 0.87 11.5
ventas efectuadas por la empresa en los últimos 11
12 0.09 7.3
años.
13 0.82 10.0
14 0.64 10.0 Demanda Ventas
15 0.24 7.5 Miles Tm Miles Tm
200 9
220 6
05.- De una determinada empresa se conocen los
400 12
siguientes datos, referidos al volumen de ventas (en
millones de soles) y al gasto en publicidad ( en miles 330 7

de soles) de los últimos 6 años: 210 5


390 10
Volumen de Gastos 280 8
ventas Publicidad 140 4
Millones soles Miles soles
280 7 b) ¿Qué cantidad de gérmenes por cm3 es predecible
290 10 encontrar cuando hayan transcurrido 6 horas? ¿Es
380 14 buena esa predicción?

08.- En un depósito cilíndrico, la altura del agua que


a) Dibujar los diagramas de dispersión de los contiene varia conforme pasa el tiempo según esta
datos. tabla:
b) Trazar la recta que más se ajuste a los datos.
c) Por medio de un ajuste mínimo cuadrático Tiempo (h) Altura (m)

encontrar la recta que más se ajuste a las 8 17


ventas de la empresa en función de la 22 14
demanda total. Si la demanda total industrial 27 12
es de 300000 toneladas, ¿Qué volumen de 33 11
ventas se predeciría usando la recta de 50 6
regresión calculada?¿y si utilizamos la recta
a) Halla el coeficiente de correlación lineal entre el
encontrada en el apartado.
tiempo y la altura e interprétalo.
07.- La siguiente tabla muestra el número de
gérmenes patógenos por centímetro cúbico de un b) ¿Cual será la altura del agua cuando hayan
determinado cultivo según el tiempo transcurrido: transcurrido 40 horas?

N° c) Cuando la altura del agua es de 2m, suena una


N° Horas Germenes alarma ¿Qué tiempo ha de pasar para que avise la
0 20 alarma?
1 26
09.- En un determinado estudio médico se pretende
2 33
medir la relación existente entre la exposición al
3 41
ruido y la hipertensión. Los siguientes datos han
4 47
sido extraídos del Jourrnal of Sound and Vibration:
5 53

Sonido
(db) Presion
a).- Calcúlala recta de regresión para predecir el
60 1
numero de gérmenes por cm3 en función del tiempo.
63 0
65 1
70 2
70 5 1,5 117,4
70 1 1,5 117,1
80 4 1,5 106,2
80 6 2 131,9
80 2 2 146,9
80 3 2,2 146,8
85 5 2,4 133,9
89 4 2,5 111
90 6 2,5 123
90 8 2,8 125,1
90 4 2,8 145,1
90 5 3 134,3
94 7 3 144,5
100 9 3,2 143,7
100 7 3,3 146,9
100 6
a) Representar gráficamente los datos y
Donde X representa la presión sonora en dB, e Y el comentar los resultados.
aumento de la presión sanguínea en mmHg. b) Hallar el coeficiente de correlación.
c) Ajustar un modelo de regresión lineal.
1) Realizar un diagrama de dispersión de Y frente a
Predecir la resistencia de una caja
X.
fabricada con pulpa cuya concentración
es 2.3.
2) Realizar el modelo de regresión lineal simple.

11.- Estamos familiarizados con el hecho de que la


10.- La resistencia del papel utilizado en la
temperatura del aire disminuye con la altura del
fabricación de cajas de cartulina (Y) está
lugar, los datos siguientes refuerzan la idea y hacen
relacionado con la concentración de madera dura en
presumir una relación lineal entre la temperatura Y y
la pulpa original (X). Bajo condiciones controladas,
la altura X observada en ciertos puntos del Valle de
una planta piloto fabrica 16 muestras con un lote
Aburrá al amanecer.
diferente de pulpa y mide la resistencia a la tensión.
Los datos obtenidos son los siguientes: X altura (m) Y temperatura en ºC
1642 18
X Y 2242 12
1000 19
1 101,4 937 21
1178 18
1502 16
2043 0
1502 14
1603 10
975 16
1549 15
1066 20
1495 15
1508 18
1000 23
1000 19
1971 19
982 23
1173 18
907 21
1790 12
2109 11
1410 14
1777 6
910 19

a) Grafique el diagrama de dispersión.


b) Estime la línea de mínimos cuadrados.
c) Si usted se encontrara al amanecer, a 2000 m
en inmediaciones de este Valle, ¿qué
temperatura esperaría soportar?

Anda mungkin juga menyukai