• A medida que aumenta la complejidad de nuestro mundo, se hace cada vez más difícil tomar
decisiones inteligentes y bien documentadas. Con frecuencia tales decisiones deben tomarse con
mucho menos que un conocimiento adecuado y experimentando una gran incertidumbre. Sin embargo,
las soluciones a estos problemas son esenciales para nuestro bienestar e incluso para nuestra
supervivencia final. Continuamente estamos recibiendo presiones debido a problemas económicos
angustiosos como inflación galopante, el sistema tributario engorroso y oscilaciones excesivas en el
ciclo empresarial. Todo nuestro tejido económico y social esta amenazado por la contaminación
ambiental, la deuda publica onerosa, la tasa de criminalidad que siempre va en aumento y las
impredecibles tasas de interés.
• Si estas condiciones parecen ser características del estilo de vida actual, no debe olvidarse que
problemas de esta naturaleza contribuyeron a la caída de la antigua Roma más que la invasión de las
hordas de bárbaros provenientes del norte. Un período de éxito en este planeta, relativamente corto,
no es garantía de una supervivencia futura. A menos que puedan encontrarse soluciones viables a
estos apremiantes problemas.
Objetivos
• Proporciona al estudiante los fundamentos que le permiten enfrentar con éxito problemas que
requieren capacidad analítica y de innovación.
• Una sólida formación en ciencias básicas es necesaria para la comprensión de los fenómenos
relacionados con las tecnologías.
DISTRIBUCIONES DE PROBABILIDAD
Contenido
• Cuando escuchamos la palabra Estadística inmediatamente nos imaginamos promedios, índices, tasas,
entre otros. Esta rama de la Estadística que utiliza números para describir hechos recibe el nombre de
Estadística Descriptiva, la cual consiste en organizar, resumir y simplificar, en términos generales
información que es bastante compleja.
• Otra rama de la Estadística estudia la Probabilidad de gran utilidad cuando interviene el azar. Juego
como los dados o cartas, o el lanzamiento de monedas, etc. En los deportes.
• La inferencia constituye una tercera rama de la Estadística. Consiste en el análisis e interpretación de una
muestra de datos (Muestreo).
• En pocas palabras, existen tres áreas muy relacionadas de interés en estadística: La descripción y resumen
de datos, la teoría de la probabilidad y el análisis e interpretación de los datos de una muestra.
• En conclusión la estadística estudia los métodos científicos para recoger, organizar y analizar datos, así
como para sacar conclusiones validas y tomar decisiones razonables basadas en tal análisis
• Población Estadística: Es el Conjunto de unidades individuales tales como personas, animales
o cosas acerca de los cuales se desea obtener alguna información. A las unidades individuales
la llamaremos unidades elementales.
• Pero seguramente, nuestra población de trabajo no sea el conjunto de los estudiantes como
tales sino el conjunto de observaciones hechas a los mismos, como por ejemplo: promedio
crédito, el numero total de créditos tomados en el semestre, el numero total de horas que dedica
semanalmente al estudio, el sexo, etc.
• fai: Es la frecuencia absoluta, es decir, el número de veces que se repite el valor de cada
variable. Donde la suma de todas las frecuencias debe ser igual al total de datos (N).
• Fai: Frecuencia absoluta acumulada, es el número de veces que se repite el valor de cada
variables y los anteriores a ellas. La última Fai, debe ser igual al total de datos (N).
202,200,198,199,201,197,200,199,201,200,204,195,200,197,200201,203,200,202,201,198,203,2
01,195.
• Como segundo paso, determinar el número de datos u observaciones (N), en el ejemplo N = 24.
• Como tercer paso, debemos ordenar los datos en forma ascendente, en donde nos va a indicar
el número de variables de estudio, obviamente no son todos los datos, ya que se encontraran
datos que se repiten.
Nota: Es importante tener en cuenta que todo tabla de frecuencias que se elabora debe llevar
un nombre de acuerdo al objeto de estudio.
Cuadro de Máquina de Llenado de Envases
∑ni=24 ∑fri=99.98
• Ahora se puede ver fácilmente, que en 6 de los 24 envases, están llenas con 200 cm3.
• Cuando se elabora el cuadro de frecuencias nos permite ver la información con mayor claridad y
así tomar las decisiones y conclusiones pertinentes.
1. Ordene de menor a mayor los datos con su respectiva frecuencia absoluta, como se hace en la
tabla de distribución de frecuencias.
2. Determine el valor máximo de la variable (Xmáx) y el valor mínimo de la variable (Xmín).
3. Obtenga el número de intervalos (I) o clases que van a conformar el cuadro. Para esto emplee
la fórmula Struges así: I = 1 + 3.33*logN.
Como el número de intervalos es un número entero, se aproxima por el entero próximo cuando
el decimal sea mayor de 0.7, de lo contrario por el entero inferior.
4. Hallar el rango, R, así: R = Xmáx – Xmín.
5. Determine la amplitud (A) o ancho que van a conformar los intervalos. Esta amplitud será
constante para todas las clases. Así: A = R/I.
6. Conformar cuadro de intervalos o clases con sus respectivas frecuencias como en el gráfico.
Cuadro por Intervalos o Clases
: : : : : :
N 100
• Donde Xmín. Representa el Límite inferior (Li) y el Xmáx. El límite superior (Ls) de cada
intervalo.
Nota: Cada intervalo o clase, tiene su propio límite inferior y límite superior.
Mci: Marca de Clase: Es la semisuma de los límites inferiores y superiores de cada intervalo. Se
calcula así:
Mci = Li + Ls
2
• Ejercicio: El primer día de clases del semestre pasado a 60 estudiantes se les solicito indicar la
distancia que hay de su casa a la Universidad en kilómetros. Así:
6,5,10,3,5,5,3,9,20,17,22,24,15,8,9,11,13,15,6,9,12,12,8,2,1,
16,10,7,4,3,6,3,15,6,1,8,10,21,9,8,21,15,6,20,10,4,10,1,14,27,5,13,16,10,11,18,20,1,13,18.
Solución: Para empezar a desarrollar el ejercicio planteado es importante tener en cuenta los
pasos para el desarrollo del mismo dados anteriormente.
1. Organizar los datos en forma ascendente como en el cuadro de distribución de frecuencias
para datos no agrupados. (No necesariamente).
3. Rango: R = Xmáx-Xmin=27-1=26
4. Intervalos: I = 1+3.33log60=7
1 5 15 3 15 25 25
8 8 10 7 25 17 42
8 12 14 10 39 23 65
12 16 10 14 49 17 82
16 20 6 18 55 10 92
20 23 3 21 68 5 97
23 27 2 25 60 3 100
∑ni=60 ∑hi=100
3. Medidas de Tendencia Central
• Son aquellas que concentran todos los valores de una población o muestra en un solo valor, es
decir, constituyen el centro de gravedad de todos los valores de la variable.
1. Promedio de Cómputos: Aquellos que para poderlos obtener intervienen todos los valores de
la variable. La medía aritmética o promedio, la media cuadrática, la media armónica y la media
geométrica.
2. Promedio de Posición: Se caracteriza porque para obtenerlos no intervienen todos los valores
de la variable, sino que depende de la posición que ocupen dentro de la serie de datos. La
mediana y la moda.
a. Media Aritmética o Promedio (Xm)
Es la más utilizada de todas las medidas de tendencia central, ya que representa todos los valores de la
variable en una sola. La media aritmética de cierto número de cantidades es la suma de sus valores
dividido por el total de datos u observaciones. Se define como:
1. Datos no agrupados:
Xm = ∑(Xi*fai)/N si es poblacional
Xm = ∑(Xi*fai)/N-1 si es muestral
2. Datos Agrupados:
Xm = ∑(Mci*fai)/N si es poblacional
Xm = ∑(Mci*fai)/N-1 si es muestral
3 15 43
7 10 86
10 14 144
14 10 140
18 6 106
21 3 64
25 2 50
∑ni=60 ∑(Mci*fai)=613
Para calcular la media, obtenemos:
Xm = 613 = 10.22
Interpretación: El promedio de distancia de la casa a la universidad de los 60 estudiantes es de
10.22 Km.
Nota: Es muy importante tener en cuenta, que para utilizar cualquiera de los tipos de distribución de
frecuencias, sea de datos agrupados o no agrupados, normalmente se recomienda utilizar el de
datos no agrupados cuando hablamos mas o menos de 30 datos, siempre y cuando los datos u
observaciones no sean muy dispersos, de lo contrario se recomienda el de datos agrupados.
Cuando se interpretan los datos, que es muy diferente a concluir, sólo se debe tener en cuenta sólo
el enunciado, es decir, no se le debe agregar o quitar información con base en el planteamiento del
problema.
b. Mediana (Me)
Nota: Para obtener la posición (i), nos vamos a vasar en la frecuencia absoluta acumulada (Fai), y el
valor de la variable correspondiente a la Fai, será el valor de la mediana.
Con base en nuestro ejemplo de llenado de envases, tenemos: N es par
i = 24/2 = 12
Este valor de i=12, y la posición i+1=13, este valor se ubica en la Fai, que corresponde al valor de 14 y la
variable correspondiente a este valor es Xi=200
Interpretación: Existe un 50% de que el liquido en los envases esta por encima de 200 cm3 y el otro 50%
por debajo de 200 cm3
Li = 8
Fai-1 = 25
fai = 14
N/2 = 30
A = 3.71
Me = 8 +((30-25)/14)*3.71 = 9.3
Interpretación: Existe un 50% de estudiantes que viven a una distancia de la universidad por
encima de 9.3 Km. Y el otro 50% por debajo de 9.3 Km.
c. La Moda (Mo)
La moda, como su nombre lo indica, es el valor de la variable que ocurre con mayor frecuencia, para
datos no agrupados. Para datos agrupados, es la marca de clase que tenga la mayor frecuencia
absoluta. La moda puede ser multimodal.
Con base en el ejemplo del llenado de envases y la distancia en km. a la universidad, tenemos:
d. Coeficiente de Variación
El coeficiente de variación es una medida relativa de dispersión que nos permite hacer
comparaciones de diferentes grupos con diferentes unidades de medida o diferentes magnitudes y
obtener mejor conclusiones. Da la desviación estándar como un porcentaje de la media así:
CV = S / Xm * 100
e. Error estándar de la media
El error estándar es otro estimador de dispersión ampliamente usado para acompañar a la media. Su
cálculo es así:
SX = S /√n
f. Límites de Confianza
Los límites de confianza también se pueden calcular para establecer el intervalo dentro del cual es
posible que se encuentre la media. Para esto se toma el error estándar, se multiplica por el valor
tabular t de student con n-1 grados de libertad y se le suma y se le resta a la media.
Lc = Xm ± t * SXm
i. Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma
(centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares. El
concepto de asimetría se refiere a si la curva que forman los valores de la serie presenta la misma
forma a izquierda y derecha de un valor central (media aritmética).
Tipos de Curvas Simétricas
Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene
definido:
Los resultados pueden ser los siguientes:
Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene
definido:
El polígono de frecuencia es el resultado de unir los puntos medios de cada barra o intervalo, es
decir, de unir las marcas de clase de cada intervalo. Un polígono de frecuencia se debe cerrar una
marca de clase antes y una marca de clase después.
HISTOGRAMADEFRECUENCIA
25
25
No. Empresa - fai
20 16 15
15
10
4
5
0
0.75 2.75 4.25 5.75 7.25 8.75
GastoenMillones-Mci
POLIGONODEFRECUENCIA
No. Empresa - fai
25 25
20
15 16
15
10
5
4
0 0
0.75 2.75 0 Líneas3D2
4.25 5.75 7.25 8.75
GastoenMillones-Mci
Unidad 2: Introducción a la probabilidad
• Introducción
• Teoría de Conjuntos
• Espacio Muestral
• Axiomas
• Teoremas
• Probabilidad Condicional
• Teorema de Bayes
• Independencia
• Análisis Combinatorio
1. Introducción
En la actualidad la teoría de la probabilidad ocupa un lugar importante en muchos asuntos de
negocios. Los seguros y prácticas actuariales se basan firmemente en los principios de la teoría de la
probabilidad. Las pólizas de seguros de vida dependen de las tablas de mortalidad, las cuales a su
vez se basan en las probabilidades de muerte en edades especificas. Otras tasas de seguros tales
como seguros de bienes raíces y de automóviles se determinan de manera similar. La probabilidad
también juega un papel importante en la estimación del número de unidades defectuosas en un
proceso de fabricación, la probabilidad de recibir pagos sobre cuentas por cobrar y las ventas
potenciales de un nuevo producto. Incluso los apostadores profesionales en eventos deportivos
deben tener una comprensión sólida de la teoría de la probabilidad.
Sin importar en cuenta la profesión que se haya elegido, algo sí es seguro: en algún momento se han
de tomar decisiones.
Definición 1: Dos conjuntos A y B, son iguales si, y sólo si cada elemento que pertenece a A
también pertenece a B y viceversa. Es decir, dos conjuntos son iguales si ambos tienen los mismos
elementos sin importar el orden ni el número de veces que un elemento aparezca en la lista.
Nota: La operación es conmutativa ya que AUB y BUA son conjuntos idénticos y es asociativa, ya
que (AUB)UC = AU(BUC).
Definición 2: La intersección de A y B denotada por A∩B es el conjunto constituido por todos los
elementos que pertenecen tanto a A como a B; es decir:
A∩B = {x/x є A y x є B}
1. A∩(BUC) = (A∩B)U(A∩C)
2. AU(B∩C) = (AUB)∩(AUC)
Definición 3: El complemento de A denotado como Ā con respecto a un conjunto universal (U) dado,
es el conjunto de todos los elementos que le faltan a A para ser igual al conjunto universal
Ā = {x/x є A}
Ejemplos:
Reglas:
1. P(S) = 1
2. 0 ≤ P(A) ≤ 1, para todo A c S
3. P(A1UA2UA3U….) = P(A1)+P(A2)+P(A3)+… si Ai∩Aj = Ǿ, para todo i ≠ j.
5. Teoremas
1. P(Ǿ) = 0
2. P(Ā) = 1 – P(A)
3. P(AUB) = P(A) + P(B) - P(A∩B)
4. P(Ā∩B) = P(B) - P(A∩B)
5. P(A∩B) = P(A) - P(A∩B)
6. P(Ā∩B) = 1 – P(AUB)
7. P(ĀUB) = P(Ā) + P(B) – P(Ā∩B)
Nota: Para cualquier experimento, el espacio muestral (S) toma el papel del conjunto universal; por
tanto, cualquier complemento a lo que se haga referencia se tomará con respecto a S.
6. Probabilidad Condicional
Con frecuencia se desea determinar la probabilidad de algún evento, dado que antes otro evento ya
haya ocurrido. Lógicamente, esta es llamada probabilidad condicional. Se denota como P(A/B) y se
lee la “probabilidad de A dado B”. Es la probabilidad de que el evento A ocurra, dado que o a
condición de que el evento B ya haya ocurrido.
Es posible definir y tener interés en eventos A y B tales que si se sabe que si ha ocurrido A, entonces se
tiene la certeza de que también ha ocurrido B. En tales casos, ciertamente hay un grado de dependencia
entre A y B. También es posible tener dos eventos A y B, en los que no se sabe si B ha ocurrido o no,
aunque se sepa que A haya ocurrido. A esta clase de eventos se les conoce como independientes (o
estadísticamente independientes).
Definición 1: Dos eventos A y B son independientes si y sólo si P(A∩B) = P(A)*P(B), conocida como la
regla de la multiplicación.
Para que dos sucesos sean independientes tienen que verificar al menos una de las siguientes
condiciones:
P(B/A) = P(B) es decir, que la probabilidad de que se de el suceso B, condicionada a que previamente
se haya dado el suceso A, es exactamente igual a la probabilidad de B.
P(A/B) = P(A) es decir, que la probabilidad de que se de el suceso A, condicionada a que previamente
se haya dado el suceso B, es exactamente igual a la probabilidad de A.
Si los eventos son dependientes, entonces, por definición, se debe considerar el primer evento al
determinar la probabilidad del segundo. Es decir, la probabilidad del evento B depende de la condición
que A ya haya ocurrido. Se necesita del principio de probabilidad condicional.
Definición 4: Se dice que dos eventos A y B son mutuamente excluyentes, sino pueden ocurrir en
forma simultanea, es decir, si y sólo si A∩B = Ǿ
• El número de elementos
• La clase o naturaleza de los elementos.
• El orden de colocación de los mismos.
• Que los elementos sean distintos; en este caso, a los grupos se les denomina Agrupaciones
Simples.
• Que los elementos sean iguales; en este caso, a los grupos se les denomina Agrupaciones con
Repetición.
Considerando la naturaleza de los elementos (que sean iguales o distintos), las agrupaciones
recibirán el nombre de variaciones, permutaciones y combinaciones.
a. Principio fundamental del Análisis Combinatorio:
Ejemplo: Para ir de la ciudad A a la ciudad B hay tres rutas diferentes. De cuántas maneras distintas
puede una persona ir de A hasta B y regresar, si:
a) Puede regresar por cualquier ruta?
b) Debe regresar por un camino diferente?
Solución:
a) Para ir de A a B tiene tres maneras diferentes, ya que existen tres rutas distintas.
Para ir de B a A tiene tres maneras diferentes, ya que existen tres rutas distintas.
Por lo tanto, en total tendrá 3*3 = 9 maneras distintas para hacer el viaje de ida y regreso.
b) El número de maneras para ir de A a B y regresar sin utilizar el mismo camino es: 3*2 = 6
maneras diferentes.
b. Variaciones Vm,n
Si tenemos un conjunto de “m” elementos y los agrupamos de “n” en “n” elementos (con m>n), sin
repetir elementos, de tal manera que dos agrupaciones se consideran distintas cuando:
a. Se diferencian por lo menos en un elemento;
b. Se diferencian en el orden de colocación de ellos.
Entonces dichas agrupaciones se denominan Variaciones y está dado por la expresión:
Vm,n = m! / (m – n)!
• Definición de Factorial
n! = n (n-1) (n-2) . . . 3 * 2 * 1, n ≥ 1
c. Permutaciones Pm
Las variaciones que pueden hacerse en un conjunto de “m” elementos, cuando los elementos se
agrupan de “n” en “n” (con m = n) se denominan Permutaciones de “m” elementos.
De la definición se concluye que dadas dos ó más permutaciones del mismo orden, ellas difieren sólo
en el orden de colocación de los elementos. Está dado por la expresión:
Vm,m = Pm = m! / (m – m)! = m! / 0! = m!
Ejemplo: De cuántas maneras pueden sentarse tres damas y dos caballeros en una fila de cinco
asientos, de modo que: a) puede hacerlo en cualquier sitio; b) las damas y los caballeros no se
separan.
Solución:
a) Como hay cinco asientos para ubicar cinco personas, una forma de ocupar los asientos se
diferencia de otra sólo en el orden de colocación de la mismas; por lo tanto:
P5 = 5! = 120 formas posibles de sentarse.
b) Como las damas y los caballeros no se separan, podemos saber que existen dos grupos
perfectamente distintos:
El grupo de las damas (3) y el grupo de los caballeros (2)
Permutaciones de las damas P3
Permutaciones de los caballeros P2
Permutaciones de ambos P2, entonces:
P3 * P2 * P2 = 3! * 2! * 2! = 24 maneras de sentarse.
Son permutaciones de "m" elementos, en los que uno de ellos se repite " n1 " veces, otro " n2 "
veces y así ... hasta uno que se repite " n*n" veces.
Denotado por:
Pm;n1,n2,n3,…,nn = m! / n1!*n2!*n3!*…*nn!
Ejemplo: ¿cuántas permutaciones con repetición podemos obtener con las letras de la palabra
“PARALELEPIPEDO”?
Solución:
Acá tenemos un conjunto de 14 elementos de los cuales 3 son la letra P, tres de la letra E, dos de la
letra L, dos de la letra A y uno de cada de las letras I, D, O, y R.
Por lo tanto aplicando la fórmula anterior, el número de permutaciones con repetición es:
e. Combinaciones Cm,n
Solución:
m = 12 libros
n = selección de 6. No interesa el orden y no hay repetición.
• Definición
• Distribución de Probabilidad
• Desigualdad de Chebishev
1. Definición
Una variable aleatoria es una variable cuyo valor es el resultado de un evento aleatorio. Se supone
que se lanza una moneda tres veces y se anota el número de caras que se obtienen. Los posibles
resultados son 0 caras, 1 cara, 2 caras, o 3 caras. La variable aleatoria es el número de caras que se
obtienen, y los posibles resultados son los valores de la variable aleatoria. Como segundo ejemplo,
los pesos de envío del agua mineral en contenedores oscilaban aleatoriamente entre 10 a 25 libras.
Los pesos reales de los contenedores, en libra, son los valores de la variable aleatoria “peso”.
Tal y como lo sugieren estos ejemplos, la variables aleatorias pueden ser de dos tipos: discretas o
continuas.
2. Tipos de Variables Aleatorias
Una Variable Aleatoria Discreta puede asumir sólo ciertos valores, con frecuencia números
enteros, y resulta principalmente del conteo. El número de caras en el experimento del lanzamiento
de la moneda es un ejemplo de variable aleatoria discreta.
Los valores de la variable aleatoria se restringen sólo a ciertos números: 0, 1, 2 y 3. El resultado del
lanzamiento de un dado, el número de camiones que llegan por hora al puerto de carga, y el número
de clientes que están en fila para sacar sus libros favoritos, son otros ejemplos de variables
aleatorias discretas.
Una Variable Aleatoria Continua resulta principalmente de la medición y puede tomar cualquier
valor, al menos dentro de un rango dado. Los pesos del agua mineral es un ejemplo, debido a que
los contenedores pueden tomar cualquier valor entre 10 y 25 libras. Otros ejemplos de variables
aleatorias continuas incluyen la estatura de los clientes en una tienda de ropa, los ingresos de los
empleados en un centro comercial local y el tiempo transcurrido entre la llegada de cada cliente a la
biblioteca. En cada caso, la variable aleatoria puede medirse con cualquier valor, incluyendo
fracciones de la unidad. Aunque las unidades monetarias no pueden dividirse en un número continuo
o infinito de subdivisiones (el dólar puede subdividirse sólo 100 veces), comúnmente se tratan como
distribuciones continuas de probabilidad.
3. Distribución de Probabilidad
2 3/8 Probabilidad.
3 1/8
1
Distribución de Probabilidad
3/8 3/8
2/5
Probabilidades
1/3
1/5
1/8 1/8
0
0
0 1 2 3
No. de Caras
4. Media y Varianza de las Distribuciones
Discretas
La media aritmética de una distribución de probabilidad discreta se llama el valor esperado E(x) y
se halla multiplicando cada resultado posible por su probabilidad y sumando los resultados, tal y
como se muestra en la fórmula:
μ = E(X) = ∑[Xi*P(Xi)]
El valor esperado de una variable aleatoria discreta es la media ponderada de todos los posibles
resultados en las cuales los pesos son las probabilidades respectivas de tales resultados.
Con base en el ejemplo del lanzamiento la moneda tres veces, el valor esperado es:
Interpretación: Significa que si se promedian los resultados del lanzamiento de la moneda 3 veces,
se obtendrá 1.5
• La varianza de una distribución de probabilidad discreta es el promedio de las desviaciones al
cuadrado con respecto de la media. La varianza puede escribirse como:
Esta fórmula mide la diferencia entre cada uno de los resultados y su media.
En nuestro ejemplo:
σ² = (0-1.5)²*1/8 + (1-1.5)²*3/8 + (2-1.5)²*3/8 + (3-1.5)²*1/8 = 0.75
σ = √0.75 = 0.87.
5. Desigualdad de Chebishev
Definición: Sea X una variable aleatoria con media µ y varianza σ² < ∞, entonces
• No se pide nada sobre la distribución de X, salvo que la varianza tiene que ser finita.
• La desigualdad nos muestra que cuanto más pequeño sea σ² tanto más pequeña será la
probabilidad de que X esté lejos de μ.
•La cota que provee la desigualdad de Chebishev puede ser, no informativa, por ejemplo, si ε ≤ σ² .
UNIDAD 4: DISTRIBUCIONES DE
PROBABILIDAD
• Discretas: Binomial – Bernoulli, hipergeométrica y poisson.
Primero mencionaremos algunos ejemplos de las variables aleatorias. El hombre que dispara un rifle
a un blanco desea saber la distancia que hay entre el punto de impacto de la bala en el blanco y en
el centro del mismo. Por su parte el Jockey se interesa en el tiempo total transcurrido desde que su
caballo sale del arrancadero hasta que llegue a la meta. Se llama variable aleatoria a aquella cuyo
valor esta determinado por el resultado de un experimento. La definición formal de variable aleatoria
es la siguiente:
Definición 1: Una variable aleatoria X es una función de valor real de los elementos de un espacio
muestral S.
Antes de dar las definiciones de estas dos variables aleatorias, se definirá primero la prueba de
Bernoulli
Definición 2: Una prueba de Bernoulli es un experimento que tiene dos resultados posibles, a los
cuales se les llama éxito y fracaso.
En general se denota S = {e, f} al espacio muestral para una prueba de Bernoulli.
Ejemplos de prueba de Bernoulli:
• Se lanza al aire una moneda (cara o sello)
• El vuelo de un proyectil (da en el blanco o no)
• El aprovechamiento de un estudiante en determinado curso (aprueba o reprueba)
• El desempeño de un equipo de atletismo (gana o no gana)
Se puede considerar como prueba de Bernoulli a cualquier mecanismo de azar cuyos resultados se
pueden agrupar en dos clases:
La notación es: P(e) = P Probabilidad de éxito
P(f) = 1- P Probabilidad de fracaso
• Ejemplo: La probabilidad de que un jugador de baloncesto anote un tiro libre es de ¾ , y sus tiros
son independientes. Suponiendo que puede hacer 5 tiros libres en un juego. Cuál es la probabilidad
de que acierte en todos?; de que falle en todos?
•Solución:
La función de probabilidad esta dada por:
Px(X) = C5,x * (3/4)x * (1/4)5-x , x = 0,1,2,3,4,5
Que acierte en todos los tiros
Px(5) = C5,5 * (3/4)5 * (1/4)0 = 0.237
Que falle en todos los tiros
Px(0) = C5,0 * (3/4)0 * (1/4)5 = 0.000976
•La Media y Varianza de una Distribución Binomial
Antes se mostró como determinar la media y varianza de una distribución discreta. Sin embargo, si
sólo hay dos resultados posibles, como en la distribución Binomial la media y la varianza pueden
determinarse fácilmente.
Si se selecciona una muestra sin reemplazo de una población finita conocida y contiene una
proporción relativamente grande de la población, de manera que la probabilidad de éxito sea
perceptiblemente alterada de una selección a la siguiente, debe utilizarse la distribución
hipergeométrica.
Ejemplo: Supongamos que en un establo de carreras hay 10 caballos y 4 de ellos tienen una
enfermedad contagiosa. Cuál es la probabilidad de seleccionar una muestra de 3 en la cual hay 2
caballos enfermos?
Solución:
N = 10, n = 3, r = 4, x = 2
Existe un 30% de probabilidad de seleccionar tres caballos de carrera, dos de los cuales están
enfermos.
c. La Distribución de Poisson
Una variable aleatoria discreta de gran utilidad en la medición de la frecuencia relativa de un evento
sobre alguna unidad de tiempo o espacio. Con frecuencia se utiliza para describir el número de
llegadas de clientes por hora, el número de accidentes industriales cada mes, el número de
conexiones eléctricas defectuosas por milla de cableado en un sistema eléctrico de una ciudad, o el
número de máquinas que se dañan y esperan ser reparadas.
La distribución de Poisson ideada por el matemático francés Simeon Poisson, la distribución de
Poisson mide la probabilidad de un evento aleatorio sobre algún intervalo de tiempo o espacio.
• La probabilidad de ocurrencia del evento es constante para dos intervalos cualquiera de tiempo o
espacio.
• La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo
cualquiera.
Dado estos supuestos, la función de probabilidad de Poisson puede expresarse como:
Px(X) = μx * ℮-μ / x!
Solución:
μ=2
x=3
Existe un 18.04% de probabilidad de encontrar 3 defectos en cualquier milla de vía después de haber
tenido tráfico durante un año.
2. Distribuciones Continuas
a. La Distribución Exponencial
Como se acaba de observar, la distribución de Poisson es una distribución discreta que mide el
número de ocurrencias sobre algún intervalo de tiempo o espacio. Describe por ejemplo, el número
de clientes que pueden llegar durante algún período determinado. Por el contrario, la distribución
exponencial es una distribución continua. Mide el paso del tiempo entre tales ocurrencias. Mientras
que la distribución de Poisson describe las tasas de llegada (de personas, camiones, llamadas
telefónicas, etc.) dentro de algún período dado, la distribución exponencial estima el lapso entre tales
arribos. Si el número de ocurrencias tiene distribución Poisson, el lapso entre las ocurrencias estará
distribuido exponencialmente.
La probabilidad de que el lapso sea menor que o igual a cierta cantidad x es:
P(X ≤ x) = 1 - ℮-μt
Solución:
Asumiendo lo peor, que el último taxi acaba de irse, usted debe determinar P(X ≤ 5 minutos). Debido
a que μ = 12 por 60 minutos, usted debe determinar a qué porcentaje son 5 minutos de 60:
5/60 = 1/12.
Por tanto, t = 1/12 y P(X ≤ 5) = 1 - ℮-(12)(1/12) = 1- ℮-1 = 0.6321
Interpretación: Usted puede relajarse y esperar el taxi, hay una probabilidad de 63.21% (> 50%) de
que llegue uno dentro de 5 minutos.
b. La Distribución Uniforme
Es una probabilidad en la cual las probabilidades de todos los resultados son las mismas. El
experimento de lanzar un dado es uno de los ejemplos. Todos los seis resultados tenían 1/6 de
probabilidad de ocurrencia. La figura muestra una distribución uniforme en la cual todos los
resultados, sobre el rango total de posibilidades de distribución son igualmente posibles, desde el
mínimo de a hasta el máximo de b.
La media o valor esperado de una distribución uniforme está a mitad de camino entre sus dos
puntos extremos. Así:
μ = E(X) = (a + b) / 2
La varianza es:
σ² = (b – a)² / 12
El área total bajo la curva, como en el caso de todas las distribuciones de probabilidad, debe ser
igual a 1 o 100%. Debido a que el área es la altura por el ancho, la altura es:
Altura = Área / Ancho
Y por tanto
Altura = 1 / (b – a), en donde b – a es el ancho o rango de la distribución.
Ejemplo: Suponga que los contenidos de las latas de 16 onzas de fruta enlatada producida por La
Constancia oscila entre 14.5 y 17.5 onzas y se ajusta a una distribución uniforme. Eso se muestra en
la figura.
Asuma que La Constancia desea saber la probabilidad de que una sola lata pese entre 16 y 17.2 onzas. Este valor
está dado por el área dentro de ese rango tal y como se muestra en la figura. La probabilidad de que una
observación única esté comprendida dentro de dos valores X1 y X2 es:
De todas las distribuciones de probabilidad que se han analizado la más importante, es la distribución
normal. La distribución normal es una distribución continua. Se utiliza para reflejar la distribución de
variables tales como estaturas, pesos, distancias y otras medidas que son divisibles infinitamente.
Tales variables continuas generalmente son el resultado de la medida.
Es el modelo de distribución más utilizado en la práctica, ya que multitud de fenómenos se comportan
según una distribución normal.
Esta distribución se caracteriza porque los valores se distribuyen formando una campana, denominada
campana de Gauss, en torno a un valor central que coincide con el valor medio de la distribución.
De acuerdo al gráfico un 50% de los valores están a la derecha de este valor medio y otro 50% a la
izquierda.
La forma y posición de una distribución normal están determinadas por dos parámetros: su media μ y
su desviación estándar σ.
μ = es el valor medio de la distribución y es precisamente donde se sitúa el centro de la curva (de la
campana de Gauss).
σ = es la desviación estándar. Indica si los valores están más o menos alejados del valor medio: si la
desviación estándar es baja los valores están próximos a la media; si es alta, entonces los valores
son muy dispersos.
1. La Regla Empírica
La regla empírica dice que si se incluyen todas las observaciones que están a una desviación
estándar de la media (tanto por debajo como por encima) estas serán el 68.3% del área bajo la
curva; si esta a dos desviaciones de la media del 95.5% y si esta a tres desviaciones será del 99.7%.
2. La Desviación Normal
Puede existir un número infinito de distribuciones normales posibles, cada una con su propia media y
desviación estándar. Ya que obviamente no se puede analizar un número tan grande de
posibilidades, es necesario convertir todas estas distribuciones normales a una forma estándar. Esta
conversión a la distribución normal estándar se efectúa con la fórmula de conversión ( o fórmula Z).
Desviación Normal: Z =( Xi – μ ) / σ
Ejemplo: Un gran fabricante de ropas, desea estudiar en la estatura de las personas. El fabricante
reconoció que el público estaba en constante cambio en su tamaño físico y proporciones. En un
esfuerzo por producir ropa de mejor ajuste, la gerencia sintió que necesitaba un análisis completo de
las tendencias actuales en los tamaños de moda. De acuerdo a sus clientes potenciales,
encontrarían que las estaturas están distribuidas normalmente alrededor de una media de 67
pulgadas y con una desviación estándar de 2 pulgadas.
Con base en el ejemplo anterior calcular la desviación normal de las siguientes estaturas: 63, 67 y 70
pulgadas.
Z = (63 – 67) / 2 = - 2 Quere decir que esta a 2 desviaciones por debajo de la media.
Z = (67 – 67) / 2 = 0 Quiere decir que esta a 0 desviaciones de la media.
Z = (70 – 67) / 2 = 1.5 Quiere decir que esta 1.5 desviaciones por encima de la media.
Si un cliente tiene una desviación normal de -1.5 por debajo de la media. Cuánto mide el cliente?
•Entonces, el valor de Z es el número de desviaciones a las que una observación está por encima o
por debajo de la media.
3. Cálculo de Probabilidades con la Desviación Normal
Estandarizar una distribución normal permite determinar más fácilmente la probabilidad de que ocurra
ciento evento.
El fabricante de ropas puede hallar la probabilidad de que un solo cliente tenga entre 67 y 69 pulgadas
de estatura, es decir, P(67 ≤ Xi ≤ 69), simplemente hallando el área bajo la curva normal entre 67 y 69
pulgadas. Es decir, si se conoce el área se conoce la probabilidad.
El área relacionada con un valor de Z puede hallarse en la Tabla. Se desea saber el área que esta
entre 67 y 69 pulgadas.
Z = (67 – 67) / 2 = 0 y Z = (69 – 67) / 2 = 1
Entonces, P(67 ≤ Xi ≤ 69) = P(0 < Z < 1) = P(Z ≥ 0) + P(Z ≤ 1).
Ya se ha establecido que el 34.13% de todos los clientes miden entre 67 y 69 pulgadas. Además
también se sabe que el 50% de todos los clientes esta por encima de la media de 67. Esto deja
0.5000 – 0.3413 = 0.1587 en el área de la cola que va más alla de 1. Hay un 15.87% de probabilidad
que un cliente escogido aleatoriamente mida más de 69 pulgadas.
Vale la pena notar que entre mayor sea el valor de Z, menor será el área en la cola de la distribución.
4. Aproximación Normal a la Distribución Binomial
La distribución binomial involucra una serie de n ensayos que puede producir un éxito p o un fracaso
q = 1 – p. Las respuestas pueden hallarse a menudo en la tabla binomial o utilizando la fórmula de la
binomial. Sin embargo, si n es demasiado grande, puede exceder los valores de cualquier tabla y la
fórmula puede ser excesivamente engorrosa. La solución puede hallarse con el uso de la distribución
normal para aproximar la distribución binomial. Esta aproximación se considera lo suficientemente
precisa si np ≥ 5 y npq ≥ 5 y si p está proximo a 0.5.
Se considera que un sindicato laboral en el cual el 40% de los miembros está a favor de una huelga.
Si se seleccionan 15 miembros de manera aleatoria. Cuál es la probabilidad de que 10 apoyen la
huelga?
Debido a que existe un número infinito de valores posibles en una distribución normal ( o en
cualquier distribución continua), la probabilidad de que la variable aleatoria se exactamente igual a
algún valor específico como 10, es cero.
Cuando se utiliza una distribución continua para estimar una variable aleatoria discreta, es necesario
un leve ajuste. Este ajuste, llamado Factor de Corrección de Continuidad es convertir, ese valor
discreto en forma continua. Es decir, restar 0.5 y sumar 0.5 a ese valor.
• Tamaño de la Muestra.
a. Muestras Aleatorias
Cuando nos interesa estudiar las características de poblaciones grandes, se utilizan muestras por
muchas razones; una enumeración completa de la población, llamada censo, puede ser
económicamente costoso, o no se cuenta con el tiempo suficiente.
A continuación se verá algunos usos del muestreo en diversos campos:
•Política: Las muestras de las opiniones de los votantes se usan para que los candidatos midan la
opinión pública y el apoyo en las elecciones.
•Educación: Las muestras de las calificaciones de los exámenes de estudiantes se usan para
determinar la eficiencia de una técnica o programa de enseñanza.
•Industria: Muestras de los productos de una línea de ensamble sirve para controlar la calidad.
•Medicina: Muestras de medid de azúcar en la sangre de pacientes diabéticos prueban la eficacia de
una técnica o de un fármaco nuevo.
•Agricultura: Las muestras de maíz cosechado en una parcela proyectan en la producción los efectos
de un fertilizante nuevo.
•Gobierno: Una muestra de opiniones de los votantes se usaría para determinar los criterios del
público sobre cuestiones relacionadas con el bienestar y la seguridad nacional.
b. Errores en el Muestreo
El error muestral se refiere a la variación natural existente entre muestras tomadas de la misma
población.
Cuando una muestra no es una copia exacta de la población; aún si se han tenido gran cuidado para
asegurar que dos muestras del mismo tamaño sean representativas de una cierta población, no
esperaríamos que las dos sean idénticas en todos sus detalles. El error muestral es un concepto
importante que ayudará a entender mejor la naturaleza de la estadística inferencial.
Los errores que surgen al tomar muestras no pueden clasificarse como errores muestrales y se
denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una
tendencia sistemática inherente a a un método de muestreo que da estimaciones de un parámetro
que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parámetro real.
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio simple, el
muestreo estratificado, el muestreo por conglomerados y el muestreo sistemático.
c. Error Muestral
Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media poblacional
μ, entonces la media muestral, como medida, conlleva algún error. Por ejemplo, supongamos que se
ha obtenido una muestra aleatoria de tamaño 25 de una población con media μ = 15: si la media de
la muestra es X = 12, entonces a la diferencia observada X- μ = -3 se le denomina el error
muestral.
Una media muestral Xm puede pensarse como la suma de dos cantidades, la media poblacional μ y
el error muestral; si e denota el error muestral, entonces:
X=μ+e
(2,2) 2 2–4=-2
(2,4) 3 3–4=-1
(2,6) 4 4–4= 0
(4,2) 3 3–4=-1
(4,4) 4 4–4= 0
(4,6) 5 5–4= 1
(6,2) 4 4–4= 0
(6,4) 5 5–4= 1
(6,6) 6 6–4= 2
Nótese las interesantes relaciones siguientes contenidas en la tabla.
La media de la colección de medias muestrales es 4, la media de la población de la que se extrae las
muestras. Sí μx denota la media de todas las medias muestrales entonces tenemos:
μx = (3 + 4 + 3 + 4 + 5 + 5 + 2 + 4 + 6)/9 = 4
La suma de los errores muestrales es cero.
e1 + e2 + e3 + . . . + e9 = (-2)+(-1)+0+(-1)+0+1+0+1+2 = 0
En consecuencia, si X se usa para medir, estimar, la media poblacional μ, el promedio de todos los
errores muestrales es cero.
d. Distribuciones Muestrales
Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se
esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la
misma media muestral o que sean completamente parecidas; puede esperarse que cualquier
estadístico, como la media muestral, calculado a partir de las medias en una muestra aleatoria,
cambie su valor de una muestra a otra.
•Por ello, se quiere estudiar la distribución de todos los valores posibles de un estadístico. Tales
distribuciones serán muy importantes en el estudio de la estadística inferencial, porque las
inferencias sobre las poblaciones se harán usando estadísticas muestrales. Como el análisis de las
distribuciones asociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de un
estadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional
desconocido.
•Como los valores de un estadístico, tal como X, varían de una muestra aleatoria a otra, se le puede
considerar como una variable aleatoria con su correspondiente distribución de frecuencias.
Solución:
a. La media poblacional es: μ = (0 + 2 + 4 + 6)/4 = 3
•B La desviación estándar de la población es:
•σ = √(0-3)² + (2-3)² + (4-3)² + (6-3)² /4 = 2.236
•C A continuación se listan los elementos de la distribución muestral de la media y la
correspondiente distribución de frecuencias.
La media de la distribución muestral de medias es:
μx = ∑f(Xm) / ∑f = (0)(1)+(1)(2)+(2)(3)+(3)(4)+…+(6)(1)/16 = 3
σx = √∑(Xm - μx )²*f / ∑f
σx = √(0-3)²*1+(1-3)²*2+(2-3)²*3+(3-3)²*4+….+(6-3)²*1)/16 = 1.58
Como para cualquier variable aleatoria, la distribución muestral de medias tiene una media o valor
esperado, una varianza y una desviación estándar, se puede que la distribución muestral de medias
tiene una media igual a la media poblacional. Esto es:
μx = E(Xm) = μ = 3
• Después de haber realizado el ejercicio anterior se puede ver que una distribución muestral se
genera extrayendo todas las posibles muestras del mismo tamaño de la población y calculándose a
éstas su estadístico.
• Si la población de la que se extraen las muestras es normal, la distribución muestral de medias será
normal sin importar el tamaño de la muestra.
• Si la población de donde se extraen las muestras no es normal, entonces el tamaño de la muestra
debe ser mayor o igual a 30 (n ≥ 30), para que la distribución muestral tenga una forma
acampanada. Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución muestral
de ser normal.
• Para muchos propósitos, la aproximación normal se considera buena si se cumple n = 30. La forma
de la distribución muestral de medias sea aproximadamente normal, aún en casos donde la
población original es bimodal, es realmente notable.
2. Tamaño de la Muestra
Cuando se hace una muestra, uno debe preguntarse: dado que una población es de N, ¿cuál es el
menor número de unidades muestrales (personas, organizaciones, capítulos de telenovelas, etc.),
que necesito para conformar una muestra (n) que me asegure un error estándar menor de 0.01?
La solución a esta pregunta pretende encontrar la probabilidad de ocurrencia de μx y que mi
estimado de μx se acerque a μ, el valor real de la población. Sí establecemos el error estándar y
fijamos 0.01, se sugiere que esta fluctuación promedio del estimado μx con respecto a los valores
reales de la población μ, no sea > 0.01, es decir que de 100 casos, 99 veces mi predicción sea
correcta y que el valor de μx se sitúe en un intervalo de confianza que comprenda el valor de μ.
Resumiendo para una determinada varianza σ² de x, ¿qué tan grande debe ser mi muestra? Esto
puede determinarse en dos pasos:
2. Tamaño de la muestra = n = n´ / (1 + n´ / N)
Es decir, para nuestra investigación, necesitaremos una muestra de 298 directores generales.
Esto es el primer procedimiento para obtener la muestra: determinar su tamaño, con base en
estimados de la población.
3. Técnicas de Muestreo
Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan la
misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.
Ejemplo: Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadística de 20 alumnos. C20,5 da el número total de formas de elegir una muestra no ordenada y
este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las 15,504 en pedazos
de papel, una tarea engorrosa, luego los colocamos en un recipiente y después los revolvemos,
entonces podremos tener una muestra aleatoria de 5 si seleccionamos un trozo de papel con cinco
nombres. Un procedimiento más simple para elegir una muestra aleatoria sería escribir cado uno de
los 20 nombres en pedazos separados de papel, colocarlos en un recipiente, revolverlos y después
extraer cinco papeles al mismo tiempo.
Otro método para obtener una muestra aleatoria de 5 estudiantes en un grupo de 20 utiliza una tabla
de números aleatorios. Se puede construir usando una calculadora o una computadora. También se
puede prescindir de estas y hacer la tabla escribiendo diez dígitos de 0 a 9 en tiras de papel, las
colocamos en un recipiente y lo revolvemos, de ahí, la primera tira seleccionada determina el primer
número de la tabla, se regresa al recipiente y después de revolver otra vez se selecciona la segunda
tira que determina el segundo número de la tabla; el proceso continua hasta obtener una tabla de
dígitos aleatorios con tantos números como se desee.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico, imposible o no
deseado; aunque sería deseable usar muestras aleatorias simples para las encuestas nacionales de
opinión sobre productos o sobre elecciones presidenciales, seria muy costoso o demorado.
b. El Muestreo Estratificado
Ejemplo: Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una
gran universidad. Puede ser difícil una muestra con todos los profesores, así que supongamos que
elegimos una muestra aleatoria de cada colegio, o departamento académico; los estratos vendrían a
ser los colegios, o departamentos académicos.
El muestreo por conglomerado requiere elegir una muestra aleatoria simple de unidades
heterogéneas entre sí de la población llamadas conglomerados.
Cada elemento de la población pertenece exactamente a un conglomerado, y los elementos dentro
de cada conglomerado son usualmente heterogéneos o disímiles.
Ejemplo: Suponga que una compañía de servicio de televisión por cable está pensando en abrir una
sucursal en una ciudad grande; la compañía planea realizar un estudio para determinar el porcentaje
de familias que utilizarían sus servicios, como no es práctico preguntar en cada casa, la empresa
decide seleccionar una parte de la ciudad al azar, la cual forma un conglomerado.
En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea
posible, a toda la población: entonces se usa una muestra aleatoria simple de conglomerados para
estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se
realizan, generalmente, con base en el muestreo por conglomerados.
d. El Muestreo Sistemático
El muestreo sistemático es una técnica de muestreo que requiere de una selección aleatoria inicial
de observaciones seguida de otra selección de observaciones obtenida usando algún sistema o
regla.
Ejemplo: Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede
obtenerse una muestra aleatoria de los números de las páginas del directorio telefónico; al elegir el
vigésimo nombre de cada página obtendríamos un muestreo sistemático, también podemos escoger
un nombre de la primera página del directorio y después seleccionar cada nombre del lugar número
cien a partir del ya seleccionado. Por ejemplo, podríamos seleccionar un número al azar entre los
primeros 100; supongamos que el elegido es el 40, entonces seleccionamos los nombres del
directorio que corresponden a los números 40, 140, 240, 340 y así sucesivamente.
UNIDAD 6: REGRESION Y CORRELACION
• Introducción.
La regresión y la correlación son las dos herramientas estadísticas mas poderosas y versátiles que
se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan
en la creencia de que se puede identificar y cuantificar alguna relación funcional entre dos o mas
variables. Se dice que una variable depende de la otra. Se puede decir que Y depende de X en
donde Y y X son dos variables cualquiera. Esto se puede escribir así: Y = f(X)
En donde X1, X2, X3, …,Xn, son variables independientes que permiten explicar Y.
2. Determinación del Modelo de Regresión
Lineal Simple
Solo son necesarios dos puntos para dibujar la línea recta que representa esta relación lineal. La
ecuación de una recta puede expresarse como :
Las relaciones entre variables son o deterministicas o estocásticas (aleatorias). Una relación
deterministica puede expresarse mediante la formula que convierte la velocidad expresada en millas
por hora (mph) a kilómetros por hora (kph). Ya que una milla es aproximadamente igual a 1.6
kilómetros, este modelo es 1 mph = 1.6 kph. Por tanto, una velocidad de 5 mph = 5 (1.6) kph = 8 kph.
Este es un modelo deterministico porque la relación es exacta y no hay error (salvo la aproximación).
Infortunadamente, muy pocas relaciones en el mundo de los negocios son así de exactas.
Se dice que un modelo es estocástico, por la presencia de la variación aleatoria y puede expresarse
como
El propósito del análisis de regresión es determinar una recta que se ajuste a los datos muestrales
mejor que cualquier otra recta que pueda dibujarse. Para ilustrarlo, se asume que Orthoplan,
recolecta datos sobre los gastos publicitarios y los ingresos por ventas de 5 meses en millones de
pesos, como se muestra en la tabla.
VENTAS ORTHOPLAN
Mes Ventas $ Publicidad $
X Y XY X² Y²
Por tanto, la ecuación para la mejor línea recta para estos datos es:
Ŷ = 0.1499X -17.65
La pendiente b1 se cálculo como + 0.1499. Este valor significa que, para cada aumento de una
unidad en X, el valor de Y aumenta en 0.1499 unidades. En este problema de gastos publicitarios,
por cada aumento de US$1000 en ventas, el costo de publicidad aumentará en US$149.9. Se puede
considerar que esta pendiente representa la parte variable del gasto en publicidad, la cual varia
según las ventas. La interpretación de b0 con el eje Y se calculó que era de (US$17.65). La
intercepción con el eje Y representa el valor de Y cuando X es igual a 0.
La ecuación de regresión que se ha ajustado a los datos, se puede utilizar ahora para predecir el
valor de Y para un valor dado de X. Por ejemplo, el contador querría predecir el costo promedio de
gastos de publicidad con unas ventas de US$540. El costo Ŷ predicho se puede determinar al
sustituir X = 540 en la ecuación Ŷ = 0.1499X -17.65 porque X representa las ventas en miles
de dólares:
Dado que Y representa miles de dólares, el gasto promedio predicho es de US$63.30 para ventas en
miles de dólares de US$540.
4. Error Estándar de la Estimación
Aunque el método de los mínimos cuadrados da por resultado una línea que ajusta en los datos con
la mínima cantidad de variación, la ecuación de regresión no es perfecta para las predicciones, sobre
todo cuando se toman las muestras de la población, excepto si todos los datos observados caen en
la línea de regresión predicha. Así como no se puede esperar que todos los valores de los datos
estén ubicados exactamente en su media aritmética, en la misma forma tampoco se puede esperar
que todos los puntos de los datos caigan exactamente en la línea de regresión. Por tanto, la línea de
regresión sirve sólo para predicción para predicción aproximada de un valor Y, para un valor dado X.
Entonces se necesita desarrollar un estadístico que mida la variabilidad en los valores reales de Y,
Yi, a partir de los valores predichos de Y, Ŷi, una medida de variabilidad en torno a la línea de
regresión se llama el error estándar de la estimación. La variabilidad en torno a la recta de
regresión se ilustra en la siguiente gráfica de los gastos publicitarios.
Se puede ver en la gráfica que, aunque la recta de regresión predicha cae cerca de muchos de los
valores de Y, hay valores en cima de la recta de regresión así como debajo de ella, de modo que:
∑(Yi – Ŷi) = 0
Diagrama de Dispersión y Recta de Regresión para el Problema de Gastos
publicitarios
Ventas en Orthoplan
70
60
y = 0,1499x - 17,643
Publicidad
50
40
30
20
10
0
0 100 200 300 400 500 600
Ventas
El error estándar de la estimación, dado por el símbolo Sxy se define:
Sxy = √ ∑(Yi – Ŷi)² / n -2
El error estándar de la estimación, igual a US$2557, representa una medida de la variación en torno
a la recta ajustada de regresión. Se mide en unidad de la variable Y. La interpretación del error
estándar de la estimación , entonces, es análogo al de la desviación estándar. Así como la
desviación estándar mide la variabilidad en torno a la media aritmética, el error estándar de
estimación mide la variabilidad en torno a la recta ajustada de regresión.
5. Medidas de Variación en La Regresión y La
Correlación
A fin de poder determinar qué tan bien predice la variable independiente a la variable dependiente en
el modelo estadístico, se necesita desarrollar varias medidas de variación. La primera medida, la
variación total, es una medida de la variación de los valores de Y en torno a su media, Ym. La
variación total se puede dividir en dos componentes. En un problema de regresión, la variación total
en Y, se puede subdividir en variación explicada, o sea, la que es atribuible a la relación entre X y
Y y la variación no explicada, atribuible a factores que no sean la relación entre X y Y.
Esto se puede interpretar que el 97.93% de la variación en los gastos de publicidad entre un mes y
otr0, se puede explicar por la variabilidad en las ventas de cada mes. Este es un ejemplo en el cual
hay una relación lineal muy fuerte entre las dos variables, por que el uso de un modelo de regresión
ha reducido en un 97.93% la variabilidad en la predicción de los gatos publicitarios.
6. Correlación
El análisis de correlación, por contraste con el de regresión, se utiliza para medir la fuerza de la
asociación entre las variables. Por ejemplo, en la encuesta del director se podría determinar la
correlación entre las estaturas y los pesos de los estudiantes. En este caso, el objetivo no es utilizar
una variable para predecir la otra, sino solo medir la fuerza de la asociación entre las dos variables.
La fuerza de una relación entre dos variables se suele medir con el coeficiente ρ de correlación
cuyos valores van desde -1 para la correlación negativa perfecta hasta +1 para la correlación positiva
perfecta.
Para muchas aplicaciones, en particular en las ciencias sociales, al investigador solo le interesa
medir la asociación y la covariacion entre las variables y no usar una variable para predecir otra.
Si se efectúa el análisis de correlación en un grupo de datos, el coeficiente r de correlación de la
muestra se puede calcular directamente con el uso de la siguiente formula:
Ahora se puede desarrollar una estimación de intervalo de confianza para hacer inferencias en
cuanto al valor predicho de Y.
Estimación de intervalo de confianza de la media de Yμyx para una X dada
Un examen de la ecuación indica que el ancho del intervalo de confianza depende de varios factores.
Para un nivel dado de confianza, el aumento en la variación alrededor de la recta de regresión,
medida con el error estándar de la estimación, da por resultado un intervalo mas ancho. Pero, como
seria de esperar, el tamaño aumentado de la muestra reduce el ancho del intervalo. Así mismo, el
ancho del intervalo varia también con diferentes valores de X. Cuando se predice Y para los valores
de X cercanos a Xm, el intervalo es mucho mas estrecho que para las predicciones de valores de X
mas distantes de la media.
• La estimación de intervalo de la media real de Y varia hiperbólicamente como función de la cercanía del X dado con Xm . Cuando se van
a hacer predicciones de valores de X que están distantes del valor promedio de X, el intervalo mucho mas ancho es la compensación por
predecir tales valores de X. Por tanto, como se ilustra en la figura, se observa un efecto de banda de confianza para las predicciones.
Ŷ = 0.1499X -17.65
Y para Xi = 540, Ŷi = 63.30. Además, Xm = 458, Syx = 2.557
∑Xi = 2.290, ∑Xi² = 1.064.900, t3 = 2.35
Por tanto,
Por tanto, se estima que el gasto promedio real de publicidad es entre US$ 60.570 y US$ 66.030
para ventas de US$ 540. Se tiene 95% de confianza en que este intervalo estima correctamente el
gasto real de gastos de publicidad
8. Inferencia acerca de los parámetros de la
población en regresión y correlación
En la sección anterior se utilizo la inferencia estadística para desarrollar una estimación del intervalo de
confianza para μyx , el valor de la media real de Y. En esta sección, se utilizara la inferencia estadística
para sacar conclusiones en cuanto a la pendiente β1 de la población y el coeficiente ρ de correlación de la
población.
Se puede determinar si existe o no una relación significativa entre las variables X y Y al probar si β1 (la
pendiente real) es o no igual a cero. Si se rechaza esta hipótesis, se puede llegar a la conclusión de que
hay pruebas de una relación lineal. Por tanto, las hipótesis nula y alternativa se podrian expresar como
sigue:
tn-2 = b1 / Sb1
En donde: Sb1 = Syx / √ ∑Xi² - (∑Xi)² / n
Por tanto, para probar la existencia de una relación con un nivel de significación de 0.01 se tiene :
Entonces, la conclusión a que se llego es rechazar la hipótesis nula y decir que hay una relación
significativa entre la publicidad y las ventas.
Prueba de una Hipótesis acerca de la pendiente de una población con un nivel de significación de
1% con 3 grados de libertad
Un segundo método, equivalente para probar la existencia de una relación lineal entre las variables,
es establecer una estimación del intervalo de confianza para β1 y determinar si el valor hipotético
(β1 = 0) esta incluido en el intervalo. La estimación del intervalo de confianza para β1 se obtendría
con el uso de la siguiente formula
b1 ± tn-2 Sb1
Si se deseo una estimación del intervalo con 99% de confianza, se tendría
Entonces,
0.03214 ≤ β1 ≤ 0.2676
Con la ecuación se estima, con 99% de confianza, que la pendiente real es entre +0.03214 y +0.2676. Como estos
valores son superiores a cero se puede llegar a la conclusión de que hay una relación positiva significativa entre la
publicidad y las ventas. Por el contrario, si el intervalo hubiera incluido cero, no se habría determinado la relación
• Un tercer método para examinar la existencia de una relación lineal entre dos variables incluye el
coeficiente r de correlación de la muestra. La existencia de una relación entre X y Y que se probo
con el uso de la ecuación tn-2 = b1 / Sb1, se podría probar en términos del coeficiente de correlación con
resultados equivalentes. La prueba de la existencia de una relación lineal entre dos variables, es la
misma que determinar si hay o no alguna correlación significativa entre ellas. Se plantea la hipótesis
de que el coeficiente ρ de correlación de población es igual a cero. Entonces, la hipótesis nula y
alternativa serian