Anda di halaman 1dari 155

PROPUESTA DE MEJORAMIENTO DE LA EMPRESA

TECNOLOGA EN GESTIN DE LA PRODUCCIN INDUSTRIAL BOGOT D.C


2014

CONTENIDO

Pg.

INTRODUCCIN.......................................................................................................9
1. OBJETIVOS......................................................................................................10
1.1 OBJETIVO GENERAL......................................................................................10
2.2 OBJETIVOS ESPECFICOS.............................................................................10
1.2 ESTADSTICA INDUCTIVA Y DESCRIPTIVA..................................................12
1.2.1 Estadstica inductiva....................................................................................12
12.2 Estadstica descriptiva..................................................................................13
1.3 ESTADSTICA DESCRIPTIVA E INFERENCIAL.............................................15
1.3.1 Anlisis estadstico......................................................................................17
1.3.2 Datos y variables..........................................................................................17
2. CLASIFICACIN DE VARIABLES.....................................................................19
2.1 Variables independientes...............................................................................19
2.2 Variables dependientes...................................................................................19
2.3 Variable contina.............................................................................................20
2.4 Variable discreta..............................................................................................21
2.5 Variable dicotmica o binaria.........................................................................21

2.6 Variable ficticia (dummy)................................................................................21


2.7 REPRESENTACIN DE DATOS......................................................................23
2.8 MTODOS DE REPRESENTACIN DE DATOS CUANTITATIVOS...............23
2.8.1 Diagrama de barras......................................................................................23
2.8.2 Histograma....................................................................................................24
2.8.3 Polgono de frecuencias..............................................................................24
2.8.4 Diagrama de sectores..................................................................................24
3. DISTRIBUCIN DE FRECUENCIAS..................................................................25
3.1 organizacin de datos agrupados.................................................................28
Su fin es el resumir la informacin, generalmente los elementos son de
mayor tamao por lo cual requieren de ser agrupados, esto implica:............28
3.2 GRFICOS DE UNA DISTRIBUCIN DE FRECUENCIA...............................29
4. HISTOGRAMA....................................................................................................30
4.1 Polgono de frecuencias:................................................................................31
4.1.1 Polgonos de frecuencia para datos agrupados.......................................32
4.1.2 Polgono de frecuencias acumuladas........................................................34
4.2 curvas de frecuencia.......................................................................................34
4.3 MEDIDAS DESCRIPTIVAS...............................................................................35
4.4.

MEDIDAS DE TENDENCIA CENTRAL........................................................37

5. MEDIA ARITMTICA..........................................................................................39
6. MEDIANA............................................................................................................41
6.1 Datos sin agrupar............................................................................................41
6.2 Datos agrupados.............................................................................................42
7. MODA..................................................................................................................43

7.1 moda de datos agrupados..............................................................................44


7.1.1 Propiedades..................................................................................................44
7.1.2 Inconvenientes..............................................................................................45
7.2 ejemplo.............................................................................................................45
8. CUARTILES, DECIL Y PERCENTIL...................................................................46
9. CALCULO DE CUARTILES DE DATOS AGRUPADOS EN INTERVALOS......47
9.1 Datos agrupados.............................................................................................47
9.1.1 Para datos no agrupados............................................................................49
9.2 cuartiles............................................................................................................50
9.3 percentiles........................................................................................................50
10. MEDIDAS DE DISPERSIN.............................................................................52
10.1 rango...............................................................................................................53
10.2 Obtencin del rango......................................................................................53
10.2.1 requisitos del rango...................................................................................54
10.2.2 ejemplos......................................................................................................55
10.3 varianza...........................................................................................................55
10.3.1 Propiedades................................................................................................56
10.4 DESVIACIN TPICA......................................................................................57
10.4.1 Desviacin Tpica maestral.......................................................................58
10.4.2 Desviacin tpica poblacional..................................................................59
10.4.3 Ejemplo........................................................................................................59
10.4.4 Covarianza...................................................................................................60
10.4.5 Propiedades................................................................................................63
11. CONCEPTOS GENERALES DE PROBABILIDAD..........................................65
11.1

POBLACIN (N).........................................................................................68

11.2. MUESTRA (n)...............................................................................................69

11.3. MUESTREO..................................................................................................71
11.3.1. Tipos de Muestreo.....................................................................................72
11.4. ESPACIO MUESTRAL.................................................................................73
11.6 DISCRETOS.................................................................................................80
11.6.1 Espacio probabilstico discreto................................................................81
11.6.2 Espacio probabilstico discreto equiprobable........................................81
11.6.3 Espacio probabilstico finito......................................................................81
11.6.4 Procesos estocsticos finitos y diagramas de rbol..............................81
11.6.5 Espacio probabilstico infinito contable..................................................82
11.7 continuos........................................................................................................82
11.8

EVENTOS ALEATORIOS.............................................................................84

11.9. EXPERIMENTO ESTADSTICO...................................................................85


11.9.1 Experimento aleatorio................................................................................87
12. TCNICAS DE CONTEO..................................................................................89
12.1 PRINCIPIO DE LA MULTIPLICACIN...........................................................91
12.1.1 Principio aditivo..........................................................................................92
12.2 PRINCIPIO DE LA SUMA O ADICIN o ley de la suma..............................93
12.3 NOTACIN FACTORIAL................................................................................95
12.3.1 Factorial de un entero Positivo.................................................................96
12.3.2 Variaciones..................................................................................................96
12.3.3 Propiedades de las Variaciones................................................................97
12.3.4 Variaciones sin Repeticin........................................................................97
12.4 permutaciones...............................................................................................97
12.4.1 Principio de permutacin..........................................................................97
12.5 combinaciones...............................................................................................98
12.5.1 Principio de combinacin..........................................................................99
13. AXIOMAS DE LAS PROBABILIDADES........................................................100
Segundo axioma..................................................................................................100
Tercer axioma.......................................................................................................101

13.1

PROPIEDADES QUE DEDUCEN LOS AXIOMAS..................................102

14 TEOREMAS FUNDAMENTALES DE LA PROBABILIDAD.........................104


14.4 proposicin..................................................................................................107
14.2

TEOREMA PROBABILIDAD COMPUESTA...........................................107

15. PROBABILIDAD CONDICIONAL...................................................................109


16. TEOREMA DE BAYES....................................................................................114
17. DISTRIBUCIN DE VARIABLE DISCRETA.................................................117
17.1 BINOMIAL.....................................................................................................121
17.1.1 Experimento binomial..............................................................................122
17.2 CARACTERSTICAS ANALTICAS.............................................................123
Ejemplo.................................................................................................................123
17.3

HIPERGEOMETRIA.................................................................................123

17.4 propiedades.................................................................................................125
18. POISSON.........................................................................................................127
18.1 PROPIEDADES.............................................................................................128
18.2

SUMA DE VARIABLES ALEATORIAS DE POISSON............................130

18.3 DISTRIBUCIN BINOMIAL..........................................................................131


18.5

DISTRIBUCIN EXPONENCIAL............................................................133

19. DISTRIBUCIN DE LA VARIABLE CONTINUA............................................135


20. DISTRIBUCIN NORMAL..............................................................................140
20.1 Distribucin normal o de Gauss................................................................140
20.1 Ejemplos.......................................................................................................145
6

CONCLUSIONES..................................................................................................147
CIBERGRAFIA......................................................................................................149
LISTA DE ILUSTRACIONES

Pg.
Ilustracin 1: Distribucin de frecuencias.................................................................26
Ilustracin 2: Distribucin de frecuencias agrpales...................................................27
Ilustracin 3: histograma........................................................................................ 31
Ilustracin 4:Poligono de frecuencia absoluta...........................................................32
Ilustracin 5: Polgono de frecuencias agrupados.....................................................33
Ilustracin 6: Polgono de frecuencias acumuladas....................................................34
Ilustracin 7: Moda de datos agrupados...................................................................45
Ilustracin 8: Cuadro de covarianza........................................................................62
Ilustracin 9: grafic de poblacin...........................................................................69
Ilustracin 10: Probabilidad condicional.................................................................112
Ilustracin 11:Diagrama de poisson.......................................................................128
Ilustracin 12: Tringulo de Tartaglia.....................................................................132
Ilustracin 13: Grafico de distribucin binomial.......................................................133
Ilustracin 14: distribucin probabilidad continua.....................................................139
Ilustracin 15: Curva de poisson...........................................................................141
Ilustracin 16: Colas de eje..................................................................................142
Ilustracin 17: histograma normal.........................................................................143
Ilustracin 18: Histograma de una variable normal..................................................143

INTRODUCCIN

Una variable aleatoria es un valor numrico que corresponde al resultado de un


experimento aleatorio, como el nmero de caras que se obtienen al lanzar 4 veces
una moneda, el nmero de lanzamientos de un dado hasta que aparece el seis, el
nmero de llamadas que se reciben en un telfono en una hora, el tiempo de
espera a que llegue un autobs. Las variables aleatorias, como las estadsticas,
pueden ser discretas o continuas. Las variables aleatorias permiten definir la
probabilidad como una funcin numrica (de variable real) en lugar de como una
funcin de un conjunto dado. Se dice que una variable aleatoria sigue una
distribucin uniforme si la funcin de densidad es constante en el intervalo en el
que se encuentran todos los valores de la variable.

Las distribuciones de probabilidad estn relacionadas con las distribuciones de


frecuencias. Una distribucin de frecuencias terica es una distribucin de
probabilidades que describe la forma en que se espera que varen los resultados.
Debido a que estas distribuciones tratan sobre expectativas de que algo suceda,
resultan ser modelos tiles para hacer inferencias y para tomar decisiones en
condiciones de incertidumbre. Una distribucin de frecuencias es un listado de las
frecuencias observadas de todos los resultados de un experimento que se
presentaron realmente cuando se efectu el experimento, mientras que una
distribucin de probabilidad es un listado de las probabilidades de todos los
posibles resultados que podran obtenerse si el experimento se lleva a cabo.

Las distribuciones de probabilidad pueden basarse en consideraciones tericas o


en una estimacin subjetiva de la posibilidad. Se pueden basar tambin en la
experiencia.

1. OBJETIVOS

1.1 OBJETIVO GENERAL

Estar en la capacidad de obtener a partir de los datos de la empresa muestras sobre diferentes
productos para as representar, analizar e interpretar datos en cuadros estadsticos al igual
graficar e interpretar un determinado producto que requiera una medicin de calidad y aplicar y
calcular diferentes medidas en el proceso de una investigacin de los datos estadsticos de los
productos que realiza la empresa Sara lee S.A.S.

2.2 OBJETIVOS ESPECFICOS

Conocer la historia y reconocer la importancia de la estadstica en todos los campos que se


pueda aplicar.

Utilizar adecuadamente smbolos y palabras del lenguaje estadstico para aplicar procesos
matemticos bsicos en clculos estadsticos.

Usar el mtodo estadstico en la recoleccin de la informacin de la empresa proyecto para


poder diagnosticar los riesgos o no conformidades que se puedan encontrar. Elaborar y
representar una investigacin en cuadros y en forma grfica.

10

1. ESTADSTICA

La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos


por las observaciones, para poder hacer comparaciones y sacar conclusiones. Es
una ciencia formal y una herramienta que estudia el uso y los anlisis provenientes
de una muestra representativa de datos, busca explicar las correlaciones y
dependencias de un fenmeno fsico o natural, de ocurrencia en forma aleatoria o
condicional.

La estadstica es comnmente considerada como una coleccin de hechos


numricos expresados en trminos de una relacin sumisa, y que han sido
recopilados a partir de otros datos numricos. Kendall y Buckland (citados por
Gini V. Glas / Julian C. Stanley, 1980) definen la estadstica como un valor
resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimacin de
parmetro de determinada poblacin; es decir, una funcin de valores de muestra.
"La estadstica es una tcnica especial apta para el estudio cuantitativo de los
fenmenos de masa o colectivo, cuya mediacin requiere una masa de
observaciones de otros fenmenos ms simples llamados individuales o
particulares". (Gini, 1953. Murria R. Spiegel, (1991) dice: "La estadstica estudia
los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como
para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal
anlisis. "La estadstica es la ciencia que trata de la recoleccin, clasificacin y
presentacin de los hechos sujetos a una apreciacin numrica como base a la
explicacin, descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954).

En ciertas ciencias (Biologa, Ciencias Humanas, algunos campos de la Fsica, ...)


aparece el concepto de experimento aleatorio (experimento que repetido en las

11

"mismas condiciones" no produce el mismo resultado) y asociado al mismo el de


variable aleatoria. Una variable no aleatoria (asociada al resultado de una
experiencia que s produce el mismo resultado) est caracterizada por un valor
para cada condicin.

Una variable aleatoria est caracterizada por la llamada funcin densidad de


probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles
valores para cada condicin. Los objetivos de la investigacin cientfica se pueden
entender, de un modo muy general, en trminos de encontrar y describir las
variables de inters y las relaciones entre ellas, para el problema en estudio. La
estadstica es la ciencia que estudia los mtodos que permiten realizar este
proceso para variables aleatorias. Estos mtodos permiten resumir datos y acotar
el papel de la casualidad (azar).

1.2 ESTADSTICA INDUCTIVA Y DESCRIPTIVA

1.2.1 Estadstica inductiva

Est fundamentada en los resultados obtenidos del anlisis de una muestra de


poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la
poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia
estadstica. Segn Berenson y Levine; Estadstica Inferencial son procedimientos
estadsticos que sirven para deducir o inferir algo acerca de un conjunto de datos
numricos (poblacin), seleccionando un grupo menor de ellos (muestra). El
objetivo de la inferencia en investigacin cientfica y tecnolgica radica en conocer
clases numerosas de objetos, personas o eventos a partir de otras relativamente

12

pequeas compuestas por los mismos elementos. En relacin a la estadstica


descriptiva y la inferencial, Levin & Rubin (1996) citan los siguientes ejemplos para
ayudar a entender la diferencia entre las dos.
Supngase que un profesor calcula la calificacin promedio de un grupo de
historia. Como la estadstica describe el desempeo del grupo pero no hace
ninguna generalizacin acerca de los diferentes grupos, podemos decir que el
profesor est utilizando estadstica descriptiva. Grficas, tablas y diagramas que
muestran los datos de manera que sea ms fcil su entendimiento son ejemplos
de estadstica descriptiva. Supngase ahora que el profesor de historia decide
utilizar el promedio de calificaciones obtenidas por uno de sus grupos para estimar
la calificacin promedio de las diez unidades del mismo curso de historia. El
proceso de estimacin de tal promedio sera un problema concerniente a la
estadstica inferencial. Los estadsticos se refieren a esta rama como inferencia
estadstica, esta implica generalizaciones y afirmaciones con respecto a la
probabilidad de su validez.

12.2 Estadstica descriptiva


La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo,
edad de una poblacin, altura de los estudiantes de una escuela, temperatura en
los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento
de estas variables. Las variables pueden ser de dos tipos:

Variables cualitativas o atributos: no se pueden medir numricamente (por

ejemplo: nacionalidad, color de la piel, sexo).


Variables cuantitativas: tienen valor numrico (edad, precio de un producto,
ingresos anuales).

13

Las variables tambin se pueden clasificar en:

Variables unidimensionales: slo recogen informacin sobre una caracterstica

(por ejemplo: edad de los alumnos de una clase).


Variables bidimensionales: recogen informacin sobre dos caractersticas de la
poblacin (por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas


(por ejemplo: edad, altura y peso de los alumnos de una clase).

Por su parte, las variables cuantitativas se pueden clasificar en discretas y


continuas:

Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
nmero de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr

ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por
ejemplo, la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.

Cuando se estudia el comportamiento de una variable hay que distinguir los


siguientes conceptos:
Individuo: cualquier elemento que porte informacin sobre el fenmeno que se
estudia. As, si estudiamos la altura de los nios de una clase, cada alumno es un
individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.

14

Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que
porten informacin sobre el fenmeno que se estudia. Por ejemplo, si estudiamos
el precio de la vivienda en una ciudad, la poblacin ser el total de las viviendas
de dicha ciudad.

Muestra: subconjunto que seleccionamos de la poblacin. As, si se estudia el


precio de la vivienda de una ciudad, lo normal ser no recoger informacin sobre
todas las viviendas de la ciudad (sera una labor muy compleja), sino que se suele
seleccionar un subgrupo (muestra) que se entienda que es suficientemente
representativo. Est fundamentada en los resultados obtenidos del anlisis de una
muestra de poblacin, con el fin de inducir o inferir el comportamiento o
caractersticas de la poblacin, de donde procede por lo que recibe tambin el
nombre de inferencia estadstica.

1.3 ESTADSTICA DESCRIPTIVA E INFERENCIAL

Es un proceso mediante el cual se recopila, organiza, presenta, analiza e


interpreta datos de manera tal que describa fcil y rpidamente las caractersticas
esenciales de dichos datos mediante el empleo de mtodos grficos, tabulares o
numricos. Llamada tambin inferencia estadstica, la cual consiste en llegar a
obtener conclusiones o generalizaciones que sobrepasan los lmites de los
conocimientos aportados por un conjunto de datos. Busca obtener informacin
sobre la poblacin basndose en el estudio de los datos de una muestra tomada a
partir de ella.

15

La estadstica descriptiva o deductiva trata del recuento, ordenacin y clasificacin


de los datos obtenidos por las observaciones. Por lo general, cuando hay un gran
nmero de datos antes de que la mente humana pueda interpretarlos, deben
resumirse o reducirse. La mente humana no tiene la capacidad de extraer
conclusiones de una serie de datos en bruto; la estadstica descriptiva sirve de
herramienta o instrumento para describir, resumir o reducir las propiedades de un
conjunto de datos para que se puedan manejar. En definitiva, comprende aquellas
tcnicas que se usan para resumir la informacin (largas listas de valores) para
proporcionar ndices simples y comprensibles

y, por lo tanto, para facilitar

descripciones y comparaciones, hacindolo de la forma ms exacta posible. Para


reducir la informacin se construyen tablas, se representan grficos y se calculan
parmetros estadsticos que caracterizan la distribucin, de esta forma se
simplifica la complejidad de todos los datos que intervienen en la distribucin. Por
lo tanto, la estadstica descriptiva hace referencia, o se utiliza en las etapas 3, 4 y
5 del mtodo cientfico (observacin, clasificacin y descripcin), y nicamente se
limita a realizar deducciones directamente a partir de los datos y parmetros
obtenidos.

Por su parte, la estadstica inferencial o inductiva trata de llegar a conclusiones


que sobrepasan el alcance de los datos analizados, es decir, se trata de tcnicas
que se emplean para inferir o deducir caractersticas desconocidas a partir de un
conjunto de datos conocidos, apoyndose fundamentalmente en el clculo de
probabilidades. Esto es as porque es imposible en la mayora de los casos utilizar
como datos para comprobar las hiptesis la totalidad de los fenmenos que
componen la poblacin objeto de estudio. (Por ejemplo, es imposible medir el
dimetro de todos los cantos en una terraza fluvial, o encuestar a todos los
agricultores de una determinada zonas...). Como resulta imposible examinar la
poblacin entera de los fenmenos que estudiamos, la construccin de leyes y
teoras se tiene que apoyar en DATOS MUSTRALES. A partir de unos pocos

16

datos conocidos (los de la muestra), se trata de obtener informacin

de la

poblacin total, y esto lo hace apoyndose en el clculo de probabilidades, como


hemos mencionado anteriormente. Uno de los principales objetivos de la
estadstica inferencial es estimar las propiedades de una poblacin a partir del
conocimiento de slo una muestra de ella. La estadstica inferencial se basa por
lo tanto en la estadstica descriptiva, ya que la inferencia o deduccin de las
propiedades de la poblacin entera se deriva de las caractersticas de la muestra
que es analizada con las tcnicas de la estadstica descriptiva.

1.3.1 Anlisis estadstico

Por anlisis se entiende la separacin de las partes de un todo hasta llegar a


conocer sus principios o elementos. Si extendemos esta definicin al mbito
estadstico, podremos afirmar que el anlisis estadstico es el anlisis que emplea
tcnicas estadsticas para interpretar datos, ya sea para ayudar en la toma de
decisiones o para explicar los condicionantes que determinan la ocurrencia de
algn fenmeno.

1.3.2 Datos y variables

La materia prima de la estadstica la constituyen los datos, stos provienen de las


variables la cuales expresan la medicin de alguna caracterstica, a manera de
ejemplo, una variable puede ser el color de los ojos en cada persona, el dato es la
expresin de la medicin hecha y podra dar como resultado: negros, caf, azules,
etc. De esta manera, como se seal antes, las variables son la herramienta
fundamental con que se trabaja en estadstica, es necesario pues considerar con

17

mayor atencin el tipo de valores que pueden tomar las variables puesto que de
ello depende el tipo de anlisis estadstico que se realizar con posterioridad. La
forma de clasificar a las variables en este caso tiene que ver con considerar los
valores que pueden tomar, as pues, en el ejemplo anterior resulta claro que al
interrogar a alguna persona, la respuesta que obtenemos tiene que ver con una
expresin tal como: negros, caf, azules, etc.

Consideremos ahora otro ejemplo supongamos que se pregunta ahora acerca del
grado de satisfaccin que tienen los clientes de un determinado banco, se obtiene
como resultado expresiones como: muy satisfecho, satisfecho y poco satisfecho.
Tambin se podran usar otros smbolos que estuvieran asociados a los resultados
anteriores como: MS, S y PS; o 3, 2 y 1. Es pertinente sealar que estos ltimos
valores no seran considerados como nmeros sino como sustitutos de las
categoras utilizadas para denotar el grado de satisfaccin.

Note que en ambos ejemplos las respuestas son expresiones, sin embargo en
este ltimo es posible percibir que las respuestas tienen un orden, puesto que si
alguien responde satisfecho es posible saber que tiene un mayor grado de
satisfaccin que quien responde poco satisfecho y menor que quien responde muy
satisfecho. En el primero ejemplo no es as, ya que no resulta posible decidir que
el color de ojos caf es mejor o peor que negros o cualquiera de los otros colores
que hayan sido la respuesta de las personas. Ahora bien, revisemos otro tipo de
variables. Si a una persona se le pregunta acerca del nmero de hermanos que
tiene, se puede apreciar que los valores que se obtendrn como respuesta sern
nmeros, iniciando desde el cero y los primeros nmeros naturales (1, 2, 3, 4, 5, 6,
7, 8, 9,...), as se puede clasificar a las personas de acuerdo al nmero de
hermanos que tengan.

18

2. CLASIFICACIN DE VARIABLES

2.1 VARIABLES INDEPENDIENTES

Son las caractersticas en las que difieren los objetos de estudio (sexo, edad, etc.)
(En estudios de encuesta y en estudios observacionales) mientras que en estudios
experimentales son las diferentes condiciones a las que exponemos a los objetos
de estudio. Tambin se les llama variables explicativas o productoras.

2.2 VARIABLES DEPENDIENTES

Son aquellas cuyo comportamiento es explicado o pronosticado por una o ms


variables independientes. Tambin se las llama variables criterio o respuesta. En
las investigaciones no experimentales no siempre est claro si una variable es
dependiente o independiente, siendo el contexto de la investigacin la que hace
decidir aunque a veces una variable puede desempear diferentes roles en
distintas situaciones. En algunas aplicaciones del anlisis multivariable, todas las
variables tienen el mismo estatus y se habla de relaciones de interdependencia
entre variables. En estos casos no hay variables dependientes e independientes.

b) Clasificacin de las variables por los valores que pueden tomar. La clasificacin
de las escalas de medida no siempre deja las cosas claras, por eso

19

frecuentemente en el anlisis de datos se divide a las variables en dos grandes


grupos:
Variables no mtricas o cualitativas (escalas nominal y ordinal)
Variables mtricas o cuantitativas (escalas de intervalo o de razn)

Variables

cualitativas:

representan

una

cualidad

atributo

no

medible

numricamente. Son ejemplos habituales de variables cuantitativas: el sexo, el


estado civil, la nacionalidad, etc. o Nominales: la variable puede tomar valores que
no mantienen una relacin de orden entre s. Por ejemplo la nacionalidad de una
persona: espaola o extranjera. O Ordinales: las variables cualitativas ordinales a
pesar de no poder cuantificarse numricamente s pueden ordenarse. Es decir,
existe cierta jerarqua entre los distintos valores que puede tomar la variable. Por
ejemplo, el grado de dificultad que tiene un hogar para llegar a fin de mes: con
mucha facilidad, con facilidad, con dificultad o con mucha dificultad.

2.3 VARIABLE CONTINA

Es una variable cuantitativa que por su naturaleza puede adoptar cualquier valor
numrico (dentro de un intervalo). Para todo par de valores siempre se puede
encontrar un valor intermedio, la precisin la da el instrumento de medida. (peso,
estatura..). Son aquellas que pueden tomar cualquier valor dentro de un rango
determinado. Por ejemplo, los ingresos procedentes del trabajo que recibe una
persona.

20

2.4 VARIABLE DISCRETA

A diferencia de las continuas no pueden tomar cualquier valor del rango.


Normalmente toman valores enteros. Son variables cuantitativas discretas el
nmero de hijos de una persona, el nmero miembros de un hogar mayores de 65
aos. Variable cualitativa o cuantitativa que slo puede adoptar un nmero finito
de valores distintos. En las cuantitativas entre dos valores continuos no hay uno
intermedio. (Nmero de hijos)

2.5 VARIABLE DICOTMICA O BINARIA

Es aquella que slo puede tomar dos valores. Por ejemplo Sexo, tener o no una
enfermedad. Si a sus valores se les pone 0 y 1 se le llama binaria.

2.6 VARIABLE FICTICIA (DUMMY)

Las variables cualitativas (nominales y ordinales) a veces se convierten en


numricas usando variables ficticias. En ellas el 1 indica presencia de una
categora y el 0 ausencia de la misma. Para convertir una variable cualitativa en
dummy hacen falta tantas variables como niveles de la variable cualitativa menos
uno. Para sexo sera suficiente con una (varn=0, mujer=1) Para Estudios (Eso,
Bachillerato y FP) haran falta dos: V1: eso=1, Bach y FP=0, V2: Bach=1, eso y Fp
=0, FP queda definida por ser 0 en las otras dos.

21

En relacin al anlisis de datos se clasifican las variables en funcin de ciertas


clasificaciones de escala y de origen:
Puntuaciones directas o brutas, son las obtenidas directamente y se suelen
representar con letras maysculas (X,Y, ...) y tienen Medias (x , , ...) y
desviaciones tpicas (s x , s y ...)

Puntuaciones centradas en la media o diferenciales, se suelen representar con


letras minsculas y son un cambio de origen al restar la media de las
puntuaciones originales (x = X - x; T = T-T ..) estas variables tienen media cero y
su desviacin tpica coincide con la de las puntuaciones originales. Es un cambio
de origen pero no de escala. Puntuaciones tpicas o estandarizadas, normalmente
representadas por la letra z con el subndice correspondiente a la variable ( z x , z
y ...). Se obtiene restando a los valores originales la media y dividiendo por la
desviacin tpica ( z x = ( X - x ) / s x. Las puntuaciones tpicas estn libres de
escala y siempre tiene media 0 y desviacin tpica 1.

La combinacin lineal de variables. La mayor parte de las tcnicas multivariables


combinan las variables de alguna forma "til". Normalmente esta combinacin es
una combinacin lineal, a veces llamada variante, aunque tambin hay
combinaciones no lineales, no las estudiaremos este curso. Una combinacin
lineal es una suma ponderada de las variables, para un conjunto p de variables
observadas tendremos V = w1 X1 + w2 X2 +... w p X k

V es la nueva variante o combinacin lineal, y X j y w j representan las variables


originales y sus pesos, respectivamente (j = 1,2, p). Esa misma ecuacin se puede
representar como el producto de dos vectores v = w' x. En cuanto al nmero de

22

variables que interesa incluir en un anlisis multivariante como regla general se


debe observar la parsimonia cientfica, es decir obtener la mejor solucin con el
menor nmero posible de variables.
2.7 REPRESENTACIN DE DATOS

En los anlisis estadsticos, es frecuente utilizar representaciones visuales


complementarias de las tablas que resumen los datos de estudio. Con estas
representaciones, adaptadas en cada caso a la finalidad informativa que se
persigue, se transmiten los resultados de los anlisis de forma rpida, directa y
comprensible para un conjunto amplio de personas. Las tablas estadsticas
representan toda la informacin de modo esquemtico y estn preparadas para
los clculos posteriores. Los grficos estadsticos nos transmiten esa informacin
de modo ms expresivo, nos van a permitir, con un slo golpe de vista, entender
de que se nos habla, observar sus caractersticas ms importantes, incluso sacar
alguna conclusin sobre el comportamiento de la muestra donde se est
realizando el estudio.

2.8 MTODOS DE REPRESENTACIN DE DATOS CUANTITATIVOS

Los grficos estadsticos son muy tiles para comparar distintas tablas de
frecuencia. Los grficos estadsticos ms usuales son:

2.8.1 Diagrama de barras: Se utiliza para la representacin de variables


cuantitativas discretas, cada valor de la variable se representa por un punto sobre
el eje OX y sobre l se dibuja una barra de longitud igual o proporcional a su
23

frecuencia absoluta. Si la frecuencia absoluta que se utiliza es la acumulativa, el


diagrama de barras que se obtiene es: diagrama de barras acumulativo.

2.8.2 Histograma: Se utiliza para la representacin de variables cuantitativas


continuas, cada intervalo se representa sobre el eje OX , este ser la base del
rectngulo que se dibuja sobre l con altura igual o proporcional a su frecuencia
absoluta. Como los intervalos son consecutivos, los rectngulos quedan
adosados. Si se utilizarn rectngulos de amplitud diferente, el rea del rectngulo
es la que tendra que ser proporcional a la frecuencia absoluta correspondiente a
ese intervalo. Histograma acumulativo, si se utiliza la frecuencia absoluta
acumulativa.

2.8.3 Polgono de frecuencias: Se utilizan para variables estadsticas


cuantitativas, discretas o continuas. Para una variable discreta, el polgono de
frecuencias se obtiene uniendo por una poligonal, los extremos superiores de las
barras. Para una variable continua, el polgono de frecuencias se obtiene uniendo
por una poligonal los puntos medios de la base superior de los polgonos del
histograma. Las escalas utilizadas para representar los polgonos de frecuencias
influyen mucho por el impacto visual de los mismos.

2.8.4 Diagrama de sectores: Se utiliza para todo tipo de variable estadstica,


cuantitativa o cualitativa. Consiste en dibujar sectores sobre un crculo, siendo la
amplitud de los sectores proporcional a su frecuencia absoluta, cada sector se
rellena con un color diferente. El clculo de la amplitud en grados sexagesimales
del sector correspondiente se realiza as: ngulo = frecuencia relativa*360

24

3. DISTRIBUCIN DE FRECUENCIAS

Una distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma


de tabla de los datos estadsticos, asignando a cada dato su frecuencia
correspondiente. Las distribuciones de frecuencias son tablas en que se dispone
las modalidades de la variable por filas. En las columnas se dispone el nmero de
ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en
frecuencias es facilitar la obtencin de la informacin que contienen los datos.

La inspeccin de los datos originales no permite responder fcilmente a


cuestiones como cul es la actitud mayoritaria del grupo, y resulta bastante ms
difcil determinar la magnitud de la diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la
variable acompaados del nmero de veces (la frecuencia) que aparece cada
valor.

X: Smbolo genrico de la variable.


f: Frecuencia (tambin se simboliza como ni).
La distribucin de frecuencias de los datos del ejemplo muestra que la actitud
mayoritaria de los individuos del grupo estudiado es indiferente. La interpretacin
de los datos ha sido facilitada porque se ha reducido el nmero de nmeros a
examinar (en vez de los 20 datos originales, la tabla contiene 5 valores de la
variable y 5 frecuencias).

25

Generalmente las tablas incluyen varas columnas con las frecuencias relativas
(son el nmero de ocurrencias dividido por el total de datos, y se simbolizan "fr" o
"pi"), frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias
de los valores iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No
obstante la frecuencia acumulada tambin es definida incluyendo al valor de
referencia), frecuencias acumuladas relativas (la frecuencia acumulada relativa es
el total de frecuencias relativas de los valores iguales o inferiores al de referencia,
y se simbolizan "fr" o "pa")

Ejemplo: Consideremos el siguiente grupo de datos:

La distribucin de frecuencias es:

26

Ilustracin 1: Distribucin de frecuencias.

La reduccin de datos mediante el agrupamiento en frecuencias no facilita su


interpretacin: La tabla es demasiado grande. Para reducir el tamao de la tabla
agrupamos los valores en intervalos, y las frecuencias son las de los conjuntos de
valores incluidos en los intervalos:

27

Ilustracin 2: Distribucin de frecuencias agrpales.

Ahora es ms sencillo interpretar los datos. Por ejemplo, podemos apreciar


inmediatamente que el intervalo con mayor nmero de datos es el 34-39, o que el
75% de los datos tiene valor inferior a 46.
Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".
Elementos bsicos de las tablas de intervalos:

Intervalo: cada uno de los grupos de valores de la variable que ocupan una fila
en una distribucin de frecuencias
Lmites aparentes: valores mayor y menor del intervalo que son observados en la
tabla. Dependen de la precisin del instrumento de medida. En el ejemplo, los
lmites aparentes del intervalo con mayor nmero de frecuencias son 34 y 39.

28

Lmites exactos: valores mximo y mnimo del intervalo que podran medirse si
se contara con un instrumento de precisin perfecta. En el intervalo 34-39, estos
lmites son 33.5 y 39.5
Punto medio del intervalo (mco marca de clase): suma de los lmites divididos por
dos. Mc del intervalo del ejemplo= 36.5
Amplitud del intervalo: diferencia entre el lmite exacto superior y el lmite exacto
inferior. En el ejemplo es igual a 6.

3.1 ORGANIZACIN DE DATOS AGRUPADOS

SU FIN ES EL RESUMIR LA INFORMACIN, GENERALMENTE LOS


ELEMENTOS SON DE MAYOR TAMAO POR LO CUAL REQUIEREN DE SER
AGRUPADOS, ESTO IMPLICA:

Ordenar, clasificar, y expresar en una tabla de frecuencias. Se agrupan los datos si


se cuenta con ms de 20 elementos, aunque se cuenta que ms de 20 elementos
debe de verificarse que los datos no sean significativos, esto es que la informacin
sea repetitiva tambin debemos de verificar que los datos puedan clasificarse y
que dicha clasificacin tiene que tener coherencia entre s.

La toma de datos es una de las partes de mayor importancia en el desarrollo de


una investigacin. As los datos obtenidos mediante un primer proceso reciben el
nombre de Datos sin tratar o en bruto. Los datos en bruto son largas listas de
nmeros que no son de gran utilidad y no brindan al investigador la informacin
29

que requiere si antes no se tratan. Los datos sin tratar se les debe sintetizar o
resumir de manera que sea posible interpretarlos, entenderlos y utilizarlos. La
manera de organizar los datos es mediante tablas de distribucin de frecuencias.

3.2 GRFICOS DE UNA DISTRIBUCIN DE FRECUENCIA

Histogramas
Polgonos de frecuencia
Ojivas
Grficas de pie
Diagramas de Pareto
Grficas de series
Scatter plot (diagrama de puntajes)
Diagramas de relaciones entre variables

30

4. HISTOGRAMA

En estadstica, un histograma es una representacin grfica de una variable en


forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados, ya sea en forma diferencial o acumulada. Sirven
para obtener una "primera vista" general, o panorama, de la distribucin de la
poblacin, o la muestra, respecto a una caracterstica, cuantitativa y continua.

Los datos de una variable numrica, resumidos en tablas, tienen una expresin
grfica que ayuda a su interpretacin visual. Esta representacin se denomina
histograma. Un histograma est formado por una sucesin de rectngulos
contiguos construidos sobre una recta. La base de cada rectngulo representa la
amplitud del intervalo y la altura est determinada por la frecuencia, de acuerdo a
la siguiente: Regla Bsica. Cada observacin representada en un histograma
ocupa un rectngulo de igual rea y de base dada por el ancho del intervalo
correspondiente. Para cada intervalo, el rectngulo que representa su frecuencia,
puede

imaginarse

formado

por

un

'apilamiento'

de

los

rectngulos

correspondientes a sus observaciones.

Al aplicar la regla bsica en este caso, manteniendo rectngulos de igual rea


para cada dato, resulta necesario determinar la altura del rectngulo asociado a un
intervalo de acuerdo al tamao de su base correspondiente.

A modo de ejemplo, si un intervalo tiene el doble ancho que otro, cada una de sus
observaciones estar representada por un 'rectangulito' de la mitad de la altura
que los datos del otro intervalo. Como consecuencia del distinto tamao de los
31

intervalos, a pesar de tener ambos la misma frecuencia, las alturas de los


rectngulos correspondientes son distintas. Sin embargo el rea graficada es la
misma para cada caso.

Ilustracin 3: histograma.

4.1 POLGONO DE FRECUENCIAS:

Los polgonos de frecuencias se realizan trazando los puntos que representan las
frecuencias y unindolos mediante segmentos. Tambin se puede realizar
trazando los puntos que representan las frecuencias y unindolos mediante
segmentos.

32

Ejemplo
Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes
variaciones:

Ilustracin 4:Poligono de frecuencia absoluta.

4.1.1 Polgonos de frecuencia para datos agrupados


Para construir el polgono de frecuencia se toma la marca de clase que coincide
con el punto medio de cada rectngulo de un histograma

33

Ejemplo
El peso de 65 personas adultas viene dado por la siguiente tabla:

ci

fi

Fi

[50, 60)

55

[60, 70)

65

10

18

[70, 80)

75

16

34

[80, 90)

85

14

48

[90, 100)

95

10

58

[100, 110)

110

63

[110, 120)

115

65

65

34

Ilustracin 5: Polgono de frecuencias agrupados

4.1.2 Polgono de frecuencias acumuladas

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se


obtiene el histograma de frecuencias acumuladas o su correspondiente polgono.

35

Ilustracin 6: Polgono de frecuencias acumuladas.

4.2 CURVAS DE FRECUENCIA

El conjunto de datos puede considerarse normalmente como perteneciente a una


muestra extrada de una poblacin grande. A causa de las muchas observaciones
que podemos realizar en la poblacin es posible tericamente (para datos
continuos) elegir los intervalos de clase muy pequeos y todava tener un nmero
adecuado de observaciones dentro de cada clase.
Las curvas de frecuencia acumuladas o acumuladas, con los histogramas, son los
mtodos ms prcticos, tiles e importantes de interpretaron de datos
geoqumicos. En este problema, se ir paso a paso para realizar la construccin
de una curva de frecuencia acumulada.

Aunque estas curvas puedan ser generadas fcilmente por ordenadores y algunas
calculadoras de escritorio, el conocimiento que est implicado en su construccin,

36

en realidad, es ventajoso, usando datos geoqumicos. En general, en nuestra


experiencia, hemos encontrado que muchos estudiantes nunca han construido
una de estas curvas. Este ejercicio usar los datos obtenidos durante un muestreo
de sedimento de corriente, de un estudio de reconocimiento, en el rea de la Hoja
del Mapa de Keiyasi, Fiji.

Son grficos representados por una sola lnea curva (el polgono de frecuencia
est conformado por varias lneas rectas consecutivas).

4.3 MEDIDAS DESCRIPTIVAS

El estudio de una variable estadstica comienza con la obtencin de datos, bien


sondeando la poblacin o tomando una muestra. El siguiente paso en el proceso
es la ordenacin de datos elaborando la tabla correspondiente. Trabajar con una
tabla es complejo y tedioso por lo que es ms conveniente la introduccin de
nuevos parmetros que nos permitan resumir la informacin que contienen esas
tablas.
El objetivo que se persigue es la sintetizacin de la informacin que nos aportan
los datos con la menor prdida posible. Vamos a agrupar los parmetros en tres
grupos dependiendo de su funcin.

Medidas de centralizacin. Con ellas pretendemos condensar los distintos


valores de la variable en uno slo que los resuma.

Medidas de posicin. Una vez ordenados los datos de menor a mayor ser
necesario identificar la posicin de los valores.

37

Medidas de dispersin. Las medidas de centralizacin nos condensan los


datos en uno slo pero no nos aportan informacin ninguna sobre la
concentracin o dispersin de los datos, habr pues que introducir medidas
que palien esta carencia.

Los fenmenos que se observan sometidos al azar no suelen ser constantes, por
lo que ser necesario que junto a una medida que indique el valor alrededor del
cual se agrupan los datos, se disponga de una medida que haga referencia a la
variabilidad que refleje dicha fluctuacin. En este sentido pueden examinarse
varias caractersticas, siendo las ms comunes: la tendencia central de los datos,
la dispersin o variacin con respecto a este centro, los datos que ocupan ciertas
posiciones, la simetra de los datos y la forma en la que los datos se agrupan.

4.4.

MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia es conveniente resumir la


informacin con un solo nmero. Este nmero que, para tal fin, suele situarse
hacia el centro de la distribucin de datos se denomina medida o parmetro de
tendencia central o de centralizacin. Cuando se hace referencia nicamente a la
posicin de estos parmetros dentro de la distribucin, independientemente de
que sta est ms o menos centrada, se habla de estas medidas como medidas
de posicin.
Supngase que un determinado alumno obtiene 35 puntos en una prueba de
matemtica. Este puntaje, por s mismo tiene muy poco significado a menos que
podamos conocer el total de puntos que obtiene una persona promedio al

38

participar en esa prueba, saber cul es la calificacin menor y mayor que se


obtiene, y cun variadas son esas calificaciones.

En otras palabras, para que una calificacin tenga significado hay que contar con
elementos de referencia generalmente relacionados con ciertos criterios
estadsticos. Las medidas de tendencia central (media, mediana y moda) sirven
como puntos de referencia para interpretar las calificaciones que se obtienen en
una prueba. Volviendo a nuestro ejemplo, digamos que la calificacin promedio en
la prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que
la calificacin del alumno se ubica notablemente sobre el promedio. Pero si la
calificacin promedio fue de 65 puntos, entonces la conclusin sera muy
diferente, debido a que se ubicara muy por debajo del promedio de la clase.

En resumen, el propsito de las medidas de tendencia central es:


Mostrar en qu lugar se ubica la persona promedio o tpica del grupo. Sirve como
un mtodo para comparar o interpretar cualquier puntaje en relacin con el puntaje
central o tpico. Sirve como un mtodo para comparar el puntaje obtenido por una
misma persona en dos diferentes ocasiones. Sirve como un mtodo para
comparar los resultados medios obtenidos por dos o ms grupos. Las medidas de
tendencia central ms comunes son:

La media aritmtica: comnmente conocida como media o promedio. Se


representa por medio de una letra M o por una X con una lnea en la parte

superior.
La mediana: la cual es el puntaje que se ubica en el centro de una distribucin.
Se representa como Md.

39

La moda: que es el puntaje que se presenta con mayor frecuencia en una


distribucin. Se representa Mo.

40

5. MEDIA ARITMTICA

Es la principal medida de tendencia central. La media se calcula sumando todos


los datos y luego dividiendo este resultado por el nmero total de datos que tiene
la muestra.

Para reconocer la mediana, es necesario tener ordenados los valores sea de


mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el
valor resultante corresponde al nmero del caso que representa la mediana de la
distribucin. Es el valor central de un conjunto de valores ordenados en forma
creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor
que deja igual nmero de valores antes y despus de l en un conjunto de datos
agrupados. Segn el nmero de valores que se tengan se pueden presentar dos
casos: Si el nmero de valores es impar, la Mediana corresponder al valor central
de dicho conjunto de datos. Si el nmero de valores es par, la Mediana
corresponder al promedio de los dos valores centrales (los valores centrales se
suman y se dividen por 2).

media aritmtica (tambin llamada promedio o simplemente media) de un conjunto


finito de nmeros es el valor caracterstico de una serie de datos cuantitativos
objeto de estudio que parte del principio de la esperanza matemtica o valor
esperado, se obtiene a partir de la suma de todos sus valores dividida entre el
nmero de sumandos. Cuando el conjunto es una muestra aleatoria recibe el
nombre de media muestra{ siendo uno de los principales estadsticos muestrales.

41

Expresada de forma ms intuitiva, podemos decir que la media (aritmtica) es la


cantidad total de la variable distribuida a partes iguales entre cada observacin.
Por ejemplo, si en una habitacin hay tres personas, la media de dinero que tienen
en sus bolsillos sera el resultado de tomar todo el dinero de los tres y dividirlo a
partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir
la informacin de una distribucin (dinero en el bolsillo) suponiendo que cada
observacin (persona) tuviera la misma cantidad de la variable.

Tambin la media aritmtica puede ser denominada como centro de gravedad[cita


requerida] de una distribucin, el cual no est necesariamente en la mitad.

Una de las limitaciones de la media aritmtica es que se trata de una medida muy
sensible a los valores extremos; valores muy grandes tienden a aumentarla
mientras que valores muy pequeos tienden a reducirla, lo que implica que puede
dejar de ser representativa de la poblacin.

La media aritmtica se calcula sumando todos los componentes y dividiendo el


resultado entre el nmero de componentes. El resultado entero o decimal es la
media aritmtica.

42

6. MEDIANA

Es el valor central de una serie de datos, para poder encontrar la mediana es


indispensable que los datos estn ordenados. Existen dos mtodos para el clculo
de la mediana:

Considerando los datos en forma individual, sin agruparlos.


Utilizando los datos agrupados en intervalos de clase. A continuacin veamos
cada una de ellas.

6.1 DATOS SIN AGRUPAR

Sean x_1,x_2,x_3. . . . x n los datos de una muestra ordenada en orden creciente


y designando la mediana como

distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posicin (n+1)/2 una vez que
los datos han sido ordenados (en orden creciente o decreciente), porque ste es el
valor central. Es decir: M_e=x_{(n+1)/2}.

Por ejemplo, si tenemos 5 datos, que ordenados son: x_1 = 3, x_2 = 6, x_3 = 7,
x_4 = 8, x_5 = 9 => El valor central es el tercero: x_{(5+1)/2} = x_3 = 7. Este valor,

43

que es la mediana de ese conjunto de datos, deja dos datos por debajo (x_1, x_2)
y otros dos por encima de l (x_4, x_5)
b) Si n es par, la mediana es la media aritmtica de los dos valores centrales.
Cuando n es par, los dos datos que estn en el centro de la muestra ocupan las
posiciones n/2 y n/2+1. Es decir: M_e = (x_{\frac{n}{2}} + x_{{\frac{n}{2}}+1})/2.

Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 =


8, x5 = 9, x6 = 10 => Hay dos valores que estn por debajo del
otros dos que quedan por encima del siguiente dato

y
1} = x_4 = 8.

Por tanto, la mediana de este grupo de datos es la media aritmtica de estos dos

datos:

6.2 DATOS AGRUPADOS

Al tratar con datos agrupados, si {{\frac {n} {2}}} coincide con el valor de una
frecuencia acumulada, el valor de la mediana coincidir con la abscisa
correspondiente. Si no coincide con el valor de ninguna abscisa, se calcula a
travs de semejanza de tringulos en el histograma o polgono de frecuencias
acumuladas, utilizando la siguiente equivalencia:

44

7. MODA

La moda es el valor que aparece con mayor frecuencia dentro de una muestra.

En estadstica, la moda es el valor con una mayor frecuencia en una distribucin


de datos. Se habla de una distribucin bimodal de los datos adquiridos en una
columna cuando encontremos dos modas, es decir, dos datos que tengan la
misma frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la
que encontramos tres modas. Si todas las variables tienen la misma frecuencia
diremos que no hay moda.

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos


agrupados antes de definir la moda, se ha de definir el intervalo modal. La moda,
cuando los datos estn agrupados, es un punto que divide al intervalo modal en
dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen
que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.

45

46

7.1 MODA DE DATOS AGRUPADOS

Para obtener la moda en datos agrupados se usa la siguiente frmula:

Dnde:
=

inferior de la clase modal.

= es el delta de frecuencia absoluta modal y la frecuencia absoluta


premodal.
= es el delta de frecuencia absoluta modal y la frecuencia absoluta
postmodal.
= Amplitud del intervalo modal

7.1.1 Propiedades

Sus principales propiedades son:

Clculo sencillo.
Interpretacin muy clara.
Al depender slo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una
poblacin no es posible realizar otros clculos, por ejemplo, cuando se
enumeran en medios periodsticos las caractersticas ms frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato robot".

47

7.1.2 Inconvenientes

Su valor es independiente de la mayor parte de los datos, lo que la hace muy


sensible a variaciones muestrales. Por otra parte, en variables agrupadas en
intervalos, su valor depende excesivamente del nmero de intervalos y de su

amplitud.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los

datos fuera de la moda, no afectan en modo alguno a su valor.


No siempre se sita hacia el centro de la distribucin.
Puede haber ms de una moda en el caso en que dos o ms valores de la
variable

presenten

la

misma

frecuencia

multimodales).

7.2 EJEMPLO

Ilustracin 7: Moda de datos agrupados.

48

(distribuciones

bimodales

8. CUARTILES, DECIL Y PERCENTIL

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos

Decil se refiere a cada uno de los 9 valores que dividen un grupo de datos
(clasificados con una relacin de orden) en diez partes iguales, y de manera que
cada parte representa un dcimo de la poblacin.

El percentil es una medida no central usada en estadstica que indica, una vez
ordenados los datos de menor a mayor, el valor de la variable por debajo del cual
se encuentra un porcentaje dado de observaciones en un grupo de observaciones.
Por ejemplo, el percentil 20 es el valor debajo del cual se encuentran el 20 por
ciento de las observaciones

49

9. CALCULO DE CUARTILES DE DATOS AGRUPADOS EN INTERVALOS

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.

Calcula Q1, Q2
275,
180,
325,
260, 290, 370.

y Q3 de
200,
250,

los salarios
350,
260,

de 15 personas:
280,
310,
400,

300,
380,

Cuartiles para datos agrupados en intervalos de clase Como son medidas de


posicin similares a la mediana, entonces para su clculo en una distribucin en
intervalos de clase se utiliza una frmula similar, slo que el total de datos en lugar
de dividirlo entre dos Para encontrar la clase que contiene al cuartil se busca la
primera clase cuya frecuencia acumulada es mayor o igual que esa posicin. En el
caso del ejemplo actual como la posicin es 15 utilizas 16 que corresponde a la
segunda clase.

9.1 DATOS AGRUPADOS

Como los cuartiles adquieren su mayor importancia cuando contamos un nmero


grande de datos y tenemos en cuenta que en estos casos generalmente los datos

50

son resumidos en una tabla de frecuencia. La frmula para el clculo de los


cuartiles cuando se trata de datos agrupados es la siguiente:
k= 1,2,3

Dnde:
Lk = Lmite real inferior de la clase del cuartil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente, mediante otra frmula se tiene lo
siguiente:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los
datos; es decir, aquel valor de la variable que supera 25% de las observaciones y
es superado por el 75% de las observaciones.
Frmula de Q1, para series de Datos agrupados:

Dnde:
L1 = lmite inferior de la clase que lo contiene
P = valor que representa la posicin de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase

51

El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los
datos, es decir aquel valor de la variable que supera al 75% y es superado por el
25% de las observaciones.
Frmula de Q3, para series de Datos agrupados:

Dnde:
L1 = lmite inferior de la clase que lo contiene
P = valor que representa la posicin de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.

9.1.1 Para datos no agrupados

Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las
siguientes frmulas:
- El primer cuartil:
Cuando n es par:

52

Cuando n es impar:

Para el tercer cuartil


Cuando n es par:

Cuando n es impar:

9.2 CUARTILES

Cuando la distribucin de datos contiene un nmero determinado de datos y se


requiere obtener un porcentaje o una parte de la distribucin de datos, se puede
dividir la distribucin en cuatro partes iguales, cada parte tiene la misma cantidad
de datos y cada una de las partes representa un 25% de la totalidad de datos.

9.3 PERCENTILES

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99%
de los datos.

53

Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de
ubicacin o clasificacin de las personas cuando atienden caractersticas tales
como peso, estatura, etc. Los percentiles son ciertos nmeros que dividen la
sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son
los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.
Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99. Datos
Agrupados Cuando los datos estn agrupados en una tabla de frecuencias, se
calculan mediante la frmula:

= 1, 2,3,... 99
Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k

Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.

10. MEDIDAS DE DISPERSIN

54

Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran


la variabilidad de una distribucin, indicando por medio de un nmero, si las
diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto
mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms
homognea ser a la media. As se sabe si todos los casos son parecidos o varan
mucho entre ellos.

Para calcular la variabilidad que una distribucin tiene respecto de su media, se


calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan
dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (desviacin media) y otra es tomando las
desviaciones al cuadrado (varianza).

Las medias de tendencia central o posicin nos indican donde se sita un dato
dentro de una distribucin de datos. Las medidas de dispersin, variabilidad o
variacin nos indican si esos datos estn prximos entre s o s estn dispersos,
es decir, nos indican cun esparcidos se encuentran los datos. Estas medidas de
dispersin nos permiten apreciar la distancia que existe entre los datos a un cierto
valor central e identificar la concentracin de los mismos en un cierto sector de la
distribucin, es decir, permiten estimar cun dispersas estn dos o ms
distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un
conjunto de datos, siendo la media aritmtica el dato central ms utilizado. Cuando
existe una dispersin pequea se dice que los datos estn dispersos o
acumulados cercanamente respecto a un valor central, en este caso el dato
central es un valor muy representativo. En el caso que la dispersin sea grande el

55

valor central no es muy confiable. Cuando una distribucin de datos tiene poca
dispersin toma el nombre de distribucin homognea y si su dispersin es alta se
llama heterognea.

10.1 RANGO

El rango o recorrido interarticular es la diferencia entre el valor mximo y el valor


mnimo en un grupo de nmeros aleatorios. Se le suele simbolizar con R'.
En estadstica descriptiva se denomina rango estadstico (R) o recorrido
estadstico al intervalo entre el valor mximo y el valor mnimo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersin de los datos,
cuanto mayor es el rango, ms dispersos estn los datos de un conjunto.

10.2 OBTENCIN DEL RANGO

Ordenamos los nmeros segn su tamao.

Restamos el valor mnimo del valor mximo

Ejemplo
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus
valores se encuentran en un rango de:

Rango = (9-4) = 5
Medio rango o Rango medio

56

El medio rango o rango medio de un conjunto de valores numricos es la media


del mayor y menor valor, o la tercera parte del camino entre el dato de menor valor
y el dato de mayor valor. En consecuencia, el medio rango es:

Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato
de mayor valor Max= 8. El medio rango resolvindolo mediante la correspondiente
frmula sera:

Representacin del medio rango: Medio rango.jpg

10.2.1 requisitos del rango


* Ordenamos los nmeros segn su tamao.

* Restamos el valor mnimo del valor mximo.


* Es calculable mediante la resta del valor mnimo al valor mximo.

57

* Comparte unidades con los datos.


* Permite obtener una idea de la dispersin de los datos.

10.2.2 ejemplos

Para una serie de datos de carcter cuantitativo como es la estatura tal y como:
x1 = 185,x2 = 165,x3 = 170,x4 = 182,x5 = 155
Es posible ordenar los datos como sigue:
x(1) =155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185
Donde la notacin x(i) indica que se trata del elemento i-simo de la serie de
datos. De este modo, el rango sera la diferencia entre el valor mximo (k) y el
mnimo; o, lo que es lo mismo:
R = x(k) x(1)

Con cinco valores, nos da que R = 185-155 = 30 .

10.3 VARIANZA

En teora de probabilidad, la varianza (que suele representarse como \sigma^2) de


una variable aleatoria es una medida de dispersin definida como la esperanza del
cuadrado de la desviacin de dicha variable respecto a su media.
Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable
mide una distancia en metros, la varianza se expresa en metros al cuadrado. La
desviacin estndar es la raz cuadrada de la varianza, es una medida de
58

dispersin alternativa expresada en las mismas unidades de los datos de la


variable objeto de estudio. La varianza tiene como valor mnimo 0.

10.3.1 Propiedades
Debido a que la variancia se define en trminos del valor esperado, tambin ella
posee propiedades, algunas de las cuales se presentan a continuacin.
Sean a y b dos constantes cualesquiera y sea X una variable aleatoria.
Entonces:

1.

Var (X) no puede ser negativa

2.

Var (a) = 0

3.

Var (X + a) = Var (X) + Var(a) = Var(X)

4.

Var (bX) = b2 Var (X)

5.

Var (a + bX) = b2 Var (X)

Las propiedades de la desviacin estndar son las mismas que las de la variancia
y lo nico que se debe hacer es tomar la raz cuadrada de los valores de la
variancia.

59

10.4 DESVIACIN TPICA

La desviacin tpica o desviacin estndar es una medida de dispersin para


variables de razn (variables cuantitativas o cantidades racionales) y de intervalo.
Se define como la raz cuadrada de la varianza de la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer tambin la desviacin que
presentan los datos en su distribucin respecto de la media aritmtica de dicha
distribucin, con objeto de tener una visin de los mismos ms acorde con la
realidad al momento de describirlos e interpretarlos para la toma de decisiones.
La desviacin tpica es una medida del grado de dispersin de los datos con
respecto al valor promedio. Dicho de otra manera, la desviacin estndar es
simplemente el "promedio" o variacin esperada con respecto a la media
aritmtica.

Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una
tiene una media de 7. Sus desviaciones estndar muestrales son 7, 5 y 1
respectivamente. La tercera muestra tiene una desviacin mucho menor que las
otras dos porque sus valores estn ms cerca de 7.

La

desviacin

estndar puede

ser

interpretada

como

una

medida

de

incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da la


precisin de stas. Cuando se va a determinar si un grupo de medidas est de
acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital
importancia: si la media de las medidas est demasiado alejada de la prediccin
(con la distancia medida en desviaciones estndar), entonces consideramos que
60

las medidas contradicen la teora. Esto es coherente, ya que las mediciones caen
fuera del rango de valores en el cual sera razonable esperar que ocurrieran si el
modelo terico fuera correcto. La desviacin estndar es uno de tres parmetros
de ubicacin central; muestra la agrupacin de los datos alrededor de un valor
central (la media o promedio).

10.4.1 Desviacin Tpica maestral

Es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con


el objetivo de estimar o inferir caractersticas de una poblacin o modelo
estadstico.

La desviacin tpica o desviacin estndar (denotada con el smbolo o s,


dependiendo de la procedencia del conjunto de datos) es una medida de
dispersin para variables de razn (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raz cuadrada de la varianza de la
variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer tambin la desviacin que
presentan los datos en su distribucin respecto de la media aritmtica de dicha
distribucin, con objeto de tener una visin de los mismos ms acorde con la
realidad al momento de describirlos e interpretarlos para la toma de decisiones.

61

10.4.2 Desviacin tpica poblacional

La Desviacin Estndar es la raz cuadrada de la varianza de la distribucin de


probabilidad discreta:

Cuando los casos tomados son iguales al total de la poblacin se aplica la frmula
de desviacin estndar poblacional. As la varianza es la media de los cuadrados
de las diferencias entre cada valor de la variable y la media aritmtica de la
distribucin.

10.4.3 Ejemplo
El gerente de una empresa de alimentos desea saber que tanto varan los pesos
de los empaques (en gramos), de uno de sus productos; por lo que opta por
seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los
siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:

62

10.4.4 Covarianza

Una medida del grado en que dos variables aleatorias se mueven en la misma
direccin o en direcciones opuestas la una respecto a la otra. En otras palabras, si
dos variables aleatorias generalmente se mueven en la misma direccin se dir
que tienen una covarianza positiva. Si tienden a moverse en direcciones opuestas,
se dir que tienen una covarianza negativa. La covarianza se mide como el valor
que se espera de los productos de las desviaciones de dos variables aleatorias
respecto a sus correspondientes medias. Una varianza es un caso especial de
covarianza. En probabilidad y estadstica,
La covarianza es un valor que indica el grado de variacin conjunta de dos
variables aleatorias. Es el dato bsico para determinar si existe una dependencia
entre ambas variables y adems es el dato necesario para estimar otros

63

parmetros bsicos, como el coeficiente de correlacin lineal o la recta de


regresin.
Cuando a grandes valores de una de las variables suelen mayoritariamente
corresponderles los grandes de la otra y lo mismo se verifica para los pequeos
valores de una y la otra, se corrobora que tienden a mostrar similar
comportamiento lo que se refleja en un valor positivo de la covarianza1
Por el contrario, cuando a los mayores valores de una variable suelen
corresponder en general los menores de la otra, expresando un opuesto
comportamiento, la covarianza es negativa. El signo de la covarianza, por lo tanto,
expresa la tendencia en la relacin lineal entre las variables. La magnitud requiere
un esfuerzo adicional de interpretacin:

La versin normalizada de la covarianza, el coeficiente de correlacin indica la


magnitud de la especificidad de la relacin lineal.

Se debe distinguir entre:


(1) la covarianza de dos variables aleatorias, parmetro estadstico de una
poblacin considerado una propiedad de la distribucin conjunta y
(2) la covarianza maestral que se emplea como un valor estadsticamente
estimado del parmetro.

64

Ilustracin 8: Cuadro de covarianza

En este sentido el indicador bivariante ms importante es la covarianza:


Dadas dos variables estadsticas x e y definiremos la covarianza Sxy como:

En el caso de disponer de la distribucin agregada por frecuencias en una tabla de


correlacin.

65

En el caso de disponer de la distribucin sin agregar por frecuencias (en un listado


matricial de datos donde cada registro es una observacin y n de registros= N)

10.4.5 Propiedades

1. La covarianza es el momento central de orden 1,1 de la distribucin


bidimensional.
2. Es invariante ante los cambios de origen en cualquiera de las dos variables.
3. Sin embargo depende de los cambios de unidad .Si se cambia de unidad de
medida en ambas variables la covarianza se modifica proporcionalmente a ambos
cambios:

u= a+bx

v = c + dy

Suv = b.d.Sxy

4. La expresin de clculo de la covarianza es


Donde a11 es el llamado momento (ordinario) mixto y su expresin es:

Si las observaciones estn agregadas por frecuencias , o bien:

66

Si las observaciones no estn agregadas por frecuencias


5. Si dos variables son independientes su covarianza es cero (el resultado
recproco no es necesariamente cierto).
6. La covarianza nos mide la covariacin conjunta de dos variables: Si es
positiva nos dar la informacin de que a valores altos de una de la variable hay
una mayor tendencia a encontrar valores altos de la otra variable y a valores
bajos de una de las variables, correspondientemente valores bajos. En cambio si
la covarianza es negativa, la covariacin de ambas variables ser en sentido
inverso: a valores altos le correspondern bajos, y a valores bajos, altos. Si la
covarianza es cero no hay una covariacin clara en ninguno de los dos sentidos.
Sin embargo el hecho de que la covarianza dependa de las medidas de las
variables no permite establecer comparaciones entre unos casos y otros.

67

11. CONCEPTOS GENERALES DE PROBABILIDAD

Probabilidad de un suceso es el nmero al que tiende la frecuencia relativa


asociada al suceso a medida que el nmero de veces que se realiza el
experimento crece.
La probabilidad es un mtodo por el cual se obtiene la frecuencia de un
acontecimiento determinado mediante la realizacin de un experimento aleatorio,
del

que

se

conocen

todos

los

resultados

posibles,

bajo

condiciones

suficientemente estables. La teora de la probabilidad se usa extensamente en


reas como la estadstica, la fsica, la matemtica, las ciencias y la filosofa para
sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la
mecnica subyacente discreta de sistemas complejos, por lo tanto es la rama de
las matemticas que estudia, mide o determina a los experimentos o fenmenos
aleatorios.

Un experimento aleatorio se caracteriza porque repetido muchas veces y en


idnticas condiciones el cociente entre el nmero de veces que aparece un
resultado (suceso) y el nmero total de veces que se realiza el experimento tiende
a un nmero fijo. Esta propiedad es conocida como ley de los grandes nmeros,
establecida por Jakob Bernouilli. Tiene el inconveniente de variar la sucesin de
las frecuencias relativas de unas series de realizaciones a otras, si bien el valor al
que se aproximan a medida que el nmero de realizaciones aumenta se mantiene
estable.
La frecuencia relativa del suceso A:
Propiedades de la frecuencia relativa:

68

0 fr (A) 1 cualquiera que sea el suceso A.


fr( ) = fr(A) + fr(B) si = .
fr(E) = 1 fr() = 0.

Esta definicin presenta el inconveniente de tener que realizar el experimento un


gran nmero de veces y adems siempre obtendremos un valor aproximado de la
probabilidad.

rbol de probabilidades: representacin grfica que muestra los resultados


posibles de una serie de experimentos y sus respectivas probabilidades.
Complemento de un evento: elementos del espacio muestral no incluidos en el
evento considerado.
Dependencia estadstica: condicin en la que la probabilidad de presentacin de
un evento depende de la presentacin de algn otro evento, o se ve afectada por
sta.
Diagrama de Venn: representacin grfica de los conceptos de probabilidad en la
que el espacio muestral est representado por un rectngulo y los eventos que
suceden en el espacio muestral se representan como partes de dicho rectngulo.
Espacio muestral: conjunto de todos los resultados posibles de un experimento
aleatorio.
Evento: uno o ms de los resultados posibles de hacer algo, o uno de los
resultados posibles de realizar un experimento.
Eventos exhaustivamente colectivos: lista de eventos que representa todos los
resultados posibles de un experimento.

69

Eventos mutuamente excluyentes: eventos que no se pueden presentar juntos.


Experimento aleatorio: actividad que tiene como resultado o que produce un
evento. Prueba donde existen dos o ms resultados posibles, y no se pude
anticipar cul de ellos va a ocurrir.
Frecuencia relativa de presentacin: fraccin de veces que a la larga se
presenta un evento cuando las condiciones son estables, o frecuencia relativa
observada de un evento en un nmero muy grande de intentos o experimentos.
Independencia estadstica: condicin en la que la presentacin de algn evento
no tiene efecto sobre la probabilidad de presentacin de otro evento.
Probabilidad: la posibilidad de que algo suceda.
Probabilidad clsica: nmero de resultados favorables a la presentacin de un
evento dividido entre el nmero total de resultados posibles. Asignacin de
probabilidad "a priori", si necesidad de realizar el experimento.
Probabilidad condicional: probabilidad de que se presente un evento, dado que
otro evento ya se ha presentado.
Probabilidad conjunta: probabilidad de que se presenten dos o ms eventos
simultneamente o en sucesin.
Probabilidad marginal: probabilidad incondicional de que se presente un evento;
probabilidad de que se presente un solo evento. Probabilidad simple, o
probabilidad de un evento cualquiera.
Probabilidad subjetiva: probabilidad basada en las creencias personales de
quien hace la estimacin de probabilidad. Asignacin de probabilidad en forma
intuitiva, en base a la experiencia o el conocimiento.
Producto de probabilidades: probabilidad de la interseccin de dos o ms
eventos.

70

Suma de probabilidades: probabilidad de la unin de dos o ms eventos.


11.1

POBLACIN (N)

Conjunto finito o infinito de elementos, sobre los que vamos a realizar


observaciones. Por ejemplo: los habitantes de un lugar, las piezas obtenidas de
una mquina en un determinado tiempo, etc. El concepto de poblacin en
estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin
se precisa como un conjunto finito o infinito de personas u objetos que presentan
caractersticas comunes.

Destacamos algunas definiciones:


"Una poblacin es un conjunto de todos los elementos que estamos estudiando,
acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).
"Una poblacin es un conjunto de elementos que presentan una caracterstica
comn". Cadenas (1974).

El tamao que tiene una poblacin es un factor de suma importancia en el proceso


de investigacin estadstica y en nuestro caso social, y este tamao vienen dado
por el nmero de elementos que constituyen la poblacin, segn el nmero de
elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos
que integra la poblacin es muy grande, se puede considerar a esta como una
poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos.
Una poblacin finita es aquella que est formada por un limitado nmero de
elementos, por ejemplo; el nmero de habitantes de una comarca. Cuando la
poblacin es muy grande, es obvio que la observacin y/o medicin de todos los
elementos se multiplica la complejidad, en cuanto al trabajo, tiempo y costos
71

necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra
estadstica.

Evolucion de la poblacion espaola

Ilustracin 9: grafic de poblacin.

Es a menudo imposible o poco prctico observar la totalidad de los individuos,


sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado
poblacin o universo, se examina una pequea parte del grupo denominada
muestra.

11.2. MUESTRA (N)

En estadstica, una muestra es un subconjunto de casos o individuos de una


poblacin estadstica.

72

Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de


la poblacin, para lo cual deben ser representativas de la misma. Para cumplir
esta caracterstica la inclusin de sujetos en la muestra debe seguir una tcnica de
muestreo. En tales casos, puede obtenerse una informacin similar a la de un
estudio exhaustivo con mayor rapidez y menor coste . La muestra es una
representacin significativa de las caractersticas de una poblacin, que bajo, la
asuncin de un error (generalmente no superior al 5%) estudiamos las
caractersticas de un conjunto poblacional mucho menor que la poblacin global.

"Se llama muestra a una parte de la poblacin a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
"Una muestra es una coleccin de algunos elementos de la poblacin, pero no de
todos". Levin & Rubin (1996).

"Una muestra debe ser definida en base de la poblacin determinada, y las


conclusiones que se obtengan de dicha muestra solo podrn referirse a la
poblacin en referencia", Cadenas (1974). Por ejemplo estudiamos los valores
sociales de una poblacin de 5000 habitantes aprox., entendemos que sera de
gran dificultad poder analizar los valores sociales de todos ellos, por ello, la
estadstica nos dota de una herramienta que es la muestra para extraer un
conjunto de poblacin que represente a la globalidad y sobre la muestra realizar el
estudio. Una muestra representativa contiene las caractersticas relevantes de la
poblacin en las mismas proporciones que estn incluidas en tal poblacin.

Los expertos en estadstica recogen datos de una muestra. Utilizan esta


informacin para hacer referencias sobre la poblacin que est representada por

73

la muestra. En consecuencia muestra y poblacin son conceptos relativos. Una


poblacin es un todo y una muestra es una fraccin o segmento de ese todo.

11.3. MUESTREO

A la tcnica para la seleccin de una muestra a partir de una poblacin.

Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean
extrapolables a la poblacin. Este proceso permite ahorrar recursos, y a la vez
obtener resultados parecidos a los que se alcanzaran si se realizase un estudio
de toda la poblacin.

Esto no es ms que el procedimiento empleado para obtener una o ms muestras


de una poblacin; el muestreo es una tcnica que sirve para obtener una o ms
muestras de poblacin. Este se realiza una vez que se ha establecido un marco
muestral representativo de la poblacin, se procede a la seleccin de los
elementos de la muestra aunque hay muchos diseos de la muestra.

Al tomar varias muestras de una poblacin, las estadsticas que calculamos para
cada muestra no necesariamente seran iguales, y lo ms probable es que
variaran de una muestra a otra.

11.3.1. Tipos de Muestreo

74

Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no


aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos
los elementos de la poblacin tienen la oportunidad de ser escogidos en la
muestra. Una muestra seleccionada por muestreo de juicio se basa en la
experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se
usa como gua o muestra tentativa para decidir como tomar una muestra aleatoria
ms adelante. Las muestras de juicio evitan el anlisis estadstico necesario para
hacer muestras de probabilidad.

No aleatorios: Se eligen los elementos, en funcin de que sean


representativos, segn la opinin del investigador.

Aleatorios: Todos los miembros de la muestra han sido elegidos al azar, de


forma que cada miembro de la poblacin tuvo igual oportunidad de salir en
la muestra.

Simple: Elegido el tamao de la muestra, los elementos que la compongan


se han de elegir aleatoriamente entre los N de la poblacin.

Sistemtico: Se ordenan previamente los individuos de la poblacin;


despus se elige uno de ellos al azar, a continuacin, a intervalos
constantes, se eligen todos los dems hasta completar la muestra.

Estratificado: Se divide la poblacin total en clases homogneas, llamadas


estratos; por ejemplo, por grupos de edades, por sexo. Hecho esto la
muestra se escoge aleatoriamente en nmero proporcional al de
componentes de cada clase o estrato.

75

los

11.4. ESPACIO MUESTRAL

La Estadstica, y por tanto el Clculo de Probabilidades, se ocupan de los


denominados fenmenos o experimentos aleatorios. El conjunto de todos los
resultados posibles diferentes de un determinado experimento aleatorio se
denomina Espacio Muestral asociado a dicho experimento y se suele representar
por . A los elementos de se les denomina sucesos elementales.

As por ejemplo, el espacio muestral asociado al experimento aleatorio consistente


en el lanzamiento de una moneda es = {Cara, Cruz}; el espacio muestral
asociado al lanzamiento de un dado es ={1, 2, 3, 4, 5, 6}, siendo Cara y Cruz los
sucesos elementales asociados al primer experimento aleatorio y 1, 2, 3, 4, 5 y 6
los seis sucesos elementales del segundo experimento aleatorio. A pesar de la
interpretacin que tiene el espacio muestral, no es ms que un conjunto abstracto
de puntos (los sucesos elementales), por lo que el lenguaje, los conceptos y
propiedades de la teora de conjuntos constituyen un contexto natural en el que
desarrollar el Clculo de Probabilidades.

Sea A. el conjunto de las partes de, es decir, el conjunto de todos los subconjuntos
de . En principio, cualquier elemento de A, es decir, cualquier subconjunto del
espacio muestral contendr una cierta incertidumbre, por lo que trataremos de
asignarle un nmero entre 0 y 1 como medida de su incertidumbre. En Clculo de
Probabilidades dichos subconjuntos reciben en el nombre de sucesos, siendo la
medida de la incertidumbre su probabilidad. La tripleta (,A,P) recibe el nombre de
espacio probabilstico. Por tanto, asociado a todo experimento aleatorio existen
tres conjuntos: El espacio muestral, la clase de los sucesos, es decir, el conjunto
de elementos con incertidumbre asociados al experimento aleatorio A, y una

76

funcin real, P:A [0, l], la cual asignar a cada suceso (elemento de A) un nmero
entre cero y uno como medida de su incertidumbre.
Se advierte no obstante, que la eleccin del espacio muestral asociado a un
experimento aleatorio no tiene por qu ser nica, sino que depender de que
sucesos elementales que se quieran considerar como distintos y del problema de
la asignacin de la probabilidad sobre esos sucesos elementales. Respecto a la
clase de los sucesos A, es natural que sta tenga una estructura tal que permita
hablar no solo de sucesos sino tambin de su unin, interseccin, diferencia,
complementario, etc., debiendo ser la clase A, en consecuencia, cerrada a dichas
operaciones entre "conjuntos" (entre sucesos). Esta es la situacin del conjunto de
las partes cuando es finito o inclusive numerable (caso, por ejemplo, del espacio
muestral asociado al experimento aleatorio consistente en lanzar una moneda
hasta que salga cara por primera vez). En otras ocasiones en las que sea un
conjunto continuo (por ejemplo, cuando estudiamos el tiempo que tarda un istopo
radioactiva en volverse inestable), deber ser A un conjunto estrictamente ms
pequeo que el conjunto de las partes de . En todo caso se puede pensar en A
como en el conjunto que contiene todos los elementos de inters, es decir, todos
los sucesos a los que les corresponde una probabilidad.

Algunas peculiaridades del Clculo de Probabilidades respecto a la teora de


conjuntos. Aqu, el conjunto vaco 0 recibe el nombre de suceso imposible,
definido como aquel subconjunto de que no contiene ningn suceso elemental y
que corresponde a la idea de aquel suceso que no puede ocurrir. De forma
anloga, el espacio total recibe el nombre de suceso seguro al recoger dicha
denominacin la idea que representa. Se Llamar sucesos incompatibles a
aquellos cuya interseccin sea el suceso imposible.

77

Por ltimo, puede decirse que la inclusin de sucesos, A B, se interpreta aqu


como que siempre que se cumpla el suceso A se cumple el B; por ejemplo,
siempre que salga el 2 (suceso A) sale par (suceso B).

Ejemplo: "Lanzamiento de un dado"


El espacio probabilstico asociado al experimento aleatorio consistente en el
lanzamiento de un dado, tendr como espacio muestras ={1,2,3,4,5,6} y como
espacio de sucesos el conjunto de las partes por ser finito, el cual contiene 26
elementos,
A = { , {1}, {2}, {3}, {4}, {5}, {6}, {1,2}, {1,3}, {1,4}, {1,5}, {1,6}, {2,3}, {2,4}, {2,5},
{2,6}, {3,4}, {3,5}, {3,6}, {4,5}, {4,6}, {5,6}, {1,2,3}, {1,2,4}, {1,2,5}, {1,2,6}, {1,3,4},
{1,3,5}, {1,3,6}, {1,4,5}, {1,4,6}, {1,5,6}, {2,3,4}, {2,3,5}, {2,3,6}, {2,4,5}, {2,4,6},
{2,5,6}, {3,4,5}, {3,4,6}, {3,5,6}, {4,5,6}, {1,2,3,4}, {1,2,3,5}, {1,2,3,6}, {1,2,4,5},
{1,2,4,6}, {1.,2,5,6}, {1,3,4,5}, {1,3,4,6}, {1,3,5,6}, {1,4,5,6}, {2,3,4,5}, {2,3,4,6},
{2,3,5,6}, {2,4,5,6}, {3,4,5,6}, {1,2,3,4,5}, {1,2,3,4,6}, {1,2,3,5,6}, {1,2,4,5,6},
{1,3,4,5,6}, {2, 3, 4, 5, 6}, }.

Obsrvese que este conjunto contiene los sucesos sobre los que habitualmente se
tiene incertidumbre, como por ejemplo que salga un nmero par, {2,4,6}, o un
nmero mayor que cuatro, {5,6}, o simplemente que salga un seis, {6}, y que como
se ve es cerrado respecto de las operaciones entre conjuntos.

El ltimo elemento del espacio probabilstico es la probabilidad, que como antes


se anot est definida sobre A, asignando a cada suceso un nmero entre 0 y 1.

78

ASIGNACIN DE PROBABILIDADES:
Concepto frecuentista Es un hecho, empricamente comprobado, que la
frecuencia relativa de un suceso tiende a estabilizarse cuando la frecuencia total
aumenta.
Surge as el concepto frecuentista de la probabilidad de un suceso como un
nmero ideal al que converge su frecuencia relativa cuando la frecuencia total
tiende a infinito. As, solemos afirmar que la probabilidad de que salga un seis al
tirar un dado es 1/6 porque al hacer un gran nmero de tiradas su frecuencia
relativa es aproximadamente esa. El problema radica en que al no poder repetir la
experiencia infinitas veces, la probabilidad de un suceso ha de ser aproximada por
su frecuencia relativa para un n suficientemente grande, y cun grande es un n
grande?. 0, qu hacer con aquellas experiencias que solo se pueden repetir una
vez?

EVENTOS
Un evento es un subconjunto de un espacio muestral .
Experimento aleatorio: conjunto de pruebas cuyos resultados estn determinados
nicamente por el azar. Es toda actividad cuyos resultados no se determinan con
certeza. Ejemplo: lanzar una moneda al aire. No podemos determinar con toda
certeza cul ser el resultado al lanzar una moneda al aire?, por lo tanto
constituye un experimento aleatorio. Espacio muestral: conjunto de todos los
resultados posibles de un experimento aleatorio Es un conjunto de todos los
resultados posibles que se pueden obtener al realizar un experimento aleatorio.
Ejemplo: sea el experimento E: lanzar un dado y el espacio muestral
correspondiente a este experimento es: S = (1, 2, 3, 4, 5, 6(.

79

Punto muestral o suceso elemental: el resultado de una sola prueba de un


experimento muestral Es un elemento del espacio muestral de cualquier
experimento dado.

Suceso o evento: cualquier subconjunto de puntos muestrales


Es todo subconjunto de un espacio muestral. Se denotan con letras maysculas:
A, B, etc. Los resultados que forman parte de este evento generalmente se
conocen como "resultados favorables". Cada vez que se observa un resultado
favorable, se dice que "ocurri" un evento. Ejemplo: Sea el experimento E: lanzar
un dado. Un posible evento podra ser que salga nmero par. Definimos el evento
de la siguiente manera: A = sale nmero par = (2, 4, 6(, resultados favorables n(E)
=3
Los eventos pueden ser:
i) Evento cierto.- Un evento es cierto o seguro si se realiza siempre. Ejemplo: Al
introducirnos en el mar, en condiciones normales, es seguro que nos mojaremos.
ii) Evento imposible.- Un evento es imposible si nunca se realiza. Al lanzar un dado
una sola vez, es imposible que salga un 10
iii) Evento probable o aleatorio.- Un evento es aleatorio si no se puede precisar de
antemano el resultado. Ejemplo: Al lanzar un dado, saldr el nmero 3?

Sucesos mutuamente excluyentes: sucesos o eventos que no pueden ocurrir


simultaneamente .
Sucesos complementarios: dos sucesos o eventos mutuamente excluyentes cuya
unin es el espacio muestral

80

Sucesos independientes: sucesos o eventos que no tienen relacin entre s; la


ocurrencia de uno no afecta la ocurrencia del otro
Sucesos dependientes: sucesos o eventos que s tienen relacin entre s; la
ocurrencia de uno s afecta la ocurrencia del otro.

EJEMPLO: Se lanza un dado.


a) Encontrar el espacio muestral. Solucin: S = {1, 2, 3, 4, 5, 6}
b) Enumerar los puntos muestrales. Solucin: Hay seis puntos muestrales: {1},{2},
{3},{4},{5} y {6}.
c) Poner dos ejemplos de eventos. Solucin: evento A = {resultado es impar} = {1,
3, 5}; evento B = {resultado es mayor que 2} = {3, 4, 5, 6}
d) Son mutuamente excluyentes los siguientes eventos? A = {resultado menor o
igual a 4}, B = {resultado es primo}. Solucin: A = {1, 2, 3, 4} y B = {2, 3, 5} s
tienen dos puntos en comn, 2 y 3. Por lo tanto, no son mutuamente excluyentes.
e) Cul suceso es complementario a M = {2, 6}? Solucin: {1, 3, 4, 5}.
f) Son dependientes o independientes los siguientes eventos? A = {obtener un 2
en el primer lanzamiento}, B = {obtener un 4 en el segundo lanzamiento}.
Solucin: Son independientes, porque obtener o no un 2 en el primer lanzamiento
no afecta el resultado del segundo lanzamiento.

PROBABILIDAD.- Es el conjunto de posibilidades de que un evento ocurra o no en


un momento y tiempo determinado. Dichos eventos pueden ser medibles a travs
de una escala de 0 a 1, donde el evento que no pueda ocurrir tiene una
probabilidad de 0 (evento imposible) y un evento que ocurra con certeza es de 1
(evento cierto).
81

La probabilidad de que ocurra un evento, siendo sta una medida de la posibilidad


de que un suceso ocurra favorablemente, se determina principalmente de dos
formas: empricamente (de manera experimental) o tericamente (de forma
matemtica).
i) Probabilidad emprica.- Si E es un evento que puede ocurrir cuando se realiza
un experimento, entonces la probabilidad emprica del evento E, que a veces se le
denomina definicin de frecuencia relativa de la probabilidad, est dada por la
siguiente frmula:
Nota: P(E), se lee probabilidad del evento E
ii) Probabilidad terica.- Si todos los resultados en un espacio muestral S finito son
igualmente probables, y E es un evento en ese espacio muestral, entonces la
probabilidad terica del evento E est dada por la siguiente frmula, que a veces
se le denomina la definicin clsica de la probabilidad, expuesta por Pierre
Laplace en su famosa Teora analtica de la probabilidad publicada en 1812:
G) POSIBILIDADES.- Las posibilidades comparan el nmero de resultados
favorables con el nmero de resultados desfavorables. Si todos los resultados de
un espacio muestral son igualmente probables, y un nmero n de ellos son
favorables al evento E, y los restantes m son desfavorables a E, entonces las
posibilidades a favor de E sonde de n(E) a m(E), y las posibilidades en contra de E
son de m(E) a n(E)
Ejemplos ilustrativos: Mathas se le prometi comprar 6 libros, tres de los cuales
son de Matemtica. Si tiene las mismas oportunidades de obtener cualquiera de
los 6 libros, determinar las posibilidades de que le compren uno de Matemtica.
Solucin:
Nmero de resultados favorables = n(E) = 3
Nmero de resultados desfavorables = m(E) = 3

82

Posibilidades a favor son n(E) a m(E), entonces,


Posibilidades a favor = 3 a 3, y simplificando 1 a 1.
Nota: A las posibilidades de 1 a 1 se les conoce como "igualdad de posibilidades"
o "posibilidades de 50-50"
Reglas de la probabilidad
A) REGLA DE LA ADICIN DE PROBABILIDADES
i) REGLA GENERAL PARA EVENTOS NO MUTUAMENTE EXCLUYENTES
Si A y B son dos eventos no mutuamente excluyentes (eventos intersecantes), es
decir, de modo que ocurra A o bien B o ambos a la vez (al mismo tiempo),
entonces se aplica la siguiente regla para calcular dicha probabilidad:

11.6

DISCRETOS

Son aquellos espacios donde el nmero de sucesos elementales es finito o infinito


numerable
Es una variable que slo puede tomar valores dentro de un conjunto numerable,
es decir, no acepta cualquier valor sino slo aquellos que pertenecen al conjunto.
En estas variables se dan de modo inherente separaciones entre valores
observables sucesivos. Dicho con ms rigor, se define una variable discreta como
la variable que hay entre dos valores observables (potencialmente), hay por lo
menos un valor no observable (potencialmente). Como ejemplo, el nmero de
animales en una granja (0, 1, 2, 3...).

83

11.6.1 Espacio probabilstico discreto

Es aquel cuyo espacio muestral es discreto. Podemos diferenciar varios tipos de


espacio probabilstico discreto:

11.6.2 Espacio probabilstico discreto equiprobable

Su espacio muestral es finito de tamao n.

La probabilidad de cualquier suceso elemental E es

, de aqu se deduce que para todo suceso A la probabilidad


es

11.6.3 Espacio probabilstico finito

Su espacio muestral es discreto finito.

Hay al menos 2 sucesos elementales que cumplen.

11.6.4 Procesos estocsticos finitos y diagramas de rbol

Un proceso estocstico es una sucesin finita de experimentos aleatorios, cada


uno de ellos con un n finito de resultados posibles. Se representan con diagrama
de rbol.

Por ejemplo, imaginemos que se lanza una moneda y un dado de seis caras. La
probabilidad de obtener un resultado particular corresponde a la multiplicacin de
sus probabilidades. Es decir, la probabilidad de obtener cara y un tres ser:

84

Ahora bien, la probabilidad de un suceso cualquiera es la suma de las


probabilidades de los distintos resultados aislados posibles. As, la probabilidad de
sacar siempre un resultado impar en los dados, independientemente del resultado
de la moneda, ser:

11.6.5 Espacio probabilstico infinito contable

Aquel cuyo espacio muestral es discreto infinito contable. Por ejemplo:

La probabilidad de que salga cara en la primera tirada ---->

La probabilidad de que salga nuevamente cara en la segunda tirada


---->

La probabilidad de que salga nuevamente cara en la tercera tirada ----

>

11.7 CONTINUOS

Son aquellos espacios donde el nmero de sucesos elementales es infinito


incontable.

85

Espacio probabilstico continuo

Espacio muestral infinito no numerable. -No es posible observar puntos concretos


del espacio.

Tiene sentido hablar de intervalos observados. - No es posible asignar


probabilidad a un punto concreto, se asigna a intervalos.

Por tanto la funcin P est definida sobre intervalos ----->

-Habitualmente cuando trabajamos con magnitudes fsicas.


Particiones
Es posible definir particiones sobre el espacio muestral. Formalmente hablando,
una particin sobre se define como un conjunto numerable:

tal que:
1.
2.
3.

Ejemplos
Por ejemplo, en el caso del experimento aleatorio "lanzar un dado", el espacio
muestral del experimento sera: ={1,2,3,4,5,6}. Por otro lado, si cambiamos
ligeramente la experiencia pensando en el nmero resultante de la suma de 2
dados, entonces tenemos 2 posibles espacios muestrales para modelar
nuestra realidad:

={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),...(6,6)} = {1,2,3,4,5,6}x{1,2,3,4,5,6}

86

'={2,3,4,...,12}

La eleccin del espacio muestral es un factor determinante para realizar el


clculo de la probabilidad de un suceso.

11.8

EVENTOS ALEATORIOS

Un evento aleatorio es aquel acontecimiento de un hecho en proceso o que est


por venir. Se dice que es aleatorio, si no es posible determinarlo con exactitud. En
todo caso, ser posible predecirlo con un nivel dado de confianza. Al evento
tambin se le denomina un suceso o un fenmeno.
Generalmente, se simula el evento por un conjunto de variables relacionadas entre
s. Por lo tanto, un evento est representado con una o ms variables vinculadas
entre ellas.
Si las variables (una o varias de stas) no son predecibles con exactitud se dice
que el evento es aleatorio. Generalmente las variables representan atributos y
propiedades de los entes que intervienen en el evento, y que pueden ser medidos.
De esta manera se dice que las variables tienen una magnitud.

Evento aleatorio es aquel que bajo el mismo conjunto de Condiciones iniciales,


puede presentar resultados diferentes es decir, no se puede predecir el resultado
de cada experiencia particular.
Ej.: Lanzamiento de un dado
Un experimento se dice aleatorio si verifica las siguientes condiciones:

87

Es posible conocer previamente todos los posibles resultados asociados al


experimento. Es imposible predecir el resultado del mismo antes de realizarlo.
Es posible repetirlo bajo las mismas condiciones iniciales un nmero ilimitado de
veces.
A cada realizacin de un experimento se le llama experiencia o prueba.

Espacios mustrales
Espacio maestral: se le llama al conjunto de todos los posibles resultados
individuales de un experimento aleatorio.
Sus elementos se representan por letras minsculas (w1, w2,...) y se denominan
eventos o sucesos elementales. Los subconjuntos de se designan por medio de
letras maysculas (A, B, C, D,...) y se denominan eventos o sucesos. Los sucesos
representan los posibles resultados del experimento aleatorio.

11.9. EXPERIMENTO ESTADSTICO

Un experimento en Estadstica es
resultados posibles, pero
ocurrir.

Un

experimento

sin

que

que

en donde
podamos

tiene

las

se

pueden

obtener varios

anticipar cul de ellos va a


siguientes

caractersticas

es

llamado experimento aleatorio o estadstico.


1.

Todos los posibles resultados del experimento son conocidos antes de


hacer una realizacin del experimento.

2.

El resultado exacto en cualquier ejecucin del experimento no es predecible


(aleatoriedad)
88

3.

El experimento puede ser repetido bajo (ms o menos) identicas condiciones.

Existe un patrn predictible a lo largo de muchas ejecuciones (regularidad estadstica)

Ejemplos

1. Algunos ejemplos de tpicos experimentos aleatorios son:

Lanzar una moneda y observar la cara


Una bombilla manufacturada en una planta es expuesta a una prueba de vida y el
tiempo de duracin de una bombilla es registrado.. En este caso no se conoce
cual ser el tiempo de duracin de la bombilla seleccionada, pero claramente se
puede conocer de antemano que ser un valor entre $0$ y $\infty $ horas

Un lote de $N$ items que contiene $D$ defectuosos es muestreado. Un item


muestreado no se reemplaza, y se registra si el item muestreado es o no
defectuoso. El proceso continua hasta que todos los items defectuosos sean
encontrados.

Una manufacturera de refrigeradores inspecciona sus regiradores para $10$ tipos


de

defectos. El

nmero

de

defectos

inspeccionado es registrado.

89

encontrado

en

cada

refrigerador

Seleccionar una planta de una parcela y observar si padece alguna enfermedad,


es decir es sana o enferma
Seleccionar una planta y medir su altura
2. Algunos ejemplos de experimentos no estadsticos son:
Seleccionar al azar un bus de ruta (no alimentador) de transmilenio y observar el
color. Aqui no se cumple la condicin (ii), ya que se puede predecir una ejecucin
del experimento, el color del bus.

Seleccionar al azar un estudiante de un colegio masculino y observar su gnero.


Aqui no se cumple la condicin (ii), ya que se puede predecir una ejecucin del
experimento, el gnero del alumno

11.9.1 Experimento aleatorio

En teora de la probabilidad un experimento aleatorio es aquel que bajo el mismo


conjunto aparente de condiciones iniciales, puede presentar resultados diferentes,
es decir, no se puede predecir o reproducir el resultado exacto de cada
experiencia particular. (Ej: Lanzamiento de un dado).

Este tipo de fenmeno es opuesto al fenmeno determinista, en el que conocer


todos los factores de un experimento nos hace predecir exactamente el resultado
del mismo. Por ejemplo, conociendo la altura desde la que se arroja un mvil es
posible saber exactamente el tiempo que tardar en llegar al suelo en condiciones
de vaco.
90

Es toda aquella situacin que debe llevarse a cabo para saber cual es el resultado.
Un experimento se dice aleatorio si verifica las siguientes condiciones:

Si los resultados se pueden contar se le llama experimento aleatorio


numerable; y si no se pueden contar, se le llama experimento aleatorio no
numerable.

Si es posible conocer previamente todos los posibles resultados (el espacio


muestral, constituido por diferentes sucesos) o por lo menos nombrar al ltimo
resultado se le llama experimento aleatorio finito; y si no se puede nombrar al
ltimo resultado, se le llama experimento aleatorio infinito.

Es imposible predecir el resultado exacto del mismo antes de realizarlo.

A cada realizacin de un experimento se le llama experiencia o prueba

91

12. TCNICAS DE CONTEO

El principio fundamental en el proceso de contar ofrece un mtodo general para


contar el nmero de posibles arreglos de objetos dentro de un solo conjunto o
entre varios conjuntos. Las tcnicas de conteo son aquellas que son usadas para
enumerar eventos difciles de cuantificar. Si un evento A puede ocurrir de n1
maneras y una vez que este ha ocurrido, otro evento B puede n2 maneras
diferentes entonces, el nmero total de formas diferentes en que ambos eventos
pueden ocurrir en el orden indicado, es igual a n1 x n2.

* La tcnica de la multiplicacin
* La tcnica aditiva
* La tcnica de la suma o Adicin
* La tcnica de la permutacin
* La tcnica de la combinacin.

Ejemplo:
De cuntas maneras pueden repartirse 3 premios a un conjunto de 10 personas,
suponiendo que cada persona no puede obtener ms de un premio?
Aplicando el principio fundamental del conteo, tenemos 10 personas que pueden
recibir el primer

92

Premio. Una vez que ste ha sido entregado, restan 9 personas para recibir el
segundo, y
Posteriormente quedarn 8 personas para el tercer premio. De ah que el nmero
de maneras distintas de repartir los tres premios.
n
10 x 9 x 8 = 720

Cuntas placas de automvil se pueden hacer utilizando dos letras seguidas de


tres cifras? No se admiten repeticiones.

26 x 25 x 10 x 9 x 8 = 468000

n un nmero entero positivo, el producto n (n-1) (n-2)...3 x 2 x 1 se llama factorial


de n.
El smbolo (!) se lee factorial y es el producto resultante de todos los enteros
positivos de 1 a n; es decir, sea
n
5! = 5 x 4 x 3 x 2 x 1 = 120
Por definicin 0! = 1

Si el nmero de posibles resultados de un experimento es pequeo, es


relativamente fcil listar y contar todos los posibles resultados. Al tirar un dado, por
ejemplo, hay seis posibles resultados.
93

Si, sin embargo, hay un gran nmero de posibles resultados tales como el nmero
de nios y nias por familias con cinco hijos, sera tedioso listar y contar todas las
posibilidades. Las posibilidades seran, 5 nios, 4 nios y 1 nia, 3 nios y 2 nias,
2 nios y 3 nias, etc.
Para facilitar el conteo examinaremos tres tcnicas:

* La tcnica de la multiplicacin
* La tcnica aditiva
* La tcnica de la suma o Adicin
* La tcnica de la permutacin
* La tcnica de la combinacin.

12.1 PRINCIPIO DE LA MULTIPLICACIN

Si se desea realizar una actividad que consta de r pasos, en donde el primer paso
de la actividad a realizar puede ser llevado a cabo de N1 maneras o formas, el
segundo paso de N2 maneras o formas y el r-simo paso de Nr maneras o formas,
entonces esta actividad puede ser llevada a efecto de. El principio multiplicativo
implica que cada uno de los pasos de la actividad deben ser llevados a efecto, uno
tras otro. Si un evento E1 puede suceder de n1 maneras diferentes, el evento E2
puede ocurrir de n2 maneras diferentes, y as sucesivamente hasta el evento Ep el
cual puede ocurrir de np maneras diferentes, entonces el total de maneras

94

distintas en que puede suceder el evento ocurren E1 y E2..y Ep es igual a


producto.

N1 x N2 x ..........x Nr maneras o formas


Ejemplo:
Se dispone de 3 vas para viajar de C1 a C2 y de 4 vas para viajar de C2 a C1.
De cuntas formas se puede organizar el viaje de ida y vuelta de C1 a
C2.Respuesta: (3)(4)=12

12.1.1 Principio aditivo

Si se desea llevar a efecto una actividad, la cual tiene formas alternativas para ser
realizada, donde la primera de esas alternativas puede ser realizada de M
maneras o formas, la segunda alternativa puede realizarse de N maneras o formas
..... y la ltima de las alternativas puede ser realizada de W maneras o formas,
entonces esa actividad puede ser llevada a cabo de,
M + N +.........+ W maneras o formas

Ejemplos:
1)

Una persona desea comprar una lavadora de ropa, para lo cul ha pensado

que puede seleccionar de entre las marcas Whirpool, Easy y General Electric,
cuando acude a hacer la compra se encuentra que la lavadora de la marca W se
presenta en dos tipos de carga ( 8 u 11 kilogramos), en cuatro colores diferentes y

95

puede ser automtica o semiautomtica, mientras que la lavadora de la marca E,


se presenta en tres tipos de carga (8, 11 o 15 kilogramos), en dos colores
diferentes y puede ser automtica o semiautomtica y la lavadora de la marca GE,
se presenta en solo un tipo de carga, que es de 11 kilogramos, dos colores
diferentes y solo hay semiautomtica. Cuntas maneras tiene esta persona de
comprar una lavadora?

Solucin:
M = Nmero de maneras de seleccionar una lavadora Whirpool
N = Nmero de maneras de seleccionar una lavadora de la marca Easy
W = Nmero de maneras de seleccionar una lavadora de la marca General
Electric.

M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras
M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora

12.2 PRINCIPIO DE LA SUMA O ADICIN O LEY DE LA SUMA

La probabilidad de la unin AUB es P(AUB)=P(A) + P(B) - P(AB). En el caso en


que A y B sean eventos mutuamente excluyentes P(AUB)=P(A) +P(B) ya que
P(AB)=0

96

Esta ley consiste en el modelo. La suma de P(A) + P(B) considera la suma de


todos los puntos mustrales de AUB pero cuenta dos veces los puntos mustrales
de la interseccin AB, por ello al restar P(AB) se obtiene el resultado correcto.

Generalizando esto si A,B, ....H son eventos mutuamente excluyentes, con


probabilidad P(A), P(B)...P(H), entonces la probabilidad de ocurrencia de A o Bo H
es la suma de las probabilidades P(A) + P(B) + P(H)

Ejemplo1: Si A es el evento extraer un as de la baraja de cartas, y B es el evento


extraer un rey.

P(A)=4/52=1/3 y P(B)=1/13

Luego la probabilidad de extraer un as o un rey es una extraccin


P(A+B)=P(A)+P(B)=1/13+1/13=2/13 puesto que ambos no pueden extraerse en
una sola extraccin. Son eventos mutuamente excluyentes .

Si una primera operacin puede realizarse de m maneras y una segunda


operacin de n maneras, entonces una operacin o la otra pueden efectuarse de:
m+n maneras.

Ejemplo:
Una pareja que se tiene que casar, junta dinero para el enganche de su casa, en
el fraccionamiento lomas de la presa le ofrecen un modelo econmico un

97

condominio, en el fraccionamiento Playas le ofrecen un modelo econmico como


modelos un residencial, un californiano y un provenzal. Cuntas alternativas
diferentes de vivienda le ofrecen a la pareja?

PRESA

PLAYAS

Econmico

Residencial

Condominio

Californiano
Provenzal

m=2

n=3

2+3= 5 maneras

12.3 NOTACIN FACTORIAL

Para todo nmero natural n, se llama n factorial o factorial de n al producto de


todos los naturales desde 1 hasta n: Que de un modo resumido, se puede
expresar como:

Se define 0! = 1, para que la relacin n! = n (n 1)! sea tambin vlida para n =


1. Esta relacin permite definir los factoriales por recursividad. La notacin n! fue
popularizada por el matemtico francs Christian Kramp.

La operacin de factorial aparece en muchas reas de las matemticas,


particularmente en combinatoria y anlisis matemtico. De manera fundamental, el

98

factorial de n representa el nmero de formas distintas de ordenar n objetos


distintos (elementos sin repeticin). Este hecho ha sido conocido desde hace
varios siglos, en el s. XII por los estudiosos hindes. La notacin actual n! fue
usada por primera vez por Christian Kramp en 1803.

La definicin de la funcin factorial tambin se puede extender a nmeros no


naturales manteniendo sus propiedades fundamentales, pero se requieren
matemticas avanzadas, particularmente del anlisis matemtico.

Por ejemplo, 5! = 54321 = 120


12.3.1 Factorial de un entero Positivo: El factorial de un nmero entero positivo
se define como el producto de todos los nmeros naturales anteriores o iguales a
l. Se escribe n!, y se lee "n factorial". (Por definicin el factorial de 0 es 1: 0!=1)

12.3.2 Variaciones: Se parte de un conjunto de m elementos prescindiendo de su


naturaleza.
- Los elementos de tal conjunto lo podemos ordenar de uno en uno, de dos en
dos, de tres en tres,......, de n en n
- Se pueden tomar todos los elementos del conjunto a la vez, en ese cason = m
- Se adopta el convenio de que una ordenacin se distingue de otra en algn
elemento o teniendo los mismos elementos en su orden de colocacin.
Ejercicio:
* Cuntos nmeros de tres cifras se puede formar con los dgitos: 1, 2, 3, 4, 5 ?
m=5

n=3

99

No entran todos los elementos. De 5 dgitos entran slo 3.


S importa el orden. Son nmeros distintos el 123, 231, 321.
S se repiten los elementos. El enunciado nos pide que las cifras sean diferentes.
12.3.3 Propiedades de las Variaciones: Existe dos tipos: variaciones sin
repeticin y variaciones con repeticin, cuyos smbolos son los siguientes.
12.3.4 Variaciones sin Repeticin: Las variaciones sin repeticin de n elementos
tomados de p en p se definen como las distintas agrupaciones formadas con p
elementos distintos, eligindolos de entre los n elementos de que disponemos,
considerando una variacin distinta a otra tanto si difieren en algn elemento como
si estn.

12.4 PERMUTACIONES

Una permutacin es una combinacin en donde el orden es importante. La


notacin para permutaciones es P(n,r) que es la cantidad de permutaciones de n
elementos si solamente se seleccionan r.

Ejemplo: Si nueve estudiantes toman un examen y todos obtienen diferente


calificacin, cualquier alumno podra alcanzar la calificacin ms alta. La segunda
calificacin ms alta podra ser obtenida por uno de los 8 restantes. La tercera
calificacin podra ser obtenida por uno de los 7 restantes. La cantidad de
permutaciones posibles sera: P(9,3) = 9*8*7 = 504 combinaciones posibles de las
tres calificaciones ms altas.

100

12.4.1 Principio de permutacin

A diferencia de la frmula de la multiplicacin, se la utiliza para determinar el


nmero de posibles arreglos cuando solo hay un solo grupo de objetos.
Permutacin: un arreglos o posicin de r objetos seleccionados de un solo grupo
de n objetos posibles. Si nos damos cuenta los arreglos a, b, c y b, a, c son
permutaciones diferentes, la frmula que se utiliza para contar el nmero total de
permutaciones distintas es: FRMULA: n P r = n! (n - r)
Ejemplo: Cmo se puede designar los cuatro primeros lugares de un concurso,
donde existen 15 participantes?
Aplicando la frmula de la permutacin tenemos:
n P r = n! (n - r)! = 15! = 15*14*13*12 *11*10*9*8*7*6*5*4*3*2*1 (15-4)!
11*10*9*8*7*6*5*4*3*2*1 = 32760

Dnde: n= nmero total de objetos r= nmero de objetos seleccionados!= factorial,


producto de los nmeros naturales entre 1 y n.
NOTA: se puede cancelar nmeros cuando se tiene las mismas cifras en
numerador y denominador. !

12.5 COMBINACIONES

Las combinaciones son aquellas formas de agrupar los elementos de un conjunto


teniendo en cuenta que:

101

NO influye el orden en que se colocan. Si permitimos que se repitan los


elementos, podemos hacerlo hasta tantas veces como elementos tenga la
agrupacin.
Ejemplo: Ejemplo: Si se seleccionan cinco cartas de un grupo de nueve, cuantas
combinaciones de cinco cartas habra?

La cantidad de combinaciones posibles sera: P(9,5)/5! = (9*8*7*6*5)/(5*4*3*2*1) =


126 combinaciones posibles.

12.5.1 Principio de combinacin

En una permutacin, el orden de los objetos de cada posible resultado es


diferente. Si el orden de los objetos no es importante, cada uno de estos
resultados se denomina combinacin. Por ejemplo, si se quiere formar un equipo
de trabajo formado por 2 personas seleccionadas de un grupo de tres (A, B y C).
Si en el equipo hay dos funciones diferentes, entonces si importa el orden, los
resultados sern permutaciones. Por el contrario si en el equipo no hay funciones
definidas, entonces no importa el orden y los resultados sern combinaciones. Los
resultados en ambos casos son los siguientes:
Permutaciones: AB, AC, BA, CA, BC, CB
Combinaciones: AB, AC, BC
Combinaciones: Es el nmero de formas de seleccionar r objetos de un grupo de n
objetos sin importar el orden. La frmula de combinaciones es: n C r = n!- r! (n r)!

102

Ejemplo: En una compaa se quiere establecer un cdigo de colores para


identificar cada una de las 42 partes de un producto. Se quiere marcar con 3
colores de un total de 7 cada una de las partes, de tal suerte que cada una tenga
una combinacin de 3 colores diferentes. Ser adecuado este cdigo de colores
para identificar las 42 partes del producto?
Usando la frmula de combinaciones:
n C r = n! = 7! = 7! = 35

r! (n r )! 3! (7 3)! 3! 4!

El tomar tres colores de 7 posibles no es suficiente para identificar las 42 partes


del producto.

13. AXIOMAS DE LAS PROBABILIDADES

Hay tres axiomas de probabilidad: 1. La probabilidad es siempre mayor que cero.


2. La probabilidad de que algo ocurra es 1, 100%. 3. Si dos eventos no pueden
ocurrir al mismo tiempo, la probabilidad de que alguno ocurra es la suma de las
probabilidades de que cada uno ocurra.

Los axiomas de probabilidad son las condiciones mnimas que deben verificarse
para que una funcin definida sobre un conjunto de sucesos determine
consistentemente sus probabilidades. Fueron formulados por Kolmogrov en
1933.
Dado un conjunto de sucesos elementales, , sobre el que se ha definida una lgebra (lase sigma-lgebra) de subconjuntos de y una funcin P que asigna
valores reales a los miembros de , a los que denominamos "sucesos", se dice
que P es una probabilidad sobre (,) si se cumplen los siguientes tres axiomas.

103

Primer axioma
La probabilidad de un suceso

es un nmero real mayor o igual que 0.

Segundo axioma
La probabilidad del total,

, es igual a 1, es decir,

Tenemos un resultado de x1

Tercer axioma
Si
son sucesos mutuamente excluyentes (incompatibles dos a
dos, disjuntos o de interseccin vaca dos a dos), entonces:

Segn este axioma se puede calcular la probabilidad de un suceso compuesto de


varias alternativas mutuamente excluyentes sumando las probabilidades de sus
componentes.

En trminos ms formales, una probabilidad es una medida sobre una -lgebra


de subconjuntos del espacio muestral, siendo los subconjuntos miembros de la lgebra los sucesos y definida de tal manera que la medida del total sea 1. Tal
medida, gracias a su definicin matemtica, verifica igualmente los tres axiomas
de Kolmogrov. A la terna formada por el espacio muestral, la -lgebra y la
funcin de probabilidad se la denomina Espacio probabilstico, esto es, un

104

"espacio de sucesos" (el espacio muestral) en el que se han definido los posibles
sucesos a considerar (la -lgebra) y la probabilidad de cada suceso (la funcin
de probabilidad).

Una ley de probabilidad, o distribucin de probabilidad, es una funcin P que a un


evento A asocia un nmero P [A], su probabilidad. Este nmero traduce la
oportunidad que tiene el evento de producirse. La forma ms intuitiva de definir
una tal funcin es repetir el experimento aleatorio y asociar a cada evento su
frecuencia experimental. . Si n es el nmero de experimentos, n A el nmero de
veces que se produce el evento A, la frecuencia experimental de A es la razn n
A/n Aqu tenemos, como ejemplo, 20 repeticiones de un experimento cuyas
eventualidades son 0, 1 y 2.

En este ejemplo la frecuencia experimental de {0} es 8/20, la de {1,2} es 12/20. El


inconveniente es que la frecuencia experimental cambiar si rehacemos los n
experimentos. En otras palabras el conjunto de las n repeticiones constituye un
nuevo experimento aleatorio. Sin embargo todos tenemos en nuestra mente una
idea de la Ley de los Grandes Nmeros segn la cual las frecuencias
experimentales varan poco cuando el nmero de repeticiones es grande. Veamos
cuatro clculos sucesivos de la frecuencia experimental de {0}, en
repeticiones del mismo experimento anterior.

105

20 000

13.1

PROPIEDADES QUE DEDUCEN LOS AXIOMAS

De los axiomas anteriores se deducen otras propiedades de la probabilidad:


1.

donde el conjunto vaco

representa en probabilidad el suceso

imposible
2. Para cualquier suceso
3.
4. Si

entonces

5.

Ejemplos:

Como ejemplo se puede tomar como espacio muestral a los posibles resultados al
arrojar un dado corriente

, tomaremos como -lgebra todos

los subconjuntos posibles de (que en matemticas se denota por

) y como

funcin de probabilidad

Donde

representa el nmero de elementos del conjunto .

Es fcil comprobar que esta funcin verifica los tres axiomas de Kolmogrovy, por
tanto, constituye una probabilidad sobre este conjunto.

1.

, puesto que es el cociente de dos nmeros positivos

106

2.

3. Si

de tal manera que


entonces

Con lo que

107

14 TEOREMAS FUNDAMENTALES DE LA PROBABILIDAD

El Teorema de la probabilidad total nos permite calcular la probabilidad de un


suceso a partir de probabilidades condicionadas:
Ejemplo: supongamos que si llueve la probabilidad de que ocurra un accidentes es
x% y si hace buen tiempo dicha probabilidad es y%. Este teorema nos permite
deducir cul es la probabilidad de que ocurra un accidente si conocemos la
probabilidad de que llueva y la probabilidad de que haga buen tiempo.
La frmula para calcular esta probabilidad es:

Es decir, la probabilidad de que ocurra el suceso B (en nuestro ejemplo, que


ocurra un accidente) es igual a la suma de multiplicar cada una de las
probabilidades condicionadas de este suceso con los diferentes sucesos A
(probabilidad de un accidente cuando llueve y cuando hace buen tiempo) por la
probabilidad de cada suceso A. Para que este teorema se pueda aplicar hace falta
cumplir un requisito: Los sucesos A tienen que formar un sistema completo, es
decir, que contemplen todas las posibilidades (la suma de sus probabilidades debe
ser el 100%).
Ejemplo: al tirar una moneda, el suceso "salir cara" y el suceso "salir cruz" forman
un sistema completo, no hay ms alternativas: la suma de sus probabilidades es el
100%
Ejemplo: al tirar un dado, que salga el 1, el 2, el 3, o el 4 no forman un sistema
completo, ya que no contempla todas las opciones (podra salir el 5 o el 6). En
este caso no se podra aplicar el teorema de la probabilidad total.
108

Teorema de la Probabilidad Total (I) Ejemplo: De una urna en la que hay 3 bolas
blancas y 5 rojas, se extraen sucesivamente dos bolas devolviendo la primera bola
extrada. Calcula la probabilidad de que las dos bolas sean del mismo color. Urna
3/8 5/8 1 1B Sistema completo de sucesos R 3/8 5/8 3/8 5/8 2 2 2R 2R B B
p(bolas de igual color) = p(las dos sean blancas o las dos rojas) = p((1By2B) o (1R
y 2R)) = p((1B2B) (1R 2R)) = 3 3 5 5 34 = p(1B2B) + p(1R 2R) = p(1B) .
p(2B) + p(1R) . p(2R) = + = 8 8 8 8 64
Teorema de la Probabilidad Total (II) Ejemplo: De una urna en la que hay 3 bolas
blancas y 5 rojas, se extraen sucesivamente dos bolas no devolviendo la primera
bola extrada. Calcula la probabilidad de que las dos bolas sean del mismo color.
Urna 3/8 5/8 1 1B Sistema completo de sucesos R 2/7 5/7 3/7 4/7 2 2 2R 2R B B
p(bolas de igual color) = p(las dos sean blancas o las dos rojas) = p((1By2B) o (1R
y 2R)) = p((1B2B) (1R 2R)) = 3 2 5 4 26= p(1B2B) + p(1R 2R) = p(1B)
p(2B/1B) + p(1R) p(2R/1R) = + = . . 8 7 8 7 56

Teorema de la Probabilidad Total (III) B1 A B1-apuntes-Sea B1, B2 Br un


sistema completo de sucesos. Entonces: B2 A B2p(A) = p (A E) = p [A (B1 U
B2 U Br)] pr. Distributiva = p [(A B1) U (A B2) U (A Br)] suc.
Incompatibles B3 A B3 = p(A B1) + p(A B2) + + p(A Br) = = p(B1) . p(A /
B1) + p(B2) . p(A / B2) + + p(Br) . p(A / Br) . . . . . . A Br Br E

Teorema de la Probabilidad Total (IV) Ejercicio: Una marca de coches realiza el


35% de su produccin en su fbrica de Espaa, el 40% en su fbrica de Italia y el
25% en su fbrica de Portugal. La probabilidad de que un coche de esa marca
fabricado en Espaa tenga una avera en el primer ao es del 4%; para los coches
fabricados en Italia es del 3% y para los de Portugal es del 5%. Cul es la

109

probabilidad de que un coche cualquiera de esa marca tenga una avera en el


primer ao? {Espaa}, {Italia} y {Portugal} son sucesos incompatibles {Espaa} U
{Italia} U {Portugal} = E es el suceso seguro Constituyen un sistema completo de
sucesos. Se puede aplicar el Teorema de la Probabilidad Total: p (avera)
=p(Espaa) p(avera/ Espaa) + p(Italia) p(avera/ Italia) + p(Portugal) p(avera/
Portugal) =035004 + 04003 + 025005 = 0014 + 0012 + 00125 = 00385 =
385%

Teorema de Bayes -apuntes- Sean B1, B2,..., Br un sistema completo de


sucesos. Se B1 llama probabilidades a posteriori a: A B1 P(A Bi ) A B2 P(Bi /
A ) = B2 P(A) B3 A B3Sabemos que: P(A Bi) = P(Bi A) = P(Bi) P(A /
Bi) . . . . . .Por el Teorema de la Probabilidad Total: P (A) = P(B1) P(A / B1) + P(B2)
P(A / B2) + + P(Br) P(A / Br) A Br Br Sustituyendo ambas expresiones, sale la
Frmula de Bayes: E P(Bi) P(A / Bi) P(Bi / A ) = P(B1) P(A / B1) + P(B2) P(A /
B2) + + P(Br) P(A / Br)
Teorema de Bayes (II) Ejercicio: En el problema anterior, supongamos que un
coche de esa marca se avera en el primer ao. Nos preguntamos ahora cul es la
probabilidad de que ese coche haya sido fabricado, por ejemplo, en Portugal. En
este ejemplo se ve bien por qu se llama a este tipo de probabilidad a posteriori:
se refiere a un suceso del pasado (pas de fabricacin) conociendo otro suceso
posterior (avera), en un razonamiento hacia atrs, inverso al que era habitual.
Divisin entre bayesianos y no bayesianos. Aplicando el Teorema de Bayes:P
(Portugal | avera) = P (Portugal) P (avera | Portugal) / P (avera)Habamos
calculado por el teorema de la probabilidad Total, que: P (avera) = 0,0385Luego:P
(Portugal | avera) = 0,25 0,05 / 0,0385 = 0,32 observa: P (Portugal | avera) =
0,32 > P (Portugal) = 0,25 es una probabilidad condicionada de sucesos
dependientes.

110

14.4 PROPOSICIN

es un concepto con diferentes usos. Puede tratarse de la manifestacin de algo


para que otros individuos conozcan una intencin, de la concrecin de una
propuesta o de un enunciado que puede resultar falso o verdadero.
Proposicin matemtica
La matemtica, por otra parte, es la ciencia dedicada al anlisis de las entidades
abstractas, como nmeros, figuras geomtricas y smbolos, y de sus propiedades.
Como adjetivo, el trmino refiere a todo lo vinculado con esta disciplina deductiva.
Despus de estas aclaraciones, podemos centrarnos en las proposiciones
matemticas. Una proposicin matemtica es una expresin algebraica que puede
acarrear dos valores: ser verdadera o ser falsa, aunque nunca ambas cosas.

14.2

TEOREMA PROBABILIDAD COMPUESTA

La probabilidad compuesta (o regla de multiplicacin de probabilidades) se deriva


de la probabilidad condicionada:
La probabilidad de que se den simultneamente dos sucesos (suceso interseccin
de A y B) es igual a la probabilidad a priori del suceso A multiplicada por la
probabilidad del suceso B condicionada al cumplimiento del suceso A. La frmula
para calcular esta probabilidad compuesta es:

111

Es aquella que se calcula cuando se ha incorporado informacin adicional a las


condiciones iniciales. La probabilidad de ocurrencia de un suceso B, condicionada
por la ocurrencia del suceso A, o probabilidad a posteriori, se denota P(B/A), y su
valor se determina por la expresin:

Ejemplo: Estudiamos el suceso A (porcentaje de varones mayores de 40 aos


casados) y el suceso B (varones mayores de 40 aos con ms de 2 hijos) y
obtenemos la siguiente informacin:
Un 35% de los varones mayores de 40 aos estn casados.
De los varones mayores de 40 aos y casados, un 30% tienen ms de 2 hijos
(suceso B condicionado al suceso A).

Se conoce tambin como la Regla de multiplicacin de probabilidades. La


probabilidad de ocurrencia simultnea de dos sucesos A y B se denota P(AB), y
se deriva de la probabilidad condicionada, matemticamente:

Si A y B son sucesos independientes, entonces,

Corolario: Sean A1, A2, A3, , An sucesos independientes entre s, entonces,

112

15. PROBABILIDAD CONDICIONAL

La probabilidad de que un evento

ocurra cuando se sabe que ya ocurrio un

evento se llama probabilidad condicional y se denota por


que por lo
general se lee como probabilidad de que "ocurra B dado que ocurri A". Esta
probabilidad se define como:

La probabilidad condicional es una funcin de probabilidad,

Es

definida como

una funcin de probabilidad?


es una funcin de probabilidad porque satisface los tres axiomas

Axioma I
para todo evento

Como

Entonces dividiendo por

se tiene los trminos de la desigualdad se tiene

113

Axioma II

Como

Axioma III
Si

es una sucesin de eventos mutuamente excluyentes, entonces

Como

Como
eventos

los

eventos

son

mutuamente

excluyentes,

entonces

son tambin mutuamente excluyentes y as

114

los

Ejemplo
1. La antena de una instalacin de radar recibe, con probabilidad

, una seal til

con una interferencia superpuesta, y con probabilidad


solo la interferencia
pura. Al suceder una seal til interferida, la instalacin indica la existencia de
cualquier seal con probabilidad
probabilidad

, cuando aparece una interferencia pura con la

. S la instalacin ha indicado la existencia de cualquier seal,

determinar la probabilidad de que esta indicacin haya sido ocasionada por una
seal til con interferencia superpuesta.

Solucin:

Sean U: el evento la seal es til con interferencia superpuesta


I : el evento la seal es til con interferencia pura
S: el evento que indica ocurre una seal
Con base en el diagrama , la probabilidad se puede calcular as:

115

sea 8 un espacio muestral en donde se ha definido un evento E, donde p(E) 0, si


deseamos determinar la probabilidad de que ocurra un evento A (el que tambin
es definido en el mismo espacio muestral), dado que E ya ocurri, entonces
deseamos determinar una probabilidad de tipo condicional, la que se determina
como se muestra;

Ilustracin 10: Probabilidad condicional.

Dnde:
p (A I E) = probabilidad de que ocurra A dado que E ya ocurri
p (A E) = probabilidad de que ocurra A y E a un mismo tiempo
p (E) = probabilidad de que ocurra E
Luego;

116

Por tanto:

Dnde:
AE = nmero de elementos comunes a los eventos A y E

I E I= nmero de elementos del evento E


Luego entonces podemos usar cualquiera de las dos frmulas para calcular la
probabilidad condicional de A dado que E ya ocurri.
Ejemplos:
1. Se lanza al aire dos dados normales, si la suma de los nmeros que
aparecen es de por lo menos siete, a. determine la probabilidad de que en el
segundo dado aparezca el nmero cuatro, b. Determine la probabilidad de que
ambos nmeros sean pares, c. Determine la probabilidad de que en el primer
dado aparezca el nmero dos.
Solucin:
El espacio muestral es el mismo que cuando se lanza un dado dos veces y se
muestra a continuacin;

(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)


(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
= (1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

117

16. TEOREMA DE BAYES

En la teora de la probabilidad el teorema de Bayes es un resultado enunciado por


Thomas Bayes en 17631 que expresa la probabilidad condicional de un evento
aleatorio A dado B en trminos de la distribucin de probabilidad condicional del
evento B dado A y la distribucin de probabilidad marginal de slo A.

En trminos ms generales y menos matemticos, el teorema de Bayes es de


enorme relevancia puesto que vincula la probabilidad de A dado B con la
probabilidad de B dado A. Es decir que sabiendo la probabilidad de tener un dolor
de cabeza dado que se tiene gripe, se podra saber (si se tiene algn dato ms), la
probabilidad de tener gripe si se tiene un dolor de cabeza, muestra este sencillo
ejemplo la alta relevancia del teorema en cuestin para la ciencia en todas sus
ramas, puesto que tiene vinculacin ntima con la comprensin de la probabilidad
de aspectos causales dados los efectos observados.

Sea
un conjunto de sucesos mutuamente excluyentes y
exhaustivos, y tales que la probabilidad de cada uno de ellos es distinta de cero
(0). Sea B un suceso cualquiera del que se conocen las probabilidades
condicionales
expresin:

. Entonces, la probabilidad

Dnde:

son las probabilidades a priori.

118

viene dada por la

es la probabilidad de

son las probabilidades a posteriori.

en la hiptesis

Viene a seguir el proceso inverso al que hemos visto en el Teorema de la


probabilidad total:
Teorema de la probabilidad total: a partir de las probabilidades del suceso A
(probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad
del suceso B (que ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un
accidente) deducimos las probabilidades del suceso A (estaba lloviendo o haca
buen tiempo?).
La frmula del Teorema de Bayes es:

Tratar de explicar estar frmula con palabras es un galimatas, as que vamos a


intentar explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio,
recordar que este teorema tambin exige que el suceso A forme un sistema
completo.
En muchas situaciones es posible que se conozca
que el espacio muestral est particionado por una coleccin de eventos
,

mutuamente excluyentes

119

La probabilidad de cada evento

La probabilidad de ocurrencia de un evento cualquiera


particin

dado un evento de la

. Esto es,

Entonces es recomendable utilizar el llamado Teorema de Bayes para calcular la


probabilidad condicional de que un evento de la particin
evento

dado que ocurre el

Teorema
Sea

un

espacio

muestral

una

coleccin

mutuamente excluyentes tal que

Para

. Entonces para cualquier evento

120

de

de

eventos

17. DISTRIBUCIN DE VARIABLE DISCRETA

Distribucin uniforme: La distribucin uniforme es la que corresponde a una


variable que toma todos sus valores, x 1, x2... , xk, con igual probabilidad; el espacio
muestral debe ser finito.
Si la variable tiene k posibles valores, su funcin de probabilidad sera:

Donde k es el parmetro de la distribucin (un parmetro es un valor que sirve


para determinar la funcin de probabilidad o densidad de una variable aleatoria)
La media y la varianza de la variable uniforme se calculan por las expresiones:

Distribucin binomial

La distribucin binomial es tpica de las variables que proceden de un experimento


que cumple las siguientes condiciones:

121

1) El experimento est compuesto de n pruebas iguales, siendo n un nmero


natural fijo.
2) Cada prueba resulta en un suceso que cumple las propiedades de la
variable binmica o de Bernouilli, es decir, slo existen dos posibles
resultados, mutuamente excluyentes, que se denominan generalmente
como xito y fracaso.
3) La probabilidad del xito (o del fracaso) es constante en todas las
pruebas. P(xito) = p ; P(fracaso) = 1 - p = q
4) Las pruebas son estadsticamente independientes,

En estas condiciones, la variable aleatoria X que cuenta el nmero de xitos en


las n pruebas se llama variable binomial. Evidentemente, el espacio muestral estar
compuesto por los nmeros enteros del 0 al n. Se suele decir que una variable
binmica cuenta objetos de un tipo determinado en un muestreo de n elementos
con reemplazamiento.
La funcin de probabilidad de la variable binomial se representa como b(x,n,p)
siendo n el nmero de pruebas y p la probabilidad del xito. n y p son los
parmetros de la distribucin.

Distribucin multinomial
La distribucin multinomial es esencialmente igual a la binomial con la nica
diferencia de que cada prueba tiene ms de dos posibles resultados mutuamente
excluyentes.

122

Si tenemos K resultados posibles (Ei , i = 1, ... , K) con probabilidades fijas (p i ,


i = 1, ... , K), la variable que expresa el nmero de resultados de cada tipo
obtenidos en n pruebas independientes tiene distribucin multinomial.

Distribucin hipergeomtrica
Una variable tiene distribucin hipergeomtrica si procede de un experimento que
cumple las siguientes condiciones:
1)

Se toma una muestra de tamao n, sin reemplazamiento, de un conjunto

finito de N objetos.
2)

K de los N objetos se pueden clasificar como xitos y N - K como fracasos.

X cuenta el nmero de xitos obtenidos en la muestra. El espacio muestral es el


conjunto de los nmeros enteros de 0 a n, de 0 a K si K < n.
En este caso, la probabilidad del xito en pruebas sucesivas no es constante pues
depende del resultado de las pruebas anteriores. Por tanto, las pruebas no son
independientes entre s.
La funcin de probabilidad de la variable hipergeomtrica es:

Distribucin multihipergeomtrica
Este variable se define igual que la hipergeomtrica con la nica diferencia de que
se supone que el conjunto de objetos sobre el que se muestrea se divide en R
123

grupos de A1, A2,..., AR objetos y la variable describe el nmero de objetos de cada


tipo que se han obtenido (x1, x2,..., xR)

Esta situacin es anloga a la planteada en el caso de la distribucin multinomial.


La funcin de probabilidad es:

Distribucin de poisson
Una variable de tipo poisson cuenta xitos (es decir, objetos de un tipo
determinado) que ocurren en una regin del espacio o del tiempo.
El experimento que la genera debe cumplir las siguientes condiciones:
1.

El nmero de xitos que ocurren en cada regin del tiempo o del espacio
es independiente de lo que ocurra en cualquier otro tiempo o espacio disjunto
del anterior.

2.

La probabilidad de un xito en un tiempo o espacio pequeo es


proporcional al tamao de este y no depende de lo que ocurra fuera de l.

3.

La probabilidad de encontrar uno o ms xitos en una regin del tiempo o


del espacio tiende a cero a medida que se reducen las dimensiones de la
regin en estudio.

124

Como consecuencia de estas condiciones, las variables Poisson tpicas son


variables en las que se cuentan sucesos raros.

La funcin de probabilidad de una variable Poisson es:

17.1 BINOMIAL

En estadstica, la distribucin binomial es una distribucin de probabilidad discreta


que

cuenta

el

nmero

de

xitos

en

una

secuencia

de n ensayos

de Bernoulli independientes entre s, con una probabilidad fija p de ocurrencia del


xito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser
dicotmico, esto es, slo son posibles dos resultados. A uno de estos se denomina
xito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una
probabilidad q = 1 - p. En la distribucin binomial el anterior experimento se
repite n veces, de forma independiente, y se trata de calcular la probabilidad de un
determinado nmero de xitos. Para n = 1, la binomial se convierte, de hecho, en
una distribucin de Bernoulli.
Para representar que una variable aleatoria X sigue una distribucin binomial de
parmetros n y p, se escribe:

Nos encontramos con un modelo derivado de un proceso experimental puro, en el


que se plantean las siguientes circunstancias.

125

Se realiza un nmero n de pruebas (separadas o separables).


Cada prueba puede dar dos nicos resultados A y

La probabilidad de obtener un resultado A es p y la de obtener un resultado es q,


con q= 1-p, en todas las pruebas. Esto implica que las pruebas se realizan
exactamente en las mismas condiciones y son , por tanto ,independientes en sus
resultados. Si se trata de extracciones, (muestreo), las extracciones debern ser
con devolucin (reemplazamiento) , o bien poblacin grande (M.A.S). A este
respecto hagamos una consideracin: si el proceso consiste en extraer individuos
de una poblacin y observar si poseen cierta caracterstica: el parmetro n ser el
nmero de extracciones (tamao muestral) y el parmetro p la proporcin de
individuos de la poblacin que poseen la caracterstica en cuestin. Se ha
comentado que para que la probabilidad, de que en cada extraccin obtengamos
un individuo poseedor de la caracterstica sea constante en todas la pruebas es
necesario que las proporciones poblacionales no cambien tras cada extraccin es
decir se reemplace cada individuo extrado .Sin embargo si la poblacin es muy
grande, aunque no reemplacemos los individuos extrados las variaciones en las
proporciones de la poblacin restante sern muy pequeas y, aunque de hecho
las probabilidades de, obtener un xito varen tras cada prueba, esta variacin
ser muy pequea y podremos considerar que son constantes .

17.1.1 Experimento binomial


Existen muchas situaciones en las que se presenta una experiencia binomial.
Cada uno de los experimentos es independiente de los restantes (la probabilidad
del resultado de un experimento no depende del resultado del resto). El resultado
de cada experimento ha de admitir slo dos categoras (a las que se denomina
126

xito y fracaso). Las probabilidades de ambas posibilidades han de ser constantes


en todos los experimentos (se denotan como p y q o p y 1-p).
Se designa por X a la variable que mide el nmero de xitos que se han producido
en los n experimentos. Cuando se dan estas circunstancias, se dice que la
variable X sigue una distribucin de probabilidad binomial, y se denota B(n,p).
17.2 CARACTERSTICAS ANALTICAS

Su funcin de probabilidad est dada por:

Donde

Siendo
tomados de

las combinaciones de

en

elementos

en )

Ejemplo
Supongamos que se lanza un dado (con 6 caras) 50 veces y queremos conocer la
probabilidad de que el nmero 3 salga 20 veces. En este caso tenemos una X ~
B(50, 1/6) y la probabilidad sera P(X=20):

127

17.3

HIPERGEOMETRIA

En teora de la probabilidad la distribucin hipergeomtrica es una distribucin


discreta relacionada con muestreos aleatorios y sin reemplazo. Supngase que se
tiene una poblacin de N elementos de los cuales, d pertenecen a la categora A y
N-d a la B. La distribucin hipergeomtrica mide la probabilidad de obtener x (0 \le
x \le d) elementos de la categora A en una muestra sin reemplazo de n elementos
de la poblacin original.
La distribucin hipergeomtrica es especialmente til en todos aquellos casos en
los que se extraigan muestras o se realizan experiencias repetidas sin devolucin
del elemento extrado o sin retornar a la situacin experimental inicial.
Modeliza , de hecho, situaciones en las que se repite un nmero determinado de
veces una prueba dicotmica de manera que con cada sucesivo resultado se ve
alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es
una distribucin .fundamental en el estudio de muestras pequeas de
poblaciones .pequeas y en el clculo de probabilidades de, juegos de azar y tiene
grandes aplicaciones en el control de calidad en otros procesos experimentales en
los que no es posible retornar a la situacin de partida.
La distribucin hipergeomtrica puede derivarse de un proceso experimental puro
o de Bernouilli con las siguientes caractersticas:

El proceso consta de n pruebas, separadas o separables de entre un


conjunto de N pruebas posibles.

Cada una de las pruebas puede dar nicamente dos resultados


mutuamente excluyentes: A y no A.

128

En la primera prueba las probabilidades son: P(A)= p y P(A)= q ;con p+q=l.

Las probabilidades de obtener un resultado A y de obtener un resultado no A


varan en las sucesivas pruebas, dependiendo de los resultados anteriores.

Derivacin de la distribucin) . Si estas circunstancias a leatorizamos de


forma que la variable aleatoria X sea el nmero de resultados A obtenidos
en n pruebas la distribucin de X ser una Hipergeomtrica de parmetros
N,n,p

as

Un tpico caso de aplicacin de este modelo es el siguiente:


Supongamos la extraccin aleatoria de n elementos de un conjunto formado por N
elementos totales, de los cuales Np son del tipo A y Nq son del tipo

(p+q=l) .Si

realizamos las extracciones sin devolver los elementos extrados , y llamamos X.


al nmero de elementos del tipo A que extraemos en n extracciones X seguir una
distribucin hipergeomtrica de parmetros N , n , p
Funcin de cuanta.
La funcin de cuanta de una distribucin Hipergeomtrica har corresponder a
cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad del suceso "obtener x
resultados del tipo A ", y (n-x) resultados del tipo no A en las n pruebas realizadas
de entre las N posibles.

17.4 PROPIEDADES

129

La funcin

de

probabilidad de

una

variable

aleatoria

con

distribucin

hipergeomtrica puede deducirse a travs de razonamientos combinatorios y es


igual a

Donde

es el tamao de poblacin,

es el tamao de la muestra extrada,

es

el nmero de elementos en la poblacin original que pertenecen a la categora


deseada y

es el nmero de elementos en la muestra que pertenecen a dicha

categora. La notacin

hace referencia al coeficiente binomial, es decir, el

nmero de combinaciones posibles al seleccionar


El valor

esperado de

una variable

elementos de un total .

aleatoria X que

hipergeomtrica es.

Y su varianza,

En la frmula anterior, definiendo

Se obtiene

130

sigue

la

distribucin

La distribucin hipergeomtrica es aplicable a muestreos sin reemplazo y


labinomial a muestreos con reemplazo. En situaciones en las que el nmero
esperado de repeticiones en el muestreo es presumiblemente bajo, puede
aproximarse la primera por la segunda. Esto es as cuando N es grande y el
tamao relativo de la muestra extrada, n/N, es pequeo.

18. POISSON

La distribucin de Poisson parte de la distribucin binomial: Cuando en una


distribucin binomial se realiza el experimento un nmero "n" muy elevado de
veces y la probabilidad de xito "p" en cada ensayo es reducida, entonces se
aplica el modelo de distribucin de Poisson:
Se tiene que cumplir que:

" p " < 0,10


" p * n " < 10
La distribucin de Poisson sigue el siguiente modelo:

131

probabilidad y estadstica, la distribucin de Poisson es una distribucin de


probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media,
la probabilidad de que ocurra un determinado nmero de eventos durante cierto
perodo de tiempo. Concretamente, se especializa en la probabilidad de ocurrencia
de sucesos con probabilidades muy pequeas, o sucesos "raros".

Fue descubierta por Simon-Denis Poisson, que la dio a conocer en 1838 en su


trabajo Recherches sur la probabilit des jugements en matires criminelles et
matire civile (Investigacin sobre la probabilidad de los juicios en materias
criminales y civiles).
Ilustracin 11:Diagrama de poisson.

18.1 PROPIEDADES

La funcin de masa o probabilidad de la distribucin de Poisson es

132

Donde

k es el nmero de ocurrencias del evento o fenmeno (la funcin nos da la


probabilidad de que el evento suceda precisamente k veces).

es un parmetro positivo que representa el nmero de veces que se


espera que ocurra el fenmeno durante un intervalo dado. Por ejemplo, si el
suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos
interesados en la probabilidad de que ocurra k veces dentro de un intervalo de
10 minutos, usaremos un modelo de distribucin de Poisson con = 104 =
40.

e es la base de los logaritmos naturales (e = 2,71828...)

Tanto el valor esperado como la varianza de una variable aleatoria con distribucin
de Poisson son iguales a . Los momentos de orden superior son polinomios de
Touchard en cuyos coeficientes tienen una interpretacin combinatorio. De
hecho, cuando el valor esperado de la distribucin de Poisson es 1, entonces
segn

la frmula

de

Dobinski,

el n-simo

momento

iguala

al

nmero

de particiones de tamao n.

La moda de una variable aleatoria de distribucin de Poisson con un no entero


es igual a

, el mayor de los enteros menores que (los smbolos

representan

la funcin parte entera). Cuando es un entero positivo, las modas son y 1.


La funcin generadora de momentos de la distribucin de Poisson con valor
esperado es

133

Las variables aleatorias de Poisson tienen la propiedad de ser infinitamente


divisibles.

La divergencia Kullback-Leibler desde una variable aleatoria de Poisson de


parmetro 0 a otra de parmetro es

18.2

SUMA DE VARIABLES ALEATORIAS DE POISSON

Al estudiar la distribucin de Poisson se ha indicado que la suma de variables de


Poisson independientes resulta en una nueva variable que tambin es de Poisson.
Ms en general, una variable aleatoria de Poisson X ~ P() puede considerarse
como una suma de n variables de Poisson independientes de la forma:
X1 + ... + Xn ~ P() y cada Xi ~ P(/n)
Al igual que la Binomial, las variables de Poisson independientes son
reproductivas. Estos dos ejemplos consecutivos no han de llevar al lector a pensar
que este es un fenmeno general, realmente es una propiedad que slo poseen
algunas familias de distribucin

134

a suma de variables aleatorias de Poisson independientes es otra variable


aleatoria de Poisson cuyo parmetro es la suma de los parmetros de las
originales. Dicho de otra manera, si

Son N variables aleatorias de Poisson independientes, entonces

18.3 DISTRIBUCIN BINOMIAL

Es una de las distribuciones de probabilidad ms tiles (control de calidad,


produccin, investigacin). Tiene que ver con el experimento aleatorio que
produce en cada ensayo o prueba uno de dos resultados posibles mutuamente
excluyentes: ocurrencia de un criterio o caracterstica especfico (llamado xito) y
no ocurrencia de ste (llamado fracaso). Los trminos o calificativos de "xito y
fracaso" son solo etiquetas y su interpretacin puede no corresponder con el
resultado positivo o negativo de un experimento en la realidad

La distribucin de Poisson es el caso lmite de la distribucin binomial. De hecho,


si los parmetros n y \theta de una distribucin binomial tienden a infinito (en el
caso de 'n') y a cero (en el caso de \theta) de manera que \!\lambda=n\theta se
mantenga constante, la distribucin lmite obtenida es de Poisson.

135

La distribucin binomial es tpica de las variables que proceden de un experimento


que cumple las siguientes condiciones:
1) El experimento est compuesto de n pruebas iguales, siendo n un nmero
natural fijo.
2) Cada prueba resulta en un suceso que cumple las propiedades de la variable
binmica o de Bernouilli, es decir, slo existen dos posibles resultados,
mutuamente excluyentes, que se denominan generalmente como xito y
fracaso.
3) La probabilidad del xito (o del fracaso) es constante en todas las pruebas.
P(xito) = p ; P(fracaso) = 1 - p = q
4) Las pruebas son estadsticamente independientes,
En estas condiciones, la variable aleatoria X que cuenta el nmero de xitos en
las n pruebas se llama variable binomial. Evidentemente, el espacio muestral estar
compuesto por los nmeros enteros del 0 al n. Se suele decir que una variable
binmica cuenta objetos de un tipo determinado en un muestreo de n elementos
con reemplazamiento. La funcin de probabilidad de la variable binomial se
representa como b(x,n,p) siendo n el nmero de pruebas y p la probabilidad del
xito. n y p son los parmetros de la distribucin.

La manera ms fcil de calcular de valor de nmeros combinatorios, como los


incluidos en la expresin anterior, es utilizando el tringulo de Tartaglia

136

Ilustracin 12: Tringulo de Tartaglia

La media y la varianza de la variable binomial se calculan como:


Media = = n p
Varianza = 2 = n p q
Grficamente el aspecto de la distribucin depende de que sea o no simtrica Por
ejemplo, el caso en que n = 4:
Ilustracin 13: Grafico de
distribucin binomial.

18.5

DISTRIBUCIN EXPONENCIAL

137

La distribucin exponencial es el equivalente continuo de la distribucin


geomtrica discreta. Esta ley de distribucin describe procesos en los que:
Supngase que para cada valor t > 0, que representa el tiempo, el nmero de
sucesos de cierto fenmeno aleatorio sigue una distribucin de Poisson de
parmetro t. Entonces, los tiempos transcurridos entre dos sucesos sucesivos
sigue la distribucin exponencial.
Nos interesa saber el tiempo hasta que ocurre determinado evento,

sabiendo que,
el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello

ocurra en un instante tf, no depende del tiempo transcurrido anteriormente en


el que no ha pasado nada.

Ejemplos de este tipo de distribuciones son:

El tiempo que tarda una partcula radiactiva en desintegrarse. El


conocimiento de la ley que sigue este evento se utiliza en Ciencia para, por
ejemplo, la datacin de fsiles o cualquier materia orgnica mediante la
tcnica del carbono 14, C14;

El tiempo que puede transcurrir en un servicio de urgencias, para la llegada


de un paciente;

En un proceso de Poisson donde se repite sucesivamente un experimento a


intervalos de tiempo iguales, el tiempo que transcurre entre la ocurrencia de
dos sucesos consecutivos sigue un modelo probabilstico exponencial. Por
ejemplo, el tiempo que transcurre entre que sufrimos dos veces una herida
importante.

138

Concretando, si una v.a. continua X distribuida a lo largo de

, es tal que su

funcin de densidad es

Es un caso particular de la distribucin gamma cuando = 1. Su funcin de


densidad es:

Su parmetro es .
La media y la varianza de la distribucin exponencial son:

139

19. DISTRIBUCIN DE LA VARIABLE CONTINUA

En teora de la probabilidad una distribucin de probabilidad se llama continua si


su funcin de distribucin es continua. Puesto que la funcin de distribucin de
una variable aleatoria X viene dada por

, la definicin

implica que en una distribucin de probabilidad continua X se cumple P[X = a] = 0


para todo nmero real a, esto es, la probabilidad de que X tome el valora es cero
para cualquier valor de a. Si la distribucin de X es continua, se llama a X variable
aleatoria continua.

En las distribuciones de probabilidad continuas, la distribucin de probabilidad es


la integral de la funcin de densidad, por lo que tenemos entonces que:

Mientras

que

en

una distribucin

de

probabilidad

discreta un suceso con

probabilidad cero es imposible, no se da el caso en una variable aleatoria


continua. Por ejemplo, si se mide la anchura de una hoja de roble, el resultado 3,5
cm es posible, pero tiene probabilidad cero porque hay infinitos valores posibles
entre 3 cm y 4 cm. Cada uno de esos valores individuales tiene probabilidad cero,
aunque la probabilidad de ese intervalo no lo es. Esta aparente paradoja se
resuelve por el hecho de que la probabilidad de que X tome algn valor en un
conjunto infinito como un intervalo, no puede calcularse mediante la adicin simple
de probabilidades de valores individuales. Formalmente, cada valor tiene una
probabilidad infinitesimal que estadsticamente equivale a cero.
Existe una definicin alternativa ms rigurosa en la que el trmino "distribucin de
probabilidad continua" se reserva a distribuciones que tienen funcin de densidad
140

de probabilidad. Estas funciones se llaman, con ms precisin, variables


aleatorias absolutamente continuas (vase el Teorema de Radon-Nikodym). Para
una variable aleatoria X absolutamente continua es equivalente decir que la
probabilidad P[X = a] = 0 para todo nmero real a, en virtud de que hay un
incontables conjuntos de medida de Lebesgue cero (por ejemplo, el conjunto de
Cantor).
Una variable aleatoria con la distribucin de Cantor es continua de acuerdo con la
primera definicin, pero segn la segunda, no es absolutamente continua.
Tampoco es discreta, ni una media ponderada de variables discretas y
absolutamente continuas.

Para una variable continua hay infinitos valores posibles de la variable y entre
cada dos de ellos se pueden definir infinitos valores ms. En estas condiciones no
es posible deducir la probabilidad de un valor puntual de la variable; como se
puede hacer en el caso de variables discretas, pero es posible calcular la
probabilidad acumulada hasta un cierto valor (funcin de distribucin de
probabilidad), y se puede analizar cmo cambia la probabilidad acumulada en
cada punto (estos cambios no son probabilidades sino otro concepto: la funcin de
densidad.
En el caso de variable continua la distribucin de probabilidad es la integral de la
funcin de densidad, por lo que tenemos entonces que:

Sea

una variable continua, una distribucin de probabilidad o funcin de

densidad de probabilidad (FDP) de


cualesquiera dos nmeros

es una funcin

siendo

141

tal que, para

La grfica de
que

se conoce a veces como curva de densidad, la probabilidad de

tome un valor en el intervalo

es el rea bajo la curva de la funcin de

densidad; as, la funcin mide concentracin de probabilidad alrededor de los


valores de una variable aleatoria continua.

rea bajo la curva de

Para que

sea una FDP (

entre

) legtima, debe satisfacer las

siguientes dos condiciones:

1.

0 para toda .

2.
Ya que la probabilidad es siempre un nmero positivo, la FDP es una funcin no
decreciente que cumple:

1.

2.

. Es decir, la probabilidad de todo el espacio muestral es 1.

. Es decir, la probabilidad del suceso nulo es cero.

Algunas FDP estn declaradas en rangos de


normal.

142

, como la de la distribucin

En aplicaciones prcticas, las variables aleatorias a menudo ofrece una


distribucin discreta o absolutamente continua, aunque tambin aparezcan de
forma natural mezclas de los dos tipos.

Las distribuciones de probabilidad son idealizaciones de los polgonos de


frecuencias. En el caso de una variable estadstica continua consideramos el
histograma de frecuencias relativas, y se comprueba que al aumentar el nmero
de datos y el nmero de clases el histograma tiende a estabilizarse llegando a
convertirse su perfil en la grfica de una funcin.
Las distribuciones de probabilidad de variable continua se definen mediante una
funcin y=f(x) llamada funcin de probabilidad o funcin de densidad.
As como en el histograma la frecuencia viene dada por el rea, en la funcin de
densidad la probabilidad viene dada por el rea bajo la curva, por lo que:

El rea encerrada bajo la totalidad de la curva es 1.

Para obtener la probabilidad p(aXb) obtenemos la proporcin de rea


que hay bajo la curva desde a hasta b.

La probabilidad de sucesos puntuales es 0, p(X=a)=0

Las distribuciones de probabilidad de variable continua son idealizaciones de las


distribuciones estadsticas de variable continua. Estas se obtienen empricamente
(experimentando u observando). Aquellas son distribuciones tericas.
Las distribuciones de probabilidad de variable continua se definen por medio de
una funcin y = f(x) que se llama funcin de probabilidad o funcin de densidad.
Ha de ser f(x) 0 para todo x.

143

Las probabilidades vienen dadas por el rea bajo la curva. Por tanto, el rea
encerrada bajo la totalidad de la curva es 1. Es decir, tomamos como unidad el
rea bajo la curva completa. Para que f(x) sea la funcin de densidad o de
probabilidad de una variable aleatoria es necesario que:
- f(x) se no negativa para todo x
- El rea bajo la curva y = f(x) sea igual a 1

Para hallar la probabilidad P[a x b], obtendremos el rea que hay bajo la
curva en el intervalo [a,b]
Las probabilidades de sucesos puntuales son cero: P[x = a] = 0.
La media y la desviacin tpica tienen los mismos significados que en las
distribuciones estadsticas.
Ilustracin 14: distribucin probabilidad continua.

144

20. DISTRIBUCIN NORMAL

La campana de Gauss o curva normal es una funcin de probabilidad continua ,


simtrica, cuyo mximo coincide pues con la media u
Para cada valor de u (media) y cada valor de o (desviacin tpica) hay una curva
normal, que se denomina N (u, o)

20.1 DISTRIBUCIN NORMAL O DE GAUSS

La distribucin normal fue definida por De Moivre en 1733 y es la distribucin de


mayor importancia en el campo de la estadstica.
Una variable es normal cuando se ajusta a la ley de los grandes nmeros, es
decir, cuando sus valores son el resultado de medir reiteradamente una magnitud
sobre la que influyen infinitas causas de efecto infinitesimal.
Las variables normales tienen una funcin de densidad con forma de campana a
la que se llama campana de Gauss.
Su funcin de densidad es la siguiente:

Los parmetros de la distribucin son la media y la desviacin tpica, y ,


respectivamente. Como consecuencia, en una variable normal, media y desviacin

145

tpica no deben estar correlacionadas en ningn caso (como desgraciadamente


ocurre en la inmensa mayora de las variables aleatorias reales que se asemejan a
la normal.

La curva normal cumple las siguientes propiedades:


1) El mximo de la curva coincide con la media.
2) Es perfectamente simtrica respecto a la media (g 1 = 0).
3) La curva tiene dos puntos de inflexin situados a una desviacin tpica de la
media. Es convexa entre ambos puntos de inflexin y cncava en ambas
colas.

Ilustracin 15: Curva de poisson.

146

4) Sus colas son asintticas al eje X.


Ilustracin 16: Colas de eje.

Para calcular probabilidades en intervalos de valores de la variable, habra que


integrar la funcin de densidad entre los extremos del intervalo. por desgracia (o
por suerte), la funcin de densidad normal no tiene primitiva, es decir, no se puede
integrar. Por ello la nica solucin es referirse a tablas de la funcin de distribucin
de la variable (calculadas por integracin numrica) Estas tablas tendran que ser
de triple entrada (, , valor) y el asunto tendra una complejidad enorme.
Afortunadamente, cualquier que sea la variable normal, X, se puede establecer
una correspondencia de sus valores con los de otra variable con distribucin
normal, media 0 y varianza 1, a la que se llama variable normal tipificada o Z. La
equivalencia entre ambas variables se obtiene mediante la ecuacin:

147

La funcin de distribucin de la variable normal tipificada est tabulada y,


simplemente, consultando en las tablas se pueden calcular probabilidades en
cualquier intervalo que nos interese.
De forma anloga a lo pasaba con las variables Poisson, la suma de variables
normales independientes es otra normal.
Ilustracin 18: Histograma de una
variable normal.

Ilustracin 17: histograma normal.

Histograma de una normal idealizada

Histograma de una muestra de una


variable normal

En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o


distribucin gaussiana, a una de las distribuciones de probabilidad de variable
continua que con ms frecuencia aparece aproximada en fenmenos reales.[cita
requerida]

La grfica de su funcin de densidad tiene una forma acampanada y es simtrica


respecto de un determinado parmetro estadstico. Esta curva se conoce como
campana de Gauss y es el grfico de una funcin gaussiana. La importancia de

148

esta distribucin radica en que permite modelar numerosos fenmenos naturales,


sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte
de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse
asumiendo que cada observacin se obtiene como la suma de unas pocas causas
independientes. De hecho, la estadstica descriptiva slo permite describir un
fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el diseo
experimental, de ah que al uso de la estadstica en psicologa y sociologa sea
conocido como mtodo correlacional.

La distribucin normal tambin es importante por su relacin con la estimacin


por mnimos cuadrados, uno de los mtodos de estimacin ms simples y
antiguos. Algunos ejemplos de variables asociadas a fenmenos naturales que
siguen el modelo de la normal son:

caracteres morfolgicos de individuos como la estatura;

caracteres fisiolgicos como el efecto de un frmaco;

caracteres sociolgicos como el consumo de cierto producto por un mismo


grupo de individuos;

caracteres psicolgicos como el cociente intelectual;

nivel de ruido en telecomunicaciones;

errores cometidos al medir ciertas magnitudes;

etc.

149

La distribucin normal tambin aparece en muchas reas de la propia estadstica.


Por

ejemplo,

la distribucin

muestral de

las medias muestrales

es

aproximadamente normal, cuando la distribucin de la poblacin de la cual se


extrae la muestra no es normal.1 Adems, la distribucin normal maximiza la
entropa entre todas las distribuciones con media y varianza conocidas, lo cual la
convierte en la eleccin natural de la distribucin subyacente a una lista de datos
resumidos en trminos de media muestral y varianza.

La distribucin normal es la ms extendida en estadstica y muchos test


estadsticos estn basados en una supuesta "normalidad".
En probabilidad, la distribucin normal aparece como el lmite de varias
distribuciones de probabilidad, continuas y discretas.

20.1 EJEMPLOS

Ejemplo. -El consumo medio bimestral de energa elctrica en una ciudad es de


59 Kwh., con una desviacin tpica de 6 Kwh. Se supone que se distribuye segn
una distribucin normal. a) Cuntos Kwh. tendra que consumir bimestralmente
para pertenecer al 5% de la poblacin que ms consume?. b) Si usted consume
45 Kwh. qu % de la poblacin consume menos que usted?

a) Buscamos en la tabla el valor de la variable tipificada cuya probabilidad


acumulada es el 0,95 (95%), por lo que por arriba estara el 5% restante. Este
valor corresponde a t = 1,645. Ahora calculamos la variable normal X equivalente
a ese valor de la normal tipificada:

150

1,645 = (X -59)/6 X = 67,87


Por lo tanto, tendra usted que consumir ms de 67,87 Kwh. bimestralmente para
pertenecer al 5% de la poblacin que ms consume

b) Vamos a ver en que nivel de la poblacin se situara usted en funcin de los 45


Kwh. consumidos.
Calculamos el valor de la normal tipificada correspondiente a 45 Kwh.
t = (45 -59)/9 = -2.333
P (X 45) = P (t -2,333) = P (t > 2,333) = 1 - P (t 2,333) = 1 - 0,9901 = 0,0099
Luego, tan slo un 1,39% de la poblacin consume menos que usted.

Ejemplo. Una empresa instala en una ciudad 20.000 bombillas para su


iluminacin. La duracin de una bombilla sigue una distribucin normal con media
302 das y desviacin tpica 40 das. Calcular. a) Cuntas bombillas es de
esperar que se fundan antes de 365 das? Cuntas durarn ms de 400 das?
Explica razonadamente las respuestas.
a) Tipificamos el valor 365 t = (365 -302)/40 = 1,575
P (X 365) = P (t 1,575 ) = 0,9418
Luego el 94,18% de las lmparas, es decir 20.000 0.9418 = 18.836 bombillas se
fundirn antes de 365 das
b) Tipificamos el valor 400 t = (400-302)/40 = 2,45
P (X > 400) = P (t >2,45 ) = 1- P (t 2,45 ) = 1 - 0,9929 = 0,0071

151

Entonces el 0,71% de las lmparas, es decir 20.000 0.0071 = 142 bombillas


durarn ms de 400 das.

152

CONCLUSIONES
Una distribucin de frecuencia es una tabla de resumen en la que los datos se
disponen en agrupamientos o categoras convenientemente establecidas de
clases ordenadas numricamente.
En esta forma las caractersticas ms importantes de los datos se aproximan muy
fcilmente, compensando as el hecho de que cuando los datos se agrupan de ese
modo, la informacin inicial referente a las observaciones individuales de que
antes se dispona se pierde a travs del proceso de agrupamiento o
condensacin.
La principal ventaja de usar una de estas tablas de resumen es que las principales
caractersticas de los datos se hacen evidentes inmediatamente para el lector.
La principal desventaja de tal tabla de resumen es que no podemos saber cmo
se distribuyen los valores individuales dentro de un intervalo de clase particular sin
tener acceso a los datos originales. El punto medio de la clase, sin embargo, es el
valor usado para representar todos los datos resumidos en un intervalo particular.
El punto medio de una clase (o marca de clase) es el punto a la mitad de los
lmites de cada clase y es representativo de los datos de esa clase.
La probabilidad es la posibilidad u oportunidad de que suceda un evento particular.
La probabilidad involucrada es una porcin o fraccin cuyo valor vara entre cero y
uno exclusivamente. Observamos un evento que no tiene posibilidad de ocurrir (es
decir, el evento nulo), tiene una probabilidad de cero, mientras que un evento que
seguramente ocurrir (es decir, el evento cierto), tiene una probabilidad de uno.
153

La regla ms evidente para las probabilidades es que deben variar en valor de 0 a


1. Un evento imposible tiene una probabilidad cero de ocurrir, y un evento cierto
tiene una probabilidad uno de ocurrir. La probabilidad simple se refiere a la
probabilidad de ocurrencia de un evento simple.
Una distribucin de probabilidad para una variable aleatoria discreta es un listado
mutuamente excluyente de todos los resultados posibles para esa variable
aleatoria, tal que una probabilidad particular de ocurrencia est asociada con cada
resultado.

154

CIBERGRAFIA

http://www.monografias.com/trabajos20/estadistica/estadistica.shtml#conclu#ixzz3FF5Gz
Ru

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal

http://www.monografias.com/trabajos89/estadistica-clasificacion/estadisticaclasificacion.shtml

http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo3/B0C3m1t6.htm

http://www.bioestadistica.uma.es/libro/node73.htm

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial

http://www.itch.edu.mx/academic/industrial/sabaticorita/_private/05Probabilidad
%20condicional.htm

http://www.aulafacil.com/CursoEstadistica/Lecc-23-est.htm

http://es.slideshare.net/matematrix5/teoremas-de-probabilidad

155

Anda mungkin juga menyukai