CONTENIDO
Pg.
INTRODUCCIN.......................................................................................................9
1. OBJETIVOS......................................................................................................10
1.1 OBJETIVO GENERAL......................................................................................10
2.2 OBJETIVOS ESPECFICOS.............................................................................10
1.2 ESTADSTICA INDUCTIVA Y DESCRIPTIVA..................................................12
1.2.1 Estadstica inductiva....................................................................................12
12.2 Estadstica descriptiva..................................................................................13
1.3 ESTADSTICA DESCRIPTIVA E INFERENCIAL.............................................15
1.3.1 Anlisis estadstico......................................................................................17
1.3.2 Datos y variables..........................................................................................17
2. CLASIFICACIN DE VARIABLES.....................................................................19
2.1 Variables independientes...............................................................................19
2.2 Variables dependientes...................................................................................19
2.3 Variable contina.............................................................................................20
2.4 Variable discreta..............................................................................................21
2.5 Variable dicotmica o binaria.........................................................................21
5. MEDIA ARITMTICA..........................................................................................39
6. MEDIANA............................................................................................................41
6.1 Datos sin agrupar............................................................................................41
6.2 Datos agrupados.............................................................................................42
7. MODA..................................................................................................................43
POBLACIN (N).........................................................................................68
11.3. MUESTREO..................................................................................................71
11.3.1. Tipos de Muestreo.....................................................................................72
11.4. ESPACIO MUESTRAL.................................................................................73
11.6 DISCRETOS.................................................................................................80
11.6.1 Espacio probabilstico discreto................................................................81
11.6.2 Espacio probabilstico discreto equiprobable........................................81
11.6.3 Espacio probabilstico finito......................................................................81
11.6.4 Procesos estocsticos finitos y diagramas de rbol..............................81
11.6.5 Espacio probabilstico infinito contable..................................................82
11.7 continuos........................................................................................................82
11.8
EVENTOS ALEATORIOS.............................................................................84
13.1
HIPERGEOMETRIA.................................................................................123
17.4 propiedades.................................................................................................125
18. POISSON.........................................................................................................127
18.1 PROPIEDADES.............................................................................................128
18.2
DISTRIBUCIN EXPONENCIAL............................................................133
CONCLUSIONES..................................................................................................147
CIBERGRAFIA......................................................................................................149
LISTA DE ILUSTRACIONES
Pg.
Ilustracin 1: Distribucin de frecuencias.................................................................26
Ilustracin 2: Distribucin de frecuencias agrpales...................................................27
Ilustracin 3: histograma........................................................................................ 31
Ilustracin 4:Poligono de frecuencia absoluta...........................................................32
Ilustracin 5: Polgono de frecuencias agrupados.....................................................33
Ilustracin 6: Polgono de frecuencias acumuladas....................................................34
Ilustracin 7: Moda de datos agrupados...................................................................45
Ilustracin 8: Cuadro de covarianza........................................................................62
Ilustracin 9: grafic de poblacin...........................................................................69
Ilustracin 10: Probabilidad condicional.................................................................112
Ilustracin 11:Diagrama de poisson.......................................................................128
Ilustracin 12: Tringulo de Tartaglia.....................................................................132
Ilustracin 13: Grafico de distribucin binomial.......................................................133
Ilustracin 14: distribucin probabilidad continua.....................................................139
Ilustracin 15: Curva de poisson...........................................................................141
Ilustracin 16: Colas de eje..................................................................................142
Ilustracin 17: histograma normal.........................................................................143
Ilustracin 18: Histograma de una variable normal..................................................143
INTRODUCCIN
1. OBJETIVOS
Estar en la capacidad de obtener a partir de los datos de la empresa muestras sobre diferentes
productos para as representar, analizar e interpretar datos en cuadros estadsticos al igual
graficar e interpretar un determinado producto que requiera una medicin de calidad y aplicar y
calcular diferentes medidas en el proceso de una investigacin de los datos estadsticos de los
productos que realiza la empresa Sara lee S.A.S.
Utilizar adecuadamente smbolos y palabras del lenguaje estadstico para aplicar procesos
matemticos bsicos en clculos estadsticos.
10
1. ESTADSTICA
11
12
13
Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
nmero de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr
ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por
ejemplo, la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.
14
Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que
porten informacin sobre el fenmeno que se estudia. Por ejemplo, si estudiamos
el precio de la vivienda en una ciudad, la poblacin ser el total de las viviendas
de dicha ciudad.
15
16
de la
17
mayor atencin el tipo de valores que pueden tomar las variables puesto que de
ello depende el tipo de anlisis estadstico que se realizar con posterioridad. La
forma de clasificar a las variables en este caso tiene que ver con considerar los
valores que pueden tomar, as pues, en el ejemplo anterior resulta claro que al
interrogar a alguna persona, la respuesta que obtenemos tiene que ver con una
expresin tal como: negros, caf, azules, etc.
Consideremos ahora otro ejemplo supongamos que se pregunta ahora acerca del
grado de satisfaccin que tienen los clientes de un determinado banco, se obtiene
como resultado expresiones como: muy satisfecho, satisfecho y poco satisfecho.
Tambin se podran usar otros smbolos que estuvieran asociados a los resultados
anteriores como: MS, S y PS; o 3, 2 y 1. Es pertinente sealar que estos ltimos
valores no seran considerados como nmeros sino como sustitutos de las
categoras utilizadas para denotar el grado de satisfaccin.
Note que en ambos ejemplos las respuestas son expresiones, sin embargo en
este ltimo es posible percibir que las respuestas tienen un orden, puesto que si
alguien responde satisfecho es posible saber que tiene un mayor grado de
satisfaccin que quien responde poco satisfecho y menor que quien responde muy
satisfecho. En el primero ejemplo no es as, ya que no resulta posible decidir que
el color de ojos caf es mejor o peor que negros o cualquiera de los otros colores
que hayan sido la respuesta de las personas. Ahora bien, revisemos otro tipo de
variables. Si a una persona se le pregunta acerca del nmero de hermanos que
tiene, se puede apreciar que los valores que se obtendrn como respuesta sern
nmeros, iniciando desde el cero y los primeros nmeros naturales (1, 2, 3, 4, 5, 6,
7, 8, 9,...), as se puede clasificar a las personas de acuerdo al nmero de
hermanos que tengan.
18
2. CLASIFICACIN DE VARIABLES
Son las caractersticas en las que difieren los objetos de estudio (sexo, edad, etc.)
(En estudios de encuesta y en estudios observacionales) mientras que en estudios
experimentales son las diferentes condiciones a las que exponemos a los objetos
de estudio. Tambin se les llama variables explicativas o productoras.
b) Clasificacin de las variables por los valores que pueden tomar. La clasificacin
de las escalas de medida no siempre deja las cosas claras, por eso
19
Variables
cualitativas:
representan
una
cualidad
atributo
no
medible
Es una variable cuantitativa que por su naturaleza puede adoptar cualquier valor
numrico (dentro de un intervalo). Para todo par de valores siempre se puede
encontrar un valor intermedio, la precisin la da el instrumento de medida. (peso,
estatura..). Son aquellas que pueden tomar cualquier valor dentro de un rango
determinado. Por ejemplo, los ingresos procedentes del trabajo que recibe una
persona.
20
Es aquella que slo puede tomar dos valores. Por ejemplo Sexo, tener o no una
enfermedad. Si a sus valores se les pone 0 y 1 se le llama binaria.
21
22
Los grficos estadsticos son muy tiles para comparar distintas tablas de
frecuencia. Los grficos estadsticos ms usuales son:
24
3. DISTRIBUCIN DE FRECUENCIAS
25
Generalmente las tablas incluyen varas columnas con las frecuencias relativas
(son el nmero de ocurrencias dividido por el total de datos, y se simbolizan "fr" o
"pi"), frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias
de los valores iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No
obstante la frecuencia acumulada tambin es definida incluyendo al valor de
referencia), frecuencias acumuladas relativas (la frecuencia acumulada relativa es
el total de frecuencias relativas de los valores iguales o inferiores al de referencia,
y se simbolizan "fr" o "pa")
26
27
Intervalo: cada uno de los grupos de valores de la variable que ocupan una fila
en una distribucin de frecuencias
Lmites aparentes: valores mayor y menor del intervalo que son observados en la
tabla. Dependen de la precisin del instrumento de medida. En el ejemplo, los
lmites aparentes del intervalo con mayor nmero de frecuencias son 34 y 39.
28
Lmites exactos: valores mximo y mnimo del intervalo que podran medirse si
se contara con un instrumento de precisin perfecta. En el intervalo 34-39, estos
lmites son 33.5 y 39.5
Punto medio del intervalo (mco marca de clase): suma de los lmites divididos por
dos. Mc del intervalo del ejemplo= 36.5
Amplitud del intervalo: diferencia entre el lmite exacto superior y el lmite exacto
inferior. En el ejemplo es igual a 6.
que requiere si antes no se tratan. Los datos sin tratar se les debe sintetizar o
resumir de manera que sea posible interpretarlos, entenderlos y utilizarlos. La
manera de organizar los datos es mediante tablas de distribucin de frecuencias.
Histogramas
Polgonos de frecuencia
Ojivas
Grficas de pie
Diagramas de Pareto
Grficas de series
Scatter plot (diagrama de puntajes)
Diagramas de relaciones entre variables
30
4. HISTOGRAMA
Los datos de una variable numrica, resumidos en tablas, tienen una expresin
grfica que ayuda a su interpretacin visual. Esta representacin se denomina
histograma. Un histograma est formado por una sucesin de rectngulos
contiguos construidos sobre una recta. La base de cada rectngulo representa la
amplitud del intervalo y la altura est determinada por la frecuencia, de acuerdo a
la siguiente: Regla Bsica. Cada observacin representada en un histograma
ocupa un rectngulo de igual rea y de base dada por el ancho del intervalo
correspondiente. Para cada intervalo, el rectngulo que representa su frecuencia,
puede
imaginarse
formado
por
un
'apilamiento'
de
los
rectngulos
A modo de ejemplo, si un intervalo tiene el doble ancho que otro, cada una de sus
observaciones estar representada por un 'rectangulito' de la mitad de la altura
que los datos del otro intervalo. Como consecuencia del distinto tamao de los
31
Ilustracin 3: histograma.
Los polgonos de frecuencias se realizan trazando los puntos que representan las
frecuencias y unindolos mediante segmentos. Tambin se puede realizar
trazando los puntos que representan las frecuencias y unindolos mediante
segmentos.
32
Ejemplo
Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes
variaciones:
33
Ejemplo
El peso de 65 personas adultas viene dado por la siguiente tabla:
ci
fi
Fi
[50, 60)
55
[60, 70)
65
10
18
[70, 80)
75
16
34
[80, 90)
85
14
48
[90, 100)
95
10
58
[100, 110)
110
63
[110, 120)
115
65
65
34
35
Aunque estas curvas puedan ser generadas fcilmente por ordenadores y algunas
calculadoras de escritorio, el conocimiento que est implicado en su construccin,
36
Son grficos representados por una sola lnea curva (el polgono de frecuencia
est conformado por varias lneas rectas consecutivas).
Medidas de posicin. Una vez ordenados los datos de menor a mayor ser
necesario identificar la posicin de los valores.
37
Los fenmenos que se observan sometidos al azar no suelen ser constantes, por
lo que ser necesario que junto a una medida que indique el valor alrededor del
cual se agrupan los datos, se disponga de una medida que haga referencia a la
variabilidad que refleje dicha fluctuacin. En este sentido pueden examinarse
varias caractersticas, siendo las ms comunes: la tendencia central de los datos,
la dispersin o variacin con respecto a este centro, los datos que ocupan ciertas
posiciones, la simetra de los datos y la forma en la que los datos se agrupan.
4.4.
38
En otras palabras, para que una calificacin tenga significado hay que contar con
elementos de referencia generalmente relacionados con ciertos criterios
estadsticos. Las medidas de tendencia central (media, mediana y moda) sirven
como puntos de referencia para interpretar las calificaciones que se obtienen en
una prueba. Volviendo a nuestro ejemplo, digamos que la calificacin promedio en
la prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que
la calificacin del alumno se ubica notablemente sobre el promedio. Pero si la
calificacin promedio fue de 65 puntos, entonces la conclusin sera muy
diferente, debido a que se ubicara muy por debajo del promedio de la clase.
superior.
La mediana: la cual es el puntaje que se ubica en el centro de una distribucin.
Se representa como Md.
39
40
5. MEDIA ARITMTICA
41
Una de las limitaciones de la media aritmtica es que se trata de una medida muy
sensible a los valores extremos; valores muy grandes tienden a aumentarla
mientras que valores muy pequeos tienden a reducirla, lo que implica que puede
dejar de ser representativa de la poblacin.
42
6. MEDIANA
a) Si n es impar, la mediana es el valor que ocupa la posicin (n+1)/2 una vez que
los datos han sido ordenados (en orden creciente o decreciente), porque ste es el
valor central. Es decir: M_e=x_{(n+1)/2}.
Por ejemplo, si tenemos 5 datos, que ordenados son: x_1 = 3, x_2 = 6, x_3 = 7,
x_4 = 8, x_5 = 9 => El valor central es el tercero: x_{(5+1)/2} = x_3 = 7. Este valor,
43
que es la mediana de ese conjunto de datos, deja dos datos por debajo (x_1, x_2)
y otros dos por encima de l (x_4, x_5)
b) Si n es par, la mediana es la media aritmtica de los dos valores centrales.
Cuando n es par, los dos datos que estn en el centro de la muestra ocupan las
posiciones n/2 y n/2+1. Es decir: M_e = (x_{\frac{n}{2}} + x_{{\frac{n}{2}}+1})/2.
y
1} = x_4 = 8.
Por tanto, la mediana de este grupo de datos es la media aritmtica de estos dos
datos:
Al tratar con datos agrupados, si {{\frac {n} {2}}} coincide con el valor de una
frecuencia acumulada, el valor de la mediana coincidir con la abscisa
correspondiente. Si no coincide con el valor de ninguna abscisa, se calcula a
travs de semejanza de tringulos en el histograma o polgono de frecuencias
acumuladas, utilizando la siguiente equivalencia:
44
7. MODA
La moda es el valor que aparece con mayor frecuencia dentro de una muestra.
Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.
45
46
Dnde:
=
7.1.1 Propiedades
Clculo sencillo.
Interpretacin muy clara.
Al depender slo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una
poblacin no es posible realizar otros clculos, por ejemplo, cuando se
enumeran en medios periodsticos las caractersticas ms frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato robot".
47
7.1.2 Inconvenientes
amplitud.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los
presenten
la
misma
frecuencia
multimodales).
7.2 EJEMPLO
48
(distribuciones
bimodales
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos
Decil se refiere a cada uno de los 9 valores que dividen un grupo de datos
(clasificados con una relacin de orden) en diez partes iguales, y de manera que
cada parte representa un dcimo de la poblacin.
El percentil es una medida no central usada en estadstica que indica, una vez
ordenados los datos de menor a mayor, el valor de la variable por debajo del cual
se encuentra un porcentaje dado de observaciones en un grupo de observaciones.
Por ejemplo, el percentil 20 es el valor debajo del cual se encuentran el 20 por
ciento de las observaciones
49
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.
Calcula Q1, Q2
275,
180,
325,
260, 290, 370.
y Q3 de
200,
250,
los salarios
350,
260,
de 15 personas:
280,
310,
400,
300,
380,
50
Dnde:
Lk = Lmite real inferior de la clase del cuartil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente, mediante otra frmula se tiene lo
siguiente:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los
datos; es decir, aquel valor de la variable que supera 25% de las observaciones y
es superado por el 75% de las observaciones.
Frmula de Q1, para series de Datos agrupados:
Dnde:
L1 = lmite inferior de la clase que lo contiene
P = valor que representa la posicin de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
51
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los
datos, es decir aquel valor de la variable que supera al 75% y es superado por el
25% de las observaciones.
Frmula de Q3, para series de Datos agrupados:
Dnde:
L1 = lmite inferior de la clase que lo contiene
P = valor que representa la posicin de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.
Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las
siguientes frmulas:
- El primer cuartil:
Cuando n es par:
52
Cuando n es impar:
Cuando n es impar:
9.2 CUARTILES
9.3 PERCENTILES
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99%
de los datos.
53
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de
ubicacin o clasificacin de las personas cuando atienden caractersticas tales
como peso, estatura, etc. Los percentiles son ciertos nmeros que dividen la
sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son
los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.
Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99. Datos
Agrupados Cuando los datos estn agrupados en una tabla de frecuencias, se
calculan mediante la frmula:
= 1, 2,3,... 99
Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
54
Las medias de tendencia central o posicin nos indican donde se sita un dato
dentro de una distribucin de datos. Las medidas de dispersin, variabilidad o
variacin nos indican si esos datos estn prximos entre s o s estn dispersos,
es decir, nos indican cun esparcidos se encuentran los datos. Estas medidas de
dispersin nos permiten apreciar la distancia que existe entre los datos a un cierto
valor central e identificar la concentracin de los mismos en un cierto sector de la
distribucin, es decir, permiten estimar cun dispersas estn dos o ms
distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un
conjunto de datos, siendo la media aritmtica el dato central ms utilizado. Cuando
existe una dispersin pequea se dice que los datos estn dispersos o
acumulados cercanamente respecto a un valor central, en este caso el dato
central es un valor muy representativo. En el caso que la dispersin sea grande el
55
valor central no es muy confiable. Cuando una distribucin de datos tiene poca
dispersin toma el nombre de distribucin homognea y si su dispersin es alta se
llama heterognea.
10.1 RANGO
Ejemplo
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus
valores se encuentran en un rango de:
Rango = (9-4) = 5
Medio rango o Rango medio
56
Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato
de mayor valor Max= 8. El medio rango resolvindolo mediante la correspondiente
frmula sera:
57
10.2.2 ejemplos
Para una serie de datos de carcter cuantitativo como es la estatura tal y como:
x1 = 185,x2 = 165,x3 = 170,x4 = 182,x5 = 155
Es posible ordenar los datos como sigue:
x(1) =155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185
Donde la notacin x(i) indica que se trata del elemento i-simo de la serie de
datos. De este modo, el rango sera la diferencia entre el valor mximo (k) y el
mnimo; o, lo que es lo mismo:
R = x(k) x(1)
10.3 VARIANZA
10.3.1 Propiedades
Debido a que la variancia se define en trminos del valor esperado, tambin ella
posee propiedades, algunas de las cuales se presentan a continuacin.
Sean a y b dos constantes cualesquiera y sea X una variable aleatoria.
Entonces:
1.
2.
Var (a) = 0
3.
4.
5.
Las propiedades de la desviacin estndar son las mismas que las de la variancia
y lo nico que se debe hacer es tomar la raz cuadrada de los valores de la
variancia.
59
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una
tiene una media de 7. Sus desviaciones estndar muestrales son 7, 5 y 1
respectivamente. La tercera muestra tiene una desviacin mucho menor que las
otras dos porque sus valores estn ms cerca de 7.
La
desviacin
estndar puede
ser
interpretada
como
una
medida
de
las medidas contradicen la teora. Esto es coherente, ya que las mediciones caen
fuera del rango de valores en el cual sera razonable esperar que ocurrieran si el
modelo terico fuera correcto. La desviacin estndar es uno de tres parmetros
de ubicacin central; muestra la agrupacin de los datos alrededor de un valor
central (la media o promedio).
61
Cuando los casos tomados son iguales al total de la poblacin se aplica la frmula
de desviacin estndar poblacional. As la varianza es la media de los cuadrados
de las diferencias entre cada valor de la variable y la media aritmtica de la
distribucin.
10.4.3 Ejemplo
El gerente de una empresa de alimentos desea saber que tanto varan los pesos
de los empaques (en gramos), de uno de sus productos; por lo que opta por
seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los
siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:
62
10.4.4 Covarianza
Una medida del grado en que dos variables aleatorias se mueven en la misma
direccin o en direcciones opuestas la una respecto a la otra. En otras palabras, si
dos variables aleatorias generalmente se mueven en la misma direccin se dir
que tienen una covarianza positiva. Si tienden a moverse en direcciones opuestas,
se dir que tienen una covarianza negativa. La covarianza se mide como el valor
que se espera de los productos de las desviaciones de dos variables aleatorias
respecto a sus correspondientes medias. Una varianza es un caso especial de
covarianza. En probabilidad y estadstica,
La covarianza es un valor que indica el grado de variacin conjunta de dos
variables aleatorias. Es el dato bsico para determinar si existe una dependencia
entre ambas variables y adems es el dato necesario para estimar otros
63
64
65
10.4.5 Propiedades
u= a+bx
v = c + dy
Suv = b.d.Sxy
66
67
que
se
conocen
todos
los
resultados
posibles,
bajo
condiciones
68
69
70
POBLACIN (N)
necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra
estadstica.
72
"Se llama muestra a una parte de la poblacin a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
"Una muestra es una coleccin de algunos elementos de la poblacin, pero no de
todos". Levin & Rubin (1996).
73
11.3. MUESTREO
Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean
extrapolables a la poblacin. Este proceso permite ahorrar recursos, y a la vez
obtener resultados parecidos a los que se alcanzaran si se realizase un estudio
de toda la poblacin.
Al tomar varias muestras de una poblacin, las estadsticas que calculamos para
cada muestra no necesariamente seran iguales, y lo ms probable es que
variaran de una muestra a otra.
74
75
los
Sea A. el conjunto de las partes de, es decir, el conjunto de todos los subconjuntos
de . En principio, cualquier elemento de A, es decir, cualquier subconjunto del
espacio muestral contendr una cierta incertidumbre, por lo que trataremos de
asignarle un nmero entre 0 y 1 como medida de su incertidumbre. En Clculo de
Probabilidades dichos subconjuntos reciben en el nombre de sucesos, siendo la
medida de la incertidumbre su probabilidad. La tripleta (,A,P) recibe el nombre de
espacio probabilstico. Por tanto, asociado a todo experimento aleatorio existen
tres conjuntos: El espacio muestral, la clase de los sucesos, es decir, el conjunto
de elementos con incertidumbre asociados al experimento aleatorio A, y una
76
funcin real, P:A [0, l], la cual asignar a cada suceso (elemento de A) un nmero
entre cero y uno como medida de su incertidumbre.
Se advierte no obstante, que la eleccin del espacio muestral asociado a un
experimento aleatorio no tiene por qu ser nica, sino que depender de que
sucesos elementales que se quieran considerar como distintos y del problema de
la asignacin de la probabilidad sobre esos sucesos elementales. Respecto a la
clase de los sucesos A, es natural que sta tenga una estructura tal que permita
hablar no solo de sucesos sino tambin de su unin, interseccin, diferencia,
complementario, etc., debiendo ser la clase A, en consecuencia, cerrada a dichas
operaciones entre "conjuntos" (entre sucesos). Esta es la situacin del conjunto de
las partes cuando es finito o inclusive numerable (caso, por ejemplo, del espacio
muestral asociado al experimento aleatorio consistente en lanzar una moneda
hasta que salga cara por primera vez). En otras ocasiones en las que sea un
conjunto continuo (por ejemplo, cuando estudiamos el tiempo que tarda un istopo
radioactiva en volverse inestable), deber ser A un conjunto estrictamente ms
pequeo que el conjunto de las partes de . En todo caso se puede pensar en A
como en el conjunto que contiene todos los elementos de inters, es decir, todos
los sucesos a los que les corresponde una probabilidad.
77
Obsrvese que este conjunto contiene los sucesos sobre los que habitualmente se
tiene incertidumbre, como por ejemplo que salga un nmero par, {2,4,6}, o un
nmero mayor que cuatro, {5,6}, o simplemente que salga un seis, {6}, y que como
se ve es cerrado respecto de las operaciones entre conjuntos.
78
ASIGNACIN DE PROBABILIDADES:
Concepto frecuentista Es un hecho, empricamente comprobado, que la
frecuencia relativa de un suceso tiende a estabilizarse cuando la frecuencia total
aumenta.
Surge as el concepto frecuentista de la probabilidad de un suceso como un
nmero ideal al que converge su frecuencia relativa cuando la frecuencia total
tiende a infinito. As, solemos afirmar que la probabilidad de que salga un seis al
tirar un dado es 1/6 porque al hacer un gran nmero de tiradas su frecuencia
relativa es aproximadamente esa. El problema radica en que al no poder repetir la
experiencia infinitas veces, la probabilidad de un suceso ha de ser aproximada por
su frecuencia relativa para un n suficientemente grande, y cun grande es un n
grande?. 0, qu hacer con aquellas experiencias que solo se pueden repetir una
vez?
EVENTOS
Un evento es un subconjunto de un espacio muestral .
Experimento aleatorio: conjunto de pruebas cuyos resultados estn determinados
nicamente por el azar. Es toda actividad cuyos resultados no se determinan con
certeza. Ejemplo: lanzar una moneda al aire. No podemos determinar con toda
certeza cul ser el resultado al lanzar una moneda al aire?, por lo tanto
constituye un experimento aleatorio. Espacio muestral: conjunto de todos los
resultados posibles de un experimento aleatorio Es un conjunto de todos los
resultados posibles que se pueden obtener al realizar un experimento aleatorio.
Ejemplo: sea el experimento E: lanzar un dado y el espacio muestral
correspondiente a este experimento es: S = (1, 2, 3, 4, 5, 6(.
79
80
82
11.6
DISCRETOS
83
Por ejemplo, imaginemos que se lanza una moneda y un dado de seis caras. La
probabilidad de obtener un resultado particular corresponde a la multiplicacin de
sus probabilidades. Es decir, la probabilidad de obtener cara y un tres ser:
84
>
11.7 CONTINUOS
85
tal que:
1.
2.
3.
Ejemplos
Por ejemplo, en el caso del experimento aleatorio "lanzar un dado", el espacio
muestral del experimento sera: ={1,2,3,4,5,6}. Por otro lado, si cambiamos
ligeramente la experiencia pensando en el nmero resultante de la suma de 2
dados, entonces tenemos 2 posibles espacios muestrales para modelar
nuestra realidad:
={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),...(6,6)} = {1,2,3,4,5,6}x{1,2,3,4,5,6}
86
'={2,3,4,...,12}
11.8
EVENTOS ALEATORIOS
87
Espacios mustrales
Espacio maestral: se le llama al conjunto de todos los posibles resultados
individuales de un experimento aleatorio.
Sus elementos se representan por letras minsculas (w1, w2,...) y se denominan
eventos o sucesos elementales. Los subconjuntos de se designan por medio de
letras maysculas (A, B, C, D,...) y se denominan eventos o sucesos. Los sucesos
representan los posibles resultados del experimento aleatorio.
Un experimento en Estadstica es
resultados posibles, pero
ocurrir.
Un
experimento
sin
que
que
en donde
podamos
tiene
las
se
pueden
obtener varios
caractersticas
es
2.
3.
Ejemplos
defectos. El
nmero
de
defectos
inspeccionado es registrado.
89
encontrado
en
cada
refrigerador
Es toda aquella situacin que debe llevarse a cabo para saber cual es el resultado.
Un experimento se dice aleatorio si verifica las siguientes condiciones:
91
* La tcnica de la multiplicacin
* La tcnica aditiva
* La tcnica de la suma o Adicin
* La tcnica de la permutacin
* La tcnica de la combinacin.
Ejemplo:
De cuntas maneras pueden repartirse 3 premios a un conjunto de 10 personas,
suponiendo que cada persona no puede obtener ms de un premio?
Aplicando el principio fundamental del conteo, tenemos 10 personas que pueden
recibir el primer
92
Premio. Una vez que ste ha sido entregado, restan 9 personas para recibir el
segundo, y
Posteriormente quedarn 8 personas para el tercer premio. De ah que el nmero
de maneras distintas de repartir los tres premios.
n
10 x 9 x 8 = 720
26 x 25 x 10 x 9 x 8 = 468000
Si, sin embargo, hay un gran nmero de posibles resultados tales como el nmero
de nios y nias por familias con cinco hijos, sera tedioso listar y contar todas las
posibilidades. Las posibilidades seran, 5 nios, 4 nios y 1 nia, 3 nios y 2 nias,
2 nios y 3 nias, etc.
Para facilitar el conteo examinaremos tres tcnicas:
* La tcnica de la multiplicacin
* La tcnica aditiva
* La tcnica de la suma o Adicin
* La tcnica de la permutacin
* La tcnica de la combinacin.
Si se desea realizar una actividad que consta de r pasos, en donde el primer paso
de la actividad a realizar puede ser llevado a cabo de N1 maneras o formas, el
segundo paso de N2 maneras o formas y el r-simo paso de Nr maneras o formas,
entonces esta actividad puede ser llevada a efecto de. El principio multiplicativo
implica que cada uno de los pasos de la actividad deben ser llevados a efecto, uno
tras otro. Si un evento E1 puede suceder de n1 maneras diferentes, el evento E2
puede ocurrir de n2 maneras diferentes, y as sucesivamente hasta el evento Ep el
cual puede ocurrir de np maneras diferentes, entonces el total de maneras
94
Si se desea llevar a efecto una actividad, la cual tiene formas alternativas para ser
realizada, donde la primera de esas alternativas puede ser realizada de M
maneras o formas, la segunda alternativa puede realizarse de N maneras o formas
..... y la ltima de las alternativas puede ser realizada de W maneras o formas,
entonces esa actividad puede ser llevada a cabo de,
M + N +.........+ W maneras o formas
Ejemplos:
1)
Una persona desea comprar una lavadora de ropa, para lo cul ha pensado
que puede seleccionar de entre las marcas Whirpool, Easy y General Electric,
cuando acude a hacer la compra se encuentra que la lavadora de la marca W se
presenta en dos tipos de carga ( 8 u 11 kilogramos), en cuatro colores diferentes y
95
Solucin:
M = Nmero de maneras de seleccionar una lavadora Whirpool
N = Nmero de maneras de seleccionar una lavadora de la marca Easy
W = Nmero de maneras de seleccionar una lavadora de la marca General
Electric.
M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras
M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora
96
P(A)=4/52=1/3 y P(B)=1/13
Ejemplo:
Una pareja que se tiene que casar, junta dinero para el enganche de su casa, en
el fraccionamiento lomas de la presa le ofrecen un modelo econmico un
97
PRESA
PLAYAS
Econmico
Residencial
Condominio
Californiano
Provenzal
m=2
n=3
2+3= 5 maneras
98
n=3
99
12.4 PERMUTACIONES
100
12.5 COMBINACIONES
101
102
r! (n r )! 3! (7 3)! 3! 4!
Los axiomas de probabilidad son las condiciones mnimas que deben verificarse
para que una funcin definida sobre un conjunto de sucesos determine
consistentemente sus probabilidades. Fueron formulados por Kolmogrov en
1933.
Dado un conjunto de sucesos elementales, , sobre el que se ha definida una lgebra (lase sigma-lgebra) de subconjuntos de y una funcin P que asigna
valores reales a los miembros de , a los que denominamos "sucesos", se dice
que P es una probabilidad sobre (,) si se cumplen los siguientes tres axiomas.
103
Primer axioma
La probabilidad de un suceso
Segundo axioma
La probabilidad del total,
, es igual a 1, es decir,
Tenemos un resultado de x1
Tercer axioma
Si
son sucesos mutuamente excluyentes (incompatibles dos a
dos, disjuntos o de interseccin vaca dos a dos), entonces:
104
"espacio de sucesos" (el espacio muestral) en el que se han definido los posibles
sucesos a considerar (la -lgebra) y la probabilidad de cada suceso (la funcin
de probabilidad).
105
20 000
13.1
imposible
2. Para cualquier suceso
3.
4. Si
entonces
5.
Ejemplos:
Como ejemplo se puede tomar como espacio muestral a los posibles resultados al
arrojar un dado corriente
) y como
funcin de probabilidad
Donde
Es fcil comprobar que esta funcin verifica los tres axiomas de Kolmogrovy, por
tanto, constituye una probabilidad sobre este conjunto.
1.
106
2.
3. Si
Con lo que
107
Teorema de la Probabilidad Total (I) Ejemplo: De una urna en la que hay 3 bolas
blancas y 5 rojas, se extraen sucesivamente dos bolas devolviendo la primera bola
extrada. Calcula la probabilidad de que las dos bolas sean del mismo color. Urna
3/8 5/8 1 1B Sistema completo de sucesos R 3/8 5/8 3/8 5/8 2 2 2R 2R B B
p(bolas de igual color) = p(las dos sean blancas o las dos rojas) = p((1By2B) o (1R
y 2R)) = p((1B2B) (1R 2R)) = 3 3 5 5 34 = p(1B2B) + p(1R 2R) = p(1B) .
p(2B) + p(1R) . p(2R) = + = 8 8 8 8 64
Teorema de la Probabilidad Total (II) Ejemplo: De una urna en la que hay 3 bolas
blancas y 5 rojas, se extraen sucesivamente dos bolas no devolviendo la primera
bola extrada. Calcula la probabilidad de que las dos bolas sean del mismo color.
Urna 3/8 5/8 1 1B Sistema completo de sucesos R 2/7 5/7 3/7 4/7 2 2 2R 2R B B
p(bolas de igual color) = p(las dos sean blancas o las dos rojas) = p((1By2B) o (1R
y 2R)) = p((1B2B) (1R 2R)) = 3 2 5 4 26= p(1B2B) + p(1R 2R) = p(1B)
p(2B/1B) + p(1R) p(2R/1R) = + = . . 8 7 8 7 56
109
110
14.4 PROPOSICIN
14.2
111
112
Es
definida como
Axioma I
para todo evento
Como
113
Axioma II
Como
Axioma III
Si
Como
Como
eventos
los
eventos
son
mutuamente
excluyentes,
entonces
114
los
Ejemplo
1. La antena de una instalacin de radar recibe, con probabilidad
determinar la probabilidad de que esta indicacin haya sido ocasionada por una
seal til con interferencia superpuesta.
Solucin:
115
Dnde:
p (A I E) = probabilidad de que ocurra A dado que E ya ocurri
p (A E) = probabilidad de que ocurra A y E a un mismo tiempo
p (E) = probabilidad de que ocurra E
Luego;
116
Por tanto:
Dnde:
AE = nmero de elementos comunes a los eventos A y E
117
Sea
un conjunto de sucesos mutuamente excluyentes y
exhaustivos, y tales que la probabilidad de cada uno de ellos es distinta de cero
(0). Sea B un suceso cualquiera del que se conocen las probabilidades
condicionales
expresin:
. Entonces, la probabilidad
Dnde:
118
es la probabilidad de
en la hiptesis
mutuamente excluyentes
119
dado un evento de la
. Esto es,
Teorema
Sea
un
espacio
muestral
una
coleccin
Para
120
de
de
eventos
Distribucin binomial
121
Distribucin multinomial
La distribucin multinomial es esencialmente igual a la binomial con la nica
diferencia de que cada prueba tiene ms de dos posibles resultados mutuamente
excluyentes.
122
Distribucin hipergeomtrica
Una variable tiene distribucin hipergeomtrica si procede de un experimento que
cumple las siguientes condiciones:
1)
finito de N objetos.
2)
Distribucin multihipergeomtrica
Este variable se define igual que la hipergeomtrica con la nica diferencia de que
se supone que el conjunto de objetos sobre el que se muestrea se divide en R
123
Distribucin de poisson
Una variable de tipo poisson cuenta xitos (es decir, objetos de un tipo
determinado) que ocurren en una regin del espacio o del tiempo.
El experimento que la genera debe cumplir las siguientes condiciones:
1.
El nmero de xitos que ocurren en cada regin del tiempo o del espacio
es independiente de lo que ocurra en cualquier otro tiempo o espacio disjunto
del anterior.
2.
3.
124
17.1 BINOMIAL
cuenta
el
nmero
de
xitos
en
una
secuencia
de n ensayos
125
Donde
Siendo
tomados de
las combinaciones de
en
elementos
en )
Ejemplo
Supongamos que se lanza un dado (con 6 caras) 50 veces y queremos conocer la
probabilidad de que el nmero 3 salga 20 veces. En este caso tenemos una X ~
B(50, 1/6) y la probabilidad sera P(X=20):
127
17.3
HIPERGEOMETRIA
128
as
(p+q=l) .Si
17.4 PROPIEDADES
129
La funcin
de
probabilidad de
una
variable
aleatoria
con
distribucin
Donde
es el tamao de poblacin,
es
categora. La notacin
esperado de
una variable
elementos de un total .
aleatoria X que
hipergeomtrica es.
Y su varianza,
Se obtiene
130
sigue
la
distribucin
18. POISSON
131
18.1 PROPIEDADES
132
Donde
Tanto el valor esperado como la varianza de una variable aleatoria con distribucin
de Poisson son iguales a . Los momentos de orden superior son polinomios de
Touchard en cuyos coeficientes tienen una interpretacin combinatorio. De
hecho, cuando el valor esperado de la distribucin de Poisson es 1, entonces
segn
la frmula
de
Dobinski,
el n-simo
momento
iguala
al
nmero
de particiones de tamao n.
representan
133
18.2
134
135
136
18.5
DISTRIBUCIN EXPONENCIAL
137
sabiendo que,
el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello
138
, es tal que su
funcin de densidad es
Su parmetro es .
La media y la varianza de la distribucin exponencial son:
139
, la definicin
Mientras
que
en
una distribucin
de
probabilidad
Para una variable continua hay infinitos valores posibles de la variable y entre
cada dos de ellos se pueden definir infinitos valores ms. En estas condiciones no
es posible deducir la probabilidad de un valor puntual de la variable; como se
puede hacer en el caso de variables discretas, pero es posible calcular la
probabilidad acumulada hasta un cierto valor (funcin de distribucin de
probabilidad), y se puede analizar cmo cambia la probabilidad acumulada en
cada punto (estos cambios no son probabilidades sino otro concepto: la funcin de
densidad.
En el caso de variable continua la distribucin de probabilidad es la integral de la
funcin de densidad, por lo que tenemos entonces que:
Sea
es una funcin
siendo
141
La grfica de
que
Para que
entre
1.
0 para toda .
2.
Ya que la probabilidad es siempre un nmero positivo, la FDP es una funcin no
decreciente que cumple:
1.
2.
142
, como la de la distribucin
143
Las probabilidades vienen dadas por el rea bajo la curva. Por tanto, el rea
encerrada bajo la totalidad de la curva es 1. Es decir, tomamos como unidad el
rea bajo la curva completa. Para que f(x) sea la funcin de densidad o de
probabilidad de una variable aleatoria es necesario que:
- f(x) se no negativa para todo x
- El rea bajo la curva y = f(x) sea igual a 1
Para hallar la probabilidad P[a x b], obtendremos el rea que hay bajo la
curva en el intervalo [a,b]
Las probabilidades de sucesos puntuales son cero: P[x = a] = 0.
La media y la desviacin tpica tienen los mismos significados que en las
distribuciones estadsticas.
Ilustracin 14: distribucin probabilidad continua.
144
145
146
147
148
etc.
149
ejemplo,
la distribucin
muestral de
es
20.1 EJEMPLOS
150
151
152
CONCLUSIONES
Una distribucin de frecuencia es una tabla de resumen en la que los datos se
disponen en agrupamientos o categoras convenientemente establecidas de
clases ordenadas numricamente.
En esta forma las caractersticas ms importantes de los datos se aproximan muy
fcilmente, compensando as el hecho de que cuando los datos se agrupan de ese
modo, la informacin inicial referente a las observaciones individuales de que
antes se dispona se pierde a travs del proceso de agrupamiento o
condensacin.
La principal ventaja de usar una de estas tablas de resumen es que las principales
caractersticas de los datos se hacen evidentes inmediatamente para el lector.
La principal desventaja de tal tabla de resumen es que no podemos saber cmo
se distribuyen los valores individuales dentro de un intervalo de clase particular sin
tener acceso a los datos originales. El punto medio de la clase, sin embargo, es el
valor usado para representar todos los datos resumidos en un intervalo particular.
El punto medio de una clase (o marca de clase) es el punto a la mitad de los
lmites de cada clase y es representativo de los datos de esa clase.
La probabilidad es la posibilidad u oportunidad de que suceda un evento particular.
La probabilidad involucrada es una porcin o fraccin cuyo valor vara entre cero y
uno exclusivamente. Observamos un evento que no tiene posibilidad de ocurrir (es
decir, el evento nulo), tiene una probabilidad de cero, mientras que un evento que
seguramente ocurrir (es decir, el evento cierto), tiene una probabilidad de uno.
153
154
CIBERGRAFIA
http://www.monografias.com/trabajos20/estadistica/estadistica.shtml#conclu#ixzz3FF5Gz
Ru
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal
http://www.monografias.com/trabajos89/estadistica-clasificacion/estadisticaclasificacion.shtml
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo3/B0C3m1t6.htm
http://www.bioestadistica.uma.es/libro/node73.htm
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial
http://www.itch.edu.mx/academic/industrial/sabaticorita/_private/05Probabilidad
%20condicional.htm
http://www.aulafacil.com/CursoEstadistica/Lecc-23-est.htm
http://es.slideshare.net/matematrix5/teoremas-de-probabilidad
155