Anda di halaman 1dari 23

INSTITUTO TEPEYAC DE ESTUDIOS SUPERIORES LICENCIATURA EN PEDAGOGIA CICLO 2012 I PROBABILIDAD Y ESTADISTICA I

NOMBRE DEL PROFESOR: CRUZ GARCIA BENJAMIN NOMBRE DE LA ALUMNA: DE LARA SANTANA ERIKA FECHA DE ENTREGA: 17 DE DICIEMBRE DEL 2011.

UNIDAD I ESTADISTICA DESCRIPTIVA


1.1MEDIDAS DE TENDENCIA CENTRAL Y DISPERSION. Las medidas de tendencia central son valores numricos que localizan, de alguna manera, el centro de un conjunto de datos. el trmino promedio a menudo es asociado con todas las medidas de tendencia central. a) Media: promedio que quiz sea el ms conocido. Se representa por (que se lee como x barra o media de la muestra). La media se encuentra sumando todos los valores de la variable x (la suma de valores x se simboliza como x) y dividiendo entre el nmero de estos valores, n. Lo anterior se expresa con una formula como

media de la muestra: x n

xbarra = suma de x nmero

Ejemplo: Un conjunto de datos consta de cinco valores: 6, 3, 8, 6 y 4. Encuentre la media. x= 6+3+8+6+4 = 5. 4 5 b) Mediana: Valor de datos que ocupa la posicin central cuando los datos se ordenan segn su tamao. Se representa por x (se lee como x tilde o mediana de la muestra). La mediana de la poblacin, M (my mayscula del alfabeto griego) es el valor de los datos que ocupa la posicin central de toda la poblacin ordenada. Procedimiento para encontrar la mediana: Paso 1. Ordene los datos. Paso 2. Determine la profundidad de la mediana. La profundidad (nmero de posiciones a partir de cualquier extremo), o posicin, de la mediana se determina con la siguiente frmula: profundidad de la mediana = nmero + 1 d(x)=

n+1 2 2 La profundidad (o posicin) de la mediana se encuentra al sumar los nmeros de posicin de los valores de los datos ms pequeos (1) y ms grandes (n) y dividir el resultado entre 2. (n es el mismo nmero que la cantidad de porciones de los datos.) PASO 3: Determine el valor de la mediana. Contar los datos ordenados, localizando el dato que est en la d(x)sima posicin. La mediana ser la misma sin importar a partir de cul extremo de los datos (mximo o mnimo) ordenados se cuente. Ejemplo: Encuentre la mediana del conjunto de datos {6, 3, 8, 5, 3}. PASO 1: Los datos, ordenados de manera creciente, son 3, 3, 5, 6 y 8. PASO 2: Profundidad de la mediana: d(x) = n + 1 = 5 + 1 =3 2 2 PASO 3: Es decir, la mediana es el tercer nmero desde cualquier extremo en los datos ordenados, o bien x = 5. Observe que la median esencialmente separa el conjunto de datos ordenado en dos subconjuntos de igual tamao. 9 6 7 8 9 10

8 8.2 8.5

c) Moda: Es el valor de x que ocurre ms frecuentemente. En el conjunto de datos (3, 3, 5, 6, 8) la moda es 3. En la muestra 6, 7, 8, 9, 9, 10, la moda es 9. Si dos o ms valores de una muestra estn empatados en cuanto a mayor frecuencia (nmero de ocurrencias), se dice que no hay moda. Por ejemplo, en la muestra 3, 3, 4, 5, 5, 7 tanto el 3 como 3l 5 aparecen

un nmero igual de veces. No hay ningn valor que aparezca con ms frecuencia; as, esta muestra no tiene moda. d) Rango Medio: Nmero que est exactamente a la mitad del camino entre un dato con menor valor Mn. y un dato con mayor valor Mx. Se encuentra promediando los valores mnimo y mximo. Valor medio = valor mnimo + valor mximo + Mx valor medio = Mn 2 2 Ejemplo: Para el conjunto de datos (3, 3, 5,, 6, 8), Mn. =3 y Mx. = 8 valor medio = Mn + Mx = 3 + 8 = 5.5 2

e) Media aritmtica: es el promedio ms comnmente usado, este puede ser simple o ponderado. La media aritmtica simple esta dada por la formula SX/n y que significa: la suma de todos los valores dividida por el nmero de datos. Medidas de dispersin incluyen el rango, la varianza y la desviacin estndar. Estos valores numricos describen la cantidad de dispersin o variabilidad, que se encuentra entre los datos: datos bastante agrupados poseen valores relativamente pequeos y datos ms dispersos tienen valores ms grandes. El agrupamiento ms estrecho ocurre cuando los datos carecen de dispersin (todos los datos tienen el mismo valor), para los cuales la medida de dispersin es cero. No hay lmite respecto a cun dispersos pueden ser los datos; en consecuencia, las medidas de dispersin pueden ser muy grandes. Rango: Se define como la diferencia existente entre el valor mayor y el menor de la distribucin,. Lo notaremos como R.

Rango = mximo mnimo Mn. El rango de la muestra 3, 3, 5, 6, 8 es: Mx. Mn. = 8 3 = 5

R = Mx.

Desviacin con respecto a la media: Es la diferencia entre el valor de x y la media es mayor que La desviacin (x ) es positiva si x

y negativa si x es menor que = ), se

Considera la muestra 6, 3,8,5,3. al usar la formula (2-1), x, se encuentra que la media es 5. Luego cada desviacin, (xencuentra restando 5 de cada valor x. DATOS DESVIACIN X 6 1 3 -2 8 3 5 0 3 -2

Varianza: Es la media de los cuadrados de las desviaciones, y la denotaremos por 1.2 DATOS AGRUPADOS o tambin por

Son datos que estn organizados (formando grupos). Podemos formar ms o menos grupos, dependiendo de que tan exacto queramos trabajar, a cada grupo le llamamos clase. Rara vez se emplean menos de seis clases o ms de quince. Ventajas Facilidad y rapidez al manejo de datos. Se notan rpidamente el valor mayor y el valor menor de los datos Se puede dividir fcilmente los datos en secciones. Se puede observar si algn valor aparece mas de una vez en el ordenamiento. Se observa la distancia entre los valores sucesivos de los datos. 1.3 HISTOGRAMAS, POLIGONOS CUARTILES Y PERCENTILES. DE FRECUENCIA, DECILES,

Histogramas de frecuencias son diagramas de barras empleados para resumir e ilustrar la variacin que se presenta en un conjunto de datos. Sirven para investigar cmo se puede solucionar un problema o mejorar un proceso.

Anlisis Estadstico de las Edades de las Personas que Asisten a Cines Unidos Ubicado en el Centro Comercial Regina (CCR) Puerto La Cruz Distribucin de Frecuencias Muestra de datos 31 24 13 19 14 15 33 18 16 27 23 16 40 20 54 37 36 26 32 15 18 19 42 35 22 18 11 51 43 33 23 20 37 21 26 23 32 10 45 30 41 17 21 21 19 34 26 46 20 39 37 11 42 17 16 17 15 34 14 35 22 15 40 46 30 29 Fila de datos 10 = 1 11 = 2 12 = 0 13 = 1 =18 14 = 2 15 = 4 34 = 2 35 = 2 36 = 1 37 = 3 38 = 0 39 = 1 16 17 18 10 = 3 22 = 3 23 = 3 24 19 = 3 = 2 28 = 0 = 3 29 = 1 = 1 30 = 2 18 25 = 0 10 31

20 = 3 21 = 3 40 = 2 41 = 1 42 = 2 9 43 = 44 = 0 45 = 1

26 = 3 32 = 2 27 = 1 33 = 2 46 = 2 52 = 0 47 = 0 53 = 0 1 48 = 0 54 = 1 1 7 49 = 0 3 50 = 0 n = 66 51 = 1

Tabla de Distribucin de Frecuencias.

I. de clase 10 15 16 21 22 27 28 33 34 39 40 45 46 51 52 - 57

fi 10 18 10 8 9 7 3 1

fa 10 28 38 46 55 62 65 66

xi 12,5 18,5 24,5 30,5 36,5 42,5 48,5 54,5

fir

far

fir%

far% Limites reales

0,15 0,15 9,5 15,5 0,27 0,42 15,5 21,5 0,15 0,57 21,5 27,5 0,12 0,69 27,5 33,5 0,13 0,83 33,5 39,5 0,10 0,93 39,5 45,5 0,04 0,08 45,5 51,5 0,01 1 51,5 57,5

Polgono e Histograma de Frecuencia Acumulada

Polgono e Histograma de Frecuencia Simple

Cuartiles: Son los valores de la variable que dividen en cuartos a los datos ordenados; cada conjunto de datos posee tres cuartiles. El primer cuartil Q1, es un nmero tal que cuando mucho el 25% de los datos e menor que el valor que Q1 y cuando mucho el 75% de los datos que Q1. El segundo cuartil es la media. E tercer cuartil Q3 es un nmero tal que cuando mucho el 75% de los datos es menor en valor que Q3 y cuando mucho el 25% de los datos es mayor que Q1.

25%

25

25%

25%

Mn. Q1 Q2 Q3 Mx. Percentiles: Son los valores de la variable que dividen a un conjunto de datos ordenados en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. L k-simo percentil, Pk, es un valor tal que cuando mucho k% de los datos son ms pequeos en valor que Pk y cuando mucho (100 k)% de los datos es mayor. 1% Mn. P98 1% P1 P99 Mx. 1% 1% P2 1% P3 P4 1% P97 1%

Deciles: dividen la serie de datos en diez partes iguales.

UNIDAD 2 ELEMENTOS DE PROBABILIDAD


2.1 DEFINICION DE PROBABILIDAD. La probabilidad de un suceso es un nmero que cuantifica en trminos relativos las opciones de verificacin de ese suceso CONCEPTOS: Experimento aleatorio: toda accin cuyo resultado no puede predecirse con certeza (por ejemplo, introducir 2 ratas en un laberinto con 3 salidas equiprobables) Suceso elemental: cada uno de los resultados posibles de un experimento aleatorio. Su conjunto constituye el espacio muestral (E).

Suceso: cualquier subconjunto de los elementos de E. Tipos: Imposible: { } suceso que tal y como est definido E, es imposible que ocurra. Seguro: suceso que est incluido en E Complementario: A subconjunto de sucesos elementales de E que no est incluido en A Sucesos Incompatibles o excluyentes: no pueden darse simultneamente: P(A B) = 0 Operaciones con sucesos: Unin: A B ............. Subconjunto de elementos de E que estn incluidos, al menos en uno de esos sucesos (A o B) Interseccin: A B ... Subconjunto de elementos de E que estn incluidos simultneamente en los subconjuntos de ambos sucesos (A y B). Diferencia: A - B .......... Subconjunto de E integrado por los sucesos elementales que pertenecen a A pero no a B. Espacio muestral, E: conjunto (poblacin) de resultados posibles o sucesos elementales de un experimento aleatorio. Puede ser de dos tipos: a) Espacio muestral finito: sabemos cuntos resultados posibles (sucesos elementales) hay. b) Espacio muestral infinito: tiene infinitos sucesos elementales. Si se corresponden con los nmeros naturales se trata de un espacio muestral infinito numerable. En caso contrario, infinito no numerable.

Cuando no tienen elementos Cuando tiene todos comunes. los elementos de un pertenecen Ejemplos:

Cuando tienen algunos elementos comunes. conjunto y a otro.

1. Dados los conjuntos: A = { 0, 1, 2, 3, 4, 5 }, B = { 0, 2, 4 } C = { 5, 6, 8 } efectuar y construir los diagramas respectivos: a) A U C Tenemos: b) B U C c) A U B

a) A = { 0, 1, 2, 3, 4, 5 } y C = { 5, 6, 8 } A U C = { 0, 1, 2, 3, 4, , 6, 8 }

b) B = { 0, 2, 4 } y C = { 5, 6, 8 } B U C = { 0, 2, 4, 5, 6, 8 }

c) A = { 0, 1, 2, 3, 4, 5 } y B = { 0, 2, 4 } A U B = { , 1, , 3, , 5 }

2.2 ALGUNOS TEOREMAS BASICOS. Teorema de la suma La probabilidad de la unin de los sucesos A y B es: P(A U B) P(A) P(A B) Teorema del producto Dos sucesos A y B son independientes si se cumple la siguiente igualdad: P(A B) = P(A) P(B) O lo que es lo mismo, si la verificacin de uno no altera la probabilidad del otro: P(A/B) = P(A) Demostracin: P(A/B) = P(A B) = P(A) P(B) = P(A) P(B) P(B) 2.2.1 FRECUENCIA RELATIVA DE OCURRENCIA. Cul es la probabilidad de que lleguemos a los 85 aos de edad? Qu probabilidad hay de romper una bocina de un estreo si ponemos el volumen a 200 watts? Cul es la probabilidad de que al construir una nueva fabrica de papel a las orillas del ro mas prximo de nuestra ciudad mueran muchos peces?

Lo mas probable es que no podamos determinar la probabilidad de dichos eventos sin haber realizado antes dichos eventos. En los mil ochocientos los estadsticos ingleses buscaban encontrar un fundamento terico para calcular el riesgo de las perdidas de los seguros de vida y en los seguros comerciales y como primer paso definieron la probabilidad de datos estadsticos referentes a los nacimientos o muertes, esto se conoce hoy en da como "FRECUENCIA RELATIVA DE OCURRENCIA" y define a la probabilidad de 2 formas: *La frecuencia relativa observada de un elemento en un gran nmero de ensayo. *Como la proporcin de las bases que un evento sucede a la larga cuando las condiciones son estables. **EJEMPLO: Supongamos que una compaa de seguros sabe por sus datos actuariales que todos los valores de 40 aos de edad, 70 de cada 100 mil moriran al cabo de 1 ao. Aplicando este mtodo la compaa determina la probabilidad de fallecimiento de ese grupo de datos en los siguiente trminos. 60/100,000 = .0006 Una segunda caracterstica se las probabilidades establecidas por la frecuencia relativa de ocurrencia puede demostrarse arrojando una moneda legal 300 veces, pese a la proporcin de que cualquiera de los datos en los primeros 100 lanzamientos, las veces en que a cado el evento sol esta lejos de esa proporcin, sin embargo a medida que seguimos lanzando la moneda la frecuencia relativa se va acercando a su probabilidad de .5 Cuando se utiliza la frecuencia relativa para establecer las probabilidades la cifra de estas ser mas exacta a medida que se aumentan el nmero de observaciones o experimentos. Cabe destacar que este mejoramiento en exactitud de los resultados tiene un precio el cual n o siempre resulta rentable para las personas que realizan las estadsticas o bien para quien hace uso de estas. Una dificultad de este enfoque consiste en que a menudo se utiliza en nmero suficiente de experimentos. 2.2.2 FRECUENCIA RELATIVA DEL ESPACIO MUESTRAL. Un experimento es un acontecimiento cuyo resultado es incierto.

El conjunto de todos los resultados posibles se llama el espacio muestral del experimento. Dado un espacio muestral S, entonces un suceso E es un subconjunto de S. Los resultados en E se llaman los resultados favorables. Decimos que ocurre E en un experimento particular si el resultado de aquel experimento es uno de los elementos de E, es decir, si es favorable el resultado del experimento. Ejemplo 1. Experimento: Tire un dado al aire y observe el nmero orientado hacia arriba. Resultados: 1, 2, 3, 4, 5, 6 Espacio muestral: S = {1, 2, 3, 4, 5, 6} Un suceso: E: el resultado es par; E = {2, 4, 6} 2. Ms abajo est un experimento que simula el lanzar de tres monedas justas y distinguibles. Para ver los resultados, pulse "Lanza monedas." El espacio muestral es el conjunto de ocho resultados posibles (a = guila, s = Sol): S = {aaa, aas, asa, ass, saa, sas, ssa, sss} Sea E el suceso que salen guilas al menos dos veces. E = {aaa, aas, asa, saa}

2.2.3 EVENTOS MUTUAMENTE EXCLUYENTES Dos o ms eventos son mutuamente excluyentes o disjuntos, si no pueden ocurrir simultneamente. Es decir, la ocurrencia de un evento impide automticamente la ocurrencia del otro evento (o eventos). Ejemplo: Al lanzar una moneda solo puede ocurrir que salga cara o sello pero no los dos a la vez, esto quiere decir que estos eventos son excluyentes. Dos o ms eventos son no excluyentes, o conjuntos, cuando es posible que ocurran ambos. Esto no indica que necesariamente deban ocurrir estos eventos en forma simultnea. Ejemplo:

Si consideramos en un juego de domino sacar al menos un blanco y un seis, estos eventos son no excluyentes porque puede ocurrir que salga el seis blanco. Reglas de la Adicin La Regla de la Adicin expresa que: la probabilidad de ocurrencia de al menos dos sucesos A y B es igual a: P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente P(A o B) = P(A) + P(B) P(A y B) si A y B son no excluyentes Siendo: P(A) = probabilidad de ocurrencia del evento A P(B) = probabilidad de ocurrencia del evento B P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B.

UNIDAD 3 VARIABLE CASUAL Y FUNCION DE PROBABILIDAD.


3.1 INTRODUCCION. En estadstica, la casualidad se refiere a una relacin de necesidad de coocurrencia de dos variables estadsticas correlacionadas, probar causalidad entre dos variables implica adems de que guarden una correlacin positiva, estudiar en casos donde una pueda aparecer sin la otra, etc. 3.2 VARIABLE CASUAL. 3.3 FUNCION DE DISTRIBUCION DE PROBABILIDAD.

La distribucin Normal suele conocerse como la "campana de Gauss".

En teora de la probabilidad y estadstica, la distribucin de probabilidad de una variable aleatoria es una funcin que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La distribucin de probabilidad est definida sobre el conjunto de todos los sucesos, cada uno de los sucesos es el rango de valores de la variable aleatoria. Cuando la variable aleatoria toma valores en el conjunto de los nmeros reales, la distribucin de probabilidad est completamente especificada por la funcin de distribucin, cuyo valor en cada real x es la probabilidad de que la variable aleatoria sea menor o igual que x. Dada una variable aleatoria todos son puntos distribucin, , es: , su funcin de

Por simplicidad, cuando no hay lugar a confusin, suele omitirse el subndice y se escribe, simplemente, . Como consecuencia casi inmediata de la definicin, la funcin de distribucin: Es una funcin continua por la derecha. Es una funcin montona no decreciente. Adems, cumple

y Para dos nmeros reales cualesquiera a y b tal que (a < b), los sucesos y es el suceso son mutuamente excluyentes y su unin , por lo que tenemos entonces que:

y finalmente

Por lo tanto una vez conocida la funcin de distribucin F(x) para todos los valores de la variable aleatoria x conoceremos completamente la distribucin de probabilidad de la variable. Para realizar clculos es ms cmodo conocer la distribucin de probabilidad, y sin embargo para ver una representacin grfica de la probabilidad es ms prctico el uso de la funcin de densidad. Distribuciones de variable discreta Se denomina distribucin de variable discreta a aquella cuya funcin de probabilidad slo toma valores positivos en un conjunto de valores de X finito o infinito numerable. A dicha funcin se le llama funcin de masa de probabilidad. En este caso la distribucin de probabilidad es el sumatorio de la funcin de masa, por lo que tenemos entonces que:

Y, tal como corresponde a la definicin de distribucin de probabilidad, esta expresin representa la suma de todas las probabilidades desde hasta el valor x. Distribuciones de variable discreta ms importantes Las distribuciones de variable discreta ms importantes son las siguientes: Distribucin binomial

Distribucin binomial negativa

Distribucin Poisson

Distribucin geomtrica

Distribucin hipergeomtrica

Distribucin de Bernoulli Distribucin Rademacher, que toma el valor 1 con probabilidad 1 / 2 y el valor -1 con probabilidad 1 / 2. Distribucin uniforme discreta, donde todos los elementos de un conjunto finito son equiprobables.

PARAMETROS DE UNA FUNCION DE DISTRIBUCION. 4.1 INTRODUCCION. 4.2 MEDIDAS DE TENDENCIA. Se les llama medidas de tendencia central porque general mente la acumulacin ms alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comnmente empleadas son : Media aritmtica Mediana Moda Media geomtrica Media armnica Los cuantilos

UNIDAD 4

4.3 VALOR ESPERADO DE UNA FUNCION DE VARIABLE CASUAL. En estadstica el valor esperado o esperanza matemtica (o simplemente esperanza) de una variable aleatoria es la suma de la probabilidad de cada suceso multiplicado por su valor. Por ejemplo en un juego de azar el valor esperado es el beneficio medio. Si todos los sucesos son de igual probabilidad la esperanza es la media aritmtica. Definicin Para una variable aleatoria discreta con valores posibles y sus posibilidades representadas por la funcin de masa p(xi) la esperanza se calcula con Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos valores y la funcin de densidad f(x): Las esperanzas E[Xk] para k = 0,1,2 se llaman momentos de orden k. Ms importantes son los momentos centrados E[(X E[X])k]. No todas

las variables aleatorias tienen un valor esperado (por ejemplo la distribucin de Cauchy). El valor esperado es una funcin lineal. Por eso E[aX + b] = aE[X] + b 4.4 PROPIEDADES Resumimos a continuacin las propiedades ms importantes de la funcin de distribucin:

Funcin siempre continua por la derecha.

Toda funcin que verifique las propiedades anteriores es una funcin de distribucin y toda funcin de distribucin caracteriza una determinada variable aleatoria sobre algn espacio de probabilidad. Las propiedades anteriores se traducen en un tipo de grfica para la funcin de distribucin del tipo de las que mostramos a continuacin

Primer tipo

Segundo tipo

Evidentemente, podran aparecer distribuciones, y por tanto grficas, que combinen la caractersticas de los dos modelos anteriores.

Anda mungkin juga menyukai