Anda di halaman 1dari 15

TEMA 1: INTRODUCCIN A LA ESTADSTICA Y ESTADSTICA

DESCRIPTIVA

1.1 Probabilidad: Probabilidad axiomtica, independencia y


exclusin, regla de Bayes, Proceso inferencial, Muestreo,
Procedimientos muestrales, Espacios muestrales.

En Probabilidad la pregunta se formula del siguiente modo: qu posibilidad hay de que


tenga lugar cada uno de los sucesos? La respuesta exige un tercer elemento que nos
proporcione esa informacin: Una funcin de conjunto P, es decir, una funcin definida
sobre la -algebra de sucesos, que a cada uno de ellos le asocie un valor numrico que
exprese la mayor o menor probabilidad o posibilidad de producirse cuando se realiza el
experimento. Esta funcin de conjunto se conoce como medida de probabilidad o
simplemente probabilidad.
PROBABILIDAD:

La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de


resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los
resultados posibles, bajo condiciones suficientemente estables. La teora de la
probabilidad se usa extensamente en reas como la estadstica, la fsica, la matemtica,
la ciencia y la filosofa para sacar conclusiones sobre la probabilidad de sucesos
potenciales y la mecnica subyacente de sistemas complejos.

PROBABILIDAD AXIOMATICA:

Los axiomas de probabilidad son las condiciones mnimas que deben verificarse para que
una funcin que definimos sobre unos sucesos determine consistentemente valores de
probabilidad sobre dichos sucesos. La probabilidad P de un suceso E, denotada por P(E),
se define con respecto a un "universo" o espacio muestral , conjunto de todos los
posibles sucesos elementales, tal que P verifique los Axiomas de Kolmogorv, enunciados
por el matemtico ruso de este nombre en 1933. En este sentido, el suceso E es, en
trminos matemticos, un subconjunto de .

PRIMER AXIOMA: SEGUNDO AXIOMA: TERCER AXIOMA:

- La probabilidad de un - La probabilidad del total, Si A1, A2... son sucesos


suceso A es un nmero , es igual a 1. mutuamente excluyentes
real mayor o igual que 0. - representa todas las (incompatibles dos a
- La probabilidad de un posibles alternativas y se dos, disjuntos o de
suceso es un nmero denomina suceso seguro. interseccin vaca dos a
positivo o nulo. dos), entonces:
.
Segn este axioma se
puede calcular la
probabilidad de un suceso
compuesto de varias
alternativas mutuamente
excluyentes sumando las
probabilidades de sus
componentes.

INDEPENDECIA Y EXCLUSIN:

En el experimento del lanzamiento de un dado P(B|A) = 2/5, mientras que P(B) = 1/3. Es
decir, P(B|A) P(B), lo cual indica que B depende de A. Consideremos ahora un
experimento en el que se sacan 2 cartas, una despus de la otra, de una baraja ordinaria,
con reemplazo. Los eventos se definen como
A: la primera carta es un as,
B: la segunda carta es una espada.
Como la primera carta se reemplaza, nuestro espacio muestral para la primera y segunda
cartas consta de 52 cartas, que contienen 4 ases y 13 espadas. Entonces,

.
Es decir, P(B|A) = P(B). Cuando esto es cierto, se dice que los eventos A y B son
independientes.
Aunque la probabilidad condicional permite alterar la probabilidad de un evento a
la luz de material adicional, tambin nos permite entender mejor el muy importante
concepto de independencia o, en el contexto actual, de eventos independientes. En el
ejemplo 2.34 del aeropuerto, P(A|D) difiere de P(A). Esto sugiere que la ocurrencia de D
influye en A y esto es lo que, de hecho, se espera en este caso. Sin embargo, considere la
situacin en donde tenemos los eventos A y B, y
P(A|B) = P(A).
En otras palabras, la ocurrencia de B no influye en las probabilidades de ocurrencia de
A. Aqu la ocurrencia de A es independiente de la ocurrencia de B. No podemos dejar
de resaltar la importancia del concepto de independencia, ya que desempea un papel
vital en el material de casi todos los captulos de este libro y en todas las reas de la
estadstica aplicada.
Definicin: Dos eventos A y B son independientes si y slo si
P(B|A) = P(B) o P(A|B) = P(A),

si se asume la existencia de probabilidad condicional. De otra forma, A y B son


dependientes.
La condicin P(B|A) = P(B) implica que P(A|B) = P(A), y viceversa. Para los experimentos
de extraccin de una carta, donde mostramos que P(B|A) = P(B) = 1/4, tambin podemos
ver que P(A|B) = P(A) = 1/13.

(Independencia mutua) Se dice que los sucesos de la familia {A1, . . . , An}


son mutuamente independientes cuando

siendo {k1, . . . , km} {1, . . . , n} y los ki distintos.


Conviene sealar que la independencia mutua de los n sucesos supone que han de
verificarse ecuaciones del tipo dado en (1.6).
Si solamente se verificasen aquellas igualdades que implican a dos elementos diramos
que los sucesos son independientes dos a dos, que es un tipo de independencia menos
restrictivo que el anterior como pone de manifiesto el siguiente ejemplo. Solo cuando n = 2
ambos conceptos son equivalentes.

se comprueba facilmente que son independientes dos a dos pero no son mutuamente
independientes.
El tipo de independencia habitualmente exigida es la mutua, a la que nos referiremos
simplemente como independencia.

REGLA DE BAYES

Puede tener inters, y de hecho as ocurre en muchas ocasiones, conocer la probabilidad


asociada a cada elemento de la particin dado que ha ocurrido B, es decir, P (Ai | B).
Para ello, recordemos la definicin de probabilidad condicionada y apliquemos el
resultado anterior.
Este resultado, conocido como el teorema de Bayes, permite conocer el cambio que
experimenta la probabilidad de Ai como consecuencia de haber ocurrido B. En el lenguaje
habitual del Clculo de Probabilidades a P (Ai) se la denomina probabilidad a priori y a P
(Ai | B) probabilidad a posteriori, siendo la ocurrencia de B la que establece la frontera
entre el antes y el despus. Cul es, a efectos prcticos, el inters de este resultado?
Vemoslo con un ejemplo.

PROCESO INFERENCIAL

La Estadstica inferencial o Inferencia estadstica estudia cmo sacar conclusiones


generales para toda la poblacin a partir del estudio de una muestra, y el grado de
fiabilidad o significacin de los resultados obtenidos.

PROCEDIMIENTOS MUESTRALES

Muestreo probabilstico
Consiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos
de muestreo:

Muestreo aleatorio simple

Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan


al azar los n elementos que contiene la muestra.

Muestreo aleatorio sistemtico

Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los


dems hasta completar la muestra.

Por ejemplo, si tenemos una poblacin formada por 100 elementos y queremos extraer
una muestra de 25 elementos, en primer lugar, debemos establecer el intervalo de
seleccin que ser igual a 100/25 = 4. A continuacin elegimos el elemento de arranque,
tomando aleatoriamente un nmero entre el 1 y el 4, y a partir de l obtenemos los
restantes elementos de la muestra.

2, 6, 10, 14,..., 98

Muestreo aleatorio estratificado

Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de


individuos de cada estrato proporcional al nmero de componentes de cada estrato.

En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20.
Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la
D.

Muestreo por Conglomerados


Consiste en extraer dentro de una poblacin grupos de elementos al azar y despus
dentro de esos grupos se eligen al azar grupos ms pequeos, y a su vez dentro de este
grupo se elige al azar grupos ms pequeos y as sucesivamente hasta que el
investigador decida parar. Al muestreo por conglomerados tambin se le llama muestreo
por reas.
Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser
infinita o finita.
En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a
muestreo con reposicin.
Si consideremos todas las posibles muestras de tamao n en una poblacin, para cada
muestra podemos calcular un estadstico (media, desviacin tpica, proporcin, ...) que
variar de una a otra.
As obtenemos una distribucin del estadstico que se llama distribucin muestral.

Muestreo NO Probabilstico

No existe el criterio de que todos los sujetos tengan la misma posibilidad para ser elegidos
para formar parte de la muestra, ya que en este tipo de muestreo hay uno o ms criterios
de decisin por parte del investigador, para que un determinado sujeto pueda o no formar
parte del estudio.

ESPACIOS MUESTRALES

En el estudio de la estadstica tratamos bsicamente con la presentacin e interpretacin


de resultados fortuitos que ocurren en un estudio planeado o en una investigacin
cientfica. Por ello, quienes se dedican a la estadstica a menudo manejan datos
numricos que representan conteos o mediciones, o datos categricos que se podran
clasificar de acuerdo con algn criterio, al referirnos a cualquier registro de informacin, ya
sea numrico o categrico, utilizaremos el trmino observacin. Los estadsticos utilizan
la palabra experimento para describir cualquier proceso que genere un conjunto de
datos.

A cada resultado en un espacio muestral se le llama elemento o miembro del espacio


muestral, o simplemente punto muestral. Si el espacio muestral tiene un nmero finito de
elementos, podemos listar los miembros separados por comas y encerrarlos entre llaves.
Por consiguiente, el espacio muestral S, de los resultados posibles cuando se lanza una
moneda al aire, se puede escribir como S = {H, T}, en donde H y T corresponden a
caras y cruces, respectivamente.
1.2 Obtencin y Organizacin de un conjunto de datos.
Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Una
coleccin de datos se conoce como conjunto de datos, y una sola observacin es
un punto de dato. Para que los datos sean tiles, necesitamos organizar nuestras
observaciones, de modo que podamos distinguir patrones y llegar a conclusiones lgicas.

OBTENCIN DE DATOS:

Los especialistas en estadstica seleccionan sus observaciones de manera que todos los
grupos relevantes estn representados en los datos.

Los datos pueden provenir de observaciones reales o de registros que se mantienen para
otros propsitos.

Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones
bien pensadas acerca de las causas y, por tanto, de los efectos probables de ciertas
caractersticas en situaciones dadas. Tambin el conocimiento de tendencias adquirido de
la experiencia previa puede permitir estar al tanto de posibles resultados y actuar en
consecuencia.

Cuando los datos son ordenados de manera compacta y til, los responsables de tomar
decisiones pueden obtener informacin confiable sobre el ambiente y usarla para tomar
decisiones inteligentes. Los administradores deben tener mucho cuidado y asegurar que
los datos utilizados estn basados en suposiciones e interpretaciones correctas. Para ello,
se utilizan las pruebas para datos:

1. De dnde vienen los datos? La fuente es parcial? Es posible que haya un


inters en proporcionar datos que conduzcan a una cierta conclusin ms que a
otras?
2. Los datos comprueban o contradicen otras evidencias que se poseen?

3. Hace falta alguna evidencia cuya ausencia podra ocasionar que se llegue a una
conclusin diferente?

4. Cuntas observaciones se tienen? Representan a todos los grupos que se


desea estudiar?

5. La conclusin es lgica? Se ha llegado a conclusiones que nuestros datos no


confirman?

Vale la pena usar los datos o debemos esperar y recabar ms informacin antes de
actuar?

Bsqueda de un patrn significativo en los datos:

Existen muchas formas de organizar los datos. Podemos slo colectarlos y mantenerlos
en orden; o si las observaciones estn hechas con nmeros, entonces podemos hacer
una lista de los puntos de dato de menor a mayor segn su valor numrico. Pero si los
datos son trabajadores especializados o los distintos tipos de automviles que ensamblan
todos los fabricantes, debemos organizarlos de manera distinta. Necesitaremos presentar
los puntos de dato en orden alfabtico o mediante algn principio de organizacin. Una
forma comn de organizar los datos consiste en dividirlos en categoras o clases
parecidas y luego contar el nmero de observaciones que quedan dentro de cada
categora. Este mtodo produce una distribucin de frecuencias.

El objetivo de organizar los datos es permitirnos ver rpidamente algunas de las


caractersticas de los datos que hemos recogido: el alcance (los valores mayor y menor),
patrones evidentes, alrededor de qu valores tienden a agruparse los datos, qu valores
aparecen con mayor frecuencia, etc.

Datos sin procesar:

La informacin obtenida, antes de ser organizada y analizada, se conoce como datos sin
procesar puesto que an no han sido tratados mediante ningn mtodo estadstico.

La cantidad de datos ms grande y los detalles ms minuciosos pueden no contener la


informacin ms til para la toma de decisiones administrativa. Una parte importante de la
planeacin de sistemas de informacin administrativa consiste en resumir y presentar los
datos de modo que se pueda obtener la informacin crtica de manera rpida y sencilla.

Ordenamiento de datos utilizando su arreglo y distribucin de frecuencias:

La ordenacin de datos es una de las formas ms sencillas de presentarlos, los forma en


orden ascendente o descendente.

Ventajas:
1. Podemos notar rpidamente los valores mayor y menor de los datos.

2. Podemos dividir fcilmente los datos en secciones.

3. Podemos ver si algunos de los valores aparecen ms de una vez en ese


ordenamiento.

4. Podemos observar la distancia entre valores sucesivos de datos.

En ocasiones, un ordenamiento de datos no resulta til. Debido a que da una lista de


todos los valores, es una forma incmoda de mostrar grandes cantidades de datos.

La distribucin de frecuencias.

Una forma en que podemos comprimir los datos es la tabla de frecuencias o distribucin
de frecuencias. Las distribuciones de frecuencias sacrifican algunos detalles, pero ofrecen
nuevas perspectivas sobre los patrones de datos.

Una distribucin de frecuencias es una tabla en la que los datos se organizan en clases,
es decir, en grupos de valores que describen una caracterstica de los datos.

Una distribucin de frecuencias muestra el nmero de observaciones del conjunto de


datos que caen en cada una de las clases.

1.3 Distribucin de Frecuencia Simple.

a) FRECUENCIA ABSOLUTA SIMPLE: (fi)

Es el nmero de veces que se repite dicho valor en un conjunto de datos.

f1 + f2 + f3 + + fi = n
Ej.: 3 + 4 + 8 + 8 + 4 + 3 = 30 = n

Interpretacin:

f3 : 8 alumnos han declarado tener 2 hermanos.

f5 : 4 alumnos han declarado tener 4 hermanos.

b) FRECUENCIA ABSOLUTA ACUMULADA: (Fi)

Es la que resulta de sumar sucesivamente las frecuencias absolutas simples.

F1 = f1

F2 = f1 + f2

F3 = f1 + f2 + f3 F3 = F2 + f3

Fi = f1 + f2 + + fi

Ej.: F2 = 3 + 4 = 7 F4 = 15 + 8 = 23

Interpretacin:

F2 : Que 7 alumnos han declarado tener entre o y 1 hermanos.

F4 : Que 23 alumnos han declarado tener entre 0 y 3 hermanos

c) FRECUENCIA RELATIVA SIMPLE: (hi)

Es el cociente que resulta de dividir la frecuencia absoluta entre el tamao de


la muestra (n)
Interpretacin:

h3 : El 0,2667 tanto por uno de 30 alumnos, han declarado tener 2 hermanos.

h3 x 100: El 26,67% de 30 alumnos han declarado tener 2 hermanos

d) FRECUENCIA RELATIVA ACUMULADA: (H)

Es la que resulta de acumular sucesivamente las frecuencias relativas simples.


1.4 Distribucin de Frecuencia de datos agrupados.
La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un nmero grande de valores o la variable es continua. Se agrupan los
valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se
le asigna su frecuencia correspondiente. Lmites de la clase. Cada clase est delimitada
por el lmite inferior de la clase y el lmite superior de la clase.
La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La
marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el
intervalo para el clculo de algunos parmetros.
EJEMPLO:
Construccin de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11,
13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1. Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48.

2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea
divisible por el nmero de intervalos que queramos establecer.
Es conveniente que el nmero de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al
intervalo, pero el lmite superior no pertenece al intervalo, se cuenta en el siguiente
intervalo.

1.5 Tabulacin y grficos.

La presentacin de datos estadsticos constituye en sus diferentes modalidades uno de


los aspectos de ms uso en la estadstica descriptiva. A partir podemos visualizar a travs
de los diferentes medios escritos y televisivos de comunicacin masiva la presentacin de
los datos estadsticos sobre el comportamiento de las principales variables econmicas y
sociales, nacionales e internacionales.

1-Presentacin escrita: Esta forma de presentacin de informaciones se usa cuando una


serie de datos incluye pocos valores, por lo cual resulta ms apropiada la palabra escrita
como forma de escribir el comportamiento de los datos; mediante la forma escrita, se
resalta la importancia de las informaciones principales.

2-Presentacin tabular: Cuando los datos estadsticos se presentan a travs de un


conjunto de filas y de columnas que responden a un ordenamiento lgico; es de gran eso
e importancia para el uso e importancia para el usuario ya que constituye la forma ms
exacta de presentar las informaciones. Una tabla consta de varias partes, las principales
son las siguientes:
- Ttulo: Es la parte ms importante del cuadro y sirve para describir todo l
contenido de este.
- Encabezados: Son los diferentes subttulos que se colocan en la parte superior de
cada columna.
- Columna matriz: Es la columna principal del cuadro.
- Cuerpo: El cuerpo contiene todas las informaciones numricas que aparecen en
la tabla.
- Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de
estos.
- Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que
aparecen en la tabla o cuadro y que no han sido explicados en otras partes.

3-Presentacin grfica: Proporciona al lector o usuario mayor rapidez en la comprensin


de los datos, una grfica es una expresin artstica usada para representar un conjunto de
datos.

De acuerdo al tipo de variable que vamos a representar, las principales graficas son las
siguientes:

Histograma: Es un conjunto de barras o rectngulos unidos uno de otro, en razn de que


lo utilizamos para representar variables continuas.
Polgono de frecuencias: Esta grafica se usa para representar los puntos medios
de clase en una distribucin de frecuencias
Grfica de barras: Es un conjunto de rectngulos o barras separadas una de la otra, en
razn de que se usa para representar variables discretas; las barras deben ser de igual
base o ancho y separadas a igual distancia. Pueden disponerse en forma vertical y
horizontal.
Grfica lineal: Son usadas principalmente para representar datos clasificados por
cantidad o tiempo; o sea, se usan para representar series de tiempo o cronolgicas.
Grfica de barra 100% y grfica circular: se usan especialmente para representar las
partes en que se divide una cantidad total.
La ojiva: Esta grafica consiste en la representacin de las frecuencias acumuladas de
una distribucin de frecuencias. Puede construirse de dos maneras diferentes; sobre la
base "menor que" o sobre la base "o ms". Puede determinar el valor de la mediana de la
distribucin.
En estadstica denominamos grficos a aquellas imgenes que, combinando la utilizacin
De sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un sistema De
referencia (coordenadas), permiten presentar informacin cuantitativa.
La utilidad De los grficos es doble, ya que pueden servir no slo como sustituto a las
tablas, sino que tambin constituyen por s mismos una poderosa herramienta para
el anlisis De los datos, siendo en ocasiones el medio ms efectivo no slo para describir
y resumir la informacin, sino tambin para analizarla.
En este trabajo solo nos vamos a centrar nicamente en los grficos como vehculo de
presentacin de datos, sin abordar su otra faceta como herramienta de anlisis.

Figura 1. Ejemplo de grfico de sectores. Distribucin de una muestra de pacientes segn


el hbito de fumar.

Figura 2. Ejemplo de grfico de barras. Estadio TNM en el cncer gstrico.

Figura 3. Ejemplo de un histograma correspondiente a los datos


de la Tabla I.
Bibliografa:

1- RONALD E. WALPOLE, RAYMOND H. MYERS,


SHARON L. MYERS Y KEYING YE
Probabilidad y estadstica para ingeniera y ciencias
Novena edicin
PEARSON EDUCACIN, Mxico, 2012
ISBN: 978-607-32-1417-9
rea: Ingeniera
2- 2007 de Francisco Montes, Departamento de Estadstica e Investigacin Operativa
Universidad de Valencia 46100-Burjassot Spain
3- http://www.ditutor.com/estadistica/estadistica.html
4- http://estadisticacrisanto.blogspot.mx/2013/10/representacion-tabular-y-
grafica-de.html
5- http://repositorio.uis.edu.co/jspui/bitstream/123456789/7179/2/134780.p
df

Anda mungkin juga menyukai