Anda di halaman 1dari 14

1.

1 Poblacin y muestra aleatoria


Poblacin
Una poblacin es un conjunto total de elementos en un contexto. Se llama tamao
de la poblacin al nmero de individuos que la componen, siendo cada posible
observacin un individuo; as pues, las poblaciones pueden ser finitas e infinitas.
Poblacin finita: La que tiene unas dimensiones contables, definidas.
Poblacin infinita: La que tiene un elemento incontable de elementos.

Para estudiar una poblacin existen dos posibilidades.


1-Estudiar todos sus elementos y sacar conclusiones.
2.-Estudiar slo una parte de ellos, una muestra, elegidos de tal forma que nos
digan algo sobre la totalidad de las observaciones de la poblacin.
Muestra: Parte del todo que se analiza para sacar informacin.
Muestra aleatoria: Parte de un todo que fue seleccionada de tal manera que cada

uno de sus elementos se obtuvo completamente al azar.

1.2 Obtencin de datos estadsticos


Son nmeros que pueden ser comparados, analizados e interpretados y el campo del cual
son tomados se identifica como poblacin o universo.

Para qu necesitamos recolectar datos?


Proporciona la introduccin imprescindible para un estudio de investigacin.
Medir el desempeo en un servicio o proceso de produccin.
Ayudar en la formulacin de alternativas para la toma de decisiones.
Satisfacer nuestra curiosidad.

Hay, por lo menos, tres maneras de obtener datos y son los siguientes:

Utilizar los datos publicados por fuentes gubernamentales, industriales o


particulares.
A travs de la experimentacin.
Realizando encuestas.

1.3 Medidas de tendencia central


La medidas de centralizacin nos indican en torno a qu valor (centro) se
distribuyen los datos. Sirve como un mtodo para comparar los resultados medios
obtenidos por dos o ms grupos.
Las medidas de tendencia central ms comunes son:

Media aritmtica
Mediana
Moda

Media aritmtica
Comnmente conocida como media o promedio. Se representa por medio de una
letra M o por una X con una lnea en la parte superior.
La media aritmtica es un promedio estndar que a menudo se denomina "promedio".
Formula y smbolo media aritmtica

1.4 Medidas de dispersin


La medida de dispersin es el grado de alejamiento de un dato cualquiera de la
muestra de su media.
Con el propsito de medir la dispersin o variabilidad, se discutirn las medidas
de:

Rango
Desviacin
Varianza
Desviacin
Estndar
Coeficiente de Variacin.

media
(tambin

llamada

Rango
Sirve para tener una idea de lo extenso de una muestra.

desviacin

tpica)

Se calcula retndole el dato menor al dato mayor, con lo que nos damos una idea general
de lo aproximados o distantes que estn los datos de la muestra.

Rango
R = XM xm

Donde= xm = Dato mayor

xm = Dato menor

Ejemplo 1.5
Clasificacin por grupos.
Determina el rango del Grupo A, respecto a los partidos ganados. (PG)

EQUIPO

MONTER
REY

SAN
LUIS

TIGRES

JAGUARE
S

NECAXA

ESTUDIAN
TES

PG

R=9-4 = 5
Esto significa que en el Grupo A los datos no se separan por ms de 5 unidades.

Desviacin media
La desviacin media es un primer intento por buscar una medida de dispersin ms
eficiente que el rango.

Es abreviada por Dm y se define como:

X = media aritmtica

Xi = Datos de la muestra

1.5 Tabla de distribucion de frecuencias

N= Nmeros de datos

Las distribuciones de frecuencias son la forma en que repartimos las frecuencias.


La frecuencia es el nmero de veces que se repite una condicin especfica en un
conjunto de datos.
Generalmente ,las distribuciones de frecuencia se obtienen de tablas o listados de
informacin, donde no son claras ni detalladas la o las frecuencias o repeticiones de
ciertas condiciones, por lo que se debe elaborar una tabla que resuma la primera
informacin para que sea ms fcil obtener las frecuencias y poderlas distribuir.

Ejemplo 1.8
Alumno

Calificaciones

10

TABLA ORIGINAL DE LA MUESTRA OBTENIDA.

Calificacion
es

10

Son las calificaciones


existentes

Frecuencias

Son las veces que se


repite cada calificacin.

TABLA DE VALORES DONDE SE DISTRIBUYEN LAS FRECUENCIAS

Representacin grfica e interpretacin


La representacin grfica y su interpretacin consiste en transformar la tabla de valores
donde estn distribuidas las frecuencias en grficos muy conocidos y tradicionales en el
mundo de la estadstica, tales como:

Diagrama de puntos de frecuencia


Histograma
Polgono de frecuencia
Ojiva

Diagrama de puntos de frecuencias


El diagrama de puntos de frecuencia, se realiza colocando a las calificaciones en la parte
horizontal y escribiendo verticalmente un punto por cada calificacin (el nmero de
frecuencias indicado en la tabla de valores).
En el diagrama de puntos de frecuencias es ms fcil identificar la frecuencia mayor a
menor.

DIAGRAMA DE PUNTOS DE FRECUENCIAS.

Histograma
Grfico de barras verticales, donde cada barra nos da el valor de cada frecuencia de los
datos ms relevantes y de inters. Cada barra tiene un color, textura, o imagen diferente
y es caracterstica con respecto a las dems.

Curva de frecuencias
Los polgonos de frecuencias se realizan trazando los puntos que
representan las frecuencias y unindolos mediante segmentos.

Ojiva
Grfica de lneas que nos representa las frecuencias acumuladas de los datos; este grfico es
creciente y siempre nos seala en cada punto las frecuencias acumuladas.

OJIVA

1.6 Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de
los datos.
Q2 coincide con la mediana.

1.7 Graficos
El objetivo de construir grficos es poder apreciar los datos como un todo e identificar
sus caractersticas sobresalientes. El tipo de grfico a seleccionar depende del tipo de
variable que nos interese representar por esa razn distinguiremos en la presentacin
grficos para variables categricas y para variables numricas.

La representacin grfica de una distribucin de frecuencias puede realizarse a travs de:

Grfica de barras
Grfica de tortas

Grfico de barras

Este grfico es til para representar


datos categricos nominales u ordinales. A cada categora o clase de la variable se le
asocia una barra cuya altura representa la frecuencia o la frecuencia relativa de esa
clase. Las barras difieren slo en altura, no en ancho.
La escala en el eje horizontal es arbitraria y en general, las barras se dibujan
equiespaciadas, por esta razn este tipo de grfico slo debe usarse para variables
categricas.

Es importante que el eje vertical comience en cero, de modo que no se exageren


diferencias entre clases.
En un grfico de barras, as como en cualquier tipo de grfico se debe indicar el nmero
total de datos ya que el grfico slo muestra porcentajes o frecuencias relativas y la
fuente de la que se obtuvieron los mismos.

Grfico de tortas

En este grfico, ampliamente utilizado, se representa


la frecuencia relativa de cada categora como una porcin de un crculo, en la que el
ngulo se corresponde con la frecuencia relativa correspondiente. Como en todo grfico
es importante indicar el nmero total de sujetos. Esta representacin grfica es muy
simple y permite comparar la distribucin de una variable categrica en 2 o ms grupos.

REPRESENTACIN GRFICA DE UN NICO CONJUNTO DE DATOS NUMRICOS

Histograma

Se trazan dos ejes de coordenadas


rectangulares. En el eje horizontal se representan los valores de la variable y en el eje
vertical una medida de frecuencia (frecuencia absoluta, frecuencia relativa o frecuencia
relativa porcentual. Indicamos en el eje horizontal los lmites de los intervalos de clase.
Asociamos a cada clase una columna cuya base cubre el intervalo de clase y cuya altura
indica cuantos datos caen en une intervalo a travs de la frecuencia o la frecuencia
relativa de la clase.
El grfico se construye sin dejar espacio horizontal entre categoras, a menos que una
clase est vaca (es decir tenga altura cero).

Polgono de frecuencias

Alternativo al histograma de frecuencias


podemos representar la informacin a travs de los llamados polgonos de frecuencias.
Estos se construyen a partir de los puntos medios de cada clase. La utilizacin de los
puntos medios o marcas de clase son llevados al escenario grfico mediante la utilizacin
de los polgonos de frecuencias. Se construye uniendo los puntos medios de cada clase
localizados en las tapas superiores de los rectngulos utilizados en los histogramas de las
grficas. Su utilidad se hace necesaria cuando desean destacarse las variables de
tendencia central, como son media, modas y medianas.

Tallo-hojas espalda con espalda COMPARACION DE GRUPOS.

Los grficos de tallo-hojas son tiles para comparar la distribucin de una variable en dos
condiciones o grupos. El grfico se denomina tallo-hojas espalda con espalda porque
ambos grupos comparten los tallos.

1.8 Cajas y bigotes


Los diagramas de Caja-Bigotes son una presentacin visual que describe varias
caractersticas importantes, al mismo tiempo, tales como la dispersin y simetra.
Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los
datos, sobre un rectngulo, alineado horizontal o verticalmente.

Construccin:
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos
muestran el recorrido intercuartlico. Este rectngulo est dividido por un segmento
vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los
cuartiles primero y tercero (recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores
mnimo y mximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes.

Estos bigotes tienen tienen un lmite de prolongacin, de modo que cualquier dato o caso
que no se encuentre dentro de este rango es marcado e identificado individualmente.

1.9 Diagrama de Pareto


Es una herramienta que se utiliza para priorizar los problemas o las causas que los generan.
El diagrama de Pareto, tambin llamado curva 80-20,segn este concepto, si se tiene un
problema con muchas causas, podemos decir que el 20% de las causas resuelven el 80 % del
problema y el 80 % de las causas solo resuelven el 20 % del problema,el diagrama de pareto
es una grfica para organizar datos de forma que estos queden en orden descendente, de
izquierda a derecha y separados por barras. Permite, pues, asignar un orden de prioridades
.
Se recomienda el uso del diagrama de Pareto:

Para identificar oportunidades para mejorar .


Para identificar un producto o servicio para el anlisis de mejora de la calidad.
Cuando existe la necesidad de llamar la atencin a los problemas o causas de una
forma sistemtica.
Para analizar las diferentes agrupaciones de datos.
Al buscar las causas principales de los problemas y establecer la prioridad de las
soluciones

Para evaluar los resultados de los cambos efectuados a un proceso comparando


sucesivos diagramas
obtenidos en momentos diferentes, (antes y despus).
Cuando los datos puedan clasificarse en categoras .
Cuando el rango de cada categora es importante.

Los propsitos generales del diagrama de Pareto:

Analizar las causas


Estudiar los resultados
Planear una mejora continua
La Grfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar
visualmente en una solarevisin las minoras de caractersticas vitales a las que es importante
prestar atencin y de esta manera utilizar todos los recursos necesarios para llevar a cabo una

accin de mejora sin malgastar esfuerzos ya que con el anlisis descartamos las mayoras
triviales.

1.10 Uso de Software

La Hoja de Clculo Excel/Calc puede convertirse en una poderosa herramienta para crear
entornos de aprendizaje que enriquezcan la representacin (modelado), comprensin y
solucin de problemas, en el rea de la estadstica y probabilidad. Excel ofrece
funcionalidades que van ms all de la tabulacin, clculo de frmulas y graficacin de
datos.

En estadstica descriptiva representa todos los tipos de grficos y calcula la media,


moda, mediana, recorrido, varianza y desviacin tpica.

La instalacin del programa es muy sencilla, adems Microsoft Excel incluye un comando
para el anlisis de datos, dentro de las "herramientas para el anlisis", su uso es poco
comn, ya que no se tiene cuidado de instalar todas las funciones dentro de las
"herramientas", perdiendo la oportunidad de utilizar un medio poderoso para el estudio
dentro de la estadstica.

Ejercicio:Estadistica Unidimensional
Al lanzar dos dados 30 veces y anotar la suma de caras superiores hemos obtenido los
datos que presentamos en la siguiente tabla:

Resultados

10

11

Frecuencias

Una vez abierta la hoja de clculo EXCEL, deberemos introducir los datos en las celdas
A1-A30; luego seleccionamos en la barra de herramientas o bien hacemos clic con el
ratn en "Funcin fx" del men "insertar", apareciendo la ventana de dilogo donde
seleccionamos "Estadsticas" y la funcin que queramos calcular.

Para calcular la media seleccionamos la funcin = PROMEDIO del men, e introducimos


el rango de valores.
Todas la medidas se calculan de la misma forma:

la moda (= MODA (A1:A30)),

la mediana ( = MEDIANA (A1:A30)),

la desviacin media (= DESVPROM (A1:A30)) ,

la varianza (= VARP (A1:A30)),

los cuartiles (= CUARTIL (A1:A30)),

el coeficiente de asimetra (= COEFICIENTE DE ASIMETRA (A1:A30)),

el coeficiente de apuntalamiento (= CURTOSIS (A1:A30))...

Anda mungkin juga menyukai