APUNTES N 1
ASIGNATURA: ESTADSTICA
CARRERA:
MATERIA: Estadstica Descriptiva. Poblacin, Muestra, Variable y Medicin.
Tipos de Variables, Tablas de Distribucin de Frecuencias y Grficos.
PROFESOR: Carlos Flores Carvajal.
ESTADSTICA
La palabra estadstica se emplea en una gran variedad de formas:
En plural como sinnimo de datos.
En singular tiene muchas definiciones solamente daremos dos.
Es una ciencia en si misma, y la vez una metodologa de investigacin.
Como la ciencia que nos proporciona un conjunto de mtodos, tcnicas
o procedimientos para:
- Recopilar,
- Organizar ( clasificar, agrupar),
- Analizar,
Datos con el fin de describirlos o de realizar generalizaciones vlidas.
Los conceptos de la estadstica pueden aplicarse en reas como:
- Los negocios
- La administracin,
- La psicologa,
- La agricultura etc.
Pero cuando nos referimos a las ciencias biolgicas y de la salud, utilizamos el trmino de
BIOESTADISTICA.
LA ESTADSTICA, SUS APLICACIONES Y MTODO.
Estamos en una etapa histrica, en que el uso y creacin de informacin, a partir de
informacin inicial, es fundamental, tanto en el mbito de las disciplinas de modelos
matemticos como en otras, al parecer desvinculadas de estas instancias.
En la lnea de lo primero, distinguimos, la Estadstica Descriptiva, que como su nombre lo
indica, ordena informacin, llegando a describir la ocurrencia de fenmenos o eventos,
mediante grficos o tablas, adems involucra la obtencin inicial de la informacin
deseada, sin pretender explicaciones de orden causal.
A estas medidas que resumen al gran conjunto de datos, se les llama Estadsticas o
Estadgrafos.
En la lnea de lo segundo, existir un conjunto de procedimientos que permitirn obtener
nueva informacin, es la Estadstica Inferencial, la que en su desarrollo terico,
permanentemente utiliza el concepto de Probabilidad, idea esta, que tambin llega a
desarrollar su propia teora, la Estadstica de Probabilidades.
( Inductiva)
ESTADSTICA DESCRIPTIVA:
Se denomina estadstica descriptiva, al conjunto de mtodos estadsticos que se relacionan
con el resumen y descripcin de los datos, como tablas, grficos y el anlisis mediante
algunos clculos.
INFERENCIA ESTADSTICA:
Se denomina inferencia estadstica al conjunto de mtodos con los que se hacen la
generalizacin o la inferencia utilizando una muestra. La inferencia puede contener
conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario que stas
sean dadas con una medida de confiabilidad que es la probabilidad.
Estas dos ramas de la estadstica no son mutuamente excluyentes, ya que para utilizar los
mtodos de la inferencia estadstica, se requiere conocer los mtodos de la estadstica
descriptiva.
FENOMENOS DETERMINSTICOS Y NO DETERMINSTICOS
En la vida cotidiana nos solemos encontrar con una serie de situaciones cuyas
consecuencias conocemos y de antemano podemos predecir, por ejemplo al finalizar el mes
de Septiembre, comienza el mes de Octubre, al sumar siete ms cinco, el resultado es doce,
los fenmenos como los descritos reciben el nombre de Fenmenos Determinsticos. Sin
embargo hay otros fenmenos con distintos resultados posibles, de los que no se pueden
efectuar afirmaciones certeras hasta que hayan ocurrido, por ejemplo lanzar un dado y
observar su cara superior, conocer los resultados de la polla gol del prximo domingo, estos
Nominal
Ordinal
De intervalos
De razones.
ESCALA DE INTERVALOS: Una escala de intervalos es una escala ordinal con cuyos
valores no slo se pueden verificar igualdad, no igualdad y orden, si no tambin, se puede
elegir una unidad de escala y comprobar cuntas veces la diferencia entre dos valores es
igual a la diferencia entre otros dos valores de la escala ( es decir , podemos comparar
intervalos ). Este tipo de escala tiene un cero relativo y no un cero absoluto.
Se miden en escalas de intervalos, por ejemplo, la temperatura, el tiempo que se registra en
nuestros calendarios, las calificaciones de una prueba de conocimientos. Estas mediciones
tienen un cero elegido arbitrariamente, por ejemplo el agua se congela a 0 grado Celsius ( =
32 grados F). La calificacin cero de un alumno en un examen de matemtica bsica, no
quiere decir no sabe nada de tal materia, pues con otra prueba ms fcil podra tener otra
calificacin.
Con los nmeros de esta escala son vlidas las relaciones de igualdad, de no igualdad y de
orden. Tambin son vlidas las operaciones de adicin y sustraccin entre los valores de la
escala. Pero no es vlida la multiplicacin y divisin entre los valores mismo de la escala.
Escalas de razn: La escala de razn es una escala de intervalo con cuyos valores
adems podemos comprobar cuntas veces un valor de la escala es igual a otro valor de la
escala. Tiene un cero absoluto. Con los nmeros de esta escala son vlidas las relaciones de
igualdad, de no igualdad , de orden y todas las operaciones matemticas. Los valores de
esta escala se obtienen en general, por mediciones tipo conteo (discretos) o por mediciones
tales como la longitud, peso, volumen, vida til etc.
ESTADSTICA DESCRIPTIVA
EN FORMA DIRECTA
(Censo Encuesta Entrevista )
RECOLECCIN
DE LOS DATOS
EN FORMA INDIRECTA
( I.N.E . REV. ESP. INTERNET )
CUALITATIVOS O ATRIBUTOS
( Sexo Estado civil profesin - Raza etc. )
CLASIFICACIN
DE LOS DATOS
DISCRETAS
CUANTITATIVOS O VARIABLES.
( Estatura Peso Sueldos Volumen etc )
CONTINUAS
Variable Cualitativa:
TABLAS DE DISTRIBUCIN
DE FRECUENCIAS
Cuantitativa
Continua.
TABLA DE DISTRIBUCIN DE FRECUENCIA
PARA VARIABLE CUALITATIVA.
Ejemplo:
En una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por
sus colores: Negro (N), blanco (B), Rojo (R), 20 consumidores dieron las siguientes
respuestas.
B
N
N
B
R
N
N
B
B
N
B
N
N
R
B
N
B
R
B
N
Construir la distribucin de frecuencias. Graficar la distribucin.
Distribucin de personas por su color preferido de una
Marca de bebida gaseosa.
Valores de x
Negro (N)
Blanco (B)
Rojo (R)
Total
Frecuencias
Porcentajes.
45
40
15
100
GRFICO CIRCULAR
10
Personas
8
6
4
Preferencias de bebidas
Serie1
15%
45%
Negro
Blanco
0
Negro
Blanco
Rojo
Rojo
40%
Frecuencia
Absoluta (ni)
0
1
2
3
4
1
4
7
6
2
20
Total
Frec. Abs.
Acumulada
(NI)
1
5
12
18
20
Frecuencia
Relativa (hi)
5
20
35
30
10
100
Frec. Relat.
Acumulada
(HI)
5
25
60
90
100
GRFICO DE BASTON
Ordenacin.
Determinar el campo de variacin (recorrido) de la variable.
Seleccionar la amplitud de los intervalos.
Fijar el lmite inferior y superior de cada intervalo.
Se definirn estos nuevos conceptos a travs del desarrollo del siguiente ejemplo.
Ejemplo:
Construir una tabla de distribucin de frecuencias de datos agrupados en intervalos de
clase. La duracin en horas de 60 tubos de ensayo, fabricados por un laboratorio, es la
siguiente.
295 322 302 301 314 319 319 297 304 312 315 310 319 315 294 300 322 312 317 312
300 290 320 304 318 314 310 319 309 311 323 294 324 301 317 307 310 317 310 319
308 294 304 300 322 313 323 323 295 291 316 314 318 311 306 312 318 307 306 313
Solucin
1.- Calcular el nmero de intervalos.
307 308 309 310 310 310 310 311 311 312 312 312 312 313 313 314 314 314 315 315
316 317 317 317 318 318 318 319 319 319 319 319 320 322 322 322 323 323 323 324
34
= 4,485 ~ 5
7
295
300
305
310
315
320
325
292.5
297.5
302.5
307.5
312.5
317.5
322.5
Frecuencia
Frecuencia
absoluta (ni) absoluta
Acumulada
5
5
3
8
9
17
6
23
15
38
14
52
8
60
n = 60
Frecuencia
relativa (hi)
8,33
5
15
10
25
23,3
13,3
100
Frecuencia
relativa
acumulada
8,33
13,33
28,33
38,33
63,33
86.63
100
Interpretacin de la tabla.
a) Cuntos tubos de ensayos tienen una duracin mayor o igual a 305 y menor a 310
horas?
b) Cuntos tubos de ensayos tienen una duracin menor a 315 horas.
c) Qu porcentaje de los tubos de ensayos tienen una duracin mayor o igual a 310
horas y menor a 315 horas?
d) Que porcentaje de los tubos de ensayos tiene una duracin menor a 300?
Grficos Histograma.
Tablas de Continencias
Una tabla de contingencia permite describir y analizar, el comportamiento de una variable
en relacin con otra variable.
En el caso de tablas de contingencia de 2x2, veamos los siguientes casos:
Ejemplo:
Se desea estudiar la relacin que existe entre encontrar trabajo y el conocimiento de un
determinado idioma. Con tal objeto se realiz una encuesta, la distribucin de los resultados
se presenta en la siguiente tabla de contingencia de 2x2
Con respecto a la tabla:
Idioma
Si
No
Total
11
4
15
7
10
17
18
14
32
Encontrar Trabajo
Si
No
Total
i) De los que encontraron trabajo Que tanto por ciento tena conocimiento de un
determinado idioma?
11
x100 73,33%
15
ii) Del total de la muestra. Cuantas personas encontraron trabajo y no tenan conocimiento
de un idioma?
7
x100 21,9%
32
iii) De los que no encontraron trabajo. Que tanto por ciento tena conocimiento de un
idioma?
4
X 100 26,67%
15