Anda di halaman 1dari 10

UNIVERSIDAD PEDRO DE VALDIVIA

APUNTES N 1
ASIGNATURA: ESTADSTICA
CARRERA:
MATERIA: Estadstica Descriptiva. Poblacin, Muestra, Variable y Medicin.
Tipos de Variables, Tablas de Distribucin de Frecuencias y Grficos.
PROFESOR: Carlos Flores Carvajal.

ESTADSTICA
La palabra estadstica se emplea en una gran variedad de formas:
En plural como sinnimo de datos.
En singular tiene muchas definiciones solamente daremos dos.
Es una ciencia en si misma, y la vez una metodologa de investigacin.
Como la ciencia que nos proporciona un conjunto de mtodos, tcnicas
o procedimientos para:
- Recopilar,
- Organizar ( clasificar, agrupar),
- Analizar,
Datos con el fin de describirlos o de realizar generalizaciones vlidas.
Los conceptos de la estadstica pueden aplicarse en reas como:
- Los negocios
- La administracin,
- La psicologa,
- La agricultura etc.
Pero cuando nos referimos a las ciencias biolgicas y de la salud, utilizamos el trmino de
BIOESTADISTICA.
LA ESTADSTICA, SUS APLICACIONES Y MTODO.
Estamos en una etapa histrica, en que el uso y creacin de informacin, a partir de
informacin inicial, es fundamental, tanto en el mbito de las disciplinas de modelos
matemticos como en otras, al parecer desvinculadas de estas instancias.
En la lnea de lo primero, distinguimos, la Estadstica Descriptiva, que como su nombre lo
indica, ordena informacin, llegando a describir la ocurrencia de fenmenos o eventos,
mediante grficos o tablas, adems involucra la obtencin inicial de la informacin
deseada, sin pretender explicaciones de orden causal.
A estas medidas que resumen al gran conjunto de datos, se les llama Estadsticas o
Estadgrafos.
En la lnea de lo segundo, existir un conjunto de procedimientos que permitirn obtener
nueva informacin, es la Estadstica Inferencial, la que en su desarrollo terico,
permanentemente utiliza el concepto de Probabilidad, idea esta, que tambin llega a
desarrollar su propia teora, la Estadstica de Probabilidades.

La Estadstica proporciona un conjunto de mtodos aplicables en todas las reas cientficas


donde se acumulan, se analizan y se interpretan datos: Salud y medicina, Biologa,
Economa, Administracin, Contabilidad, Ingeniera etc. y en la Investigacin Cientfica.
EL MTODO ESTADSTICO
El mtodo cientfico de investigacin se basa en dos tipos de razonamiento: el deductivo y
el inductivo. El mtodo deductivo procede de lo general a lo particular y utiliza
especialmente el razonamiento matemtico: se establecen hiptesis generales que
caracterizan un problema y se deducen ciertas propiedades particulares por razonamientos
lgicos. El mtodo inductivo realiza el proceso inverso: a partir de observaciones
particulares de ciertos fenmenos se intenta deducir unas reglas generales aplicables a todos
ellos.
La investigacin estadstica se desarrolla utilizando el ciclo deductivo- inductivo en las
siguientes etapas:
1. Planteamiento del problema
2. Recoleccin de la informacin
3. Organizacin y clasificacin de los datos recogidos
4. Anlisis e interpretacin de los resultados
5. Conclusiones

ESTADSTICA DESCRIPTIVA ( Deductiva )


ESTADSTICA
INFERENCIA ESTADSTICA

( Inductiva)

ESTADSTICA DESCRIPTIVA:
Se denomina estadstica descriptiva, al conjunto de mtodos estadsticos que se relacionan
con el resumen y descripcin de los datos, como tablas, grficos y el anlisis mediante
algunos clculos.
INFERENCIA ESTADSTICA:
Se denomina inferencia estadstica al conjunto de mtodos con los que se hacen la
generalizacin o la inferencia utilizando una muestra. La inferencia puede contener
conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario que stas
sean dadas con una medida de confiabilidad que es la probabilidad.
Estas dos ramas de la estadstica no son mutuamente excluyentes, ya que para utilizar los
mtodos de la inferencia estadstica, se requiere conocer los mtodos de la estadstica
descriptiva.
FENOMENOS DETERMINSTICOS Y NO DETERMINSTICOS
En la vida cotidiana nos solemos encontrar con una serie de situaciones cuyas
consecuencias conocemos y de antemano podemos predecir, por ejemplo al finalizar el mes
de Septiembre, comienza el mes de Octubre, al sumar siete ms cinco, el resultado es doce,
los fenmenos como los descritos reciben el nombre de Fenmenos Determinsticos. Sin
embargo hay otros fenmenos con distintos resultados posibles, de los que no se pueden
efectuar afirmaciones certeras hasta que hayan ocurrido, por ejemplo lanzar un dado y
observar su cara superior, conocer los resultados de la polla gol del prximo domingo, estos

fenmenos cuyos resultados no pueden asegurarse hasta el momento de su ocurrencia


reciben el nombre de fenmenos no determinsticos o aleatorios, no podemos saber cual de
los resultados ocurrir la prxima vez que se observe este fenmeno, aunque conozcamos
todos los resultados posibles.
Poblacin: En forma general, en estadstica, se denomina poblacin, a un conjunto de
elementos ( que consiste en personas, objetos etc. ), que tienen una o ms caracterstica
observable de naturaleza cualitativa o cuantitativa que se pueda medir. A cada elemento de
una poblacin se denomina unidad elemental o unidad estadstica.
Ejemplos.
1. Las edades de los estudiantes de la Universidad de Chile
2. Los dimetros de la produccin diaria de tuercas
3. Las placas de los automviles que circulan en el pas
4. Los enfermos de SIDA tratados con uno de tres tratamientos diferentes
Muestra: Despus de definir la investigacin estadstica a realizar, se debe decidir entre
investigar toda la poblacin o solo una parte de ella. El primer procedimiento es
denominado CENSO y el segundo MUESTREO.
Se denomina muestra a una parte de la poblacin seleccionada de acuerdo con un plan o
regla, con el fin de obtener informacin acerca de la poblacin de la cual proviene.
La muestra debe ser seleccionada de manera que sea representativa de la poblacin.
Ejemplo:
Si se desea estimar el gasto promedio anual de los estudiantes del AIEP de todo Chile, se
extraera una muestra formada por cierto nmero de estudiantes, en seguida se determinara
el gasto anual correspondiente a cada uno de ellos y despus se obtendra el promedio de
estos gastos.
VARIABLES ESTADSTICAS
La caracterstica que se mida en unidades elementales de una poblacin definida por la
tarea estadstica, tiene diversos valores de naturaleza cualitativa o cuantitativa. Por ejemplo,
la caracterstica sexo tiene dos modalidades: hombre y mujer, la caracterstica peso en
kilogramos tiene infinitos valores.
VARIABLE: Se denomina variable estadstica a una caracterstica definida en la
poblacin por la tarea o investigacin estadstica, que puede tomar dos o ms valores
( cualidades o nmeros).
Ejemplos:
1. Horas extras realizadas por los trabajadores de una empresa
2. Nmero de hijos de una muestra de familias
3. Nivel educacional y religin de los chilenos
4. Temperatura y humedad diaria en Santiago
ESCALAS DE MEDICIN
La asignacin de valores a cada una de las unidades estadsticas mediante una variable, se
hace siguiendo determinadas escalas de medicin.

ESCALA DE MEDICIN, es un instrumento de medida, con el que se asigna valores (


cualidades o nmeros ) a las unidades estadsticas para una variable definida.
El conocimiento de las escalas de medicin es muy importante, pues cada una de ellas
tienen mtodos estadsticos especficos.
Las escalas de medicin son de los siguientes tipos:

Nominal
Ordinal
De intervalos
De razones.

ESCALA NOMINAL. En el estudio de la estadstica encontramos distintos tipos de


datos numricos, los cuales, a su vez, tienen diferentes grados de estructura en las
relaciones entre sus posibles valores. Una de las clases ms simples de datos es la variable
nominal, en la cual los valores se registran dentro de categoras o clases desordenadas.
Ejemplo N 1
En cierto estudio, los hombres podra asignrseles el valor 1 y las mujeres el 0. Aunque los
atributos se indican con nmeros, en lugar de vocablos, tanto el orden como las magnitudes
de los nmeros son irrelevantes. Podramos simplemente representar con el 1 a las mujeres
y con el cero a los hombres. Los nmeros se utilizan principalmente por razones de
conveniencia.
Ejemplo N 2
A menudo hay tres o ms posibles categoras dentro de las cuales pueden colocarse las
observaciones.
Por ejemplo, las personas podran agruparse segn su tipo sanguneo de manera que:
1 represente 0
2 represente el tipo A
3 represente el tipo B
4 represente el tipo AB
De nuevo la secuencia de estos valores no tiene importancia. Los nmeros simplemente
sirven de etiquetas para los diferentes tipos de sangre, como lo hacen las letras.
Si se asignan nmeros a estos valores cualitativos ( modalidades ), con estos no se pueden
realizar operaciones aritmticas. Slo son vlidas las relaciones de igualdad ( = ) y no
igualdad ( )
ESCALA ORDINAL: Cuando el orden entre las categoras adquiere importancia se
denominan
escalas ordinales.
Ejemplo N 1
Los daos pueden clasificarse de acuerdo con su grado de gravedad, de modo que:
1 represente un dao fatal
2 un dao severo
3 un dao moderado
4 un dao menor.
Aqu existe un orden natural entre los agrupamientos. An no nos interesa la magnitud de
estos nmeros. Podramos haber asignado el 4 al dao fatal y el 1 al menor.
Si asignan nmeros a tales modalidades, con estos, no se pueden realizar operaciones
aritmticas. Slo son vlidas las relaciones de igualdad ( = ), de no igualdad ( ) y de orden
( ).

ESCALA DE INTERVALOS: Una escala de intervalos es una escala ordinal con cuyos
valores no slo se pueden verificar igualdad, no igualdad y orden, si no tambin, se puede
elegir una unidad de escala y comprobar cuntas veces la diferencia entre dos valores es
igual a la diferencia entre otros dos valores de la escala ( es decir , podemos comparar
intervalos ). Este tipo de escala tiene un cero relativo y no un cero absoluto.
Se miden en escalas de intervalos, por ejemplo, la temperatura, el tiempo que se registra en
nuestros calendarios, las calificaciones de una prueba de conocimientos. Estas mediciones
tienen un cero elegido arbitrariamente, por ejemplo el agua se congela a 0 grado Celsius ( =
32 grados F). La calificacin cero de un alumno en un examen de matemtica bsica, no
quiere decir no sabe nada de tal materia, pues con otra prueba ms fcil podra tener otra
calificacin.
Con los nmeros de esta escala son vlidas las relaciones de igualdad, de no igualdad y de
orden. Tambin son vlidas las operaciones de adicin y sustraccin entre los valores de la
escala. Pero no es vlida la multiplicacin y divisin entre los valores mismo de la escala.
Escalas de razn: La escala de razn es una escala de intervalo con cuyos valores
adems podemos comprobar cuntas veces un valor de la escala es igual a otro valor de la
escala. Tiene un cero absoluto. Con los nmeros de esta escala son vlidas las relaciones de
igualdad, de no igualdad , de orden y todas las operaciones matemticas. Los valores de
esta escala se obtienen en general, por mediciones tipo conteo (discretos) o por mediciones
tales como la longitud, peso, volumen, vida til etc.

ESTADSTICA DESCRIPTIVA

EN FORMA DIRECTA
(Censo Encuesta Entrevista )
RECOLECCIN
DE LOS DATOS
EN FORMA INDIRECTA
( I.N.E . REV. ESP. INTERNET )

CUALITATIVOS O ATRIBUTOS
( Sexo Estado civil profesin - Raza etc. )

CLASIFICACIN
DE LOS DATOS

DISCRETAS

CUANTITATIVOS O VARIABLES.
( Estatura Peso Sueldos Volumen etc )
CONTINUAS

VARIABLE CUALITATIVA, es la caracterstica cuyos valores se expresan en escalas


nominal u ordinal, por ejemplo, sexo, profesin, estado civil. Con sus valores, que son
cualidades, no se pueden realizar operaciones aritmticas.
Variable cuantitativa, es la caracterstica cuyos valores se expresan en escalas de
intervalos o de razn, por ejemplo, temperatura, nmero de hijos, ingresoa mensuales,
tiempo de vida til, etc. Con sus valores, que son nmeros, se pueden realizar operaciones
aritmticas.
Las variables cuantitativas, a su vez, se clasifican en : discretas, y continuas.
Variable Discreta, es aquella variable cuantitativa que puede tomar slo ciertos valores
en un intervalo considerado y no admite ningn valor entre dos valores consecutivos fijos.
Generalmente, es una variable cuyos valores se obtienen por conteo (nmeros naturales).
Por ejemplo, una familia puede tener 0,1,2,.....hijos, pero no un valor intermedio.
Variable Continua, es aquella variable cuantitativa que puede tomar cualquier valor en
el intervalo considerado, por ejemplo, salario, tiempo, peso, volumen, longitud, etc.

ORGANIZACIN DE LOS DATOS

Variable Cualitativa:
TABLAS DE DISTRIBUCIN
DE FRECUENCIAS

Variable Cuantitativa Discreta.


Variable

Cuantitativa

Continua.
TABLA DE DISTRIBUCIN DE FRECUENCIA
PARA VARIABLE CUALITATIVA.
Ejemplo:
En una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por
sus colores: Negro (N), blanco (B), Rojo (R), 20 consumidores dieron las siguientes
respuestas.
B
N
N
B
R
N
N
B
B
N
B
N
N
R
B
N
B
R
B
N
Construir la distribucin de frecuencias. Graficar la distribucin.
Distribucin de personas por su color preferido de una
Marca de bebida gaseosa.
Valores de x
Negro (N)
Blanco (B)
Rojo (R)
Total

Frecuencia Absoluta Frecuencia Relativa


ni
hi
9
0.45
8
0.40
3
0.15
20
1.00

Frecuencias
Porcentajes.
45
40
15
100

Grficos recomendables para este tipo de tabla:

GRFICO DE BARRAS SIMPLE


Preferencias de bebidas

GRFICO CIRCULAR

10

Personas

8
6
4

Preferencias de bebidas
Serie1

15%
45%

Negro
Blanco

0
Negro

Blanco

Rojo

Rojo

40%

TABLA DE DISTRIBUCIN DE FRECUENCIAS


PARA VARIABLE CUANTITATIVA DISCRETA.
Ejemplo:
Ante la pregunta del nmero de mascotas por hogar(variable x) una muestra de 20 hogares,
marc las siguientes respuestas:
2
1
2
4
1
3
2
3
2
0
3
2
1
3
2
3
3
1
2
4
Construir una tabla de distribucin de frecuencias.
Distribucin de frecuencias, del nmero de Mascotas por Hogar
N de Mascotas

Frecuencia
Absoluta (ni)

0
1
2
3
4

1
4
7
6
2
20

Total

Frec. Abs.
Acumulada
(NI)
1
5
12
18
20

Grficos recomendable para este tipo de tabla

GRFICO DE BARRAS SIMPLE

Frecuencia
Relativa (hi)
5
20
35
30
10
100

Frec. Relat.
Acumulada
(HI)
5
25
60
90
100

GRFICO DE BASTON

TABLAS DE DISTRIBUCIN DE FRECUENCIAS


PARA VARIABLE CUANTITATIVA CONTINUA.
PASOS PARA LA CONSTRUCCIN DE LA TABLA.
- Calcular el nmero de intervalos.
- Calcular la marca de clase.
- Obtener las frecuencias absolutas y relativas.
- Obtener las frecuencias acumuladas.
Para determinar el nmero de intervalos de una distribucin de frecuencias es
necesario seguir cuatro pasos.
A)
B)
C)
D)

Ordenacin.
Determinar el campo de variacin (recorrido) de la variable.
Seleccionar la amplitud de los intervalos.
Fijar el lmite inferior y superior de cada intervalo.

Se definirn estos nuevos conceptos a travs del desarrollo del siguiente ejemplo.
Ejemplo:
Construir una tabla de distribucin de frecuencias de datos agrupados en intervalos de
clase. La duracin en horas de 60 tubos de ensayo, fabricados por un laboratorio, es la
siguiente.
295 322 302 301 314 319 319 297 304 312 315 310 319 315 294 300 322 312 317 312
300 290 320 304 318 314 310 319 309 311 323 294 324 301 317 307 310 317 310 319
308 294 304 300 322 313 323 323 295 291 316 314 318 311 306 312 318 307 306 313

Solucin
1.- Calcular el nmero de intervalos.

A) Se ordenan los datos de menor a mayor.


290 291 294 294 294 295 295 297 300 300 300 301 301 302 304 304 304 306 306 307

307 308 309 310 310 310 310 311 311 312 312 312 312 313 313 314 314 314 315 315
316 317 317 317 318 318 318 319 319 319 319 319 320 322 322 322 323 323 323 324

B) Campo de variacin (c.v.) = Mayor valor - Menor valor.


C.V. = 324 - 290 = 34

C) SELECCIONAR LA AMPLITUD DE LOS INTERVALOS.


Cuando se tienen un conjunto de datos y se especifica el nmero de intervalos para la tabla,
entonces la amplitud ( a ) se obtiene de la siguiente forma,
C.V
I) a =
N de intervalos
Cuando no se especifica el nmero de intervalos se sugiere el siguiente procedimiento.
II)

N de intervalos es igual 1 + 3,3 log ( n )


a=

1 + 3,3 log ( 60 ) = 6,86 ~ 7,0

34
= 4,485 ~ 5
7

III) Fijar los limites inferior y superior de los intervalos.


IV) Calcular la marca de clase.
V) Calcular las frecuencias absolutas, relativas y acumuladas.

DURACION EN HORAS DE 60 TUBOS DE ENSAYOS


Duracin en Marca de
horas
Clase
290 295 300 305 310 315 320 Totales

295
300
305
310
315
320
325

292.5
297.5
302.5
307.5
312.5
317.5
322.5

Frecuencia
Frecuencia
absoluta (ni) absoluta
Acumulada
5
5
3
8
9
17
6
23
15
38
14
52
8
60
n = 60

Frecuencia
relativa (hi)
8,33
5
15
10
25
23,3
13,3
100

Frecuencia
relativa
acumulada
8,33
13,33
28,33
38,33
63,33
86.63
100

Interpretacin de la tabla.
a) Cuntos tubos de ensayos tienen una duracin mayor o igual a 305 y menor a 310
horas?
b) Cuntos tubos de ensayos tienen una duracin menor a 315 horas.
c) Qu porcentaje de los tubos de ensayos tienen una duracin mayor o igual a 310
horas y menor a 315 horas?
d) Que porcentaje de los tubos de ensayos tiene una duracin menor a 300?

Grficos Histograma.

Grfico Polgono de frecuencias.

Tablas de Continencias
Una tabla de contingencia permite describir y analizar, el comportamiento de una variable
en relacin con otra variable.
En el caso de tablas de contingencia de 2x2, veamos los siguientes casos:
Ejemplo:
Se desea estudiar la relacin que existe entre encontrar trabajo y el conocimiento de un
determinado idioma. Con tal objeto se realiz una encuesta, la distribucin de los resultados
se presenta en la siguiente tabla de contingencia de 2x2
Con respecto a la tabla:
Idioma

Si

No

Total

11
4
15

7
10
17

18
14
32

Encontrar Trabajo

Si
No
Total

i) De los que encontraron trabajo Que tanto por ciento tena conocimiento de un
determinado idioma?
11
x100 73,33%
15

ii) Del total de la muestra. Cuantas personas encontraron trabajo y no tenan conocimiento
de un idioma?
7
x100 21,9%
32

iii) De los que no encontraron trabajo. Que tanto por ciento tena conocimiento de un
idioma?
4
X 100 26,67%
15

Anda mungkin juga menyukai