BASADRE GROHMANN
FACULTAD DE CIENCIAS
ESTADISTICA Y PROBABILIDAD
- recopilar
-organizar ( clasificar o agrupar)
-presentar y
- analizar
Datos con el fin de describirlos o de realizar
generalizaciones validas que permita la toma de decisiones.
DDGGDDDDDDDDDDDIVISSSSSJJJDDDDDDJDDDDDDDION
SS
DIVISION:
ESTADISTICA DESCRIPTIVA.- Es el conjunto de mtodos
estadsticos que se encarga de la recoleccin, clasificacin
y la descripcin de datos , para su interpretacin anlisis y
toma de decisiones.
INFERENCIA ESTADISTICA .- Es el conjunto de mtodos y tcnicas que
permiten inducir, a partir de la informacin emprica proporcionada por
una muestra, el comportamiento de una poblacin con un riesgo de error
medible en trminos de probabilidad.
I.1.- DATO
I.- INFORMACION ESTADISTICA
Es toda informacin cualitativa o cuantitativa acerca de una
caracterstica de un conjunto de entes materiales o
inmateriales.
La fuente de obtencin de datos:
Las Estadsticas Vitales de los Pases (Registro Civil).
Boletines de los distintos Ministerios de los Pases.
Institutos Nacionales de Estadsticas.
Encuestas - Entrevistas.
Registro de importacin y exportacin de productos alimenticios
Reservas nacionales , balanza de pagos
Investigaciones diseadas con un propsito especfico.
Todas las posibilidades de bsqueda ofrecida hoy por
internet, etc.
FORMAS DE OBTENER INFORMACION:
a) mediante una urna
b) mediante una tmbola
c) mediante nmeros aleatorios
1.2.- POBLACIN
Conjunto de datos, observaciones o medidas
en un determinado universo del cual se desea
estudiar una caracterstica en particular y se
denota por N . El nmero de elementos de
la poblacin.
Ejem.
El rendimiento acadmico de los estudiantes de la UCV
La estatura de los trabajadores de la Zona de
Educacin
El nmero de votantes a favor de un candidato.
etc.
1.3.- MUESTRA
Cualquier subconjunto representativo
de la poblacin, requiere que las
unidades o elementos sean
seleccionados al azar.
se denotar por n el nmero de
elementos de la muestra
1.4.- ESTIMADOR
Es una estadstica que se obtiene a
partir de los datos muestrales
,describe alguna caracterstica de la
muestra, constituye una estimacin
de un parmetro, y se representa por
letras minsculas.
1.5.- PARMETRO
Es un nmero que describe alguna
caracterstica de toda la poblacin y para
determinar su valor es necesario utilizar la
informacin poblacional completa se
representa por letras griegas o letras
maysculas del idioma espaol. , P, ,
2 , S, S2 etc.
Poblacin
, , 2
inferencia Anlisis
Relacional
Muestra
x-,med,mod
ESTRUCTURA Y TIPOS DE DATOS ESTADISTICOS
Ejemplos:
El puntaje obtenido en un examen ( )
Nmero de aulas de un colegio ( )
Cantidad de alumnos aprobados en un examen ( )
Cantidad de libros defectuosos en una biblioteca.(
)
El tiempo que dura una prueba de examen ( )
Peso o estatura de un estudiante ( )
Temperatura ambiental promedio etc. ( )
Sin embargo existen variables que el valor
observado expresa un cierto orden o
jerarqua. Se le denomina Variable
Ordinal. Tiene la caracterstica de que el
valor obtenido indica un orden o jerarqua,
permitiendo indicar una posicin relativa de
los distintos elementos clasificados.
Rendimiento acadmico de un estudiante :
Bueno, Regular, Malo.
Grado de dificultad de una examen: fcil o
difcil .
Orden de meritos de un docente en la
Universidad
Grado de desarrollo de un Centro
Educativo
Etc.
PRACTICA CALIFICADA
NOMBRES Y APELLIDOS
1.- Clasifique las variables que aparecen a continuacin identifique el tipo que
segn la forma de expresar sus valores y la escala en que originalmente clasifi
unidades de observacin.
1. Numero de Hijos
2. Gestin Publica
3. Nivel de ingresos
4. Concentracin de un contaminante
5. Gnero
6. Estatura del recin nacido
7. Porcentaje de das trabajados
8. Ciclos de la maestra
9. Velocidad de un vehculo
10. Dificultad de un examen
11. Peso del oxigeno
12. Gravedad de un accidente
13. Clasificacin de las Regiones
14. Temperatura ambiental
15. Niveles de ansiedad
16. Edad en su ltimo cumpleaos
17. Profesin de una persona
18. Temperaturas registradas en un observatorio cada hora
DESARROLLO
MATRIZ DE LOS DATOS
Cuando se realiza un estudio sobre un
conjunto finito n sujetos, objetos, cosas,
individuos, entidades etc., normalmente existe
una variada gama de caractersticas y que se
expresan en los trminos vistos anteriores,
digamos entonces de manera genrica, que
determinan p variables.
Lo anterior permite construir lo que se llama
Base de Datos, que de manera muy general
podemos decir que es un arreglo tipo matricial
que tiene n filas y p columnas.
Individuos Var.X1 Var.X2 Var.X3 Var.X4 . Var.xp
.
1
2
3
4
.
.
.
.
n
El propsito de la matriz de datos es
presentar los datos de la manera ms
depurada posible para proceder al
procesamiento de los datos y obtener
informacin.
La primera preocupacin es entonces
aprender a estructurar una base de datos,
utilizando un software para su posterior
procesamiento.
Utilizaremos un software estadstico llamado
SPSS. Es una versin para ambiente
Windows 98 2000 y XP. SIM
Los datos se ingresan en una planilla, muy
similar a la denominada planilla EXCEL.
Construiremos una pequea base de datos,
con antecedentes de persona.
CONSTRUCCION DE UNA BASE
DEDATOS
Considere una planilla de sueldos de
una institucin publica :
Cdigo
Nombres y apellidos
Remuneracin
Edad
Mes
SEXO
GRAFICO : NUBE DE PUNTOS
TEMPERATURA SEMANAL
20
15
TEMPERATURA
10
0
1 2 3 4 5 6 7
DIAS
GRAFICO: LINEAL
TEMPERATURA SEMANAL
16
14
TEMPERATURA
12
10
8
6
4
0 2 4 6 8
DIAS
GRAFICO DE BARRAS
VERTICALES
TEMPERATURA SEMANAL
16
12
TEMPERATURA
0
1 3 5 7
2 4
DIAS
6
GRAFICO DE BARRAS
HORIZONTALES
TEMPERATURA SEMANAL
1
2
3
DIAS
4
5
6
7
0 4 8 12 16
TEMPERATURA
GRAFICO DE PARTES COMPONENTES
GRAFICO CIRCULAR
RENDIMIENTO ACADEMICO
17.18%
71.78% APRO
11.04% RET
17.18% DESAP
11.04%
71.78%
CAUSAS DEL BAJO RENDIMEINTO
ACADEMICO
CAUSAS CANTIDAD
Econmicas 180
Bibliografa 40
Conocimiento 50
Docente 30
Sicolgicas 12
Drogas 6
Otros 2
TOTAL 32 0
GRAFICO DE PARETO
RENDIMIENTO ACDEMICO
400
300
frequency
200
100
0
eco doc bibl conc Other
GRAFICO DE PARETO
400
99.38 100.00
93.75 97.50
300 84.38
71.88
CANTIDAD
200 56.25
100
0
eco bibl sic otros
doc conc dro
II. PROCESAMIENTO ESTADISTICO DE DATOS
2. Si yi a b xi = a b X
= y
x i pi
w i 1
k
p
i 1
i
Ejemplo 2 :
Se desea determinar el promedio ponderado de los estudiantes del primer ciclo de la
Escuela de Ing. Civil teniendo en cuenta los cursos y crditos
SOLUCION
Xi = Nota pi = Creditos
x i pi
w i 1
k
= 228/15 = 15.2
p
i 1
i
2.1.4 MEDIA GEOMTRICA .- Esta media corresponde al valor que tomara la
variable si se calculase la media aritmtica de los logaritmos de los datos
en lugar de los valores directos .
n
LogX
g Inv i
g= n x1 x 2 ........x n
i 1 o
=
n
Log
Este estadgrafo se utiliza principalmente en estudios
tales como distribucin de ingresos, clculo de ndice de p
de inters ,en estudios de crecimiento de poblacin . En
generales donde los valores de las variables representan
porcentajes de variacin relativos al comportamiento de
exponencial.
Ejemplo
k
ni xi
X = i 1
n
Se denomina media global de la muestra particionada.
Ejemplo1.
Si a una seccin de estudiantes se divide en tres grupos de practica A,B,C de 10,16,14
estudiantes, si su rendimiento acadmico de cada grupo es 15,14 y 12 respectivamente .
Cul ser el rendimiento global de toda la seccin.
SOLUCION
k
ni xi 15 10 14 16 12 14 542
i 1 = 13,55
n 40 40
1.1.7 MEDIANA: Es una medida de tendencia central que divide a la informacin en dos partes
iguales 50% a cada lado. Sean x1 , x 2 , x 3 Xn una muestra en orden creciente o
decreciente de magnitud. Entonces la mediana se define de la siguiente manera:
x n 1 /2 impar
med =
x n
2
2 1
x n
par
2
En el caso que la cantidad de datos sea un nmero impar , la mediana se obtiene ubicando
el valor que esta en el centro.
En el caso de que la cantidad de datos sea un nmero par, la mediana se obtiene como el
promedio de los dos valores centrales.
Ejemplo 3:
Las notas de 5 maestrantes fueron 11, 15, 17, 14, 13. Encontrar la la mediana de dichas
notas:
SOLUCIN
Como la cantidad de datos es impar entonces la mediana ser el valor central una vez
ordenado los datos: 11, 13, 14, 15,17 luego la med=14
1.1..8 MODA : Esta medida se conoce
tambin con el nombre de Promedio
Industrial. Est
representado por el valor o cantidad
que ms se repite o tiene una mayor
frecuencia
La distribucin de datos puede ser
modal
bimodal o multimodal
1.2 MEDIDAS DE VARIABILIDAD :
Estas medidas estn orientadas a cuantificar el grado o magnitud de cmo los datos se
dispersan entorno a una medida de tendencia central . Generalmente en torno a la media
aritmtica . Mucha dispersin es seal de poca uniformidad u homogeneidad en los datos.
Por el contrario poca dispersin , es seal de homogeneidad en los datos.
1.2.1 RANGO: Es una mediada de variabilidad que se obtiene de la diferencia entre el mayor
valor de la variable y el menor valor.
R = X mximo - X mnimo
2
Se utiliza, entre otras aplicaciones para construir intervalos de confiabilidad
en torno a los cuales ocilar un parmentro de una poblacin en estudio Si
la forma de la curva es una campana entonces el 68,27% de las veces la
medicin estar en el intervalo es decir :
x 2
CV = 100
X
VARIANZA GLOBAL:
Si una muestra de tamao n se particiona en K submuestras de
tamao s n , n , n.nk tales que
k
ni n
i 1
x1 , x 2 , x3 ,........x k son las medias ,
2
k k
ni (S i 2 X 2 i ) i
ni X 1
S x 2 i 1 1
n n
CAPITULO II