Anda di halaman 1dari 68

MUESTREO ESTADSTICO PARA AUDITORA.

Conceptos Bsicos
de Estadstica
Clase No. 1
Alonso Bermdez M., MDE

Qu es la estadstica?
Mtodos y procedimientos destinados a recoger,
clasificar, resumir, hallar regularidades, analizar los
datos y realizar inferencias con el fin de ayudar a
la toma de decisiones y en su caso formular
predicciones.

CLASIFICACIN
ESTADSTICA
DESCRIPTIVA

ESTADSTICA
INFERENCIAL

Describe, analiza y
representa un grupo de
datos utilizando
mtodos numricos y
grficos que resumen y
presentan la
informacin contenida
en ellos.

A partir del clculo de


probabilidades y datos
muestrales, efecta
estimaciones, decisiones,
predicciones u otras
generalizaciones sobre un
conjunto mayor de datos.

DEFINICIONES Y CONCEPTOS BSICOS


Individuos o elementos: Personas u objetos que
contienen cierta informacin que se desea estudiar.
Poblacin: Conjunto de individuos o elementos que
cumplen ciertas propiedades comunes.
Muestra: Subconjunto representativo de una
poblacin.
Muestreo: Mtodos para la recoleccin de la muestra.
Datos: Conjunto de valores de una variable para cada
uno de los elementos de la muestra.

DEFINICIONES Y CONCEPTOS BSICOS


Variable: Caracterstica que toma diferentes valores en
diferentes personas, lugares o cosas.
Ordinales
Variables cualitativas
Nominales

Discretas
Variables cuantitativas
Continuas

Parmetro: Medicin numrica que describe algunas


caractersticas de una poblacin.
Estadstico: Medicin numrica que describe algunas
caractersticas de la muestra.

Qu incluye un problema
estadstico?
Definicin clara del objetivo del experimento y de
la poblacin pertinente.

Diseo del experimento o procedimiento del


muestreo.

Recoleccin y anlisis de los datos.


El procedimiento para hacer inferencias acerca de
la poblacin, basado en la informacin muestral.

La provisin de una medida


(confiabilidad) para la inferencia.

de

bondad

MUESTREO
Se utiliza cuando surgen preguntas de cmo
seleccionar la informacin y qu tan grande debe ser
el tamao de la muestra para que las conclusiones e
inferencias acerca de alguna caracterstica de una
poblacin sean representativas.

Poblacin pequea

Censo

Poblacin grande

Muestreo

CLASIFICACIN
Sin reposicin
TIPOS DE MUESTREO
Con reposicin

Muestreo Aleatorio Simple


ALGUNOS MTODOS
DE MUESTREO

Muestreo Aleatorio Sistemtico


Muestreo Aleatorio Estratificado

Muestreo Aleatorio por rea o


Conglomerados

ESTADSTICA
DESCRIPTIVA

DATOS
CUALITATIVOS

ESTADSTICA DESCRIPTIVA
DATOS CUALITATIVOS
Se miden en
escala
Nominal

Ordinal

Se representan
en
Grficos
Diagramas de
Barras
Diagramas de Sectores

Tablas
Frecuencia
Contingencia

ANLISIS DE VARIABLES
CUALITATIVAS
Ejemplo:
Se recolectaron datos
sobre el nivel
acadmico de 120
empleados de una
empresa

REPRESENTACIN TABULAR
FRECUENCIA

FRECUENCIA
RELATIVA

Bachiller

40

0,33

40

0,33

Tcnico

27

0,23

67

0,56

Tecnlogo

27

0,23

94

0,78

Profesional

20

0,17

114

0,95

0,05

120

1,00

CLASE

Posgrado

FRECUENCIA FRECUENCIA RELATIVA


ACUMULADA
ACUMULADA

En un conjunto de datos, se define moda como el valor de


mayor frecuencia. En nuestro ejemplo, Bachiller es la clase
modal.

DIAGRAMA DE BARRAS
45
40
35
30
25
20
15
10
5
0
Bachiller

Tcnico

Tecnlogo

Profesional

Posgrado

DIAGRAMA DE SECTORES
FRECUENCIAS RELATIVAS

0.05
0.17

0.33

0.23
0.23

Bachiller
Tcnico
Tecnlogo
Profesional
Posgrado

TABLAS DE CONTINGENCIA
La empresa del ejemplo anterior consta de tres plantas
y sus empleados estn distribuidos de la siguiente
forma:

Diagrama de Barras:
18
16
14
12

Bachiller
Tcnico
Tecnlogo
Profesional
Posgrado

10
8
6
4
2
0

Planta A

Planta B

Planta C

Diagrama de Barras:
45
40
35
Posgrado
Profesional
Tecnlogo
Tcnico
Bachiller

30
25
20
15
10
5
0

Planta A

Planta B

Planta C

DATOS
CUANTITATIVO
S

ESTADSTICA DESCRIPTIVA
DATOS CUANTITATIVOS
Se dividen en
Discretos

Continuos
Se miden en
escalas
Razn

Se representan
en

Intervalos

Se resumen en medidas
de

Grficos

Tablas

Centralidad

Histogramas

Frecuencia
Agrupada

Media

Varianza

Mediana

Rango

Moda

Coeficiente de
Variacin

Boxplot
Diagramas de
Dispersin

Frecuencia no
Agrupada

Variabilidad

A) ESTADSTICOS DESCRIPTIVOS
1. Medidas de Tendencia Central:
. Media Aritmtica
. Mediana: Es el valor que divide los datos en dos
partes
iguales cuando estos se presentan en orden
de magnitud creciente o decreciente.
. Moda: Valor que ocurre con mayor frecuencia.

A) ESTADSTICOS DESCRIPTIVOS
2. Medidas de Colocacin:
)
)

Percentiles
Cuartiles

3. Medidas de Dispersin:
)

Rango:

Varianza:

ESTADSTICA BSICA I

A) ESTADSTICOS DESCRIPTIVOS
3. Medidas de Dispersin:

Rango Semi-intercuartil:

Coeficiente de Variacin:

Desviacin Estndar :

B) REPRESENTACIN DE DATOS
Ejemplo:
Se recolectaron datos
sobre las notas
correspondientes a los
cursos de matemticas
de un grupo de 50
estudiantes.

TABLA DE FRECUENCIAS
Al resumir grandes cantidades de datos, es til
distribuir los datos en clases o categoras y
determinar el nmero de individuos que
pertenecen a cada clase, llamado frecuencia de
clase. Una disposicin tabular de los datos por
clases junto con las correspondientes frecuencias
de clase, se llama distribucin de frecuencias. Los
datos as organizados en clases como en la
anterior distribucin de frecuencias se llaman
datos agrupados.

TABLA DE FRECUENCIAS
Reglas Generales Para la Distribucin de Frecuencias:

Si k es el nmero de clases y n el tamao de la muestra,


entonces se recomienda que:

Si R es el rango de los datos y k es el nmero de clases,


entonces como tamao o extensin de un intervalo de clase
se toma el valor
, de tal manera que

Las fronteras de clase son cerradas por el lado izquierdo.

TABLA DE FRECUENCIAS
Para nuestro ejemplo, la tabla de frecuencias
correspondiente a matemticas es:

GRFICOS
Histograma
Histograma - Matemticas

Frecuencia

18
16
14
12
10
8
6
4
2
0

Frecuencia

Clase

GRFICOS
Boxplot
Proporciona informacin
sobre
el
centro,
la
dispersin y la simetra
de
un
conjunto
de
observaciones. En l se
pueden ubicar valores
como los cuartiles, la
media, la mediana y los
valores
mximo
y
mnimo de los datos

Utilidad de la Estadstica e Importancia


de la tica
Utilidad del conocimiento estadstico
Descubrir la existencia o no
existencia de problemas
Identificar posibles factores
explicativos de problemas
previamente formulados
Evaluar soluciones aplicadas a los
problemas
Importancia de la tica

tica en la estadstica
Usos ilegtimos de la estadstica
Comparar datos que no siempre son
comparables
Derivar conclusiones de datos no
representativos
Esconder parte de las evidencias
Manipular representaciones grficas
Confundir asociacin con causalidad
Derivar conclusiones que no pueden
sostenerse con la evidencia disponible
Medir cambio a partir de bases inadecuadas
Interpretaciones acomodaticias

tica en la estadstica
Continuacin de usos ilegtimos de la estadstica
Buenas matemticas y malas estadsticas
Grficas engaosas
Informacin insuficiente
Muestras pequeas
Confundir estimaciones con conjeturas
Uso de por cientos en forma distorsionada
Datos parciales
Distorsiones deliberadas
Preguntas predispuestas
Presin del encuestador

Factores que pueden afectar la tica


Sesgo (bias) en seleccin de la muestra
Exclusin individuos que puedan responder
preguntas especficas
Presentacin de resultados sin dar tamao de
muestra ni el margen de error
Preguntas sesgadas
Entrevistador con actitudes y tono de voz
deliberado que promueve respuestas en cierta
direccin
Persona que responde a encuesta puede
proveer informacin falsa a propsito

Definiciones

Estadstica
Ciencia que trata sobre la
recopilacin,
organizacin,
presentacin,
anlisis
e
interpretacin de informacin,
con apoyo matemtico, a travs
de
estudios
investigativos
cientficamente diseados y
realizados con el objetivo de
tomar decisiones respecto a un
problema.

Se realizan los siguientes procesos


en una muestra:
Recopilacin de datos
Organizacin y tabulacin de los datos
recopilados
Presentacin de los datos en tablas y
grficas (Ayuda a resumir e interpretar
los datos)
Anlisis estadstico (Aplicacin de
medidas estadsticas tales como:
Tendencia Central, Posicin, Variacin)
Interpretacin del anlisis estadstico

Estadstica Inferencial
Es la rama de la estadstica que
utiliza informacin obtenida del
estudio de una muestra para hacer
inferencias sobre la poblacin.
Comprende la aplicacin de una serie
de tcnicas estadsticas
especializadas que permiten inferir
las caractersticas de la poblacin.

Poblacin
Es la totalidad de sujetos
(personas, animales, u objetos)
que comparten en comn la
caracterstica o variable bajo
estudio.
Representa el universo de donde
se extrae una muestra.

Muestra
La muestra es un subconjunto de la
poblacin
Muestra representativa- Tiene las
mismas caractersticas de la
poblacin en la misma proporcin.
En una muestra representativa
cada sujeto en la poblacin tiene la
misma oportunidad de ser
seleccionado.

Parmetro y Estadgrafo
ParmetroMedida que se obtiene por medio
del estudio de una poblacin.
Estadgrafo o estadsticaMedida que se obtiene por medio
del estudio de una muestra.

Tipos de Muestreo

Muestreo aleatorioProcedimiento que utiliza mtodos aleatorios para


seleccionar la muestra. En este tipo de muestra se
conoce de antemano cul es la oportunidad que
cada sujeto tiene de ser seleccionado.
Muestreo no-aleatorioIntervienen factores no-aleatorios en la seleccin
de los sujetos

Muestreo Aleatorio
Tipos de muestreo aleatorio:
Simple
Conglomerado o grupos intactos
Estratificado
Sistemtico

Para poder hacer inferencias a una


poblacin se necesita tener
muestras aleatorias

Muestreo Simple
Cada sujeto de la poblacin (N) tiene
la misma probabilidad de ser elegido.
Se tiene una lista de los n sujetos de
la muestra rotulados o identificados
con un nmero.
Se utilizan mtodos de seleccin tipo
urna o al azar. Puede ser con
reemplazo o sin reemplazo.

Muestreo Simple

Tabla de Nmeros Aleatorios

A veces es inconveniente usar una


urna por la dificultad de poder mover
bien las tarjetas, los bolos o los
objetos que representan los sujetos
de la muestra.
Por eso, se usa la tabla de nmeros
aleatorios.
Demostrar ejemplo de la utilizacin
de la tabla de nmeros aleatorios.
Seleccin de una muestra de 10 sujetos
de una poblacin de 50 sujetos.

Muestreo Simple

Tabla de Nmeros Aleatorios

Tambin, se puede utilizar una


calculadora o computadora que
genere nmeros aleatorios.
La tabla de nmeros aleatorios es
generada por una computadora.

Muestreo Sistemtico
Se usa este muestreo cuando se tiene una
lista de los N miembros de la poblacin.
Se llama sistemtico porque se selecciona
sistemticamente cada k-simo miembro de
la lista de la poblacin.
O sea, si k es 50, se selecciona cada
50-simo sujeto de la lista
El primer sujeto de la muestra se halla al
azar.
Luego, se determina la fraccin que nos da
el nmero k.

Muestreo Sistemtico
Ejemplo: N es 15,000. Se desea
seleccionar una muestra que represente el
2% de la poblacin.

(15,000) (0.02) 300

Por tanto, n es 300.


Para determinar k, se divide n y se
N
simplifica:

n
300
1

N 15,000 50

Observa que el
numerador de la
fraccin es 1.

El denominador de la fraccin anterior


representa k.

Muestreo Sistemtico
Continuacin: N es 15,000, n es 300, k es 50.
Se selecciona al azar el primer sujeto de la
muestra entre 1 y k. Supn que
seleccionamos el sujeto nmero 37.
El segundo sujeto de la muestra ser el 50simo sujeto despus del primero, o sea:
37 + 50 = 87.
El tercer sujeto ser: 87 + 50 = 137.
Se contina seleccionando los dems sujetos
cada 50-simo sujeto despus de anterior
hasta completar los 300 sujetos de la muestra.

Muestreo Sistemtico
Muestras simples o sistemticas podran no
ser representativas de la poblacin.
Por qu?
Supn que la lista est por orden alfabtico,
qu probabilidad tiene de salir el primer y
el ltimo sujeto de la lista?, Si hay dos
hermanos en la lista, qu probabilidad hay
de que salgan ambos?
Recomendacin: La lista de la poblacin
debe estar organizada aleatoriamente.
Si se utiliza una lista alfabtica, se debe
asegurar que est libre de sesgo.

Muestreo Sistemtico
El muestreo sistemtico es ms
conveniente que el muestreo simple
cuando se tiene una lista de la poblacin.
No siempre es tan fcil de obtener como
este ejemplo.
A veces se torna compleja cuando en la
1
fraccin
, k es decimal.
k
Se usa muestreo sistemtico cuando el
proceso de seleccin es ms fcil que el
muestreo simple.
En caso de que k sea decimal, quizs
conviene mejor usar el muestreo simple.

Muestreo Estratificado
Los muestreos anteriores asumen que la
poblacin es homognea.
Sin embargo, la poblacin pudiera ser
heterognea y consistir de varias
subpoblaciones o estratos.
Ejemplo: Estudiantes de una universidad.
Posibles estratos: Ao de estudio, subgraduadograduado, Programa acadmico, Gnero,
Diurno-Nocturno, etc.

Muestreo Estratificado
Proceso para seleccionar la muestra estratificada:
Se dividen los N sujetos en subpoblaciones o
estratos de acuerdo a la caracterstica en comn
que se interesa estudiar.
Se realiza un muestreo aleatorio simple (o
estratificado) en cada estrato para sacar sujetos
dentro de cada uno.
Se unen todos los sujetos de las muestras
aleatorias separadas para formar la muestra.
La muestra seleccionada dentro de cada estrato
puede ser la misma para todos los estratos o
puede ser proporcional a cada subpoblacin.

Muestreo Estratificado
En algunos casos, el muestreo estratificado es ms
eficiente que los mtodos anteriores porque
garantiza representacin de la caracterstica que se
interesa estudiar, principalmente en la misma
proporcin que la subpoblacin estudiada.
Pero, esta no es la razn principal.
Muestreo simple tiende a distribuirse
proporcionalmente.
En el muestreo estratificado, si los estratos son
heterogneos, aumenta la precisin estadstica.
Esto es muy deseable cuando se va a determinar el
proceso de seleccin de la muestra.
Si se disminuye la variacin en la distribucin
muestral de la medida estadstica que se utilice, los
resultados sern ms precisos.

Muestreo Conglomerado o Grupos Intactos


A veces no se pueden seleccionar sujetos
individuales de una poblacin. Los sujetos
pertenecen a grupos que no pueden separarse
de ellos.
Ejemplo: estudiantes en salones de clases,
estudiantes en escuelas de un distrito.
En estos casos, los conglomerados, y no los
individuos, son los que se seleccionan
aleatoriamente de la poblacin de
conglomerados.
Cada sujeto de la poblacin debe pertenecer a
un solo conglomerado (uno y solo uno).
Los conglomerados pueden tener diferente
nmero de sujetos.

Muestreo Conglomerado o Grupos Intactos


Se dividen los N sujetos en varios conglomerados
de manera que cada conglomerado sea
representativo de la poblacin.
Despus se obtiene una muestra aleatoria de los
conglomerados y se estudian todos los sujetos
de los conglomerados seleccionados.
Ejemplo: El director de una escuela elemental
desea conocer la opinin de los padres sobre los
servicios de consejera que se ofrecen en la
escuela.
Decide que la muestra debe ser 750. Sabe que
los grupos promedian 26 estudiantes, as que
selecciona 29 grupos de tercero, cuarto y quinto
750
grado:
28.85 29
26

Muestreo Conglomerado o Grupos Intactos


Ver dificultad del ejemplo anterior usando muestra
simple, sistemtica o estratificada.
Este mtodo tiende a ser menos eficiente que el
simple, sistemtico y el estratificado. Para
subsanar esto requiere una muestra ms grande.
Se considera una muestra grande si es mayor o
igual a 30 sujetos.
Se puede usar el muestreo conglomerado en
multietapas. Ejemplo: 2-etapas: Se va a
administrar un cuestionario en un rea geogrfica
grande (San Juan). Se pueden seleccionar
regiones (urbanizaciones) y luego bloques (calles).
Finalmente, se encuesta a todos los seleccionados
en los bloques.

Muestreo No-Aleatorio
Tipos de muestreo no-aleatorio Juicio, opinin del investigador o
subjetivo
Voluntarios
Conveniencia
No hay tal cosa como muestreo casi
aletaorio. O la muestra es aleatoria
o no lo es.

Muestreo No-Aleatorio
Juicio de investigador o subjetivoEl investigador decide, de acuerdo a su
experiencia y su juicio, la muestra que mejor
podra usar.
VoluntariosEl investigador utiliza los sujetos que estn
disponibles voluntariamente para participar.
ConvenienciaEl investigador utiliza los sujetos que estn
disponibles de acuerdo a cierta conveniencia
pre-establecida. Ejemplo: sujetos que estn en
cierto lugar en el momento adecuado, etc.

Muestreo No-Aleatorio
Cuestionarios por correoCuando se envian cuestionarios por correo, an
si la muestra fue aleatoria, no representar
muestreo aleatorio. El que devuelve el
cuestionario contestado decide voluntariamente
participar.

Tipos de Datos
DatosCifras, nmeros, cantidades,
puntuaciones, ndices, cualidades o
atributos.
Datos

Categricos

Cuantitativos

Discretos

Contnuos

Tipos de Variables

VariableCualquier caracterstica bajo estudio que puede tomar


distintos valores numricos.
Variables discretasVariables que nicamente pueden asumir valores que son
cantidades enteras.
Variables contnuasVariables que pueden asumir valores fraccionarios o
intermediarios entre dos valores que representan
cantidades enteras.

Tipos de Escalas de la Variable

Cada nivel prximo en la escala, presupone las


mismas caractersticas del nivel anterior ms
otras que se aaden en ese nivel.

Tipos de Escalas
NominalSe agrupan los datos solamente en
clases o categoras que son mutuamente
excluyentes y no tienen un orden en
particular.
Ej. Variables categricas tales como:
gnero, religin, partido poltico

Tipos de Escalas
OrdinalSe agrupan los datos en categoras que
tiene un orden especfico pero no se
puede diferenciar entre s la magnitud o
el alcance de los valores de las distintas
categoras.
Ej. Variables categricas tales como:
clase social, minerales de acuerdo a
tipo de resistencia (mucha, regular o
poca), grado de agresividad (mucha,
poca, ninguna)

Tipos de Escalas
IntervaloSe agrupan los datos en categoras que
representan un orden especfico y
adems ese orden implica un intervalo
especfico de diferencias entre las
distintas categoras que es igual para
todas las categoras. El valor 0 es un
valor ms, no implica ausencia de la
caracterstica.
Ej.- Variables cuantitativas tales como:
temperatura, cociente intelectual

Tipos de Escalas
RaznSe agrupan los datos en categoras que
representan un orden especfico en el
cual las diferencias entre las distintas
categoras son iguales para todas las
categoras y adems el 0 implica la
ausencia de la caracterstica.
Ej. Variables cuantitativas contnuaspeso, estatura, edad

Fin de la Leccin

Tabla de Nmeros Aleatorios

Anda mungkin juga menyukai