Anda di halaman 1dari 24

UNIVERSIDAD AUTNOMA DE

COAHUILA

FACULTAD DE CONTADURA Y
ADMINISTRACIN
LICENCIATURA EN CONTADURIA PBLICA

PORTAFOLIO DE EVIDENCIAS
NOMBRE DE LOS ALUMNOS:
JAQUELINE SIFUENTES VALENZUELA.
WILBERT OMAR ACOSTA BARRERA.
SEMESTRE: 3

SECCION: C.

FACILITADOR: DOC. JUAN GABRIEL


CONTRERAS MARTINEZ

MATERIA: APLICAR ESTADISTICA BASICA


MUESTREO
En ocasiones en que no es posible o conveniente realizar un
censo (analizar a todos los elementos de una poblacin), se
selecciona una muestra, entendiendo por tal una parte
representativa de la poblacin.
El muestreo es por lo tanto una herramienta de la
investigacin cientfica, cuya funcin bsica es determinar
que parte de una poblacin debe examinarse, con la finalidad
de hacer inferencias sobre dicha poblacin.
La muestra debe lograr una representacin adecuada de la
poblacin, en la que se reproduzca de la mejor manera los
rasgos esenciales de dicha poblacin que son importantes
para la investigacin. Para que una muestra sea
representativa, y por lo tanto til, debe de reflejar las
similitudes y diferencias encontradas en la poblacin, es decir
ejemplificar las caractersticas de sta.
Los errores ms comunes que se pueden cometer son:
1.- Hacer conclusiones muy generales a partir de la
observacin de slo una parte de la Poblacin, se denomina
error de muestreo.
2.- Hacer conclusiones hacia una Poblacin mucho ms
grandes de la que originalmente se tom la muestra. Error de
Inferencia.
En la estadstica se usa la palabra poblacin para referirse no
slo a personas sino a todos los elementos que han sido
escogidos para su estudio y el trmino muestra se usa para
describir una porcin escogida de la poblacin.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificacin de los diferentes
tipos de muestreo, aunque en general pueden dividirse en dos

grandes grupos: mtodos de muestreo probabilsticos y


mtodos de muestreo no probabilsticos.
I.

Muestreo probabilstico

Los mtodos de muestreo probabilsticos son aquellos que se


basan en el principio de equiprobabilidad. Es decir, aquellos
en los que todos los individuos tienen la misma probabilidad
de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamao n
tienen la misma probabilidad de ser seleccionadas. Slo estos
mtodos de muestreo probabilsticos nos aseguran la
representatividad de la muestra extrada y son, por tanto, los
ms recomendables. Dentro de los mtodos de muestreo
probabilsticos encontramos los siguientes tipos:
1.- Muestreo aleatorio simple:
El procedimiento empleado es el siguiente:
1) se asigna un nmero a cada individuo de la poblacin y 2)
a travs de algn medio mecnico (bolas dentro de una bolsa,
tablas de nmeros aleatorios, nmeros aleatorios generados
con una calculadora u ordenador, etc.) se eligen tantos
sujetos como sea necesario para completar el tamao de
muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o
nula utilidad prctica cuando la poblacin que estamos
manejando es muy grande.
2.- Muestreo aleatorio sistemtico:
Este procedimiento exige, como el anterior, numerar todos
los elementos de la poblacin, pero en lugar de extraer n
nmeros aleatorios slo se extrae uno. Se parte de ese
nmero aleatorio i, que es un nmero elegido al azar, y los
elementos que integran la muestra son los que ocupa los
lugares i, i+k, i+2k, i+3k,..., i+(n-1) k, es decir se toman los
individuos de k en k, siendo k el resultado de dividir el
tamao de la poblacin entre el tamao de la muestra: k=

N/n. El nmero i que empleamos como punto de partida ser


un nmero al azar entre 1 y k.
El riesgo este tipo de muestreo est en los casos en que se
dan periodicidades en la poblacin ya que al elegir a los
miembros de la muestra con una periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la
poblacin. Imaginemos que estamos seleccionando una
muestra sobre listas de 10 individuos en los que los 5
primeros son varones y los 5 ltimos mujeres, si empleamos
un muestreo aleatorio sistemtico con k=10 siempre
seleccionaramos o slo hombres o slo mujeres, no podra
haber una representacin de los dos sexos.
3.- Muestreo aleatorio estratificado:
Trata de obviar las dificultades que presentan los anteriores
ya que simplifican los procesos y suelen reducir el error
muestral para un tamao dado de la muestra. Consiste en
considerar categoras tpicas diferentes entre s (estratos) que
poseen gran homogeneidad respecto a alguna caracterstica
(se puede estratificar, por ejemplo, segn la profesin, el
municipio de residencia, el sexo, el estado civil, etc.). Lo que
se pretende con este tipo de muestreo es asegurarse de que
todos los estratos de inters estarn representados
adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los
elementos concretos que formarn parte de la muestra. En
ocasiones las dificultades que plantean son demasiado
grandes, pues exige un conocimiento detallado de la
poblacin. (Tamao geogrfico, sexos, edades,...).
La distribucin de la muestra en funcin de los diferentes
estratos se denomina afijacin, y puede ser de diferentes
tipos:
Afijacin Simple: A cada estrato le corresponde igual nmero
de elementos mustrales.

Afijacin Proporcional: La distribucin se hace de acuerdo con


el peso (tamao) de la poblacin en cada estrato.
Afijacin ptima: Se tiene en cuenta la previsible dispersin
de los resultados, de modo que se considera la proporcin y la
desviacin tpica. Tiene poca aplicacin ya que no se suele
conocer la desviacin.
4.- Muestreo aleatorio por conglomerados:
Los mtodos presentados hasta ahora estn pensados para
seleccionar directamente los elementos de la poblacin, es
decir, que las unidades mustrales son los elementos de la
poblacin.
En el muestreo por conglomerados la unidad muestral es un
grupo de elementos de la poblacin que forman una unidad, a
la que llamamos conglomerado. Las unidades hospitalarias,
los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales. En otras
ocasiones se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales. Cuando los
conglomerados son reas geogrficas suele hablarse de
"muestreo por reas".
El muestreo por conglomerados consiste en seleccionar
aleatoriamente un cierto nmero de conglomerados (el
necesario para alcanzar el tamao muestral establecido) y en
investigar despus todos los elementos pertenecientes a los
conglomerados elegidos.
Distribucin de muestreo
Distribucin t
Distribucin F
Qu es la distribucin de muestreo?
Muestreo es definido como el proceso de seleccionar un
nmero de observaciones (sujetos) de un grupo en
particular de la poblacin.
Distribucin de muestreo mes definida como la distribucin
de frecuencias de la estadstica de muchas muestras.

Es la distribucin de medias y es llamada la distribucin de


muestreo de la media.
Hechos de la distribucin de muestreo
Los cuatro hechos de la distribucin de muestreo, incluyen:
1. La estadstica de inters (proporcin, desviacin
estndar, o media)
2. Seleccin aleatoria de la muestra
3. Tamao de la muestra aleatoria (muy importante)
4. Las caractersticas de la poblacin siendo muestreada.
5. Caractersticas de la distribucin de muestreo
Teorema del lmite central
Cuando muestras aleatorias del mismo tamao son
tomadas de la poblacin, la distribucin de las medias de
las muestras se acercar a la distribucin Normal.
Cuando la distribucin de muestreo de la media tiene
muestras de tamao de 30 o mayores se dice que estn
Normalmente distribuidas.

Caractersticas estadsticas de la distribucin de


muestreo
Las estadsticas principales son:
Media
Desviacin estndar
Error estndar
El error estndar (ES o ESM) de la distribucin de muestreo
es dado por la frmula:
S
n
Donde, n = tamao de muestra
s- desviacin estndar de la muestra
x media de la muestra

Caractersticas estadsticas de la distribucin de muestreo


cont.
SE de una proporcin = p (1-p)/n
Donde, p es la proporcin de la muestra
SE de un porcentaje = p (100-p)/n
Donde, p es el porcentaje de la muestra
Caractersticas estadsticas de la distribucin de muestreo
cont.
Intervalo de confianza
IC = p z /2 p (1-p)/n
IC= p z /2 p (100-p)/n
Caractersticas estadsticas de la distribucin de muestreo
cont.
Puntaje Z (Puntaje estndar)
Z = x-
/n
Donde, X es la media de la muestra
es la media de la distribucin de muestreo
es el ES de la distribucin de muestreo
n
Ejercicios
Un epidemilogo estudi un grupo aleatorio de 25
individuos (hombres y mujeres) entre 30-49 aos de edad y
encontr que la frecuencia cardiaca media es de 70 latidos
por minuto.
Ejercicio # 1
Cun frecuentemente la muestra de 25 individuos tiene
una frecuencia cardiaca media de 74 latidos por minuto o
ms?

En otras palabras
Qu proporcin de la muestra tendr valor medio de 74
latidos por minuto o mayor, si muestras repetidas de 25
individuos son aleatoriamente seleccionadas de la
poblacin?
Ejercicio # 2
Investigacin adicional mostr que 25 individuos parecan
haber usado un medicamento para tratamiento y ahora el
epidemilogo quiere detectar los eventos adversos del
medicamento sobre la tasa de frecuencia cardiaca. El
epidemilogo asume que la frecuencia cardiaca media est
en el 5% superior de la distribucin y ser la causa de
inters.
Determine el valor que divide el 5% superior del 95%
inferior de la distribucin de muestreo.
El uso de la curva Normal para resolver problemas

Ejercicio # 3
El detective de enfermedades (epidemilogo) quiere
saber cuntos pacientes sern incluidos en el estudio para
determinar el efecto del medicamento. El epidemilogo
asume que la frecuencia cardiaca media deber no ser
mayor a 72 latidos por minuto, 90% de las veces.
En otras palabras

Para incluir a individuos en el estudio, cul ser el tamao


de muestra para que el 90% de las medias de las muestras
ser de 72 latidos por minuto o menos?
Soluciones/respuestas
1) 2.3%
2) 73.29
3) 40.96
Otros tipos de distribucin de muestreo
Distribucin F
Es una distribucin de muestreo de la media con una
desviacin estndar estimada.
Distribucin t
Es una distribucin de muestreo de dos varianzas
(desviaciones estndar al cuadrado).
Aplicacin de la distribucin de muestreo
La distribucin de muestreo, como la distribucin Normal,
es un modelo descriptivo, que es usado para describir
situaciones del mundo real.
Es muy til para hacer sealamientos acerca de la
probabilidad de que ocurran observaciones especficas.
Investigadores/modeladores la usan para estimaciones y
pruebas de hiptesis.

DISTRIBUCION DEL MUESTREO


Una distribucin de muestreo describe la probabilidad de
obtener cada valor posible de un estadstico de una muestra
aleatoria de una poblacin, en otras palabras, qu proporcin
de todas las muestras aleatorias de ese tamao ofrecer ese
valor.

Las propiedades de la distribucin de muestreo pueden


variar dependiendo de cun pequea sea la muestra en
comparacin con la poblacin. Se supone que la poblacin
se distribuye normalmente como generalmente sucede. Si
el tamao de la muestra es lo suficientemente grande, la
distribucin de muestreo tambin estar cerca de lo normal.
Si ste es el caso, entonces la distribucin de muestreo puede
ser totalmente determinada por dos valores: la media y
la desviacin estndar. Estos dos parmetros son importantes
para calcular la distribucin de muestreo si se nos da la
distribucin normal de toda la poblacin.

CARACTERSTICAS DE LA DISTRIBUCIN DE MUESTREO


Teorema del lmite central
Cuando muestras aleatorias del mismo tamao son tomadas
de la poblacin, la distribucin de las medias de las muestras
se acercar a la distribucin Normal.
Cuando la distribucin de muestreo de la media tiene
muestras de tamao de 30 o mayores se dice que estn
Normalmente distribuidas.

CARACTERSTICAS ESTADSTICAS DE LA DISTRIBUCIN DE


MUESTREO
Las estadsticas principales son:

Media
Desviacin estndar
Error estndar

El error estndar (ES o ESM) de la distribucin de muestreo es


dado por la frmula:
s
n
Donde, n = tamao de muestra
s- desviacin estndar de la muestra
x media de la muestra
a) SE de una proporcin = p (1-p)/n
Donde, p es la proporcin de la muestra
b) SE de un porcentaje = p (100-p)/n
Donde, p es el porcentaje de la muestra

REGRESION Y CORRELACION LINEAL


La regresin lineal es una tcnica que permite cuantificar
la relacin que puede ser observada cuando se grafica
un diagrama de puntos dispersos correspondientes a dos

variables, cuya tendencia general es rectilnea; relacin


que cabe compendiar mediante una ecuacin del mejor
ajuste de la forma:
y = a + bx
En esta ecuacin, y representa los valores de la
coordenada a lo largo del eje vertical en el grfico
(ordenada).
en tanto que x indica la magnitud de la coordenada
sobre el eje horizontal (abscisa).

El valor de a (que puede ser negativo, positivo o igual


a cero) es llamado el intercepto.

en tanto que el valor de b (el cual puede ser negativo o


positivo) se denomina la pendiente o coeficiente de
regresin.

Objetivos que tiene el uso de la regresin lineal


simple:
Saber construir un modelo de regresin lineal simple que
describa Como influye una variable X sobre otra variable
Y

Saber obtener estimaciones puntuales de los


parmetros de dicho modelo

Saber construir intervalos de confianza y resolver


contrastes sobre dichos parmetros

Saber estimar el valor promedio de Y para un valor de X

Saber predecir futuros de la variable respuesta, Y


El modelo de regresin lineal simple supone que,
yi = 0 + 1xi + u

donde:
yi= representa el valor de la variable respuesta para la
observacin
i-esima.
xi = representa el valor de la variable explicativa para la
observacin
i-esima.
ui = representa el error para la observacin i-esima que
se asume
normal,
ui N(0, )
0 y 1 son los coeficientes de regresin:
0 : intercepto
1 : pendiente
Los parmetros que hay que estimar son: 0, 1 y
El objetivo es obtener estimaciones 0 y 1 de 0 y 1 para
calcular la recta de regresin:
y = 0 + 1x que se ajuste lo mejor posible a los datos.
Ejemplo: Supongamos que la recta de regresin del ejemplo
anterior es:
Costo = 15,65 + 1,29 Volumen

Se estima que una empresa que produce 25 mil unidades


tendr un costo:
costo = 15,65 + 1,29 25 = 16,6 mil euros
ECUACIN DE REGRESIN.
La ecuacin de la recta de regresin permite pronosticar
la puntuacin que alcanzar cada sujeto en una variable
Y conociendo su puntuacin en otra variable X. A la
variable Y se le denomina criterio y a la variable X
predictor.

SUPUESTOS DEL MODELO DE REGRESIN LINEAL

Que la relacin entre las variables sea lineal.


Que los errores en la medicin de las variables
explicativas sean independientes entre s.
Que los errores tengan varianza constante.
Que los errores tengan una esperanza matemtica igual
a cero.
Que el error total sea la suma de todos los errores.
EJEMPLO DE REGRESION Y CORRELACION LINEAL
Un conjunto de datos bidimensionales (X, Y) tiene
Coeficiente de correlacin
r=
-0.9, siendo las medias de las distribuciones marginales = 1,
= 2. Se sabe que una delas cuatro ecuaciones siguientes
corresponde a la
Recta de regresin
de Y sobre X:y = -x + 2 3x - y = 1 2x + y = 4 y = x +
1Seleccionar razonadamente esta
recta
.Como el
coeficiente de correlacin lineal es negativo
, la
pendiente
de la
recta
tambin ser

negativa
, por tanto descartamos la 2 y
4.U n p u n t o d e l a re c t a h a d e s e r ( , ) , e s d e c i r , ( 1, 2
).
2
- 1 + 22 . 1 + 2 = 4La recta pedida es:2x + y = 4

Error Estndar de la Regresin (EER)


No slo es cierto que la esperanza matemtica de la
distribucin de probabilidad de cada uno de los residuos MCO
es igual a cero. Tambin se cumple que su media muestral es
igual a cero, puesto que la suma de todos ellos lo es, como
vimos en las ecuaciones normales. Esta es una peculiaridad
del mtodo de estimacin MCO, que otro procedimiento de
estimacin no tiene. Si, considerados a lo largo de toda la
muestra, los residuos tienen media cero, entonces su
desviacin tpica muestra ser un indicador del tamao
promedio de cada uno de ellos. Esto es importante, porque si
la recta estimada se ajusta bien a la nube de puntos, entonces
los residuos deberan ser pequeos en algn sentido. Utilizar
la desviacin tpica muestra de los residuos parece un criterio
razonable de ajuste. Adems, sabemos que si utilizamos n 2
en el denominador, su cuadrado es un estimador insesgado
de
. La ausencia de sesgo en este estimador puede
demostrarse sin necesidad de obtener previamente los
residuos de la regresin, tomando esperanzas en la expresin:

Su raz cuadrada, la desviacin tpica estimada, recibe el


nombre de error estndar de la regresin EER:

Es claro que minimizar la varianza residual equivale a


minimizar el error estndar de la regresin, EER. Sin embargo,
recordemos que la desviacin tpica tiene, respecto a la
varianza, la ventaja de estar medida en las mismas unidades
que la variable a la que se reitere, el residuo, que tiene, a su
vez, las mismas unidades que la variable endgena ya. Para
valorar si el ajuste obtenido por la recta MCO a la nube
muestra de puntos es bueno, es conveniente utilizar el valor
numrico del EER en relacin con alguna referencia, y la
media muestral de la variable endgena es un buen indicador.
Ello nos permite presentar el porcentaje que de la media de yi
representa el EER, pudiendo decir, por ejemplo: el modelo
estimado es bueno, puesto que el EER es tan solo un 4% de la
media de la variable endgena o, por el contrario: "el ajuste
obtenido no es muy bueno, porque el tamao medio de los
residuos, indicado por el EER, es de un 65% de la media de Y.

Determinacin de los coeficientes de correlacin y de


determinacin
Una vez ajustada la recta de regresin a la nube de
observaciones es importante disponer de una medida que
mida la bondad del ajuste realizado y que permita decidir si el
ajuste lineal es suficiente o se deben buscar modelos
alternativos. Como medida de bondad del ajuste se utiliza
el coeficiente de determinacin, definido como sigue
(6.1
5)
O bien

Como scE < scG, se verifica que 0 < R2 < 1.


El coeficiente de determinacin mide la proporcin de
variabilidad total de la variable dependiente
respecto a su
media que es explicada por el modelo de regresin. Es usual
expresar esta medida en tanto por ciento, multiplicndola por
cien.
Por otra parte, teniendo en cuenta que
obtiene

- =

, se se
(6.1
6)

Dadas dos variables aleatorias cualesquiera X e Y , una


medida de la relacin lineal que hay entre ambas variables es
el coeficiente de correlacin definido por
(6.1
7)
donde
representa la desviacin tpica de la
variable X (anlogamente para
). Un buen estimador de
este parmetro es el coeficiente de correlacin lineal

muestral (o coeficiente de correlacin de Pearson),


definido por
(6.1
8)
Por tanto, r
. Este coeficiente es una buena medida de la
bondad del ajuste de la recta de regresin. Evidentemente,
existe una estrecha relacin entre r y 1 aunque estos
estimadores proporcionan diferentes interpretaciones del
modelo:
* r es una medida de la relacin lineal entre las
variables X e Y.
* 1 mide el cambio producido en la variable Y al realizarse un
cambio de una unidad en la variable X.
De las definiciones anteriores se deduce que:

Es importante estudiar si r es significativo (distinto de cero)


ya que ello implica que el modelo de regresin lineal es
significativo. Desafortunadamente la distribucin de r es
complicada pero para tamaos muestrales mayores que 30 su
desviacin tpica es
1/ , y puede utilizarse la
siguiente regla

En la interpretacin del coeficiente de correlacin se debe


tener en cuenta que:
r = 1 indica una relacin lineal exacta positiva
(creciente) o negativa (decreciente),
r = 0 indica la no existencia de relacin lineal estocstica,
pero no indica independencia de las variables ya que puede
existir una relacin no lineal incluso exacta,

valores intermedios de r (0 < r < 1 -1 < r < 0) indican la


existencia de una relacin lineal estocstica, ms fuerte
cuanto ms prximo a +1 ( -1) sea el valor der.
Para poder interpretar con mayor facilidad el coeficiente de
correlacin muestral se exponen varias nubes de
observaciones y el ajuste lineal obtenido:
Figura 6.7. Existe una dependencia funcional lineal, las
observaciones estn sobre la recta de regresin. r = R 2 = 1,
recta de regresin: y = x.

Figura Dependencia funcional lineal.


Figura 6.8. La relacin lineal entre las variables es muy
pequea y no parece que exista otro tipo de relacin entre
ellas, la nube de puntos indica que las variables son casi
independientes.
r = 0'192, R2 = 0'037, recta de regresin: y = 6'317 +
0'086x.

Contraste de regresin: R = 0'687 F1,18 p - valor =


0'418. Se acepta la no influencia de la variable regresora en Y.

Figura Observaciones casiindependientes.


Figura 6.9. Existe una dependencia funcional entre las
observaciones pero no de tipo lineal, por tanto la correlacin
es muy pequea
r = 0'391, R2 = 0'153, recta de regresin: y =
32'534 - 1'889x.
Contraste de regresin: R = 3'252 F1,18 p-valor =
0'088. Se acepta que no existe relacin lineal con = 0'05. En
base a la Figura 6.6. se debe de hacer un ajuste del tipo
parablico Y = 0 + 1x + 2x2.

Figura Existe una relacin cuadrtica.


Figura 6.10. La nube de datos se ajusta razonablemente a una
recta con pendiente positiva.
r = 0'641, R2 = 0'410, recta de regresin: y = -3' 963 + 1'749x.
Contraste de regresin: R = 12'522 F1,18 p - valor =
0'002. Se rechaza la no influencia lineal de la variable x.

Relacin estocstica lineal.


Figura 6.11. Existe una fuerte dependencia lineal negativa
entre las dos variables y la correlacin es muy alta (prxima a
1).
r = 0'924, R2 = 0'846, recta de regresin: y = 2'528 - 2'267x
Contraste de regresin: R = 105'193 F1,18 p - valor =
0'000. Se acepta la existencia de una relacin lineal.

Fuerte relacin estocstica lineal.

Anda mungkin juga menyukai