por
GARCA LUENGO, AMELIA VICTORIA
y
OA CASADO, INMACULADA
Departamento de Estadstica y Matemtica Aplicada. Universidad de Almera.
RESUMEN
1. INTRODUCCIN
Jessen (1942), Tikkiwal (1951), Yates (1949), Patterson (1950), Eckler (1955) y
Raj (1979) contribuyeron a desarrollar la teora de la estimacin de la media en
muestreo sucesivo. Hansen y Hurwitz (1946) sugirieron para las encuestas por
correo una tcnica cuando hay no-respuesta. Estas encuestas tienen la ventaja de
que los datos pueden ser recogidos con bajo coste. Sin embargo, la no-respuesta
es un problema comn en las encuestas por correo. Cochran (1977) y ms recien-
temente Fabian y Hyunshik (2000) extendieron la tcnica de Hansen y Hurwitz al
caso que estudia la caracterstica principal junto con informacin auxiliar disponible.
En este trabajo utilizamos la tcnica de Hansen y Hurwitz para estimar la suma de
medias, bajo un diseo de muestreo en ocasiones sucesivas. De esta manera,
completamos el trabajo de Choudhary, Bathla y Sud (2004), que estudian la no-
respuesta en el muestreo en ocasiones sucesivas.
( )
Consideremos una poblacin finita = U 1 , U 2 , ......., U N de N unidades
( )
identificables. Sean x i , y i ; i = 1, 2, 3, ......., N los valores de la caracterstica
en la primera y segunda ocasin respectivamente. Asumimos que la poblacin est
dividida en dos clases, unos que respondern en el primer intento y otros que no.
Sean N 1 y N 2 los tamaos de esas dos clases. En la primera ocasin, las en-
cuestas, mediante el correo, se envan a n unidades seleccionadas por muestreo
aleatorio simple. En la segunda ocasin, una muestra aleatoria simple de m = np
unidades se retienen mientras una muestra independiente de = nq = n m
unidades se selecciona. Asumimos que en la parte no comn de la muestra en las
dos ocasiones u 1 unidades responden y u 2 unidades no lo hacen. Igualmente, en
la parte comn de la muestra en las dos ocasiones m1 unidades responden y m 2
unidades no lo hacen.
Primera ocasin x *u x *m
Segunda ocasin y *m y *u
donde
m1 y m1 + m 2 y m h 2 u 1 y u1 + u 2 y u h 2
y *m = ; y *u =
m u
m1 x m1 + m 2 x m h 2 u 1 x u1 + u 2 x u h 2
x *m = ; x *u =
m u
* * * *
z12 = a x u + b x m + c ym + d yu
* * * *
E( z12 ) = aE( x u ) + bE( x m ) + cE( y m ) + dE( y u ) =
= aX * + bX * + cY * + dY * = (a + b )X * + (c + d )Y * = X * + Y *
a + b = 1 y c + d = 1 luego b = 1 a y d = 1 c
El estimador ser
* * * *
z12 = a x u + (1 a) x m + c y m + (1 c) y u
* * *
+ (1 c)2V( y u ) + 2(1 a)cCov( x m , y m )
* * * * * * * *
Cov( x m , x u ) = Cov( x m , y u ) = Cov( y m , x u ) = Cov( y m , y u ) =
* *
= Cov( y u , x u ) = 0
2 fN 2 22
* *
Cov( x , x ) = Var( x ) =
m m
*
m
+
m Nm
2 fN 2 22
* *
Cov( x , x ) = Var( x ) =
u u
*
u
+
u Nu
2 fN 2 22
* *
Cov( y , y ) = Var( y ) =
m m
*
m
+
m Nm
2 fN 2 22
* *
Cov( y , y ) = Var( y ) =
u u
*
u
+
u Nu
ESTIMACIN DEL PROMEDIO SOBRE DOS OCASIONES CUANDO HAY NO-RESPUESTA 609
2 2 fN 2 22
Cov( y m , x m ) =
* *
+
m Nm
N2 m2 u
W2 = A = fW2 22 f = = 2
N mh2 u h2
( )
Hallamos a y c para que V z 12 sea mnima, para lo cual igualaremos a cero
las respectivas derivadas parciales, respecto de a y c , obteniendo
a opt =
pq ( 2 + A )( 2 + 2 A )
+
((
q 2 + A q 2 + 2 A)2
( )) 2
( 2
+ A ) q 2 ( 2 + 2 A )
2 2
( 2
+ A q2 )2
( 2
+ A)
2
2
( ) pq ( 2 + A )( 2 + 2 A )
2
p 2 + A
c opt = -
( 2
)
2
+ A q 2 2 + 2 A ( )
2
( 2
+ A ) q 2 ( 2 + 2 A )
2 2
Sustituyendo en z12
z12 =
((
q 2 + A q 2 + 2 A) 2
( ) )( y 2
*
+ x *u )+
( 2
+A q ) 2 2
( 2
+ A) 2
2 u
+
(
p 2 + A ) 2
( ym +
*
x *m )+
( 2
+ A ) q ( + 2 A )
2 2 2 2
pq ( 2 + A )( 2 + 2 A )
+ [(x *
) (
x *m + y *u y *m )]
( 2
+ A ) q ( + 2 A )
2 2 2 2 u
z12 =
p 2 + A ( *
( ym
) x *m )
( 2 2
) (
+ A + q + 2 A ) +
610 ESTADSTICA ESPAOLA
(( ) (
q 2 + A + 2 + 2 A )) ( y *
x *u )
+
( ) (
2 + A + q 2 + 2 A ) u + [1]
Esta frmula fue establecida por Yates (1960) y equivale a una media aritmtica
ponderada de los estimadores, y *m + x *m , y *u + x *u , con pesos
(
p 2 + A ) (( ) (
q 2 + A + 2 + 2 A ))
( ) (
2 + A + q 2 + 2 A ) ,
( ) (
2 + A + q 2 + 2 A )
que evidentemente suman la unidad.
V( z12
( + A )+ ( + A )
2 2
2
)=
( + A )+ q( + A )
2 2
2
V( z12 ) =
2 2
n
(
+A )
En el caso en que = 2
1+
V( z12 ) =
2 2
n
+A (
1 + q
)
2 2 1 +
V( z 0 ) =
n 1 + q
ESTIMACIN DEL PROMEDIO SOBRE DOS OCASIONES CUANDO HAY NO-RESPUESTA 611
* *
z1 = a x u + b x m + c ym + d yu
donde
1 m 1 u
ym = yi
m i =1
y yu = yi
u i =1
El estimador ser
* *
z1 = a x u + (1 a) x m + c y m + (1 c) y u
Tomando varianzas en z1
* *
V( z1 ) = a2V( x u ) + (1 a)2V( x m ) + c2V( y m ) +
*
+ (1 c)2V( y u ) + 2(1 a)cCov( x m , y m )
2 A 2
2
A 2
V( z1 ) = a + + (1 a )
2
+ +
2
c +
qn qn pn pn pn
2 2
+ (1 c ) 2
+ 2(1 a )c
qn pn
612 ESTADSTICA ESPAOLA
( )
Hallamos a y c para que V z 1 sea mnima, para lo cual igualaremos a cero
las respectivas derivadas parciales, respecto de a y c , obteniendo
a opt =
pq 2 (( )
q 2 + A q 2 2 )
( 2 + A ) q 22 2 +
( )
2 + A q 22 2
p( 2 + A ) pq( 2 + A )
c opt
( 2 + A ) q 2 2 2
= -
( 2 + A ) q 2 2 2
4. ESTIMADOR DE LA SUMA DE MEDIAS CUANDO HAY NO-RESPUESTA EN
LA SEGUNDA OCASIN
* *
z2 = a xu + b x m + c ym + d yu
donde
1 m 1 u
xm = xi
m i =1
y xu = xi
u i =1
El estimador ser
* *
z2 = a x u + (1 a) x m + c y m + (1 c) y u
Tomando varianzas en z2
*
V( z 2 ) = a2V( x u ) + (1 a)2V( x m ) + c2V( y m ) +
* *
+ (1 c)2V( y u ) + 2(1 a)cCov( x m , y m )
ESTIMACIN DEL PROMEDIO SOBRE DOS OCASIONES CUANDO HAY NO-RESPUESTA 613
2 2
A 2 2 A
V( z 2 ) = a2 + (1 a )2 + + c + +
qn pn pn pn pn
2
A 2
+ (1 c )2 + + 2(1 a )c
qn qn pn
pq ( 2 + A ) q (( 2 + A ) q 2 2 )
a opt = +
( 2 + A ) q 2 2 2 ( 2 + A ) q 2 2 2
c opt
(
p 2 + A ) pq 2
=
( )
2 + A q 2 2 2
-
( 2 + A ) q 2 2 2
V( z 2 )
L2 = 1 x 100
V( z 0 )
Cuadro 1
PORCENTAJE DE PRDIDA EN PRECISIN DE z12 , z1 Y z 2 SOBRE z0
PARA DIFERENTES VALORES DE , 2 , 22 Y 2
2 q f W2 22 2 L12 L1 L2
2 < 22
0,7 0,2 0,7 2,5 0,8 0,4 0,3 247,621 118,064 128,505
0,7 0,2 0,7 2,5 0,8 0,6 0,3 370,831 176,591 191,684
0,7 0,2 0,7 2,5 0,8 0,9 0,3 555,511 264,311 286,312
2 > 22
0,6 0,2 0,3 1,5 0,6 0,2 0,3 50,748 22,866 33,715
0,6 0,2 0,3 1,5 0,6 0,2 0,7 21,819 9,889 14,591
0,6 0,2 0,3 1,5 0,6 0,2 0,9 16,982 7,707 11,373
2 = 22
0,8 0,3 0,7 2,0 0,7 0,1 0,1 131,395 61,769 66,431
0,8 0,3 0,7 2,0 0,7 0,3 0,3 131,395 61,769 66,431
0,8 0,3 0,7 2,0 0,7 0,8 0,8 131,395 61,769 66,431
< 2
0,1 0,7 0,6 2,5 0,5 0,5 0,4 182,893 75,347 102,030
0,3 0,7 0,6 2,5 0,5 0,5 0,4 170,749 71,334 90,899
0,6 0,7 0,6 2,5 0,5 0,5 0,4 159,047 67,516 79,586
> 2
0,8 0,1 0,3 2,0 0,5 0,5 0,4 94,708 44,673 63,008
0,8 0,4 0,3 2,0 0,5 0,5 0,4 108,428 44,673 63,008
0,8 0,9 0,3 2,0 0,5 0,5 0,4 128,868 44,673 63,008
= 2
0,2 0,2 0,8 1,5 0,5 0,5 0,5 75 36,347 41,616
0,5 0,5 0,8 1,5 0,5 0,5 0,5 75 35,377 38,430
0,9 0,9 0,8 1,5 0,5 0,5 0,5 75 34,529 35,604
ESTIMACIN DEL PROMEDIO SOBRE DOS OCASIONES CUANDO HAY NO-RESPUESTA 615
Cuadro 2
2 q f W2 22 2 L12 L1 L2
W2
0,7 0,2 0,6 2,5 0,1 0,4 0,6 15,242 7,298 8,598
0,7 0,2 0,6 2,5 0,3 0,4 0,6 45,543 21,640 25,249
0,7 0,2 0,6 2,5 0,6 0,4 0,6 90,736 42,864 49,624
f
0,8 0,3 0,4 1,0 0,5 0,4 0,6 28,958 13,008 16,986
0,8 0,3 0,4 3,0 0,5 0,4 0,6 86,338 38,196 49,496
0,8 0,3 0,4 3,5 0,5 0,4 0,6 100,627 44,417 57,492
q
0,8 0,2 0,1 1,5 0,4 0,7 0,5 60,059 25,874 45,205
0,8 0,2 0,5 1,5 0,4 0,7 0,5 72,915 34,000 41,053
0,8 0,2 0,7 1,5 0,4 0,7 0,5 77,860 37,304 40,376
0,8 0,2 0,9 1,5 0,4 0,7 0,5 82,099 40,418 41,028
N = 300, n = 50, co = 1, c1 = 4, c2 = 45
donde
c2 ,
es el coste por cuestionario con los datos recogidos mediante entrevistas
personales.
ESTIMACIN DEL PROMEDIO SOBRE DOS OCASIONES CUANDO HAY NO-RESPUESTA 617
C 00 = 2nc 2
1. La funcin coste para el caso en el que hay no-respuesta en las dos ocasiones
viene dado por
c n
C12 = 2 c 0 n + c1 n 1 + 2 2
f
c W
E(C12 ) = 2n c 0 + c1 W1 + 2 2
f
N1 N2
donde W1 = y W2 = , con W1 + W2 = 1
N N
2. La funcin coste para el caso en el que hay no-respuesta en la segunda ocasin
viene dado por
c n
C 2 = 2c 0 n + c1 n + c1 n 1 + 2 2
f
y el coste esperado viene dado por
c W
E(C 2 ) = n 2c 0 + c1 (W1 + 1) + 2 2
f
618 ESTADSTICA ESPAOLA
c n
C1 = c1n 1 + 2 2 + 2c 0 n + c1n
f
c W
E(C1 ) = n 2c 0 + c1 (W1 + 1) + 2 2
f
2 q f W2 22 2 n n 1 n 2 E(C12 ) E (C1 ) E (C 2 )
2 < 22
0,7 0,2 0,5 2,5 0,4 0,4 0,3 109 77 83 2.301,55 1.203,96 1.301,13
0,7 0,2 0,5 2,5 0,4 0,7 0,3 152 97 108 3.223,77 1515,92 1.680,45
0,7 0,2 0,5 2,5 0,4 0,8 0,3 167 104 116 3.530,82 1.619,63 1.806,36
2 > 22
0,6 0,2 0,3 1,5 0,3 0,2 0,3 63 56 58 1.605,68 992,54 1.041,27
0,6 0,2 0,3 1,5 0,3 0,2 0,6 56 53 54 1.443,14 941,54 966,07
0,6 0,2 0,3 1,5 0,3 0,2 0,9 54 52 53 1.388,83 924,43 940,83
2 = 22
0,8 0,3 0,7 2,0 0,5 0,2 0,2 97 72 74 2.764,25 1.388,96 1.423,03
0,8 0,3 0,7 2,0 0,5 0,6 0,6 97 72 74 2.764,25 1.388,96 1.423,03
0,8 0,3 0,7 2,0 0,5 0,9 0,9 97 72 74 2.764,25 1.388,96 1.423,03
< 2
0,1 0,7 0,6 2,5 0,5 0,4 0,6 99 70 77 2.378,30 1.191,68 1.312,78
0,5 0,7 0,6 2,5 0,5 0,4 0,6 93 68 72 2.239,37 1.162,63 1.229,16
0,8 0,7 0,6 2,5 0,5 0,4 0,6 91 68 70 2.184,70 1.151,01 1.192,21
> 2
0,8 0,2 0,3 2,0 0,4 0,5 0,3 103 74 83 2.554,08 1.284,02 1.453,85
0,8 0,6 0,3 2,0 0,4 0,5 0,3 112 74 83 2.786,68 1.284,02 1.453,85
0,8 0,9 0,3 2,0 0,4 0,5 0,3 119 74 83 2.944,47 1.284,02 1.453,85
= 2
0,3 0,3 0,8 1,5 0,3 0,6 0,4 84 66 68 2.144 1.178,07 1.213,57
0,5 0,5 0,8 1,5 0,3 0,6 0,4 84 65 67 2.144 1.173,52 1.198,19
0,8 0,8 0,8 1,5 0,3 0,6 0,4 84 65 66 2.144 1.168,54 1. 180,96
620 ESTADSTICA ESPAOLA
Si 2 > 22 , el coste aumenta para los tres estimadores al aumentar los valores
de 2 , y los tamaos muestrales, considerando que los estimadores tienen igual
precisin que z 0 , disminuyen al aumentar los valores de 2 .
2 2
Cuando = 2 el coste permanece constante para los tres estimadores al
2 2
aumentar los valores de y 2 . Asimismo, el tamao muestral de los tres esti-
madores, considerando que tienen igual precisin que z 0 , permanece constante.
Si < 2 , el coste aumenta para los tres estimadores al aumentar los valores
de , y los tamaos muestrales, considerando que los estimadores tienen igual
precisin que z 0 , disminuyen al aumentar los valores de .
> 2 , el coste permanece constante para z1 y z 2 al aumentar los valo-
Si
res de 2 , mientras que para z12 el coste disminuye. Asimismo, los tamaos
muestrales de z1 y z 2 , considerando que tienen igual precisin que z 0 , perma-
necen constante, mientras que el tamao muestral de z12 , considerando que tiene
igual precisin que z 0 , aumenta.
= 2 , el coste permanece constante para z12 al aumentar los valo-
Cuando
res de y 2 , mientras que para z1 y z 2 el coste aumenta. Asimismo, los
tamaos muestrales de z1 y z 2 , considerando que tienen igual precisin que z 0 ,
disminuyen, mientras que el tamao muestral de z12 , considerando que tiene igual
precisin que z 0 , permanece constante.
Se observa en el cuadro 4 que los tamaos muestrales de los tres estimadores,
considerando que tienen igual precisin que z 0 , aumentan al aumentar los valores
de W2 , f y q, exceptuando el caso del tamao muestral de z 2 , considerando que
z 0 , que primero disminuye y despus aumenta conforme
tiene igual precisin que
aumentan los valores de q . Adems, el coste de los tres estimadores aumenta
cuando los valores de f aumentan y disminuye cuando los valores de W2 y q
ESTIMACIN DEL PROMEDIO SOBRE DOS OCASIONES CUANDO HAY NO-RESPUESTA 621
Cuadro 4
2 q f W2 22 2 n n 1 n 2 E(C12 ) E (C1 ) E (C 2 )
W2
0,7 0,2 0,6 2,5 0,2 0,4 0,6 65 57 58 1.017,25 732,79 748,72
0,7 0,2 0,6 2,5 0,6 0,4 0,6 95 71 75 2555,86 1.314,36 1.376,54
0,7 0,2 0,6 2,5 0,8 0,4 0,6 110 78 83 3.576,47 1.663,42 1.756,37
f
0,8 0,3 0,4 1,0 0,5 0,4 0,6 64 56 58 3.288,45 1.723,37 1.784,04
0,8 0,3 0,4 1,5 0,5 0,4 0,6 72 60 63 2.580,31 1.372,77 1.440,15
0,8 0,3 0,4 3,0 0,5 0,4 0,6 93 69 75 1.956,55 1.071,02 1.158,59
q
0,8 0,2 0,2 1,5 0,4 0,7 0,5 82 62 72 2.521,48 1.260,25 1.467,63
0,8 0,2 0,7 1,5 0,4 0,7 0,5 89 69 70 2.739,05 1.400,50 1.431,83
0,8 0,2 0,9 1,5 0,4 0,7 0,5 91 70 71 2.804,33 1.432,26 1.438,48
622 ESTADSTICA ESPAOLA
REFERENCIAS
CHOUDHARY, R.K, BATHLA, H.V.L AND SUD, U.C. (2004), On non-response in sam-
pling on two occasions, Journal of the Indian Society of Agricultural Statistics,
58(3), 331-343.
COCHRAN, W. G. (1977), Sampling Techniques, third edition, John Wiley & Sons,
New York.
FABIAN, C.O. AND HYUNSHIK, L. (2000), Double sampling for ratio and regression
estimation with sub-sampling the non-respondents, Survey Methodology,
26(2), 183-188.
GARCA LUENGO, A. V. (2001), Mejora de estimadores en muestreo en ocasiones
sucesivas, Servicio de Publicaciones de la Universidad de Almera.
RAJ, D. (1979), Sampling Theory, Tata McGraw Hill, New Delhi, 152-162.
YATES, F. (1949), Sampling Methods for Censuses and Surveys, Griffin, London.
ESTIMACIN DEL PROMEDIO SOBRE DOS OCASIONES CUANDO HAY NO-RESPUESTA 623
ABSTRACT