Anda di halaman 1dari 40

3.

A ` INFERENCIA INTRODUC AO ESTATISTICA

No c oes preliminares sobre estima c ao

Pode dizer-se que as probabilidades e a estat stica t em objectivos diferentes: enquanto nas probabilidades se parte de um dado esquema ou modelo para calcular pr obabilidades de certos resultados ou acontecimentos, na estat stica parte-se de dados ou observa co es e procura saber-se algo sobre o modelo (Tiago de Oliveira (1990) e Murteira (1990)). a infer E encia estat stica que tem como objectivo a constru c ao e desenvolvimento de m etodos que permitem a extens ao do particular para o geral (chamada infer encia indutiva), i.e., a partir de um conjunto de dados e poss vel fazer infer encias ou generaliza co es acerca de uma popula c ao da qual os dados foram extra dos. A infer encia estat stica e ent ao um m etodo cient co de tirar conclus oes sobre os par ametros da popula c ao a partir da recolha, tratamento e an alise dos dados de uma amostra, recolhida dessa popula c ao. O conjunto completo de todas as observa c oes poss veis constitui a popula ca o, enquanto o conjunto dos valores efectivamente observados constitui a amostra. Chama-se popula ca o de amostras ao conjunto de todas as amostras observ aveis. Atenda-se a que par ametro de uma popula c ao e uma constante desconhecida, cujo verdadeiro valor s o se conseguiria saber, nalguns casos, ap os estudos exaustivos e noutros nem sequer e poss vel saber. Num problema de infer encia estat stica ou se admite que a distribui c ao da popula ca o tem uma forma matem atica conhecida, embora contendo um ou mais par ametros desconhecidos, e o que se chama estat stica param etrica ou se pretende conhecer a forma da distribui c ao, e o dom nio da estat stica n ao param etrica. Os dois tipos mais importantes de infer encia estat stica s ao: estima c ao dos par ametros e testes de hip oteses estat sticas. A estima c ao permite-nos adivinhar ou melhor estimar o verdadeiro valor desconhecido do(s) par ametro(s) da popula c ao, estima c ao pontual, ou obter um intervalo de valores plaus veis para esse par ametro, com a indica c ao da conan ca no procedimento, estima c ao por intervalos.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

109

A outra grande area da infer encia estat stica, a dos testes de hip oteses, tem como objectivo decidir se o valor do par ametro pertence ou n ao a um dom nio de valores especicado pelo investigador. A extens ao do particular ao geral que temos estado a referir, chama-se infer encia indutiva. E o caminho para a aquisi c ao de novos conhecimentos. O grau de incerteza que acompanha as infer encias indutivas pode ser medido rigorosamente em termos de probabilidade, se a experi encia foi conduzida segundo determinados princ pios (probabil sticos ou aleat orios). Os procedimentos que levam ` a obten c ao de amostras nestas condi c oes s ao do dom nio da teoria da amostragem. Vejamos alguns conceitos b asicos, deixando como refer encias para um aprofundamento do assunto Murteira (1990), Barnett (1982) e Cochran (1977). A amostra, que ir a ser utilizada para tirar conclus oes sobre par ametros desconhecidos da popula c ao, dever a ser representativa dessa popula c ao. Para isso dever a obedecer a princ pios de aleatoriedade, i.e., a selec c ao dos indiv duos a incluir na amostra e deixada completamente ao acaso. Temos assim um dos conceitos fundamentais da teoria da amostragem, o de amostra aleat oria. Deni c ao 3.1 Diz-se que (1 , 2 , ..., ) e uma amostra aleat oria de dimens ao se as vari aveis ( = 1, , ) s ao independentes e semelhantes, i.e., t em todas a mesma distribui ca o, que e a da popula c ao. Se as vari aveis 1 , 2 , ..., constituem uma amostra aleat oria extra da de uma popula ca o com fun c ao densidade (), ent ao a fun c ao densidade conjunta daquele veca independ encia entre das tor aleat orio = (1 , 2 , ..., ) pode escrever-se (devido ` vari aveis) como: (1 , 2 , ..., ) = (1 ) (2 )... ( ) importante real E car que uma amostra aleat oria (1 , 2 , ..., ) e um conjunto aveis de vari aveis aleat orias. Antes da amostragem ser realizada as quantidades observ s ao vari aveis aleat orias, depois de feitas as observa c oes temos um conjunto de dados que constituem a amostra observada, que passaremos a representar por (1 , ..., ). Note-se que nem todas as amostras conduzem a generaliza c oes v alidas para a popula ca o da qual foram extra das. De facto os m etodos de infer encia que iremos utilizar baseiam-se na hip otese de que estamos a considerar amostras aleat orias. Deni c ao 3.2 Dada uma amostra aleat oria, chama-se estat stica a toda a fun c ao da amostra

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

110

aleat oria, que n ao contenha par ametros desconhecidos. Uma estat stica, = (1 , 2 , ..., ), fun c ao dos valores aleat orios, e portanto uma vari avel aleat oria. A cada amostra observada (1 , ..., ), corresponde um valor num erico bem determinado para a estat stica, (1 , 2 , ..., ). Para a amostra aleat oria (1 , ... ), vejamos alguns exemplos de estat sticas importantes. M edia Amostral = Mediana Amostral = Vari ancia Amostral =
2

=1

(3.1)

(+1)/2
(/2) +(/2)+1 2

mpar par

(3.2)

=1 (

)2 . 1

(3.3)

Acab amos de referir alguns exemplos de estat sticas. Observe-se que n ao s ao estat sticas, por exemplo, as seguintes fun c oes: por conterem par ametros desconhecidos. ; ,

Suponhamos que de uma popula c ao innita qualquer, extra mos ao acaso uma primeira amostra de observa c oes: 1 , ..., cuja m edia ser a ent ao = . Se, nas mesmas condi c oes, fosse outra pessoa a extrair uma amostra tamb em de dimens ao , ter amos 1 , ..., cuja m edia ser a, digamos, = , que provavelmente ser a diferente da primeira, ; e assim sucessivamente para outras amostras que possam ser extra das, nas mesmas condi c oes das anteriores. Podiamos ent ao considerar , , , , ..., valores observados da vari avel aleat oria .

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

111

Um processo de amostragem d a lugar, como vimos, a muitas amostras diferentes. Uma amostra particular e apenas uma das muitas amostras (em n umero innito se a popula ca o for innita), que e poss vel extrair da popula c ao. As utua c oes de amostragem s o podem ser controladas quando a amostra e aleat oria. Observe-se que, o facto de se ter considerado a popula c ao innita e no desenvolvimento que se segue, todo o estudo ter este pressuposto como base, n ao e efectivamente uma restri c ao. Muitas das popula c oes que n os estudamos ou s ao innitas, por exemplo, a popula ca o dos pers pedol ogicos de determinada regi ao, as realiza c oes poss veis do mesmo jogo, etc, ou podem ser consideradas teoricamente innitas, por a dimens ao da popula c ao comparada com a dimens ao da amostra ser de tal modo grande, que torna desprez vel o erro cometido ao considerar-se innita. As estat sticas s ao, pela pr opria deni c ao como vimos, vari aveis aleat orias, tendo portanto distribui c oes a que e costume chamar distribui c oes de amostragem. Se (1 , 2 , ..., ) e uma amostra aleat oria extra da de uma popula c ao com fun c ao de probabilidade ou densidade (), onde designa o(s) par ametro(s) desconhecido(s), a distribui c ao de amostragem da estat stica ( , , ..., ) 1 2 pode denir-se a partir da distribui c ao conjunta =1 ( ). Iremos considerar agora as distribui c oes por amostragem das estat sticas mais frequentemente usadas.

Distribui c oes de amostragem


Distribui c ao da M edia Amostral Consideremos uma amostra aleat oria com observa c oes, retirada de uma popula ca o normal, com valor m edio e vari ancia 2 . Sendo assim, por deni c ao de amostra aleat oria, cada observa c ao , = 1, ..., , tem distribui c ao normal, com valor m edio e vari ancia e 2 , respectivamente. Tendo em conta propriedades da distribui c ao normal, sabemos que (, / ) (0, 1). / (3.4)

Por em, se a amostragem foi feita numa popula c ao com distribui c ao desconhecida, a distribui c ao de amostragem de e ainda aproximadamente normal com valor m edio 2 e vari ancia e /, respectivamente, desde que o tamanho da amostra seja grande (teorema limite central), i. e., quando

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

112

(0, 1). /

(3.5)

Na pr atica, a aproxima c ao anterior e regra geral boa quando > 30 e a distribui ca o tenha apenas uma moda. No caso de < 30 a aproxima c ao ainda e razo avel se a distribui c ao da popula c ao n ao diferir muito da normal. Se a popula c ao for normal, a e exactamente normal qualquer que seja o tamanho da distribui c ao de amostragem de amostra. As distribui c oes apresentadas em (3.4) e (3.5) s ao fundamentais para a realiza c ao de infer encias sobre o par ametro , quando e conhecido. Veremos mais adiante a distribui c ao que surge quando n ao e conhecido. Antes disso, por em, necessitamos do conhecimento da distribui c ao da Vari ancia Amostral. Distribui c ao da Vari ancia Amostral Dada uma amostra aleat oria de dimens ao extra da de uma popula c ao normal 2 com valor m edio e vari ancia , pretendemos determinar a distribui c ao de amostragem da vari ancia amostral 2 , denida em (3.3). Por em, a distribui c ao de 2 tem pouca aplica ca o pr atica em estat stica. Em vez daquela vari avel aleat oria e costume considerar a distribui c ao de amostragem da vari avel aleat oria ( 1) 2 / 2 . Teorema 3.1 Sendo vari aveis aleat orias normais independentes, (, ), a vari avel aleat oria 2 2 2 ( 1) / tem distribui c ao com ( 1) g.l. Dem: Consideremos ( ) 2 = [ ( ) + ( ) ]2 =

( ) 2 + =

( )2 + 2

( )2 + ( )2

( )( ) =

dado que a u ltima parcela e nula. Portanto podemos escrever

( ) 2 ( )2 ( )2 = + 2 2 2

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

113

O primeiro membro da igualdade (3.6) tem, como se sabe, distribui c ao 2 () , visto ser a soma dos quadrados de v.a. independentes normais reduzidas (ver generaliza c ao 2 do teorema 2.20, p ag. 105) e o segundo termo do segundo membro tem distribui c ao (1) . O resultado que se pretende provar resulta de dois teoremas fundamentais que iremos enunciar sem demonstra c ao. Teorema 3.2 Se ( = 1, , ) s ao vari aveis aleat orias normais independentes, as vari aveis ao independentes. 2 e s Teorema 3.3 Se e s ao duas vari aveis aleat orias independentes tais que + 2 () e 2 2 (1 ) com 1 < , ent ao (1 ) . Como consequ encia destes dois teoremas e da igualdade (3.6) temos ent ao ( 1) 2 2 Exemplo 3.1 Um fabricante de baterias de autom oveis garante que as suas baterias t em uma dura ca o m edia de 3 anos com um desvio padr ao de 1 ano. Se 5 dessas baterias tiverem durado 1.9 2.4 3.0 3.5 e 4.2 anos 2 (1) . (3.7)

( )2

( 1) 2 = + 2

)2

(3.6)

continuar a o fabricante convencido que as suas baterias t em um desvio padr ao de 1 ano? (Nota: admita-se que a dura c ao das baterias se pode considerar uma v.a. normal). Resolu c ao: Consideremos ent ao (3, 1), a v.a. que designa a dura c ao de vida das referidas baterias, sendo o nosso objectivo estudar o seu desvio padr ao. Para isso considere-se a vari avel ( 1) 2 / 2
2 que como sabemos tem distribui c ao 2 (1) = (4) . Vejamos qual o valor desta vari avel no caso da amostra observada:

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

114

Portanto

( )2 = = 0.815 1
2

( 1)2 = 3.26 2 2 Ora sabemos que 95% dos valores de um 2 est ao entre 2 0.975 e 0.025 , que no nosso 2 caso s ao 2 ao, podemos dizer que o valor 0.975 = 0.484 e 0.025 = 11.143. Como conclus da estat stica calculado considerando 2 = 1 e um valor plaus vel, n ao tendo portanto o fabricante raz oes para suspeitar que o desvio padr ao n ao seja de 1 ano. 2 calculado = Acab amos de estudar as distribui c oes de amostragem da m edia e da vari ancia, por em a distribui c ao da m edia (3.4) ou mesmo a distribui c ao aproximada (3.5) n ao t em interesse quando a vari ancia e desconhecida. No caso de dispormos de amostras de dimens ao grande, podemos substituir em (3.5) 2 pela vari ancia observada na amostra, 2 , tendo-se ent ao a v.a. (0, 1) / (3.8)

Por em, se e pequeno, os valores de 2 est ao sujeitos a grandes utua co es de amostra para amostra e a aproxima c ao (3.8) j a n ao e v alida. Para dar resposta a esta situa c ao, tem-se uma distribui c ao diferente da distribui c ao normal - a distribui c ao 1 . Vejamos em primeiro lugar a deni c ao da distribui c ao . Deni c ao 3.3 denida Sejam (0, 1) e 2 aveis aleat orias independentes. A v.a. assim () , vari = / (3.9)

diz-se ter distribui c ao com par ametro , ou com graus de liberdade e representa-se por () . Propriedades da distribui c ao 1. Trata-se de uma distribui c ao sim etrica, unimodal. 2. A distribui c ao e semelhante a ` distribui c ao normal reduzida (ver gura seguinte)
A distribui c ao de Student, foi introduzida em 1908 por William Gosset, que trabalhava ent ao para uma f abrica de cervejas. Como esta n ao queria que os seus concorrentes soubessem do uso que os seus t ecnicos faziam de m etodos estat sticos, Gosset teve de publicar o seu trabalho sob o pseud onimo de Student.
1

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

115

0.0
6

0.1

0.2

0.3

0.4

Gr acos da fun c ao densidade de uma v.a. com distribui c ao (0, 1) (a verde), (4) (a vermelho) e (10) (a azul).

Par ametros da distribui c ao ( > 2). 2

[ ] = 0 ( > 1)

[ ] =

(3.10)

Existem tamb em tabelas para esta distribui c ao. As utilizadas no nosso curso de Estat stica d ao-nos para cada par de valores e o ponto () tal que, sendo () , [ > () ] = . Atendendo ao facto de se tratar de uma distribui c ao sim etrica, e f acil vericar a seguinte rela c ao: 1 = . (3.11)

Consideremos agora novamente o estudo da distribui c ao da vari avel , quando a amostra aleat oria prov em de uma popula c ao normal com vari ancia desconhecida. Tem-se o seguinte teorema: Teorema 3.4 Se 1 , ..., e uma amostra aleat oria retirada de uma popula c ao normal de valor 2 m edio e vari ancia , a v.a. (1) / Dem: Nas condi c oes do teorema sabemos que (0, 1) / e ( 1) 2 2 (1) . 2 (3.12)

Al em disso, como no caso de vari aveis aleat orias normais e 2 s ao independentes tem-se, aplicando a deni c ao (3.3)

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

116

( 1) 2 / 2 ( 1)

( )/(/ )

(1) . /

Distribui c ao da diferen ca entre duas m edias amostrais Consideremos duas amostras aleat orias 11 , 12 , ..., 11 e 21 , 22 , ..., 22 extra das independentemente de duas popula c oes normais 1 (1, 1 ) e 2 (2 , 2 ). As m edias, 1 2 2 =1 1 e 1 = 2 = =1 1 2

s ao tamb em normais independentes. Ent ao aplicando o Exerc cio 2.15, p ag. 97, que generaliza o teorema da estabilidade da soma de normais, temos 2 2 1 2 1 2 1 2 , + (3.13) 1 2 Se as popula c oes s ao n ao normais, a distribui c ao de amostragem de 1 2 e aproximadamente normal, desde que as dimens oes das amostras 1 e 2 sejam ambas grandes.
2 A distribui c ao de amostragem (3.13) s o tem aplica c ao quando as vari ancias 1 e de cada uma das popula c oes s ao conhecidas. No caso de 1 e 2 grandes pode 2 2 2 2 substituir-se 1 por 1 e 2 por 2 sendo a aproxima c ao ` a normal ainda bastante razo avel. Por em, se as dimens oes s ao pequenas, a aproxima c ao j a n ao e v alida. No caso de as vari ancias das popula c oes embora desconhecidas poderem ser supostas iguais (mais tarde veremos como se poder a vericar esta condi c ao), e poss vel usar um procedimento que vai tamb em conduzir ` a distribui c ao . 2 2

Teorema 3.5 Se 11 , 12 , ..., 11 e 21 , 22 , ..., 22 s ao amostras aleat orias extra das independentemente de duas popula c oes normais 1 (1, 1 ) e 2 (2 , 2 ), respectiva2 2 mente, com vari ancias iguais, 1 = 2 , ent ao ( 1 2 ) ( 1 2 )
2 +( 1) 2 (1 1)1 2 1 2 ( 1 + 2 2 1

1 ) 2

(1 +2 2)

Dem: Seja 2 a vari ancia comum ` as duas popula c oes normais, ent ao

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

117

Sabemos ainda que as vari aveis aleat orias

( 1 2 ) ( 1 2 ) (0, 1) 1 1 2( + ) 2 1

(3.14)

2 2 (2 1)1 (1 1)1 2 e 2 (1 1) (2 1) 2 2 s ao independentes pois as amostras s ao seleccionadas independentemente de cada popula ca o. Pela estabilidade da soma da distribui c ao 2 tem-se 2 2 (1 1)1 + (2 1)2 2 (1 +2 2) 2 Sendo assim, e utilizando de novo a deni c ao (3.3), a vari avel aleat oria denida

como ( 1 2 ) ( 1 2 ) 1 1 2 ( + ) 1 2 = 2 2 (1 1)1 + (2 1)2 2 (1 + 2 2) ( 1 2 ) ( 1 2 )


2 +( 1) 2 (1 1)1 2 1 2 ( 1 + 2 2 1

1 ) 2

(1 +2 2)

costume designar por E


2 = 2 2 (1 1)1 + (2 1)2 a que se chama vari ancia ponderada. 1 + 2 2

No caso de as vari ancias das popula c oes n ao poderem ser consideradas iguais v arios m etodos t em sido sugeridos; referiremos aqui o procedimento devido a WelshSatterthwaite que estabelece que a vari avel aleat oria ( 1 2 ) ( 1 2 ) 2 1 2 + 2 1 2 (3.15)

tem aproximadamente distribui c ao em que o n umero de graus de liberdade , tem de ser estimado directamente a partir dos dados: =
2 2 ( 2 1 /1 + 2 /2 )
2 (2 1 /1 ) 1 1 2 (2 2 /2 ) 2 1

(3.16)

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

118

Como o valor obtido para pela express ao anterior n ao e necessariamente um inteiro, deve arredondar-se para o inteiro imediatamente inferior. Distribui c ao do quociente de vari ancias amostrais
2 2 2 2 A estat stica 1 /2 , em que 1 e 2 s ao as vari ancias amostrais de duas populac oes, tem um grande interesse em quest oes de infer encia sobre a raz ao entre as vari ancias das duas popula c oes. A distribui c ao de uma vari avel aleat oria fun c ao do quociente entre duas vari ancias amostrais, em popula c oes normais com base em amostras independentes, foi estudada por Fisher e Snedecor. Vamos aqui apresentar a deni c ao e algumas propriedades da distribui ca o .

Deni c ao 3.4
2 Sejam 2 aveis aleat orias independentes. A v.a. assim denida () e () vari

/ /

(3.17)

tem distribui c ao com (, ) graus de liberdade e costuma representar-se por (,), Esta distribui c ao e, juntamente com as distribui c oes normal, qui-quadrado e , uma das mais importantes distribui c oes em estat stica aplicada. Estas distribui c oes constituem um conjunto de instrumentos indispens aveis na resolu c ao de problemas de infer encia estat stica. A distribui c ao encontra a sua grande aplica c ao em problemas de an alise de vari ancia (ANOVA), um dos m etodos mais importantes da an alise estat stica. Na gura seguinte pode ver-se algumas formas da fun c ao densidade para alguns valores dos par ametros.
0.6 df(xval, 5, 50) 0.0
0

0.2

0.4

3 xval

Gr acos da fun c ao densidade de uma v.a. com distribui c ao (5,50) (a preto), (5,5) (a vermelho) e (3,10) (a verde).

Exerc cio 3.1 Seja () . Prove que 2 (1,) .

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

119

Teorema 3.6 Se Dem: A demonstra c ao e imediata tendo em conta a deni c ao (3.4) de uma vari avel aleat oria com distribui c ao . Consequ encia: Sendo (,) o valor de uma distribui c ao tal que [ > (,) ] = , tem-se 1(,) = 1 (,) (3.18) (,) = 1/ (,) .

Dem: Se (,) temos 1(,) como o ponto tal que ( > 1(,) ) = 1 (1/ < 1/1(,) ) = 1 Portanto ( > 1/1(,) ) = com = 1/ (,) .

1/(,) = 1(,) .

Vejamos agora a utiliza c ao desta distribui c ao na Infer encia Estat stica Teorema 3.7 Suponhamos que temos amostras aleat orias independentes, de tamanhos 1 e 2 2 2 seleccionadas de duas popula c oes normais com vari ancias 1 e 2 , respectivamente. Ent ao a v.a.
2 2 1 /1 2 / 2 2 2

(11,2 1) .

(3.19)

Dem: Como se trata de amostras aleat orias seleccionadas de popula co es normais, sabemos que
2 (1 1)1 2 (1 1) 2 1

2 (2 1)2 2 (2 1) 2 2

e como s ao vari aveis independentes, tem-se atendendo ` a deni c ao (3.4) da distribui c ao ,


2 2 2 2 1 /1 (1 1)1 /(1 1)1 = (1 1,2 1) . 2 2 2 / 2 (2 1)2 /(2 1)2 2 2

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

120

Teoria da Estima c ao
Consideremos uma popula c ao da qual e conhecida a forma da fun c ao de distribui c ao, mas tendo par ametros desconhecidos, cujo valor pretendemos estimar. Tal como j a foi referido atr as, o problema da estima c ao divide-se em duas grandes areas: estima c ao pontual; estima c ao por intervalos. Estima c ao pontual Seja uma popula c ao cuja distribui c ao iremos supor conhecida, ou pelo menos admitida, mas dependendo de um par ametro desconhecido. Entre outras hip oteses, pode ser, um valor m edio, uma propor c ao, uma vari ancia, etc. Pretendemos ent ao estimar a partir da informa c ao dada por uma amostra aleat oria, (1 , 2 , ..., ), extra da da referida popula c ao. Deni c ao 3.5 Uma estat stica denida sobre a amostra, que sirva para estimar o valor do . Um par ametro , diz-se que e um estimador de e costuma representar-se por estimador e portanto uma v.a. com uma dada distribui c ao. Deni c ao 3.6 Chama-se estimativa ou estimativa pontual de e e costume representar-se por , o valor num erico de para uma amostra concreta. Exemplo 3.2 Se para uma dada popula ca o pretendemos estimar = = ( ) podemos usar como estimador =
1 =1

sendo a estimativa obtida a partir de uma amostra concreta (1 , ..., ), ==


1 =1

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

121

Nesta disciplina iremos apresentar os estimadores dos par ametros mais comuns e fazer infer encia sobre esses par ametros. Na tabela seguinte encontram-se esses par ametros, os estimadores que iremos considerar e estimativas associadas. Par ametro a estimar 2 1 2
2 2 1 /2

Estimador = 2 =

=1

Estimativa = 2 =

=1

1 ( )

2 =1 ( )

1 ()

2 =1 ( )

1 2
2 2 1 /2

1 2
2 2 1 /2

1 2

com () - v.a. que conta o n umero de sucessos em provas de Bernoulli e () - n umero observado de sucessos na amostra de dimens ao (concretiza c ao daquelas provas de Bernoulli).

1 2

1 2

Para um dado par ametro desconhecido e poss vel propor mais de um estimador, sendo assim, uma vez denido um estimador pontual, p oe-se uma pergunta natural: Qu ao bom e o estimador obtido?. Obviamente, pretendemos que o estimador forne ca estimativas que se espere estarem muito pr oximas do valor de . E necess ario ent ao dispor de crit erios ou propriedades que permitam escolher um estimador como o melhor de entre outros poss veis estimadores do par ametro. Propriedades de um estimador Estimador centrado. Deni c ao 3.7 do par O estimador ametro , diz-se centrado ou n ao enviesado se e s o se = . ()

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

122

Exemplo 3.3 Seja (1 , ..., ) uma amostra aleat oria de dimens ao extra da de uma popula c ao e um estimador centrado para . com m edia . A m edia amostral De facto ( ) = Exemplo 3.4 A vari ancia amostral 2 denida em (3.3), baseada numa amostra aleat oria de dimens ao , retirada de uma popula c ao com valor m edio e vari ancia 2 e um estimador centrado de 2 . Pretendemos ent ao provar que ( 2 ) = 2 . Ora [ ] [ ] ( ) 2 [( ) ( )]2 ( ) = = 1 1 [ ] ( )2 2( ) ( ) + ( )2 1
2

1 1 (1 + ... + ) = () =

[ ] [ ] [ ] ( )2 ( )2 ( ) 2 ( )2 = 1 1 1 Como s ao elementos da amostra aleat oria, s ao independentes e ( ) = ent ao, [ ] ( ) 2 [( )2 ] 2 = = e 1 1 1 [ ] 2 2 ( )2 = ( )2 = = 1 1 1 1 pois ( )2 = ( ) = 2 / Tem-se ent ao 2 2 ( ) = = 2 1 1
2

( ) = [( )2 ] = 2 ,

logo 2 e um estimador centrado de 2 .

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

123

importante perceber o que signica centrado: dizer que E e um estimador centrado de , signica que, fazendo repeti c oes de uma experi encia os valores das esti mativas resultantes ao em torno de e a m edia daquelas estimativas 1 , 2 , ..., , variar igualmente importante, compreender o que o termo est a razoavelmente pr oxima de . E centrado n ao implica. De facto o termo centrado n ao implica que uma estimativa esteja muito pr oxima do verdadeiro valor do par ametro a estimar. Por em, regra geral apenas uma amostra e obtida quando se estuda uma dada popula ca o, porque de facto os estudos estat sticos n ao se repetem muitas vezes, por forma a que das estimativas obtidas se possa calcular a m edia. Para ter alguma garantia de que a estimativa obtida est a pr oxima do verdadeiro valor do par ametro , o ideal ser a o estimador usado ser, n ao s o centrado, como ter tamb em vari ancia pequena. Deste modo, mesmo que os valores estimados utuem em torno de , a variabilidade e pequena. Aparece aqui um novo conceito, o conceito de eci encia de um estimador. Estimador eciente. )2 ]. A Uma maneira de denir a eci encia de um estimador e pelo valor de [( esta quantidade chama-se erro quadr atico m edio e o ideal e que seja m nimo. )2 ] = (). Se e um estimador centrado, [( Deni c ao 3.8 diz-se eciente se Um estimador e centrado e tem vari ancia menor ou igual ` a vari ancia de qualquer outro estimador do mesmo par ametro. 1 e 2 s 1 tem menor vari Observe-se que s o ao centrados, mas o estimador ancia do que 2 portanto e mais eciente. Existem outras propriedades que um estimador deve possuir, mas que n ao aboro o daremos neste curso (consultar Murteira 2volume, Tiago de Oliveira 2volume ou ainda Mood, Graybill e Boes). Referimos at e aqui alguns estimadores, algumas propriedades que eles dever ao possuir, por em nunca fal amos em m etodos de estima c ao, i.e., procedimentos para obter estimadores de par ametros. N ao nos e poss vel estudar tais m etodos no decorrer deste curso, cando por em aqui a refer encia aos mais importantes, que se encontram expostos na bibliograa indicada: m etodo dos momentos; m etodo da m axima verosimilhan ca; m etodo dos m nimos quadrados.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

124

Estima c ao por intervalos


At e aqui consider amos o problema da estima c ao pontual e zemos refer encia a m etodos de determinar estimadores pontuais de par ametros desconhecidos. Por em, a indica c ao de um u nico valor como estimativa de um par ametro n ao nos d a nenhuma informa c ao sobre a precis ao de tal valor. Por isso em muitas situa c oes, interessa-nos dar uma medida de erro, , para indicar que o verdadeiro valor do par ametro e + . est a muito provavelmente entre Deni c ao 3.9 Um intervalo de estima c ao de um par ametro e um intervalo da forma face a uma 1 < < 2 , onde 1 e 2 s ao dois valores assumidos pelo estimador , amostra concreta. A medida da conan ca com que aquele intervalo conter a o verdadeiro valor do par ametro e feita em termos de probabilidades. Para isso e necess ario conhecer, pelo Assim, xada uma probamenos aproximadamente, a distribui c ao de amostragem de . bilidade que regra geral e elevada, interessa-nos determinar o intervalo aleat orio que com a referida probabilidade cont em o par ametro que se pretende estimar. A constru c ao do intervalo baseia-se na determina c ao de duas vari aveis aleat orias, 1 e 2 tais que xado um valor , com 0 < < 1, 1 < < 2 ) = 1 ( A 1 chama-se coeciente de conan ca e a chama-se n vel de signic ancia. Deni c ao 3.10 O intervalo 1 < < 2 , calculado para uma amostra concreta chama-se intervalo de conan ca a (1 ) 100% . 1 , 2 [ Note-se que o intervalo ] e um intervalo aleat orio e o que vamos determinar 1 e 2 , respectivamente. s ao 1 e 2 , realiza c oes de 2 ) = 0.95, signica que temos uma conan Quando temos (1 < < ca de 95% de que o nosso intervalo contenha o verdadeiro valor do par ametro, ou ainda, signica 1 , 2 [, obtidos a partir de amostras que esperamos que em cerca de 95% dos intervalos ] extra das da popula c ao, o valor esteja l a inclu do e nos restantes 5%, n ao esteja. , produzindo portanto Diferentes amostras, conduzem a diferentes valores de diferentes intervalos de conan ca para o par ametro . Quanto maior for o intervalo, maior e o grau de conan ca que temos de que ele contenha o verdadeiro valor do par ametro desconhecido, mas n ao h a interesse em ter um intervalo muito largo. O ideal seria um intervalo curto com probabilidade elevada.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

125

Como j a diss emos, para construir um intervalo de conan ca para um par ametro , e necess ario encontrar um vari avel aleat oria cuja express ao contenha e cuja distribui c ao seja conhecida, pelo menos aproximadamente. Iremos considerar intervalos de conan ca para o valor m edio, vari ancia, diferen ca de valores m edios, quociente de vari ancias e para propor c oes.

Intervalos de conan ca para o valor m edio a) Caso de uma popula c ao normal com conhecido Seja (1 , ..., ) uma amostra aleat oria retirada de uma popula c ao , com distribui c ao normal com valor m edio e vari ancia 2 conhecida. Vimos j a que um estimador para a m edia da popula c ao , e dado pela estat stica , que no nosso caso tem distribui c ao 2 normal com valor m edio e vari ancia /. Sendo assim tem-se = (0, 1) (3.20)

a v.a. , em cuja express E ao interv em como u nico par ametro desconhecido, que vai ser utilizada para a determina c ao do intervalo de conan ca para . Fixado o n vel de signic ancia e designando por /2 o valor da v.a. tal que ( > /2 ) = /2, tem-se (/2 < < /2 ) = 1 (/2 < donde, ap os pequenos c alculos ( /2 < < + /2 ) = 1 Para uma amostra concreta (1 , ..., ), seja o valor da estat stica , tem-se ent ao o intervalo a (1 ) 100% de conan ca para numa popula c ao normal com conhecido e /2

< /2 ) = 1

< < + /2

(3.21)

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

126

b) Caso de uma popula c ao normal com desconhecido Na verdade, na maioria dos casos n ao conhecemos a vari ancia da popula c ao da qual pretendemos estimar a m edia. Se a amostra e grande, pode substituir-se por em (3.21) e obter assim um intervalo de conan ca para . Tal procedimento resulta da distribui ca o de amostragem (3.8). Por em, e pequena, a distribui c ao de se a amostra de que dispomos ( )/(/ ), a vari avel que resulta de substituir por um seu estimador, j a n ao e normal. Por c ao da popula c ao e normal, a v.a. = em, vimos que se a distribui c ao -Student com ( 1) g.l. ( )/(/ ) tem distribui A constru c ao dos intervalos de conan ca segue aqui um procedimento an alogo ao considerado em a). Sendo /2 o valor da v.a. tal que ( > /2 ) = /2, tem-se (/2 < < /2 ) = 1 (/2 < < /2 ) = 1 /

( /2 / < < + /2 / ) = 1 . Portanto, o intervalo de conan ca para a (1 ) 100%, no caso de 2 desconhecido e a popula c ao ser normal e
/2(1) < < + /2(1)

(3.22)

Exemplo 3.5 Uma amostra de 10 medidas do di ametro de uma esfera apresenta uma m edia = 4.38 e um desvio padr ao = 0.06. Determine um intervalo de conan ca a 99% para o valor do di ametro m edio da esfera, supondo admiss vel que as medidas dos di ametros seguem uma lei aproximadamente normal. Resolu c ao: Como = 10 e pequeno e n ao conhecemos o valor do desvio padr ao da popula c ao das medidas dos di ametros, o intervalo de conan ca para o verdadeiro valor do di ametro e dado por (3.22), portanto como = 0.01, tem-se /2(9) = 0.005(9) = 3.25, donde o intervalo de conan ca pedido e ]4.38 3.25(0.06/ 10), 4.38 + 3.25(0.06/ 10)[=]4.318, 4.442[.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

127

c) Caso de uma popula c ao n ao normal Se a amostra de que dispomos tiver dimens ao elevada, o Teorema Limite Central permite-nos resolver a quest ao da determina c ao dos intervalos de conan ca. De facto, se grande, tem-se pelo Teorema Limite Central que, qualquer que seja a forma da distribui c ao da qual se retirou a amostra aleat oria (0, 1) ent ao analogamente ao que foi feito na al nea anterior o intervalo a (1 ) 100% de conan ca para numa popula c ao qualquer com conhecido, desde que a dimens ao da amostra, , seja grande, e dado por (3.21). Se n ao e conhecido, mas a dimens ao da amostra e grande pode ainda substituirse na express ao do intervalo de conan ca (3.21), por (desvio padr ao da amostra). Sendo assim temos o intervalo a (1 ) 100% de conan ca para numa popula c ao qualquer com desconhecido e com grande, e /2 Exemplo 3.6 A m edia e o desvio padr ao da classica c ao m edia de uma amostra aleat oria de 100 alunos de uma dada escola s ao 2.6 e 0.3, respectivamente. Determine um intervalo de conan ca a 95% para a classica c ao m edia de todos os alunos daquela escola. Resolu c ao: Como = 100 e grande, n ao se exige o conhecimento da distribui c ao subjacente as classica ` c oes; o desvio padr ao tamb em n ao e conhecido mas podemos usar , vindo ent ao o intervalo de conan ca dado por (3.23) com = 2.6 e = 0.3. Para = 0.05, tem-se /2 = 0.025 = 1.96; o intervalo de conan ca a 95% para a classica ca o m edia e ent ao 0 .3 0 .3 2.6 1.96 < < 2.6 + 1.96 100 100 2.54 < < 2.66.

< < + /2

(3.23)

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

128

Um outro problema que se levanta frequentemente e o de saber que dimens ao dever a ter a amostra para assegurar que o erro cometido ao estimar por seja inferior a uma quantidade especicada . Ora, considerando o intervalo de conan ca para /2 / < < + /2 /

se usarmos como uma estimativa de , podemos estar (1 ) 100% conantes que o erro cometido ser a menor que /2 / . Sendo assim, para termos uma estimativa de com erro inferior a devemos escolher tal que /2 / , i.e., ( ) /2 2 (3.24) Por em esta igualdade s o se pode aplicar se conhecermos a vari ancia da popula c ao da qual se vai seleccionar a amostra. Mas, o que acontece na realidade e que na grande maioria dos casos n ao se conhece; ent ao o que se dever a fazer e tomar uma amostra preliminar de > 30, us a-la para obter uma estimativa de e ent ao entrar com este valor na f ormula (3.24).

Intervalos de conan ca para a diferen ca entre duas m edias populacionais a) Caso de popula c oes normais com vari ancias conhecidas Suponhamos duas popula co es normais 1 (1 , 1 ) e 2 (2, 2 ). ao, Um estimador para a diferen ca das m edias 1 2 e dado por 1 2 . Ent para ter uma estimativa pontual para 1 2 seleccionamos duas amostras aleat orias independentes uma de cada popula c ao com dimens oes 1 e 2 , respectivamente. Como vimos j a, 2 2 1 2 1 2 1 2 , + . 1 2 Sendo assim, analogamente ao que zemos atr as, xado o n vel de signic ancia , o intervalo de conan ca a (1 ) 100% para 1 2 no caso de popula c oes normais com vari ancias conhecidas das quais foram extra das amostras independentes e
2 1 1 2 2 2

(1 2 ) /2

< 1 2 < (1 2 ) + /2

2 1 1

2 2 2

(3.25)

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

129

b) Caso de popula c oes normais, vari ancias desconhecidas O que acab amos de dizer sobre a diferen ca de duas m edias s o e aplic avel no caso 2 2 2 de e 2 conhecidos ou estimados, no caso de grandes amostras. De facto se 1 e 2 s ao 2 2 2 2 desconhecidas e 1 e 2 grandes, podemos substituir em (3.25) 1 por 1 e 2 por 2 , sem haver altera c ao signicativa na precis ao do intervalo de conan ca. Se no entanto as amostras s ao pequenas, podemos contruir intervalos de conan ca para a diferen ca dos valores m edios se forem vericadas as seguintes hip oteses:
2 1

1. ambas as distribui c oes normais; 2. as vari ancias das popula c oes, embora desconhecidas possam ser supostas iguais (veremos mais adiante um procedimento que permite estudar a admissibilidade desta hip otese). Como cou dito atr as, teorema 3.5, se as vari ancias embora desconhecidas, pud2 2 erem ser supostas iguais, seja 1 = 2 = 2 , a v.a. ( 1 2 ) ( 1 2 ) (1 +2 2) 1 1 ( + ) 2 1
2

(3.26)

com

2 2 (1 1)1 + (2 1)2 . = 1 + 2 2 A constru c ao de um intervalo de conan ca para 1 2 segue os procedimentos j a atr as referidos: dado o n vel de signic ancia , tem-se

(/2 < < /2 ) = 1 ( 1 2 ) ( 1 2 ) < /2 = 1 /2 < 1 1 1 + 2

donde, ap os pequenos c alculos se tem

o intervalo de conan ca a (1 ) 100% para 1 2 no caso de amostras de pequena dimens ao retiradas de popula c oes normais com vari ancias descon2 2 2 hecidas mas supostas iguais, 1 = 2 = e
1 1 1 2

(1 2 ) /2

< 1 2 < (1 2 ) + /2

1 1

1 2

(3.27)

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

130

Exemplo 3.7 Num processo qu mico pretende comparar-se o efeito de dois catalizadores sobre o produto obtido. Utilizaram-se 12 quantidades iguais de produto nas quais se usou o catalizador 1 e 10 outras quantidades nas quais se usou o catalizador 2. Quando foi usado o catalizador 1, obteve-se uma m edia de 85 com desvio padr ao 4, enquanto para o catalizador 2 se obteve m edia 81 com desvio padr ao 5. Determinar um intervalo de conan ca a 90% para a diferen ca entre o efeito m edio dos dois catalizadores, supondo que as popula c oes s ao aproximadamente normais. Resolu c ao: Para j a admitamos poder aceitar-se a igualdade das vari ancias (mais tarde teremos oportunidade de vericar se esta hip otese e admiss vel). Como as amostras t em dimens ao pequena e e suposto terem sido retiradas de popula co es aproximadamente normais, o intervalo de conan ca e dado por (3.27), com
2 (1 1)2 1 + (2 1)2 = 20.05 1 + 2 2 = 0.05(20) = 1.725, o intervalo de conan ca a 90% para 1 2 e

2 =

Como /2(20) ent ao

ou seja,

4 (1.725)(4.478) 1/12 + 1/10 < 1 2 < 4 + (1.725)(4.478) 1/12 + 1/10 0.69 < 1 2 < 7.31.

As hip oteses da normalidade das popula c oes e da igualdade das vari ancias s ao bastante restritivas e muitas vezes n ao s ao vericadas nas aplica c oes. Por em, v arios autores mostraram que o grau de conan ca nos intervalos n ao e seriamente afectado para pequenos afastamentos da normalidade. No caso de as popula c oes serem normais, a hip otese da igualdade das vari ancias pode ser n ao vericada continuando a ter-se bons resultados, desde que estejam a ser consideradas amostras do mesmo tamanho. Portanto, ao planear-se uma experi encia, e de fazer um esfor co para obter amostras com a mesma dimens ao. Se no entanto as amostras tiverem dimens oes diferentes e n ao for admissi vel supor as vari ancias iguais e ainda poss vel contruir intervalos de conan ca aproximados para a diferen ca das m edias das duas popula c oes considerando uma estat stica aproximada, em que o n umero de graus de liberdade tem de ser estimado a partir dos dados. Esta vari avel foi j a estudada atr as, (3.15), vindo-nos portanto o intervalo de conan ca a (1 ) 100% para 1 2 no caso de amostras de pequena dimens ao retiradas de popula c oes normais com vari ancias diferentes

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

131

1 2 /2

2 1 1

2 2 2

< 1 2 < 1 2 + /2

2 1 1

2 2 2

(3.28)

onde /2 e o valor de uma vari avel aleat oria , com distribui c ao com g.l., denido em (3.16). c) Caso de popula c oes quaisquer e amostras de dimens ao grande Quando as popula c oes 1 e 2 n ao s ao normais mas as dimens oes das amostras retiradas independentemente de cada uma delas s ao grandes, (como regra pr atica 1 e 2 ambos maiores que 30) o intervalo de conan ca (3.25) d a uma aproxima c ao bastante boa 2 2 quando as vari ancias de cada uma das vari aveis 1 e 2 s ao conhecidas. 2 2 2 Se 1 e 2 s ao desconhecidas e 1 e 2 grandes, podemos substituir em (3.25) 1 2 2 por 2 avel a precis ao do intervalo de conan ca. 1 e 2 por 2 , sendo razo Exemplo 3.8 Foi feito um teste a 50 raparigas e 75 rapazes. As raparigas tiveram uma pontua ca o m edia de 76 com desvio padr ao 6 e os rapazes tiveram uma pontua c ao m edia de 82 com desvio padr ao 8. Construindo um intervalo de conan ca a 95% para a diferen ca da pontua c ao m edia entre os rapazes e as raparigas, interprete o resultado obtido. Resolu c ao: Designando por 1 a popula c ao dos rapazes e 2 a popula c ao das raparigas, temos 1 = 75 e 2 = 50. Como as amostras t em dimens oes grandes n ao e necess ario exigir a normalidade das popula c oes a estudar, assim como o conhecimento das vari ancias de cada uma delas. ca a 95% para Dado que 1 = 82, 2 = 76, 1 = 8 e 2 = 6, o intervalo de conan a diferen ca da pontua c ao m edia entre os rapazes e as raparigas e (82 76) 1.96 64/75 + 36/50 < 1 2 < (82 76) + 1.96 64/75 + 36/50 3.54 < 1 2 < 8.46.

donde o intervalo de conan ca a 95% e

Dado que o intervalo de conan ca cont em apenas valores positivos para 1 2 , podemos dizer que, com uma conan ca de 95%, as pontua c oes m edias obtidas pelos rapazes s ao superiores ` as obtidas pelas raparigas.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

132

e) Caso de amostras emparelhadas At e aqui consider amos intervalos de conan ca para a diferen ca das m edias de duas popula c oes, quando as amostras obtidas de cada uma dessas popula c oes eram independentes. o caso de observa Por em, em muitas situa c oes tal n ao acontece. E c oes de uma o dada experi encia ocorrendo aos pares, sendo o 1elemento do par de uma amostra e o 2o elemento da outra. Por exemplo, ao ser feito um teste sobre uma nova dieta em indiv duos, os pesos registados antes e ap os o tempo de teste constituem as observa c oes de cada uma das nossas amostras. Como se v e, as observa c oes em cada uma das amostras est ao relacionadas (emparelhadas) pelo indiv duo. Uma outra situa c ao e a de haver factores estranhos ao fen omeno em estudo, que causam diferen cas signicativas nas m edias. E o caso de se pretender fazer um ensaio de dois adubos na produ c ao de trigo. Se para isso escolhermos v arios talh oes aplicando numa parte deles um dos adubos e na outra parte o outro adubo, pode acontecer que ao compararmos as produ c oes m edias, as diferen cas vericadas se devam n ao aos adubos mas a condi c oes diferentes de solo e clima a que os talh oes estejam sujeitos. A inu encia de factores estranhos pode reduzir-se considerando aquilo a que chamamos observa c oes emparelhadas. De facto, ao compararmos dois tratamentos (o termo tratamentos usa-se regra geral para designar coisas que se pretendem comparar), e desej avel que as unidades experimentais (s ao os elementos b asicos a que s ao aplicados os tratamentos) sejam o mais homog eneas poss vel, por forma que, as diferen cas que se verique existirem entre os dois grupos em estudo possam ser atribu das a diferen cas nos tratamentos. Se existirem certos factores variando nas unidades experimentais e que possam inuenciar a resposta , tais factores podem obscurecer as diferen cas reais devidas ao efeito dos tratamentos. O requerimento da homogeneidade entre as duas amostras, que poderia resolver este problema, pode impor restri c oes grandes ao n umero de elementos a incluir nas amostras. Por exemplo, para comparar dois analg esicos pode ser impratic avel obter um n umero razo avel de doentes que tenham as mesmas caracter sticas: idade, sexo, condi co es f sicas gerais e o mesmo grau de severidade de doen ca. Al em de ser muitas vezes impratic avel obter amostras com mesmas caracter sticas, tamb em n ao tem interesse o estudo feito com um grupo t ao restrito. Um estudo com muito mais interesse consistir a em considerar uma variedade grande de doentes, com idades, sexos, condi c oes gerais diferentes e para aplicar os tratamentos tentar formar pares de indiv duos o mais semelhantes poss vel em cada par, mas variando de par para par. Em cada par escolhe-se aleatoriamente um elemento para receber um tratamento cando o outro com outro tratamento. Surge ent ao um conceito muito importante, e o conceito de bloco que se mostra fundamental por permitir uma situa c ao de compromisso entre o requesito da homogeneidade e da diversidade das unidades experimentais. O procedimento consiste ent ao em formar grupos ou blocos por forma que em cada bloco as referidas unidades sejam homog eneas e nos diferentes blocos sejam bastante heterog eneas. Temos ent ao amostras a

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

133

que chamamos amostras emparelhadas. Depois em cada bloco e atribu do aleatoriamente o tratamento 1 a uma das unidades, cando a outra para o tratamento 2. Este processo permite a compara c ao efectiva dentro de cada bloco e a diversidade de condi c oes poss veis de existir entre os blocos. No caso dos adubos, a experi encia deve ent ao ser planeada de modo a formar talh oes emparelhados, i.e., o mais semelhantes poss vel quanto ao tipo de solo, humidade, exposi ca o ao sol, etc, e num deles aplicar um adubo e no outro o outro adubo. O emparelhamento serve portanto para remover fontes de varia c ao que possam existir entre as duas popula c oes em estudo e que obscure cam o efeito dos tratamentos. A diferen ca nas respostas dos dois grupos ser a assim atribu da a `s diferen cas nos tratamentos e n ao aos grupos. Consideremos a amostra emparelhada ( , ) ( = 1, ..., ), composta por pares de observa c oes independentes, mas dentro de cada par e s ao correlacionadas. Designemos por (1 , 2 , ..., ), a amostra aleat oria das diferen cas, i.e., 1 = 1 1 ; 2 = 2 2 ; ... = .

As vari aveis aleat orias 1 , 2 , ..., s ao independentes. Supondo que 1 , 2 , ..., s ao observa c oes de uma popula c ao normal com valor 2 m edio e vari ancia , desconhecida, pelas propriedades do valor m edio v e-se que = , por conseguinte a infer encia sobre a diferen ca das m edias entre as duas popula co es e o mesmo que fazer infer encia sobre a m edia da diferen ca. 2 2 Naturalmente, como estimador pontual de temos e como estimador pontual de temos sendo 1 = =1

Para determinarmos um intervalo de conan ca para , uma vez xado um n vel , temos de considerar a v.a. (1) / donde o intervalo de conan ca a (1 ) 100% para , onde as diferen cas = s ao supostas normais e independentes e
/2 < < + /2

1 = ( ) 2 . 1 =1

(3.29)

(3.30)

Observa c ao: Tal como tem vindo a ser referido se grande n ao e necess aria a hip otese da normalidade para a popula c ao das diferen cas.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

134

Exemplo 3.9 Numa investiga c ao m edica pretende-se estudar o efeito de determinado medicamento na redu c ao da tens ao arterial. Para isso registaram-se as tens oes arteriais de 15 pessoas e posteriormente usaram o referido medicamento durante seis meses, no m dos quais as suas tens oes arteriais foram de novo registadas. Que infer encias e poss vel efectuar a partir dos dados obtidos? Indiv duo Antes ( ) Depois ( ) = 1 2 70 80 68 72 2 8 3 4 5 6 7 8 72 76 76 76 72 78 62 70 58 66 68 52 10 6 18 10 4 26 9 10 11 12 13 14 82 64 74 92 74 68 64 72 74 60 74 72 18 -8 0 32 0 -4 15 84 74 10

Resolu c ao: Estamos perante observa c oes emparelhadas, por pessoa, feitas antes e ap os o uso do medicamento. Tem-se 1 1 = = 8 .8 , = ( )2 = 10.98. 15 14 Supondo que as diferen cas s ao valores de uma amostra aleat oria extra da de uma popula ca o normal, um intervalo de conan ca a 95% para a diferen ca m edia, obtido a partir de (3.30) e 10.98 10.98 ]8.8 2.145 , 8.8 + 2.145 []2.72, 14.88[ 15 15 Sendo assim, podemos dizer que, com 95% de conan ca, a redu ca o m edia est a entre 2.72 e 14.88 e como o intervalo de conan ca inclui apenas valores positivos h a fortes raz oes para acreditar que h a redu c ao da tens ao arterial. Observa c oes: Na altura de planear uma experi encia para comparar dois tratamentos, por vezes teremos de decidir entre fazer amostras emparelhadas ou amostras independentes. Vejamos algumas considera c oes: Ao considerarmos amostras emparelhadas e dispondo de pares de observa c oes, a vari avel a usar na constru c ao do intervalo de conan ca tem distribui c ao com ( 1) g.l.; se as amostras fossem consideradas independentes com observa c oes cada, a vari avel a usar teria distribui c ao com (2 2) g.l. Vemos ent ao que amostras emparelhadas resultam numa perda de graus de liberdade, o que acarreta um valor maior para /2 e consequentemente um intervalo de conan ca maior.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

135

Mas, se nas unidades experimentais existem condi c oes que possam inuenciar a resposta e que produzam uma grande variabilidade nos dois grupos em estudo, e pela amostragem emparelhada que devemos optar. Sempre que estejamos a trabalhar com unidades experimentais que sejam homog eneas ou cuja heterogeneidade n ao se pode relacionar a factores identic aveis e ent ao prefer vel fazer amostras independentes.

Intervalo de conan ca para a vari ancia Dada uma amostra aleat oria a que um estimador da (1 , 2 , ..., ), vimos j vari ancia 2 da popula c ao era 2 = ( )2 /( 1). Por outro lado sabemos que se a amostra for extra da de uma popula c ao normal de par ametros e , ( 1) 2 2 (1) . 2 esta vari E avel aleat oria que n os vamos utilizar para construir um intervalo de conan ca para 2 . Fixado um n vel , e sendo 2 c ao 2 /2 o valor de uma v.a. com distribui (1) tal 2 2 que ((1) > /2 ) = /2 [ ] ( 1) 2 2 2 1/2 < < /2 = 1 2 [ ] 2 ( 1) 2 ( 1) < 2 < 2 = 1 2 1/2(1) /2(1) Ent ao o intervalo de conan ca a (1 ) 100% para a vari ancia de uma popula c ao normal e
(1)2 2 /2(1)

< 2 <

(1)2 2 1/2(1)

(3.31)

Intervalo de conan ca para o quociente entre duas vari ancias Suponhamos que temos duas popula c oes normais (1, 1 ) e (2 , 2 ) das quais retiramos duas amostras independentes de dimens oes 1 e 2 , respectivamente. Pretendemos comparar as vari ancias das duas popula c oes, determinando um in2 1 tervalo de conan ca para 2 . 2

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

136

2 2 2 1 tem distribui c ao (1 1,2 1) 2 2 1 2 Para construir um intervalo de conan ca, para um n vel de signic ancia , basta ent ao ter em conta que ] [ 2 2 2 1 1/2 < 2 2 < /2 = 1 1 2 ] [ 2 2 2 1 1 1 < 2 < 2 = 1 . 2 2 /2 2 2 1/2

Vimos, teorema 3.7, que a vari avel aleat oria

Portanto, tendo ainda em conta o resultado (3.18) para a distribui c ao , 2 1 o intervalo de conan ca para 2 , raz ao das vari ancias de duas pop2 ula c oes normais das quais foram extra das duas amostras independentes, e
2 2 2 1 /2;(1 1,2 1)

<

2 1 2 2

<

2 1 /2;(2 1,1 1) 2 2

(3.32)

Mais uma vez e de referir que estamos a supor as popula c oes normais. A viola c ao desta hip otese pode levar-nos a conclus oes incorrectas. Por em, tem-se vericado que tal tal problema e minimizado se as amostras tiverem a mesma dimens ao.

Intervalos de conan ca para propor c oes. Dada uma popula c ao com distribui c ao binomial de par ametros (, ), regra geral e o par ametro desconhecido. Um estimador de e = , (3.33) onde , designando o n umero de sucessos em provas, tem ent ao distribui c ao (, ) Como sabemos ( ) = e ( ) = , portanto ) = ( ( ) e ent ao um estimador centrado de e ( ) = 1 = . 2

) = (

Se estivermos nas condi c oes de ser poss vel aproximar a v.a. binomial pela normal, teorema de De Moivre, sabemos que (, )

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

137

. Portanto ( ) / , = (0, 1) (3.34)

Usando esta vari avel aleat oria podemos determinar um intervalo de conan ca para a propor c ao , atendendo a que ( ) /2 < < /2 = 1

( ) / /2 < < /2 = 1 . ) ( /2 + /2 = 1 << Observe-se por em que e desconhecido, por isso os limites da express ao anterior n ao se conseguem obter. No entanto, como toda esta constru c ao s o e v alida para grande, nos limites da express ao anterior pode substituir-se por = /. Temos ent ao um intervalo de conan ca para a (1 ) 100% de conan ca para amostras de dimens ao grande e /2 com = /.
(1 )

<< + /2

(1 )

(3.35)

Exemplo 3.10 Numa amostra de 400 fam lias extra da de entre os habitantes de Lisboa, vericouse que 140 tinham televis ao via sat elite. Determine um intervalo a 95% de conan ca para a propor c ao de fam lias possuindo TV sat elite. Resolu c ao: Designando por a v.a. que conta o n umero de fam lias possuindo TV sat elite na amostra seleccionada, trata-se de uma vari avel com distribui c ao hipergeom etrica. Mas = 400 e muito pequeno relativamente ` a dimens ao da popula c ao (todas as fam lias de Lisboa) e por isso e poss vel fazer uma aproxima c ao ` a binomial. Temos ent ao a v.a. aproximadamente binomial de par ametros ( = 400, ). O par ametro , desconhecido, tem como estimativa = 140/400 = 0.35. O intervalo de conan ca, para a propor c ao pedida, obtido a partir de (3.35) e ent ao dado por (0.35) (0.65) (0.35) (0.65) 0.35 1.96 < < 0.35 + 1.96 400 400

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

138

ou seja 0.303 < < 0.397. O intervalo de conan ca (3.29) pode escrever-se sob a forma < /2

permitindo-nos dar uma ideia do erro cometido ao estimar por . Teorema 3.8 Se e usado como uma estimativa de , podemos ter (1 ) 100% de conan ca que o erro cometido ao usarmos em vez de e inferior a /2 /.

Aplicando este teorema podemos determinar a dimens ao da amostra que se deve tomar por forma que o erro cometido ao estimar por seja inferior a um certo valor especicado . Assim, basta fazer /2
2 / 2 . 2

Podemos enunciar ent ao o Teorema 3.9 Se e usado como estimativa de , o erro cometido e inferior a com (1)100% de conan ca, quando a dimens ao da amostra f or
2 / 2

(3.36)

Observe-se por em que, na determina c ao do tamanho da amostra necess aria para ter uma estimativa de com um erro inferior a uma quantidade especicada, usa-se , calculado a partir da amostra. Regra geral este problema e resolvido do seguinte modo: Se for poss vel ter uma estimativa grosseira de sem necessidade de recolher uma amostra usa-se essa estimativa na express ao que nos d a o valor de . na falta dessa estimativa, extrai-se uma primeira amostra de dimens ao > 30, estima-se e depois este valor entra na express ao que permite determinar . Note-se ainda que, independentemente do grau de conan ca e poss vel ter um limite inferior para , tendo em conta que = (1 ) = 2 = 1/4 ( 2 + 1/4) = 1/4 ( 1/2)2 1/4

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

139

Sendo assim o m aximo valor que podem tomar e 1/4. Substituindo na express ao (3.36) obtemos um valor para a dimens ao da amostra que se deve recolher para termos uma estimativa com um erro inferior a , independentemente do grau de conan ca
2 / 2

42

(3.37)

Intervalo de conan ca para a diferen ca entre duas propor c oes Consideremos duas popula co es binomiais das quais retiramos duas amostras aleat orias independentes, sucientemente grandes, de dimens oes 1 e 2 . Dena-se as vari aveis aleat orias (1 , 1 ) 1 = /1 e (2 , 2 ) 2 = /2

Pretendemos determinar um intervalo de conan ca para 1 2 . Sejam e estimadores de 1 e 2 , respectivamente. Como estamos a considerar 1 e 2 grandes, temos ( ) 1 1 1 1 , 1 2 ( 2 2 2 )

2 ,

Como as amostras s ao independentes as v.a.s e s ao independentes e portanto 1 e 2 tamb em independentes , logo ( ) 1 1 2 2 1 2 1 2 , + . 1 2 Procedendo como temos feito at e aqui temos o intervalo de conan ca a (1 ) 100% para a diferen ca 1 2 de duas popula c oes binomiais das quais se retiraram amostras independentes e de dimens ao elevada e

( 1 2 ) /2

1 1 1

2 2 2

< 1 2 < ( 1 2 ) + /2

1 1 1

2 2 2

(3.38)

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

140

Exemplo 3.11 Pretende-se saber se a propor c ao de ulmeiros afectados pela graose e id entica em duas zonas A e B. Na zona A foi recolhida uma amostra de 150 ulmeiros e vericou-se que 107 estavam afectados e na zona B recolheu-se uma amostra de 100 havendo 63 afectados. Que conclus oes se pode tirar ao n vel de signic ancia de 0.05? Resolu c ao: Sejam 1 e 2 as propor c oes de ulmeiros afectados pela graose nas zonas A e B respectivamente. Em face dos resultados obtidos temos como estimativas 63 107 = 0.71 2 = = 0.63. 150 100 Um intervalo de conan ca para 1 2 , aplicando directamente (3.38) e 1 = (0.71 0.63) 1.96 0.06 < 1 2 < (0.71 0.63) + 1.96 0.06 0.04 < 1 2 < 0.20 Atendendo a que o intervalo de conan ca cont em valores positivos e negativos, podemos dizer com 95% de conan ca que n ao h a diferen ca signicativa entre as propor co es de ulmeiros afectados em cada uma das zonas.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

141

Testes de hip oteses


Vamos aqui introduzir uma outra metodologia usada em infer encia estat stica que j a referimos atr as, chamada Testes de Hip oteses Estat sticas. Grosseiramente falando o objectivo dos testes de hip oteses estat sticas e determinar se certas arma c oes sobre uma popula ca o s ao suportadas pelos dados da amostra. Portanto apresenta procedimentos adequados para p or ` a prova ideias que formulamos sobre factos desconhecidos. Uma ideia, mesmo que pare ca muito boa, deve ser pelo menos transitoriamente negada, e s o se a evid encia factual nos levar a rejeitar essa nega c ao e que deve ser acolhida como promissora ... Pestana e Velosa (2008), Introdu c ao ` a Probabilidade e ` a Estat stica Vejamos em primeiro lugar algumas

No c oes b asicas

Deni c ao 3.11 Uma hip otese estat stica e uma conjectura sobre: - um par ametro desconhecido da popula c ao ou - a forma da distribui c ao de uma caracter stica em estudo na popula co Pode ser ent ao sobre a forma da distribui c ao ou sobre o valor de par ametros desconhecidos da popula c ao, conhecida ou n ao a forma da distribui c ao. Tal conjectura pode ou n ao ser verdadeira. A verdade ou falsidade nunca pode ser conrmada, a menos que observ assemos toda a popula c ao, o que nalguns casos e impratic avel (quando a popula c ao e muito grande) ou noutros mesmo imposs vel (caso de popula c oes innitas ou mesmo de a caracter stica em estudo levar ` a destrui c ao da popula ca o dura c ao de vida de um elemento, etc.) E ent ao atrav es da informa c ao fornecida por uma amostra que n os rejeitamos ou n ao a hip otese formulada. Iremos tratar aqui hip oteses sobre o(s) valor(es) do(s) par ametro(s) desconhecidos da popula c ao (testes param etricosou testes de hip oteses param etricas). Ent ao, por exemplo, admitamos que temos uma popula c ao cuja lei e conhecida com excep c ao de um par ametro (escalar ou vector) desconhecido. A teoria de Neyman-Pearson sobre testes de hip oteses estabelece uma dicotomia no espa co, , do par ametro (conjunto de valores poss veis para o par ametro desconhecido),i.e., = 0 1 e 0 1 = . Tal dicotomia consiste anal na formula c ao de duas hip oteses alternativas, que e costume serem designadas por 0 hip otese nula e 1 hip otese alternativa.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

142

A formula c ao matem atica das hip oteses e ent ao a seguinte: 0 : 0

1 : 1 , e dizemos que queremos testar 0 contra 1 , escrevendo muitas vezes 0 vs 1 . Se 0 (1 ) cont em um s o elemento, 0 (1 ) diz-se hip otese simples, se cont em mais de um elemento diz-se hip otese composta.

Escolha da hip otese nula e da hip otese alternativa Ao testar uma hip otese nula contra uma hip otese alternativa a nossa atitude dever a ser admitir 0 como verdadeira at e que os dados testemunhem fortemente contra ela; nesse caso dever a ser rejeitada a favor de 1 . Uma analogia ` a formula c ao das hip oteses nula e alternativa, pode ser a que se estabelece num julgamento, onde os jurados ter ao de decidir por considerar culpado ou inocente um r eu. Deve considerar-se culpado apenas se houver provas verdadeiramente convincentes da culpa, portanto a hip otese nula deve ser aquela que deve ser olhada como verdadeira e s o rejeitada quando os dados apresentarem forte evid encia disso. Portanto devem ser assim formuladas as hip oteses: 0 : 1 : n ao culpado culpado.

Regra geral toma-se como hip otese 0 a hip otese a ensaiar, por exemplo, 0 eo valor de um par ametro cuja plausibilidade se pretende vericar, e a situa c ao actual, etc. Um teste de hip oteses e anal uma regra que permite especicar um subconjunto do espa co-amostra (Chama-se espa co amostra o conjunto de todas as amostras poss veis), , que permita decidir se a amostra observada conduz ` a rejei c ao ou n ao de 0 Designe-se por - regi ao de aceita c ao de 0 e - regi ao de rejei c ao de 0 , com = e = . Para tomarmos uma decis ao e necess ario ent ao estabelecer um conjunto de regras: Denir uma vari avel aleat oria, fun c ao da amostra aleat oria, cujo valor ser a calculado a partir de uma amostra observada: se o valor calculado , rejeita-se 0 se o valor calculado , aceita-se 0 Podemos dizer que um teste de uma hip otese nula e o decurso de uma ac c ao que especica o conjunto de valores de uma v.a. , para os quais 0 e

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

143

rejeitada. A v.a. cujos valores permitem decidir qual a atitude a tomar diz-se Estat stica do teste e o conjunto de valores dessa vari avel que conduzem ` a rejei ca o de 0 chama-se Regi ao de Rejei c ao ou Regi ao Cr tica.

Os dois tipos de erros e a fun c ao pot encia de um teste Sendo um teste de hip oteses um tipo particular de infer encia estat stica, e portanto um procedimento que leva do particular ao geral, podendo assim conduzir a erros. Ao proceder-se a um teste de hip oteses podem cometer-se dois tipos de erros: rejeitar a hip otese nula, sendo ela verdadeira chama-se a este erro do tipo I ou erro de primeira esp ecie e n ao rejeitar 0 e ela ser falsa chama-se a este erro do tipo II ou erro de segunda esp ecie. Vejamos esquematizadas no seguinte quadro as situa c oes que podem ocorrer Conclus oes do teste N ao rejeitar 0 Rejeitar 0 Situa c oes correctas desconhecidas 0 verdadeira Correcto Errado Erro tipo I 0 falsa Errado Erro tipo II Correcto

A decis ao do teste e portanto errada nas duas situa c oes seguintes: Rejeitar 0 e 0 ser verdadeira (erro de 1a esp e cie); N ao rejeitar 0 e 0 ser falsa (erro de 2a ecie). esp ` As probabilidades de cometer cada um dos erros anteriores e costume designar por e : = (erro tipo I)= (Rejeitar 0 / 0 verdadeiro) e chamado o n vel de signic ancia do teste; = (erro tipo II)= (n ao rejeitar 0 / 0 falso) e a 1 = (rejeitar 0 / 0 falso) chama-se a pot encia do teste. O aspecto fundamental da teoria dos testes de hip oteses consiste na escolha da regi ao cr tica de modo a controlar cada um dos dois tipos de erros. A situa c ao ideal seria aquela que minimizasse simultaneamente e . Mas, na realidade, mantendo xa a dimens ao da amostra, e variam em sentidos contr arios. O que se faz e xar o n vel de signic ancia (o erro tipo I e considerado o mais gravoso e portanto o que deve ser controlado) e tomar o teste que minimize , ou seja, que maximize a pot encia do

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

144

teste (na verdade a procura de um teste que minimize s o tem sentido quando 0 e 1 s ao hip oteses compostas, porque neste caso as probabilidades de cometer erros de 1a e 2a esp e cie dependem do valor particular do par a metro em cada uma das regi o es). Vejamos esquematicamente os principais passos na formula c ao de um teste de hip oteses, respeitante a um par ametro de uma popula c ao: 1. 0 : 0 ou 0 : 0 ou 0 : = 0 ; e respectivamente 2. 1 : < 0 ou > 0 ou = 0 ; 3. Escolher o n vel de signic ancia ; 4. Seleccionar a estat stica do teste e denir a regi ao de rejei c ao; 5. Calcular o valor da estat stica para uma amostra observada, de dimens ao ; 6. Decis ao: stica pertence ` a regi ao critica Rejeitar 0 , se o valor da estat N ao rejeitar 0 , caso contr ario. Podem se consultados os quadros com os diferentes testes que ir ao ser considerados neste curso, e que s ao testes ao valor m edio, vari ancia, diferen ca de valores m edios no caso de amostras independentes e emparelhadas, quociente de vari ancias e propor co es.

Notas sobre Regras de decis ao em Testes de Hip oteses A indica c ao do valor observado da estat stica do teste, seguido da consulta de uma tabela para a procura de um valor cr tico de modo a tirar conclus oes, tem sido recentemente substitu do pelo c alculo da probabilidade de se observar um valor igual ou mais extremo do que o observado, se a hip otese nula e verdadeira chama-se a isto valor de prova; valor-p (p-value ) Nota: e esta quantidade que hoje em dia qualquer software est a preparado para calcular e indicar quando se manda realizar um teste. Podemos interpretar o valor de prova, valor-p ou p-value como a medida do grau de concord ancia entre os dados e H0 . Assim Quanto menor for o p-value, menor e a consist encia entre os dados e a hip otese nula

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

145

Habitualmente adopta-se como regra de decis ao: rejeitar H0 se p-value .

Testes de Normalidade Vamos aqui considerar apenas o caso de se pretender testar a forma da distribui c ao. Estamos ent ao no dom nio dos testes n ao param etricos que neste caso se designam por testes de ajustamento. Comecemos com um teste muito importante nas nossas aplica c oes - um teste de ajustamento para averiguar se um dado conjunto de observa c oes se pode considerar proveniente de uma popula c ao lue com distribui c ao normal e um teste de normalidade, o Teste de Shapiro Wilk, que se tem revelado ser um dos mais potentes. Vejamos em s ntese como se processa. O teste de Shapiro-Wilk Seja X a caracter stica em estudo na popula c ao. Formulam-se as hip oteses: H0 : X tem distribui c ao normal H1: X n ao tem distribui c ao Normal Calcula-se o valor da estat stica do teste = 2 ( )
2

com constante

=1

a determinar a partir dos dados e com recurso a uma tabela (que neste ano lectivo n ao ser a dada). Valores pequenos de indicam n ao normalidade, i.e. RC: <

Com valor cr tico a consultar na tabela. Aqui iremos utilizar o teste de Shapiro-Wilk, apenas com recurso ao valor-, para a tomada de decis ao. Rejeita-se H0 se valor , signicando que n ao se pode admitir que tem distribui c ao normal; Se valor > n ao se rejeita H0 , o que signica que a distribui c ao normal e uma distribui c ao poss vel para X.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

146

Exerc cios propostos 1. Suponhamos que se pretende comparar, numa mesma regi ao, as produ c oes leiteiras de duas ra cas bovinas e que se escolheu com esse objectivo, aleat oria e independentemente, uma amostra de 50 animais de cada ra ca. Se obtivermos para cada uma das amostras rendimentos m edios de 1 = 4360 kg e 2 = 4190 kg, deve-se admitir que existe realmente uma diferen ca entre as duas ra cas? Justique a resposta. 2. Um fabricante de sacos de pl astico vende os sacos, a peso, em lotes de 100. Cada lote deveria ter um peso de 500 gr. Recolhida uma amostra de 20 lotes de sacos, observaram-se os seguintes valores: = 502.5 = 4.31.

Diga se e de admitir que o peso m edio dos sacos e efectivamente 500 gr. 3. Pretende-se comparar dois m etodos para determinar a percentagem de magn esio existente num composto qu mico. Para isso foram submetidos ` aqueles m etodos dez compostos diferentes, tendo-se obtido os seguintes resultados: no de composto M etodo A M etodo B 1 2 3 4 5 6 7 13.3 17.6 4.1 17.2 10.1 3.7 5.1 13.4 17.9 4.1 17.0 10.3 4.0 5.1 8 9 10 7.9 8.7 11.6 8.0 8.8 12.0

Haver a diferen ca signicativa entre os dois m etodos, a um n vel de signic ancia de 5%? 4. Para controlar a qualidade dos lotes de um dado produto que vai ser vendido a peso, produzidos numa linha de fabrico, decidiu-se usar o seguinte esquema: recolher uma amostra e dimens ao , de cada lote e calcular a m edia , dos pesos das embalagens; se > aceitar o lote. se rejeitar o lote;

Decidiu-se ainda que, se a verdadeira m edia do peso das embalagens no lote () for inferior ou igual a 5.3 a probabilidade de rejeitar o lote deve ser pelo menos 99% e, se for superior ou igual a 5.5 a probabilidade de aceitar o lote deve ser pelo menos 90%. Admita que o desvio padr ao do peso, em cada lote, e de 0.2. Calcule o valor de e o menor valor de requerido por este esquema de amostragem. Justique.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

147

Refer encias bibliogr acas Bhattacharyya, G.K. and Johnson R.A.(1977), Statistical Concepts and Methods, John Wiley & Sons Inc. Dagnelie, P.(1973), Estat stica, Teoria e M etodos, trad. do Prof. Doutor A. St.Aubyn, Europa Am erica, vol I e II. Walpole, R.E (1993), Mathematical Statistics, 3th edition, Englewood Clis, N.J., Prentice-Hall. Milton, J.S. and Arnold, J.C. (1987), Probability and Statistics in the Engineering and Computing Sciences, Mc Graw Hill. Mood, A. Graybill, F. and Boes D. (1985). Introduction to the Theory of Statistics , Mc Graw Hill. Murteira, B. (1990), Probabilidades e Estat stica (vol I), Mc Graw Hill. Murteira, B., Ribeiro, C.S., Silva, J.A. e Pimenta C.(2002), Introdu c ao ` a Estat stica, Mc Graw Hill. Pestana, D.D. e Velosa, S.F. (2008), Introdu c ao ` a Probabilidade e ` a Estat stica 3 edi ca o. Funda c ao Calouste Gulbenkian.

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

148