pt
Dossiers Didcticos
Dossiers Didcticos
(Populao e Demografia, Inquritos, Inflao e Preos, Grficos em Estatstica, etc.). Vrios nmeros destes dossiers vo estar disponveis neste local, medida que forem sendo elaborados.
Neste momento apresenta-se o Dossier IV Estatstica com Excel, que teve a colaborao da Prof Maria Eugnia Graa Martins, com formato legvel em ambiente browser (ex. Internet Explorer, Netscape) e em papel. Neste dossier poder encontrar uma descrio de como aplicar os conhecimentos adquiridos nas pginas das "Noes de Estatstica" (http://alea-estp.ine.pt) com o Microsoft Excel. Entendemos que alguns leitores podero estar menos familiarizados com o Excel, pelo que se inicia este dossier com uma breve abordagem ao ambiente Excel e s suas folhas de clculo. No final, a rubrica Ver Tambm contm links para outros estudos de interesse relacionados com as temticas em causa (artigos, web sites , etc.).
http://alea-estp.ine.pt
Dossiers Didcticos
http://alea-estp.ine.pt
Dossiers Didcticos
1) Atravs dos menus ou submenus, os quais podem ser seleccionados na Barra de menus, clicando com o rato, ou recorrendo a teclas de atalho.
3) Atravs da Barra de frmulas: Seleccione a clula de destino, clique na tecla de edio de frmulas , abra o menu das funes.
Atravs dos trs mtodos citados aceder ao comando Colar funo [Function Wizard], o qual apresenta as diferentes funes agrupadas em 11 categorias:
http://alea-estp.ine.pt
Dossiers Didcticos
Categoria da funo
Financeiras Data e Hora Matemtica e trigonometria Estatstica Consulta e referncia Base de dados Texto Lgica Informao Definidas pelo utilizador Engenharia
[Function Category]
Finantial Date & Time Math & Trig Statistical Lookup & Reference Database Text Logical Information Uder Defined Engineering
Para cada categoria escolhida, o menu apresenta as diferentes funes, bem como uma breve descrio da funo escolhida e da sua sintaxe.
Aps
seleco
da
funo
desejada, aparece um segundo menu que permite a definio dos diferentes argumentos da funo.
Quando estiver familiarizado com as diferentes funes, poder digit-las, sem recorrer ao menu. 4) Atravs da Caixa de edio de clula ou directamente na clula, ambas seleccionadas com o clicar do rato.
http://alea-estp.ine.pt
Dossiers Didcticos
2.3.
O Excel apresenta um conjunto de funes e procedimentos avanados para a anlise estatstica de dados, os quais se encontram sob o comando Anlise de dados [Data analysis ]. Antes de dar incio apresentao das diferentes funes estatsticas, verifique se estas j foram instaladas no seu computador: 1) Aceda ao menu Ferramentas [Tools ] e verifique se o comando Anlise de dados [Data analysis ] j consta do menu.
2) Se no constar, escolha o comando Suplementos [Add-Ins ] do menu Ferramentas [Tools ], marque a opo Analysis ToolPack e clique OK, para tornar disponveis as funes e os procedimentos avanados. O comando Anlise de dados passou a constar do menu Ferramentas.
http://alea-estp.ine.pt
Dossiers Didcticos
Exemplo 1 (Dados discretos): Suponha-se uma amostra constituda pelo nmero de irmos dos 20 alunos de uma determinada
Dados quantitativos que s podem tomar um nmero finito, ou infinito numervel, de valores distintos.
turma: 1, 1, 2, 1, 0, 3, 4, 2, 3, 1, 0, 2, 1, 1, 0, 1, 1, 0, 3, 2 . Comece por digitar na clula A1 o ttulo N. de irmos . Da clula A2 clula A21, digite cada um dos valores apresentados. Grave o ficheiro para o disco e prepare-se para as novas funes!
Exemplo 2 (Dados contnuos ): Suponha-se uma amostra constituda pelas notas obtidas por 22 alunos num ponto de Matemtica de
Dados quantitativos que podem tomar todos os valores numricos, compreendidos no seu intervalo de variao.
uma determinada turma: 12,1; 8,9; 16,2; 8,2; 9,8; 15,1; 14,5; 13,4; 14,7; 7,5; 8,8; 12,4; 16,1; 15,2; 13,5; 14,6; 15,5; 7,8; 12,5; 13,2; 11,0; 10,5 . Comece por digitar na clula A1 o ttulo Nota Matemtica. Da clula A2 clula A23, digite cada um dos valores apresentados. Grave o ficheiro para o disco e prepare-se para as novas funes!
http://alea-estp.ine.pt
Dossiers Didcticos
Determina-se a frequncia absoluta atravs da funo CONTAR.SE [COUNTIF]. CONTAR.SE(sequncia de nmeros ou endereos de clula; critrios de seleco ou endereo de clula contendo critrios) Esta funo calcula o nmero de clulas que no estejam em branco e que obedeam a um determinado critrio.
Para determinar o nmero de alunos com 2 irmos: - Desloque o apontador para a clula de destino C3. - Introduza a funo: =CONTAR.SE(A2:A21;"2").
O procedimento utilizado para o clculo da frequncia absoluta de classes de dados qualitativos, idntico ao apresentado para os dados discretos, substituindo-se nos critrios, o cardinal pelo nome da modalidade.
Representam a informao que identifica alguma qualidade, categoria ou caracterstica, no susceptvel de medida, mas de classificao, assumindo vrias modalidades.
Para determinar o nmero de alunos que tiveram uma nota inferior a 10 no ponto de Matemtica: - Desloque o apontador para a clula de destino C2. - Introduza a funo: = CONTAR.SE(A2:A23;"<10").
Para determinar o nmero de alunos que tiveram uma nota igual ou superior a 10 e menor do que 14 no ponto de Matemtica: - Desloque o apontador para a clula de destino C3. - Introduza a funo: =CONTAR.SE(A2:A23;"<14") - CONTAR.SE(A2:A23;"<10").
http://alea-estp.ine.pt
Dossiers Didcticos
Frequncia relativa Para o clculo da frequncia relativa, necessrio determinar a dimenso da amostra atravs das funes CONTAR [COUNT] ou CONTAR.VAL [COUNTA].
Razo entre o nmero de elementos pertencentes a uma determinada classe e o nmero total de elementos do conjunto de dados a analisar.
CONTAR(sequncia de nmeros ou endereos de clula) Esta funo calcula o nmero de clulas no conjunto que no estejam em branco e que apresentem valores numricos. CONTAR.VAL(sequncia de nmeros ou endereos de clula) Esta funo calcula o nmero de clulas no conjunto que no estejam em branco, sendo adequada para o clculo da dimenso de amostras contendo variveis qualitativas.
Para determinar a fraco de alunos com 2 irmos: - Desloque o apontador para a clula de destino C4. - Introduza a funo: =CONTAR.SE(A2:A21;"2")/CONTAR(A2:A21).
Tabela que apresenta a distribuio da varivel, isto , quais as classes ou modalidades que a varivel assume, assim como a frequncia com que assume essas classes.
Vejamos os dados do Exemplo 1, os quais podem ser agrupados em 5 classes distintas: 0, 1, 2, 3 ou 4 irmos. Comece por introduzir os diferentes ttulos e valores das classes.
http://alea-estp.ine.pt
Dossiers Didcticos
10
Clculo das frequncias absolutas: - Desloque o apontador para a clula de destino C3. - Introduza a funo: = CONTAR.SE(A2:A21;B3) . - Repita o procedimento para as clulas C4 a C7. - Na clula C8 introduza a funo: =CONTAR(A2:A21).
Clculo das frequncias relativas: - Desloque o apontador para a clula de destino D3. - Introduza a funo: =C3/C8. - Repita o procedimento para as clulas C4 a C7. - Na clula D8 introduza a funo: =SOMA(D3:D7) [SUM]. Enquanto que no caso dos dados discretos, a construo da tabela de frequncias no apresenta qualquer dificuldade, no caso das variveis contnuas o processo um pouco mais elaborado, distinguindo-se certas etapas principais, as quais se passam a descrever, e que sero ilustradas com o Exemplo 2: 1 Definio das classes a) Determinar a amplitude da amostra (ver seco 5.3). b) Dividir essa amplitude pelo nmero k de classes pretendido { ARRED.PARA.CIMA(LOG(n;2);0)}; tomar para amplitude de classe h um valor aproximado por excesso do quociente anteriormente obtido. c) Construir as classes C1 , C2 , ... Ck de modo que tenham todas a mesma amplitude e cuja unio contenha todos os elementos da amostra: De forma genrica Ci = [min. da amostra + (i-1) x h, min. da amostra + i x h[ com i=1, 2, ..., k
Para uma amostra de dimenso n, k k o menor inteiro tal que 2 n {k log2(n)}
http://alea-estp.ine.pt
Dossiers Didcticos
11
2 Contagem dos elementos das classes Determina-se o nmero de elementos da amostra que pertencem a cada classe. Analogamente no esses caso valores ao dos que sero foi as considerado discretos, dados
da Barra de
http://alea-estp.ine.pt
Dossiers Didcticos
12
Para continuar a construo do grfico, e para passar ao Passo [Step] seguinte, clique no boto Seguinte > [Next >].
No terceiro passo, a Caixa de dilogo apresenta vrias opes que permitem formatar o grfico: - Em Ttulos [Titles ] siga o exemplo apresentado. - Em Legenda [Legend], desactive a opo da legenda. Para continuar a construo do grfico, e para passar ao Passo [Step] seguinte, clique no boto Seguinte > [Next >]. No ltimo passo pode escolher se o grfico colocado numa nova folha de clculo ou numa folha j existente. Clique em Concluir [Finish] e obter o seguinte resultado: O mesmo procedimento poder ser aplicado construo de um diagrama de barras com frequncias relativas. Nesse caso, comece por seleccionar as duas colunas, contendo os dados e respectivos ttulos, relativos s classes e frequncia relativa. Uma vez que as colunas no so contguas, para as seleccionar, comece por seleccionar a primeira coluna e premindo a tecla <ctrl> seleccione a segunda coluna.
http://alea-estp.ine.pt
Dossiers Didcticos
13
3.4. Histograma
Antes de iniciar a construo do histograma, dever definir, o nmero de classes, a sua amplitude e os seus limites, tal como se descreveu na seco 3.2, para a construo da tabela de frequncias no caso dos dados contnuos.
No entanto, se se pretender utilizar a opo Histograma [Histogram] do Excel, faz-se notar que a frequncia absoluta de cada classe calculada, considerando o limite inferior da classe como aberto e o limite superior como fechado. Assim, para construir as classes de modo que tenham todas a mesma amplitude e cuja unio contenha todos os elementos da amostra, deve-se comear pelo valor mximo, considerando as seguintes classes: Ck-i+1 = ]max. da amostra - i x h, max. da amostra - (i-1) x h] com i=1, 2, ..., k Retomando o Exemplo 2, obtm-se as seguintes classes: ]7,2; 9,0], ]9,0; 10,8], ]10,8; 12,6], ]12,6; 14,4] e ]14,4; 16,2] Crie uma tabela com os limites superiores das classes: Comece por digitar na clula D10 o ttulo Nota Matemtica. Da clula D11 clula D14, digite cada um dos valores dos limites superiores de cada uma das classes, com excepo do limite da ltima classe.
Atravs do comando Anlise de dados [Data analysis ], presente no menu Ferramentas se [Tools ]. o (Verifique efectuou
procedimento descrito na seco 2.3). Ao aceder ao comando Anlise de dados [Data analysis ], seleccione a opo Histograma [Histogram ] e clique OK.
http://alea-estp.ine.pt
Dossiers Didcticos
14
Seleccionar para obter o histograma Aps preenchimento da Caixa de dilogo , clique OK.
De facto, o que o Excel oferece, mais um diagrama de barras do que um verdadeiro histograma. Pode-se minimizar esta falha com os seguintes passos:
a) Seleccione o grfico e clique duas vezes sobre as barras de frequncias, de forma a que se abra o menu Formatar Srie de Dados [Format Data Series ]. Seleccione o sub-menu Opes [Options ] e ajuste para 0 o valor da Largura do intervalo [Gap widht].
http://alea-estp.ine.pt
Dossiers Didcticos
15
b) Substitua na folha de clculo , os valores do limite superior das classes, pela expresso dos intervalos de classe. A opo Histograma [Histogram ] no permite, a construo (desenho) de histogramas com amplitudes de classe variveis. Para visualizar um histograma correctamente elaborado em Excel, aceda pgina da DISCUS e abra o mdulo de estatstica descritiva (DESC.XLS). (http://www.mis.coventry.ac.uk/research/discus/discus_home.html )
um tipo de representao grfica, em que se realam algumas caractersticas da amostra. O conjunto dos valores da amostra compreendidos entre o 1 e o 3 quartis, Q.25 e Q.75 representado por um rectngulo (caixa) com a mediana indicada por uma barra. Consideram-se seguidamente duas linhas que unem os lados dos rectngulos com os valores mximo e mnimo, respectivamente.
Para ilustrar a elaborao do diagrama, vamos considerar as estatsticas relativas a duas amostras de notas obtidas por alunos de duas turmas num ponto de Matemtica , Turma A: mediana = 13,1; 1 quartil = 9,6; 3 quartil = 14,6; mnimo = 6.3 e mximo = 16,2. Turma B: mediana = 12,2; 1 quartil = 9,3; 3 quartil = 14,6; mnimo = 2,9 e mximo = 18,1. Comece por digitar nas clulas A1, A2 e A3 os ttulos Estatsticas , Turma A e Turma B, respectivamente. Para cada srie introduza os valores das estatsticas de acordo com a seguinte ordem: 1 quartil, mnimo, mediana, mximo e 3 quartil. Digite cada um dos valores apresentados. Grave o ficheiro para o disco. Aps a digitao da tabela pode-se obter com facilidade o diagrama de extremos e quartis, atravs do Assistente de Grficos [Chart Wizard].
http://alea-estp.ine.pt
Dossiers Didcticos
16
Comece por seleccionar as clulas contendo os dados e os respectivos ttulos e clique no cone da Barra de ferramentas .
Para continuar a construo do grfico, e para passar ao Passo [Step] seguinte, clique no boto Seguinte > [Next >].
Para continuar a construo do grfico, seleccione a opo Srie em: Linhas [Series in: Lines ]e clique no boto Concluir [Finish].
20
15
1 Quartil M nimo
10
Mediana Mximo
3 Quartil
0 Turma A Turma B
Seleccione o grfico e clique duas vezes sobre uma das linhas, de forma a que se abra o menu Formatar Srie de Dados [Format Data Series ]. Seleccione o sub-menu Padres [Patterns ] e ajuste Linha
http://alea-estp.ine.pt
Dossiers Didcticos
17
[Line] para a opo Nenhuma [None]. Repita o procedimento para todas as sries.
20
15
1 Quartil M nimo
10
Mediana Mximo
3 Quartil
0 Turma A Turma B
Novamente, seleccione o grfico e clique duas vezes sobre uma das sries, de forma a que se abra o menu Formatar Srie de Dados [Format Data Series ]. Seleccione o sub-menu Opes [Options ] e marque as opes: Linhas de mximo/mnimo [High-Low lines ] e Barras para cima/baixo [Up-Down bars].
20 18 16 14 12 10 8 6 4 2 0 Turma A Turma B
Nota Matemtica
http://alea-estp.ine.pt
Dossiers Didcticos
18
Como o nome sugere esta representao constituda por um crculo, em que se apresentam vrios sectores circulares, tantos quanto as classes consideradas na tabela de frequncias da amostra em estudo. Os ngulos dos sectores so proporcionais s frequncias das classes.
Comece por seleccionar as clulas contendo os dados e o respectivo ttulo e clique no cone Barra de ferramentas . da
Para continuar a construo do grfico, e para passar ao Passo [Step] seguinte, clique no boto Seguinte > [Next >].
Para continuar a construo do grfico, e para passar ao Passo [Step] seguinte, clique no boto Seguinte > [Next >].
http://alea-estp.ine.pt
Dossiers Didcticos
19
No terceiro passo, a Caixa de dilogo apresenta vrias opes que permitem formatar o grfico: - Em Rtulos de dados [Data labels ] seleccione a opo Mostrar rtulos e percentagem [Show labels and percentages ]. - Em Legenda [Legend], desactive a opo da legenda. Para continuar a construo do grfico, e para passar ao Passo [Step] seguinte, clique no boto Seguinte > [Next >] No ltimo passo pode escolher se o grfico colocado numa nova folha de clculo ou numa folha j existente.
N. de irmos
5 4 5% 15% 3 20%
1 20%
2 40%
http://alea-estp.ine.pt
Dossiers Didcticos
20
4. Medidas de localizao
Para ilustrar o clculo das diferentes medidas de localizao e de disperso, vamos considerar o seguinte conjunto de dados, correspondente altura, em cm, de uma amostra de 10 alunos de uma turma de Educao Fsica: 175, 170, 185, 154, 165, 175, 182, 178, 175 e 173. Comece por digitar na clula A1 o ttulo Altura (cm). Da clula A2 clula A11, digite cada um dos valores apresentados. Grave o ficheiro para o disco e prepare-se para as novas funes!
4.1. Mdia
Determina-se a mdia atravs da funo MEDIA [AVERAGE].
a medida de localizao do centro da amostra, mais utilizada e obtm-se somando todos os elementos da amostra e dividindo o resultado da soma pela dimenso da amostra.
MEDIA(sequncia de nmeros ou endereos de clula) O resultado desta funo a mdia aritmtica (x ) dos valores introduzidos como argumento:
x=
x
i =1
- Desloque o apontador para a clula B2 e digite: Mdia (cm). - Desloque o apontador para a clula C2 e introduza a funo: =MEDIA(A2:A11).
http://alea-estp.ine.pt
Dossiers Didcticos
21
4.2. Moda
Determina-se a moda atravs da funo MODA [MODE].
Valor que surge com mais frequncia num conjunto de dados, se estes so discretos, ou a classe com maior frequncia se os dados esto agrupados.
- Desloque o apontador para a clula B3 e digite: Moda (cm). - Desloque o apontador para a clula C3 e introduza a funo: =MODA(A2:A11).
4.3. Mediana
uma medida de localizao do centro da distribuio dos dados, correspondente ao valor que divide a amostra ao meio, isto , metade dos elementos do conjunto de dados so menores ou iguais mediana, enquanto que os restantes so superiores ou iguais.
- Desloque o apontador para a clula B4 e digite: Mediana (cm). - Desloque o apontador para a clula C4 e introduza a funo: =MED(A2:A11).
http://alea-estp.ine.pt
Dossiers Didcticos
22
4.4. Quantis
Os quantis determinam-se atravs das funes QUARTIL [QUARTILE] e PERCENTIL [PERCENTILE].
Chama-se quantil de ordem p, 0<p<1, ou percentil 100p% ao valor Qp tal que 100p% dos elementos da amostra so menores ou iguais a Qp e os restantes so maiores ou iguais a Qp. Os quantis de ordem 0,25 e 0,75 chamam-se, respectivamente, 1 e 3 quartis.
- Desloque o apontador para a clula B5 e digite: 1 Quartil (cm). - Desloque o apontador para a clula C5 e introduza a funo: =QUARTIL(A2:A11;1). - Desloque o apontador para a clula B6 e digite: 3 Quartil (cm). - Desloque o apontador para a clula C6 e introduza a funo: =QUARTIL(A2:A11;3).
- Desloque o apontador para a clula B7 e digite: Percentil 85% (cm). - Desloque o apontador para a clula C7 e introduza a funo: =PERCENTIL(A2:A11;0.85).
http://alea-estp.ine.pt
Dossiers Didcticos
23
5. Medidas de disperso
5.1. Varincia
Determina-se a varincia atravs da funo VAR [VAR] VAR(sequncia de nmeros ou endereos de clula) O resultado desta funo a varincia amostral (s2 ) dos valores introduzidos como argumento:
Medida que se obtm somando os quadrados dos desvios dos dados relativamente mdia e dividindo o valor da soma pelo nmero de observaes menos uma.
s2 =
(x
n i =1
n 1
- Desloque o apontador para a clula B8 e digite: Varincia (cm2). - Desloque o apontador para a clula C8 e introduza a funo: =VAR(A2:A11).
5.2. Desvio-padro
Determina-se o desvio-padro atravs da funo DESVPAD [STDEV].
Medida da variabilidade de uma amostra, relativamente ao seu valor mdio, correspondente raiz quadrada do valor da varincia e que expressa nas mesmas unidades que os dados originais.
- Desloque o apontador para a clula B9 e digite: Desviopadro (cm). - Desloque o apontador para a clula C9 e introduza a funo: =DESVPAD(A2:A11).
http://alea-estp.ine.pt
Dossiers Didcticos
24
5.3. Amplitude
Determina-se a amplitude recorrendo s funes MXIMO [MAX]e MNIMO [MIN].
Medida da variabilidade de uma amostra, correspondente diferena entre o valor mximo e o valor mnimo do conjunto de dados.
- Desloque o apontador para a clula B10 e digite: Amplitude(cm). - Desloque o apontador para a clula C9 e introduza a funo: =MXIMO(A2:A11)-MNIMO(A2:A11).
Medida da variabilidade da amostra, correspondente diferena entre os valores do terceiro e do primeiro quartis, dando-nos informao sobre a amplitude do intervalo em que se encontram 50% das observaes centrais.
- Desloque o apontador para a clula B11 e digite: Amplitude inter-quartil(cm). - Desloque o apontador para a clula C9 e introduza a funo: =QUARTIL(A2:A11;3)- QUARTIL(A2:A11;1).
http://alea-estp.ine.pt
Dossiers Didcticos
25
O Excel permite calcular as diferentes medidas de localizao e de disperso, de uma forma mais expedita, atravs do comando Anlise de dados [Data analysis ], presente no menu Ferramentas [Tools ]. Ao aceder ao comando Anlise de dados [Data analysis ], seleccione a opo Estatstica descritiva [Descriptive statistics ] e clique OK.
Seleccionar quando includos no intervalo de entrada Seleccionar para obter as estatsticas Aps preenchimento da Caixa de dilogo , clique OK.
Para
evidenciar
os
resultados a tabela
deste dos
comando, resultados
formatou-se
Conforme se pode verificar, a lista de estatsticas Estatstica fornecida descritiva pela opo [Descriptive
statistics ] inclui medidas no descritas anteriormente (ex: curtose, assimetria), mas no inclui os quantis (excepo para a mediana).
http://alea-estp.ine.pt
Dossiers Didcticos
26
Pode-se obter a ordem e o quantil (percentil) de cada um dos dados apresentados, atravs da opo Ordem e percentil [Rank and Percentile], do comando Anlise de dados [Data analysis ]
http://alea-estp.ine.pt
Dossiers Didcticos
27
6. Dados bivariados
Para ilustrar o estudo de dados bivariados, recorreu-se ao exemplo apresentado no incio do captulo 4, tendo-se acrescentado o peso, em kg, para cada um dos 10 alunos descritos anteriormente: 72, 65, 80, 57, 60, 77, 83, 79, 67 e 68, respectivamente. Repita o procedimento de introduo de dados Comece por digitar na clula A1 o ttulo Peso (kg) e na clula B1 o ttulo Altura (cm). Da clula A2 clula A11, digite cada um dos novos valores apresentados e da clula B2 clula B11, digite os correspondentes valores da altura. Grave o ficheiro para o disco e prepare-se para as novas funes!
Par de valores correspondente a um dado indivduo ou resultado experimental.
uma representao grfica para os dados bivariados, em que cada par de dados (xi, yi) representado por um ponto de coordenadas ( xi, yi), num sistema de eixos coordenados.
Comece por seleccionar as clulas contendo os dados e os respectivos ttulos e clique no cone da Barra de ferramentas . Na primeira Caixa de dilogo seleccione a opo Disperso (xy) [XY (Scatter]. Para continuar a construo do grfico, e para passar ao Passo [Step] seguinte, clique no boto Seguinte > [Next >].
http://alea-estp.ine.pt
Dossiers Didcticos
28
Para continuar a construo do grfico, e para passar ao Passo [Next >] [Step] seguinte, clique no boto Seguinte >
No terceiro passo, a Caixa de dilogo apresenta vrias opes que permitem formatar o grfico: - Em Ttulos [Titles ] siga o exemplo apresentado. - Em Linhas de grelha [Gridlines ], desactive a opo de grelha. - Em Legenda [Legend], desactive a opo da legenda. Para continuar a construo do grfico, e para passar ao Passo [Step] seguinte, clique no boto Seguinte > [Next >]. No ltimo passo pode escolher se o grfico colocado numa nova folha de clculo ou numa folha j existente.
http://alea-estp.ine.pt
Dossiers Didcticos
29
So mltiplas as opes de formatao para os grficos de Excel, desde o aspecto geral, aos tipos de letras, formatao dos eixos, etc. Eis um exemplo do que poder obter.
Medida do grau e do tipo (negativa ou positiva) de associao linear entre duas variveis.
existncia de uma associao linear entre as variveis, pode-se medir a maior ou menor fora com que as variveis se associam atravs do coeficiente de correlao, que no Excel corresponde funo CORREL[CORREL]. CORREL(sequncia de nmeros ou endereos de clula referentes 1 varivel; sequncia de nmeros ou endereos de clula referentes 2 varivel) O resultado desta funo o coeficiente de correlao (r) entre os dois conjuntos de valores introduzidos como argumento:
r=
s xy s xx s yy
, s xy = x i x y i y
i =1
)(
- Desloque o apontador para a clula C3 e digite: Correlao - Desloque o apontador para a clula C4 e introduza a funo: =CORREL(A2:A11;B2:B11) Alternativamente aceda ao comando Anlise de dados [Data analysis ] e seleccione a opo Correlao [Correlation]. Preencha a Caixa de dilogo e clique OK.
http://alea-estp.ine.pt
Dossiers Didcticos
30
Voltando ao exemplo das alturas e dos pesos dos alunos de Educao Fsica e ao
Altura (cm)
seu diagrama de disperso, pode-se observar uma associao linear entre o peso e a altura. Ser que possvel inferir a altura de um aluno que pese 70 kg? Perante uma situao anloga, em que
tenhamos um conjunto de dados bivariados (xi , yi ), i=1, ..., n, que seguem um padro linear, vamos tentar ajustar uma recta de equao:
y = a + bx
que permite descrever como se reflectem em y varivel resposta, as modificaes processadas em x varivel explicativa. Um dos mtodos mais conhecidos de ajustar uma recta a um conjunto de dados o mtodo dos mnimos quadrados, que consiste em determinar a recta que minimiza, precisamente, a soma dos quadrados dos desvios [y i (a+bxi )] entre os verdadeiros valores de y e os obtidos a partir da recta que se pretende ajustar. A esta recta d-se o nome de recta de regresso ou dos mnimos quadrados. Vamos exemplificar de seguida a obteno da recta de regresso com o Excel. Construa novamente o diagrama de disperso.
190
Altura (cm)
Peso (kg)
http://alea-estp.ine.pt
Dossiers Didcticos
31
Seleccionando o diagrama, clique no menu de Grfico tendncia [Chart], [Add seleccione o comando Adicionar linha
Peso (kg)
Substituindo na equao o Peso por 70, obtm-se o valor de 172,472, pelo que a altura esperada para um aluno que pese 70 kg , de cerca de 172,5 cm. Para obter uma recta ajustada, no necessariamente a recta de regresso, pode-se comear por ajustar uma recta a olho, obtendo os coeficientes a partir de dois pontos seleccionados de forma conveniente. Para verificar se esse ajustamento razovel calcula-se a soma dos quadrados dos desvios.
http://alea-estp.ine.pt
Dossiers Didcticos
32
Retomando o exemplo, descreve-se o processo a seguir, pelo que sugerimos que prepare uma tabela idntica que se apresenta. Para a recta ajustada considermos os coeficientes a=100 e b=1. Os valores do Ajuste (valores da recta ajustada para os xi dados, isto , os valores 100+xi ), do Desvio (yi Ajuste) e do Desvio 2 , podero ser calculados com as seguintes expresses: - Ajuste (y) 1 valor (clula E2 ) =$A$3+C2*$A$6 Copie esta expresso para as clulas E3 a E11 . - Desvio 1 valor (clula F2 ) =D2-E2 Copie esta expresso para as clulas F3 a F11. - Desvio 2 1 valor (clula G2 ) =F2^2 Copie esta expresso para as clulas G3 a G11 . Seleccione as clulas das trs primeiras colunas contendo os dados e os respectivos ttulos e clique no cone da Barra de ferramentas .
http://alea-estp.ine.pt
Dossiers Didcticos
33
Seleccione a srie de dados correspondente ao "Ajuste (y)" e clique duas vezes, para abrir o menu Formatar srie de dados [Format Data Series ].
Na opo Linha [Line], personalize de acordo com o exemplo. Na opo Marcador [Marker], seleccione: Nenhum [None]
Experimente
agora
alterar
os
valores da "Constante(a)" e do "Declive (b)" e observe como se comporta a recta e a soma dos quadrados dos Desvios.
Verifique que para os valores de a=109,36 e b=0,9016, obtm uma soma dos quadrados dos desvios menor do que qualquer uma das obtidas anteriormente.
http://alea-estp.ine.pt
Dossiers Didcticos
34
7. Ver Tambm
Sobre Estatstica com Excel existe um vasto conjunto de materiais disponveis (artigos, revistas, outras publicaes, web sites, etc). Destacamos os seguintes:
Publicaes:
(Livros, algumas revistas com artigos de interesses)
! LEVINE, DAVID M.; BERENSON, MARK L. and STEPHAN, DAVID (1999): "Statistics for Managers Using Microsoft Excel", 2nd Ed., Prentice Hall, New Jersey, EUA ! DIAS CURTO, J.J. (1995): Excel para Economia e Gesto, Edies Slabo, Lisboa ! GAENG, PETER (1993): "Excel for Science and Technology", Abacus, Grand Rapids, MI, EUA ! PELOSI, MARILYN K.; SANDIFER, THERESA M. and LETKOWSKI, JERZY J. (1998): " Doing Statistics with Excel 97", John Wiley & Sons, Inc. New York, USA.
! Teaching Statistics (encontra informao e cpia de alguns artigos desta revista no web site : http://science.ntu.ac.uk/rsscse/ts/) ! Spreadsheet User (encontra informao e cpia de alguns artigos desta revista no web site : http://www.shu.ac.uk/maths/ssuser/)
http://alea-estp.ine.pt
Dossiers Didcticos
35
Web sites:
DiscoveringImportant StatisticalConcepts Using SpreadSheets
http://home.edu.coventry.ac.uk/Volume/ http://www.mis.coventry.ac.uk/research/discus/discus_home.html
The Association ofStatisticsSpecialistsUsing MicrosoftExcel http://www.mailbase.ac.uk/lists/assume/files/welcome.html A pgina da ASSUME, apresenta ligaes para vrios recursos relativos ao uso do Excel para a prtica e o ensino da Estatstica. So vrios os programas que suplementam as capacidades do Excel na Estatstica, apresentam-se os nomes de alguns e os sites onde poder obter informao detalhada e verses de demonstrao dos mesmos. ! PHStat Excel Add-In. Software includo no livro Statistics for Managers Using Microsoft Excel http://cw.prenhall.com/bookbind/pubbooks/levine/ ! Analyse-it General statistics software for Microsoft Excel http://www.analyse-it.com/info/genstat.htm ! WinSTAT Statistics Add-In for Microsoft Excel http://www.winstat.com/ ! XLSTAT an Excel Add-in for statistics and data analysis + several Excel utilities + XLControl http://www.xlstat.com/ ! XLStatistics Home Page - Excel, Statistics, Data Analysis http://www.man.deakin.edu.au/rodneyc/XLStats.htm
http://alea-estp.ine.pt