Anda di halaman 1dari 27

3

1. INTRODUO

A importncia da estatstica pode ser vista atravs da sua utilizao ao nvel
do Estado, de organizaes sociais e profissionais, do cidado comum e ao nvel
cientfico. O grau de importncia atribuda estatstica to grande que
praticamente todos os governos possuem organismos oficiais destinados
realizao de estudos estatsticos.
A estatstica responsvel pelo desenvolvimento cientfico em geral. De uma
forma sinttica, pode dizer-se que a estatstica um conjunto de tcnicas
apropriadas para recolher, classificar, apresentar e interpretar conjuntos de dados
numricos. Assim, a estatstica constitui-se fundamentalmente como mtodo e no
como uma teoria, pois o seu objetivo descrever os fenmenos e no tanto explic-
los. Como a estatstica um ramo de matemtica aplicada, os seus mtodos so
rigorosos e precisos. Apesar da objetividade que a matemtica confere aos mtodos
estatsticos, deve ter-se em conta que os seus resultados incorporam alguma
subjetividade. Tal subjetividade resulta principalmente da qualidade das medidas e
das observaes.
Este trabalho tem por objetivo coletar e analisar dados: altura e idade, de uma
turma do 1 ano de engenharia da Faculdade Federal do Tringulo Mineiro e aplicar
todo o conhecimento adquirido na disciplina de Probabilidade e Estatstica sobre
essa amostra.












4



2. METODOLOGIA

Esse trabalho baseia-se em analisar a relao entre altura e idade entre os
alunos da turma 303 de 2011 de engenharia da Universidade Federal do Triangulo
Mineiro UFTM. Os dados foram coletados no dia 09 de Novembro de 2011,
contando com colaborao macia da turma em questo.
Todos os alunos que participaram foram considerados como sendo a populao
da amostra, e partindo-se disso foi extrada duas amostras da populao, uma de
homens com 15 membros e outra com 10 mulheres. A formao das amostras foi
feita atravs do software Microsoft Excel, que sorteou de forma aleatria os
elementos das amostras, esse software tambm foi de extrema importncia em
praticamente todas as etapas do trabalho.
Foram calculados as medidas de tendncias e de disperso tanto de idade
como de altura da populao e da amostra.
Tambm foram feitos grficos de disperso para analisar se existe alguma
correlao linear entre os dados obtidos.
Posteriormente estudou-se sobre intervalos de confiana e testes de
hipteses em relao a amostra.
Por fim, foi realizado testes de aderncia para verificar se a altura e idade da
amostra seguem uma distribuio normal.


3. FUNDAMENTAO TERICA

Nesta seo mostrado os conceitos tericos utilizados e necessrios para
elaborao deste trabalho.

3.1. MEDIDAS DE TENDNCIA CENTRAL E MEDIDAS DE DISPERSO

Quando se deseja obter o valor esperado de uma amostra quase sempre a
Mdia o melhor parmetro. O clculo da mdia feito atravs do somatrio de
todos os termos da amostra dividido pelo numero de elementos da mesma. Como
mostra a equao 1.
5



(1)

A Mediana o valor intermedirio da amostra, quando a mesma se encontra
ordenada, crescente ou decrescente.

A Moda o termo mais frequente na amostra.

A Varincia e o Desvio Padro so medidas de disperso, seu valor
numrico sozinho no apresenta grande sentido, essas medidas devem ser
analisadas em funo de um parmetro. O desvio padro a raiz quadrada da
Varincia e ambas tem como funo analisar o quanto determinada medida pode
variar em torno de um valor esperado, sua funo tambm medir a preciso de
uma estimao. A varincia de uma populao pode ser calcula pela equao (2) e
o desvio padro pela equao (3).

(2)

(3)

H uma diferena no clculo da varincia e do desvio padro da populao
para o amostral, no amostral onde n nas equaes (2) e (3) troca-se por n-1,
ficando a equao para a varincia e desvio padro amostral como mostrado a
seguir nas equaes (4) e (5) respectivamente.

(4)

( )
1
1
2

=

=
n
X x
s
n
i
i
(5)

6




3.2. INTERVALOS DE CONFIANA


So feitas estimativas intervalares quando se deseja obter um intervalo de
valores possveis, no qual se admite que esteja o parmetro populacional. Neste tipo
de estimativa tem-se um intervalo de valores em torno do parmetro amostral, no
qual julgamos, com um risco conhecido de erro, estar o parmetro da populao. A
esse intervalo chamamos intervalo de confiana.
Para efetuar a estimativa de mdias de uma populao, deve-se levar em
conta se o desvio padro da populao ou no conhecido.
Nos casos em que se conhece o desvio-padro da mdia, situao pouco
comum se falando em situaes prticas, utiliza-se a tabela de distribuio normal e,
atravs da relao representada em (6), estimamos o intervalo desejado, dadas as
condies de confiabilidade e o nmero de elementos da amostra.

(6)
Sendo,
- n = nmero de elementos da amostra;
- = desvio padro populacional;
- 1 = coeficiente de confiana desejado;
- = Mdia amostral.

Lembrando que para altos valores de n, nossa amostra se aproxima de uma
distribuio normal, ento a troca de por S (desvio padro amostral), tem pouco
efeito na distribuio de Z. Temos assim que nesses casos no h necessidade de
se conhecer o desvio padro populacional, o que muito mais til em situaes
prticas.
Apesar disso, temos que para valores de desvio padro populacionais
desconhecidos e pequenos valores de n, a distribuio normal apresenta valores
com menor preciso, o que pode comprometer os resultados estimativos. Nesse
caso utiliza-se a distribuio t de Student, onde se faz o uso da relao representada
7



em (7), dadas as condies de confiabilidade e o nmero de elementos de sua
amostra.

(7)
Onde,
- n = nmero de elementos da amostra;
- S = desvio padro amostral;
- 1 = coeficiente de confiana desejado;
- = Mdia amostral.

Para estimar um intervalo de confiana para a varincia populacional, dada
uma coleta de dados amostrais, utiliza-se a distribuio qui-quadrado. Tendo um
nmero n de elementos conhecido, faz-se o uso da relao representada em (8).



(8)
Onde:
- n = nmero de elementos da amostra;
- S = desvio-padro da amostra;
-
2
(/2)(n 1)
= valor da varivel aleatria de distribuio
2
com n 1 graus de
liberdade;
-
2
(1 /2)(n 1)
= idem para (1 /2). Lembrar que a distribuio chi-quadrado
no simtrica;
-
2
= varincia da populao, presumivelmente desconhecida;
- 1 = coeficiente de confiana desejado.


3.3. TESTES DE HIPTESES

Os testes de hipteses so utilizados para comparar algum parmetro entre
duas amostras, sendo os mais comuns, os testes de comparao entre mdias
populacionais ou entre varincias populacionais. Inicialmente apresenta-se uma
8



hiptese nula (

) na qual se tem uma igualdade entre os parmetros comparados.


Em seguida, apresenta-se uma hiptese negativa (

), opondo-se a hiptese nula.


O teste realizado pode ser tanto unilateral quanto bilateral. No teste unilateral
discute-se as possibilidades de ocorrncia da hiptese menor ou maior que o valor
do parmetro apresentado. No teste bilateral feito o estudo para a diferena do
que foi apresentado na hiptese nula.
Alguns testes de hipteses que podem ser usados so: teste de hiptese para
mdia com varincia populacional conhecida, com varincia populacional
desconhecida e teste de hiptese para duas propores.
- Teste de hiptese com varincia populacional conhecida:

2
2
2
1
2
1
0
2 1
n n
X X
Z
o o
+
A
=
(9)

Onde n
1
e n
2
so os tamanhos das amostras.


3.4. TESTE DE ADERNCIA

Os testes de aderncia ou adequao de um ajuste so usados quando no
se conhece a distribuio sobre considerao da populao e desejamos testar a
hiptese de que uma distribuio particular ser satisfatria como modelo para a
populao.
No nosso trabalho foram feitos histogramas para traar conjecturas a respeito
da populao a partir da avaliou-se o ajuste de distribuio normal tanto para a
populao quanto para as amostras. Testou-se de forma individual se a distribuio
normal era representativa para a idade e para a altura dos alunos.
Existem vrios mtodos para se testar tais hipteses, como o mtodo da qui-
quadrado e o mtodo de Kolmogorov-Smirnov. Escolhemos o mtodo de Smirnov
por ser mais confivel e por ele ser melhor aplicvel no caso de distribuies
contnuas como a altura.
O mtodo de Smirnov tem-se as seguintes etapas:
9




o Faz-se o levantamento da amostra,
o Monta-se uma tabela como a que segue:

xi f(xi) F(xi) G(xi) esquerda direita

Onde xi representa o valor principal, no caso dos dados estarem divididos
em classes, xi ser o valor mdio desse intervalo de classe. f(xi) ser a frequncia
dos dados pertencentes ao intervalo de classe. F(xi) a distribuio de
probabilidade acumulada crescente. G(xi) a frequncia relativa acumulada
crescente. Esquerda a subtrao, em mdulo, que se faz dos elementos f(xi) -
G(x(i-1)). Direita a subtrao, em mdulo, que se faz dos elementos f(xi) - G(x(i)).

- A varivel de teste dada maior diferena, Dmax, observada entre a
funo de distribuio de probabilidade acumulada do modelo e a
frequncia relativa acumulada da amostra.
Dmax = max|F(x)-G(x)|
Compara-se ento com o n crtico, que est tabelado, e depende de dois fatores, a
quantidade N da amostra e o valor de significncia .Feito isso estabelece o teste de
hiptese.
- Ho: Se Dmax< n crtico ,os dados seguem uma distribuio normal ;
- H1: Se Dmax > n crtico, os dados no seguem uma distribuio normal.



3.5. CORRELAES LINEARES

Conceito que permite verificar se h alguma relao linear entre duas ou mais
variveis. Essa relao linear do tipo Y=
0
+
1
x+, em que
0
e
1
so constantes
e uma varivel aleatria.
H tambm alguns indicadores sobre a qualidade das correlaes entre
variveis, neste trabalho usaremos o Coeficiente de Pearson, r, esse coeficiente
10



varia de -1 a 1, sendo que valores prximos aos extremos desse intervalo
representam uma boa correlao linear e valores de r prximos de zero indica uma
correlao ruim. Neste trabalho todas as correlaes e seus respectivos
Coeficientes de Pearson sero calculados com a ajuda do Microsoft Office Excel.
Como r calculado a partir de uma amostra de tamanho n, pode-se dizer que
n uma estimativa do verdadeiro coeficiente da populao, , sendo assim existem
um teste do Coeficiente de correlao calculado atravs da varivel t de Student
com (n - 2) graus de liberdade:
2
2
1
2
r
n
r t
n

(10)


4. RESULTADOS E DISCUSSO

4.1 ARRANJO DOS DADOS
Os dados coletados so exibidos na Tabela 1:

N NOME Idade (anos): Altura (m):
1 ELISA PINHEIRO TAMIAO 19 1,63
2 GABRIEL SHIOTSUKI ROSADA 20 1,75
3 GABRIELA DOS REIS PEREIRA 18 1,6
4 GABRIELA LINO FREITAS 20 1,7
5 GABRIELA ZAMPIERI CAMPOS 18 1,72
6 GASPAR FERREIRA IDALIO SILV 18 1,71
7 GIORDANNI DA SILVA TRONCHA 18 1,83
8 GIOVANA MARA ARAUJO OLIVEIRA 20 1,62
9 GUILHERME DUTRA GERARDI 18 1,81
10 GUILHERME MAURI FARIA DA CUNHA 18 1,7
11 GUILHERME RANUSSI URBANO 18 1,85
12 GUILHERME SILVA BARCELLOS DO NACIMENTO 19 1,69
13 GUSTAVO BISSI PIMENTEL 19 1,9
14 GUSTAVO DE SOUZA WINK 18 1,65
15 GUSTAVO FUNES BOLELLA 19 1,74
16 GUSTAVO FUREGATO PEDREIRA DE FREITAS 18 1,73
17 GUSTAVO HENRIQUE SANCHES ARF 20 1,95
18 GUSTAVO JOSSE RIBEIRO RIOS 20 1,95
11



19 GUSTAVO LAZARINI 20 1,85
20 HERMANN ALVES CARNEIRO DENECKE 20 1,85
21 IGOR ALVES RECHE 20 1,67
22 ISABELA OLIVEIRA LOPES 18 1,62
23 ISABELLA MURINELLI PESOTI 18 1,67
24 ISABELLA RIBEIRO JORGE 18 1,67
25 ISADORA MANZI NEVES ADRIANO 18 1,71
26 IVAN ILICH KERBAUY VELOSO 22 1,73
27 JAIRO BORGES FERREIRA JUNIOR 18 1,91
28 JAQUELINE VIVEIROS 18 1,57
29 JEANCARLLE CAMARGO DE CARVALHO 19 1,77
30 JESSICA MIRANDO ROSA 20 1,59
31 JESSICA PAOLA MARTIS 19 1,72
32 JESSICA SEBASTIANE 19 1,65
33 JOAO LUCAS HANA FRADE 20 1,81
34 JOAO PAULO BORGES RODRIGUES 21 1,85
35 JOAO PAULO DE OLIVEIRA 18 1,67
36 JOAO VITOR SARTORI RICCIARDI 20 1,81
37 JORGE PAIN COURI 19 1,76
38 JOSE MARIO BERETA RUBIO 21 1,88
39 JOSIANNE RIBELA MARICONI 18 1,63
40 JULIA NUNIZ BARBOZA VACILOTTO 19 1,67
41 MATHEUS DAMASCENO AMORIM 18 1,75
42 PAULA ARAUJO NASCIUTTI 19 1,57
Tabela 1 Dados coletados

Os dados sobre as idades da Tabela 1 foram representados de duas formas:
um histograma, mostrado na Figura 1, e tambm uma anlise da porcentagem,
mostrado na Figura 2.


0
2
4
6
8
10
12
14
16
18
20
18 19 20 21 22
Frequncia
12



Figura 1 Histograma das idades da populao.


Figura 2 Grfico das porcentagens das idades.

Analisando os grficos, observa-se que, na turma 303, a idade predominante
dos alunos de 18 anos, correspondendo a 43% da populao total.

De maneira anloga, foi feito um grfico, mostrando em classes, as
frequncias das alturas. Logo abaixo o grfico 1 est representado na Figura 3. Foi
feito tambm um grfico das porcentagens, ilustrado na Figura 4.


43%
24%
26%
5%
2%
Porcentagem
18 19 20 21 22
0
1
2
3
4
5
6
7
8
9
10
Frequncia
de Alturas
13



Figura 3 Frequncia das alturas


Figura 4 Porcentagem das alturas

Com os dados da Tabela, referentes populao, foram obtidos os valores
das mdias, varincias, desvios-padro, moda e mediana, das idades e alturas,
apresentados na Tabela 2.

Idade Altura
Mdia 19 1,7360
Varincia 1,0952 0,0104
Desvio padro: 1,0592 0,1032
Moda 18 1,67
Mediana 19 1,72
Tabela 2 Estatstica da populao

Foi realizada tambm uma separao da populao em dois conjuntos:
homens e mulheres que segue na Tabela 3 e na Tabela 4, respectivamente.

ALUNOS Idade: Altura:
GABRIEL SHIOTSUKI ROSADA 20 1,75
GASPAR FERREIRA IDALIO SILV 18 1,71
GIORDANNI DA SILVA TRONCHA 18 1,83
GUILHERME DUTRA GERARDI 18 1,81
GUILHERME MAURI FARIA DA CUNHA 18 1,70
GUILHERME RANUSSI URBANO 18 1,85
1,55-1,6
1,6-1,65
1,65-1,7
1,7-1,75
1,75-1,8
1,8-1,85
1,85-1,9
1,9-1,95
1,95-2
14



GUILHERME SILVA BARCELLOS DO NACIMENTO 19 1,69
GUSTAVO BISSI PIMENTEL 19 1,90
GUSTAVO DE SOUZA WINK 18 1,65
GUSTAVO FUNES BOLELLA 19 1,74
GUSTAVO FUREGATO PEDREIRA DE FREITAS 18 1,73
GUSTAVO HENRIQUE SANCHES ARF 20 1,95
GUSTAVO JOSSE RIBEIRO RIOS 20 1,95
GUSTAVO LAZARINI 20 1,85
HERMANN ALVES CARNEIRO DENECKE 20 1,85
IGOR ALVES RECHE 20 1,67
IVAN ILICH KERBAUY VELOSO 22 1,73
JAIRO BORGES FERREIRA JUNIOR 18 1,91
JEANCARLLE CAMARGO DE CARVALHO 19 1,77
JOAO LUCAS HANA FRADE 20 1,81
JOAO PAULO BORGES RODRIGUES 21 1,85
JOAO PAULO DE OLIVEIRA 18 1,67
JOAO VITOR SARTORI RICCIARDI 20 1,81
JORGE PAIN COURI 19 1,76
JOSE MARIO BERETA RUBIO 21 1,88
MATHEUS DAMASCENO AMORIM 18 1,75
Tabela 3 Populao de Homens.

ALUNAS Idade: Altura:
ELISA PINHEIRO TAMIAO 19 1,63
GABRIELA DOS REIS PEREIRA 18 1,6
GABRIELA LINO FREITAS 20 1,7
GABRIELA ZAMPIERI CAMPOS 18 1,72
GIOVANA MARA ARAUJO OLIVEIRA 20 1,62
ISABELA OLIVEIRA LOPES 18 1,62
ISABELLA MURINELLI PESOTI 18 1,67
ISABELLA RIBEIRO JORGE 18 1,67
ISADORA MANZI NEVES ADRIANO 18 1,71
JAQUELINE VIVEIROS 18 1,57
JESSICA MIRANDO ROSA 20 1,59
JESSICA PAOLA MARTIS 19 1,72
JESSICA SEBASTIANE 19 1,65
JOSIANNE RIBELA MARICONI 18 1,63
JULIA NUNIZ BARBOZA VACILOTTO 19 1,67
PAULA ARAUJO NASCIUTTI 19 1,57
Tabela 4 Populao de Mulheres.

Da mesma forma, foi calculado para cada conjunto a mdia, a varincia e o
desvio-padro, apresentados abaixo na Tabela 5.

15




Homens

Mulheres
Idade Altura

Idade Altura
Mdia 19,19231 1,7912

18,6875 1,64625
Varincia 1,309172 0,0073

0,589844 0,002398
Desvio Padro 0,0855 0,0855

0,768013 0,048974
Tabela 5 Estatsticas das Amostras.

Aps a escolha das amostras, realizado atravs de sorteio pelo Excel, foram
feitos os clculos da mdia, varincia e desvio-padro. Na Tabela 6 e na Tabela 7,
esto os dados desses dois subconjuntos, representando os 15 homens e as 10
mulheres, respectivamente.


ALUNOS Idade: Altura:
GABRIEL SHIOTSUKI ROSADA 20 1,75
GASPAR FERREIRA IDALIO SILV 18 1,71
GIORDANNI DA SILVA TRONCHA 18 1,83
GUILHERME DUTRA GERARDI 18 1,81
GUILHERME MAURI FARIA DA CUNHA 18 1,70
GUILHERME RANUSSI URBANO 18 1,85
GUILHERME SILVA BARCELLOS DO NACIMENTO 19 1,69
GUSTAVO BISSI PIMENTEL 19 1,90
GUSTAVO DE SOUZA WINK 18 1,65
GUSTAVO FUNES BOLELLA 19 1,74
GUSTAVO FUREGATO PEDREIRA DE FREITAS 18 1,73
GUSTAVO HENRIQUE SANCHES ARF 20 1,95
GUSTAVO JOSSE RIBEIRO RIOS 20 1,95
GUSTAVO LAZARINI 20 1,85
HERMANN ALVES CARNEIRO DENECKE 20 1,85
Tabela 6 Amostra de homens

ALUNAS Idade: Altura:
ELISA PINHEIRO TAMIAO 19 1,63
GABRIELA DOS REIS PEREIRA 18 1,6
GABRIELA LINO FREITAS 20 1,7
GABRIELA ZAMPIERI CAMPOS 18 1,72
GIOVANA MARA ARAUJO OLIVEIRA 20 1,62
ISABELA OLIVEIRA LOPES 18 1,62
ISABELLA MURINELLI PESOTI 18 1,67
ISABELLA RIBEIRO JORGE 18 1,67
ISADORA MANZI NEVES ADRIANO 18 1,71
JAQUELINE VIVEIROS 18 1,57
16



Tabela 7 Amostra de mulheres

A Tabela 8, mostrada a seguir, mostra os clculos realizados, em relao s
tabelas 6 e 7.

Homens

Mulheres

Idade Altura

Idade Altura
Mdia 18,86667 1,7973

18,5000 1,6510
Varincia 0,8381 0,0091

0,7222 0,0025
Desvio padro 0,9155 0,0953

0,8498 0,0504
Tabela 8 Estatstica das Amostras


4.2. CORRELAES LINEARES

Com o intuito de verificar se h uma correlao linear entre os dados obtidos,
foi analisado primeiramente a relao entre idades e alturas para a amostra formada
apenas por mulheres e tambm formada apenas por homens, com a ajuda do
software Microsoft Excel foram plotados os grficos 1 e 2:


Grfico 1 Correlao Linear entre idade e altura para amostra de mulheres

y = 0,0042x + 1,5733
R = 0,0014
1.56
1.58
1.6
1.62
1.64
1.66
1.68
1.7
1.72
1.74
17 18 19
(m)

Correlao Idade e Altura - Mulheres
17




Grfico 2 Correlao Linear entre idade e altura para amostra de homens

Os Grficos 1 e 2 revelam que no h uma relao linear entre as idades e as
alturas tanto para a amostra de homens quanto para de mulheres. Esse resultado
pode ser observado pela falta de ordem entre os pontos, no possvel observar
alguma relao linear entre as variveis, os valores de R corroboram com a
constatao anterior, pois como j explicado anteriormente, valores de r ou r
prximos a zero revelam uma correlao ruim.
Tambm foi testado se existe alguma correlao linear entre idades e numero
de alunos por idade na amostra mista (homens e mulheres), para verificar a
existncia ou no dessa correlao foi plotado o Grfico 3.


Grfico 3 Correlao linear entre idade e n de alunos por idade
y = 0,0092x + 1,6018
R = 0,0127
1.60
1.65
1.70
1.75
1.80
1.85
1.90
1.95
2.00
17 18 19 20 21 22
Correlao Idade e Altura - Homens










(anos)
(m)
y = -2,7143x + 59,857
R = 0,8624
R = 0,9286
0
2
4
6
8
10
12
14
17 18 19 20 21 22 23
N de
alunos




Correlao Idade e N de alunos por idade - Amostra
18




Ao contrrio dos grficos 1 e 2, o grfico 3 Apresenta pontos com uma
distribuio que aproxima-se grosseiramente com uma correlao linear, o valor de
R nos indica isso, pois se aproxima modestamente de 1.
Para uma melhor anlise do grfico 3 foi feito o teste do Coeficiente de
correlao para valendo 0,05 e 0,1. O teste teve como objetivo verificar se a
correlao significativa. Foram adotadas as seguintes hipteses:

- H
0
: =0
- H
1
: 0
A partir dos dados do grfico 3, com o uso da equao (10) e o auxilio de uma
tabela de t de Student, foram obtidos:

t
2
= 3,54 ; t
2,0,05
= 2,92 ; t
2,0,025
= 4,303

Para a hiptese H
0
ser rejeitada t
n-2
> t
(n-2;/2)
deve ser verdadeiro, portanto
pode se afirmar que com 10% de significncia que a correlao linear do grfico 3
no nula, entretanto isso no verdadeiro quando a significncia de 5%. Essa
correlao linear com =0,1 no muito significativa, pois este valor de
relativamente alto em relao ao seu valor mais comumente usado que de
0,01 e 0,05.

4.3. ESTIMATIVAS INTERVALARES


Para estimativas referentes a intervalos de confiana, primeiramente fez-se os
clculos considerando a varincia conhecida, definida pelos dados obtidos na
pesquisa. A Tabela 9 representa os erros calculados para as amostras de homens e
mulheres, bem como para a amostra como um todo, sendo o valor desse erro igual
metade do comprimento do intervalo estimado. Diferentes valores de confiana
foram utilizados para fins de anlise de preciso dos resultados obtidos. Lembrando
que os valores de idade so dados em anos e altura em metros.

19





Erro

Altura
mulheres
Altura
homens

Altura
sala
Idade
mulheres
Idade
homens
Idade sala
0,05 0,030 0,043 0,039 0,48 0,58 0,41
0,01 0,040 0,056 0,052 0,62 0,76 0,54
Tabela 9 Erros das distribuies de mdia de idade e de altura, com varincia conhecida.

Com a anlise dos dados, percebemos que quando se aumenta o valor de
confiana na determinao de um intervalo, h um sensvel aumento no
comprimento desse mesmo intervalo, o que comprova o fato de que quanto maior a
confiabilidade estabelecida no tratamento estatstico, menor ser a preciso dos
dados apresentados.
Tambm foi observado a influncia dos dados envolvidos, como o nmero de
elementos e a varincia da populao correspondente ao conjunto amostral, pois,
apesar de o nmero de elementos homens ser maior, a varincia populacional de
suas alturas, que no caso apresentou um valor maior que o das mulheres, fez com
que o intervalo de confiana para a mdia de suas alturas apresentasse um maior
comprimento.
Sabendo que no uma situao comum em estatstica o conhecimento
prvio do valor de varincia populacional, estabelecemos tambm uma situao
onde consideramos esse valor desconhecido, para que pudssemos fazer uso de
mtodos estimativos com aplicaes mais comuns. Como o nmero de elementos
em todas as amostras relativamente pequeno, fizemos o uso da distribuio t de
Student, sendo que os resultados obtidos com esse mtodo esto apresentados na
Tabela 10.

Erro

Altura
mulheres
Altura
homens

Altura
sala
Idade
mulheres
Idade
homens
Idade sala
0,05 0,041 0,055 0,044 0,37 0,67 0,43
0,01 0,060 0,077 0,060 0,53 0,95 0,58
Tabela 10 Erros das distribuies de mdia de idade e de altura com varincia desconhecida.

20



Percebe-se que, se desconhecemos o valor da varincia populacional, o
comprimento do intervalo de confiana tende, geralmente, a um aumento
significativo, reduzindo ento a sua preciso. Apenas a distribuio amostral da
altura das mulheres apresentou diminuio com relao ao mtodo anterior, o que
pode ter acontecido devido ao fato de a varincia amostral ser menor que a
varincia populacional.
Por ltimo, foram estimados intervalos de confiana para a varincia,
estabelecendo os mesmos critrios de confiana dos itens anteriores. Os dados
referentes a essa etapa se encontram na Tabela 11 que, como as anteriores mostra
os erros para cada situao.

Erro

Altura
mulheres
Altura
homens

Altura
sala
Idade
mulheres
Idade
homens
Idade sala
0,05 0,005 0,010 0,007 0,382 1,458 0,718
0,01 0,008 0,015 0,011 0,641 2,234 1,03
Tabela 11 Erros das varincias de idade e de altura.

Tambm para o caso de intervalos de confiana para a varincia vemos
nitidamente a influncia de fatores como nmero de elementos e varincia amostral.
Nota-se, por exemplo, que o intervalo de confiana para a varincia de idade dos
homens bem mais alto se comparado aos outros grupos, dado que sua varincia
amostral tambm apresentou um valor relativamente elevado. O comprimento dos
intervalos para a amostra feminina se mostraram bastante pequenos devido aos
baixos valores de varincia amostral tanto para o caso da idade quanto para a
altura.


4.4 TESTES DE HIPTESES

Teste de Hiptese para verificar se a mdia da altura entre as duas
populaes, a de homem e a de mulher, so iguais. Utilizando = 5%


21



2
2
2
1
2
1
0
2 1
n n
X X
Z
o o
+
A
=
=

= 4.82


Como

, rejeita-se

, ou seja, existe diferena entre a varincia de


mdias.

Agora, fazendo o mesmo teste pra verificar se a mdia da idade entre as duas
populaes so iguais. Adotando = 5%,


2
2
2
1
2
1
0
2 1
n n
X X
Z
o o
+
A
=
=

= 1.74



Como Z<

se aceita

e conclui-se que a mdia da idade entre a


populao de homem e mulher a mesma.
Supondo agora que a varincia populacional seja desconhecida, mais
considerando elas diferentes, faz-se um teste de hiptese para mdia, com o
objetivo de validar os testes anteriormente apresentados.


( )
2
2
2
1
2
1
0 2 1
v
n
s
n
s
x x
t
+

= =

= 4.097

=
(

= 23

22



Como

, rejeita-se

, mostrando que as mdias populacionais entre


altura so diferentes, confirmando os testes j feitos anteriormente.
Fazendo o mesmo para a idade, teste de hiptese supondo uma varincia
desconhecida, temos:


( )
2
2
2
1
2
1
0 2 1
v
n
s
n
s
x x
t
+

= =

= 1.876

=
(

=21

Como

, rejeita-se

, mostrando que as mdias populacionais entre


altura so diferentes, confirmando os testes j feitos anteriormente.


4.5. TESTES DE ADERNCIA

Teste de aderncia(distribuio normal) para a altura da populao ,usando
Smirnov:

xi f(xi) F(xi) G(xi) esquerda direita

157,5 3 0,0538 0,0714 0,0538 0,0177
162,5 5 0,1336 0,1905 0,0622 0,0569
167,5 8 0,2711 0,3810 0,0806 0,1099
172,5 9 0,4564 0,5952 0,0754 0,1388
177,5 4 0,6519 0,6905 0,0567 0,0386
182,5 4 0,8134 0,7857 0,1229 0,0277
187,5 5 0,9178 0,9048 0,1321 0,0130
192,5 2 0,9707 0,9524 0,0659 0,0183
23



197,5 2 0,9916 1,0000 0,0392 0,0084
Soma: 42 D max: 0,13884
Mdia das
alturas:

173,5952 cm
Desvio Padro:

10,0000 cm
Concluso, sendo Dmax=0,1388
Para = 0,20 e n=42 n crtico =0,1651 > Dmax
Ho aceito, ou seja a populao tem distribuio normal
Para = 0,05 e n=42 n crtico =0,2098 > Dmax
Ho aceito, a populao tem distribuio normal

Teste de aderncia usando Smirnov (distribuio normal) para a altura dos homens
a partir da amostra,
xi f(xi) F(xi) G(xi) esquerda direita 20 1,75
usando Mtodo de
Kolmogorov-Smirnov 18 1,71
18 1,81
0,0000 0,0000 18 1,85
167,5 3 0,1469 0,2000 0,1469 0,0531 19 1,69
172,5 3 0,2912 0,4000 0,0912 0,1088 18 1,65
177,5 3 0,4801 0,6000 0,0801 0,1199 20 1,95
182,5 2 0,6736 0,7333 0,0736 0,0597 20 1,95
187,5 1 0,8289 0,8000 0,0956 0,0289 20 1,67
192,5 1 0,9265 0,8667 0,1265 0,0598 22 1,73
197,5 2 0,9744 1,0000

0,0256 18 1,91
Soma: 15 D max: 0,1469 20 1,81

18 1,67
Mdia das alturas:

178 cm

19 1,76
Desvio Padro:

10 cm

18 1,75
Concluso: sendo Dmax=0,1469

Para = 0,20 e n=15 n crtico =0,266 > Dmax
Ho ACEITO, ou seja a amostra tem distribuio normal

Para = 0,15 e n=15 n crtico =0,283 > Dmax
Ho ACEITO, ou seja a amostra tem distribuio normal


24



Para = 0,1 e n=15 n crtico =0,304 > Dmax
Ho ACEITO, ou seja a amostra tem distribuio normal

Para = 0,05 e n=15 n crtico =0,338 > Dmax
Ho ACEITO, ou seja a amostra tem distribuio normal

Teste de aderncia(distribuio normal) para altura das mulheres a partir da
amostra,
xi f(xi) F(xi) G(xi) esquerda direita 18 1,6
usando Mtodo de
Kolmogorov-Smirnov 18 1,72
18 1,62
157,5 2 0,0991 0,2000 0,0991 0,1009 18 1,67
162,5 2 0,3340 0,4000 0,1340 0,0660 18 1,71
167,5 3 0,6660 0,7000 0,2660 0,0340 18 1,57
172,5 3 0,9009 1,0000 0,2009 0,0991 19 1,72

19 1,65

19 1,67

19 1,57

Soma: 10 D max: 0,2660

Mdia das alturas:

165 cm
Desvio Padro:

5,83 cm
Concluso: sendo Dmax=0,2660

Para = 0,20 e n=10 n crtico =0,322 > Dmax
Ho ACEITO, ou seja a amostra tem distribuio normal

Para = 0,15 e n=10 n crtico =0,342 > Dmax
Ho ACEITO, ou seja a amostra tem distribuio normal

Para = 0,1 e n=10 n crtico =0,368 > Dmax
Ho ACEITO, ou seja a amostra tem distribuio normal

Para = 0,05 n=10 n crtico =0,410 > Dmax
Ho ACEITO, ou seja a amostra tem distribuio normal


25




Teste de aderncia
Smirnov
testando a distribuio
normal


para a idade da
populao


Homens Mulheres
xi f(xi) F(xi) G(xi) esquerda direita 18 18
usando Mtodo de
Kolmogorov-
Smirnov 18 18
18 18
18 18 0,1725 0,4286 0,1725 0,2561 18 18
19 10 0,5000 0,6667 0,0714 0,1667 18 18
20 11 0,8275 0,9286 0,1608 0,1011 18 18
21 2 0,9705 0,9762 0,0420 0,0057 18 18
22 1 0,9977 1,0000 18 18
42 18 19
18 19
19 19
Soma: 84 D max: 0,2561 19 19

19 19
Mdia das alturas:

19
cm

19 20
Desvio Padro:

1,059
cm

19 20
Concluso: sendo Dmax=0,2561

20 20

20
Para = 0,20 e n=42 n crtico =0,16 < Dmax

20
Ho rejeitado, ou seja a populao

20
no possui uma distribuio normal

20
Para = 0,05 e n=42 n crtico =0,209 < Dmax

20
Ho rejeitado, ou seja a populao

20
no possui uma distribuio normal

20

21

21

22







26



Teste de aderncia Smirnov
testando a distribuio
normal

para a idade ;amostra de mulheres


xi f(xi) F(xi) G(xi) esquerda direita 18
usando Mtodo de
Kolmogorov-Smirnov 18
18
18 6 0,2192 0,6000 0,2192 0,3808 18
19 4 0,8774 1,0000 0,2774 0,1226 18
10 18

19

19

19

19

Soma: 20 D max: 0,3808

Mdia das alturas:

18,4 cm
Desvio Padro:

0,5163 cm
Concluso: sendo Dmax=0,3808

Para = 0,20 e n=10 n crtico =0,322 < Dmax
Ho rejeitado, ou seja a amostra no possui uma distribuio normal

Com = 0,1 e n=10 n crtico =0,368 < Dmax
Ho rejeitado, ou seja a amostra no possui uma distribuio normal












27





Teste de aderncia Smirnov
testando a distribuio
normal

para a idade ;amostra de homens


xi f(xi) F(xi) G(xi) esquerda direita 18
usando Mtodo de
Kolmogorov-
Smirnov 18
18
18 7 0,1725 0,4667 0,1725 0,2942 18
19 2 0,5000 0,6000 0,0333 0,1000 18
20 5 0,8275 0,9333 0,2275 0,1058 18
21 0 0,9705 0,9333 0,0372 0,0372 18
22 1 0,9977 1,0000 0,0644 0,0023 19
15 19

20

20
Soma: 30 D max: 0,2942 20

20
Mdia das alturas:

19 cm

20
Desvio Padro:

1,059 cm

22
Concluso: sendo Dmax=0,2942

Para = 0,20 e n=15 n crtico =0,266 < Dmax
Ho rejeitado, ou seja a amostra no possui uma distribuio normal

A partir de = 0,1 a avaliao se modifica
Com = 0,1 e n=15 n crtico =0,304 > Dmax
Ho ACEITO, a amostra possui uma distribuio normal













28



5. CONCLUSO


A partir da elaborao deste trabalho foi possvel concluir que, por meio de
anlises feitas a partir de dados concisos e organizados, podemos, em muitos
casos, prever determinadas tendncias, as quais nos auxiliaro na tomada de
decises, permitindo elaborar um planejamento mais adequado. Sabendo disso,
salientamos a importncia da estatstica para as vrias reas do conhecimento,
sendo uma ferramenta indispensvel para qualquer profissional e essencial para a
formao do engenheiro.




































29



6. REFERNNCIAS BIBLIOGRFICAS


MONTGOMERY, DOUGLAS C., et al Estatstica Aplicada Engenharia, 4
Ed. Rio de Janeiro, Editora LTC., 2009

COSTA NETO, Pedro Luiz de Oliveira Estatstica. 12. Ed. So Paulo, Editora
Edgard Blcher Ltda., 1992.

Anda mungkin juga menyukai