Vimos
que possvel sintetizar os dados sob a forma de distribuies de frequncia e grficos grficos. . ser de interesse apresentar esses dados atravs de medidas descritivas que sintetizam as caractersticas da distribuio distribuio. .
Pode
Para
representar um conjunto de dados de forma condensada utilizaremos algumas medidas de posio e de disperso disperso. .
Nos clculos envolvendo mdia aritmtica simples, todas as ocorrncias tm exatamente a mesma importncia ou o mesmo peso peso. . No entanto, existem casos onde as ocorrncias tm importncia relativa diferente diferente. . Nestes casos, o clculo da mdia deve levar em conta esta importncia relativa ou peso relativo relativo. .
17 20 25
17
20 25 26
Me=(16+17)/2 = 16,5
Exemplo: Kamile participou de um concurso, onde Exemplo: foram realizadas provas de Portugus, Matemtica, Biologia e Histria. Histria. Essas provas tinham peso 3, 3, 2 e 2, respectivamente. respectivamente. Sabendo que Kamile tirou 8 em Portugus, 7,5 em Matemtica, 5 em Biologia e 4 em Histria, qual foi a mdia que ele obteve?
2)
Altura dos alunos 1,75 1,69 1,81 1,72 1,73 1,66 1,59
MEDIDAS DE POSIO - QUARTIS, DECIS E PERCENTIS Em alguns casos, o pesquisador tem interesse em conhecer outros aspectos relativos ao conjunto de dados. dados . Nessa direo, os quartis quartis, , decis e percentis podem fornecer informaes relevantes pesquisa pesquisa. .
Quartis: So as observaes que dividem o rol em 4 partes Quartis: iguais e so denotadas por Q1, Q2 e Q3. Decis: So as observaes que dividem o rol em 10 partes Decis: iguais e so denotadas por D1,D2, . . . ,D9. Percentis: So as observaes que dividem o rol em 100 Percentis: partes iguais e so denotadas por P1, P2, . . . , P99. Note ainda que Q2 = D5 = P50 = Me.
ASSIMETRIA
Mdia = mediana = moda -> distribuio simtrica Mdia > Mediana > Moda -> distribuio assimtrica positiva Mdia < Mediana < Moda -> distribuio assimtrica negativa
MEDIDAS DE DISPERSO
As
medidas de posio apresentadas fornecem a informao dos dados apenas a nvel pontual, sem ilustrar outros aspectos referentes forma como os dados esto distribudos na amostra. amostra.
As
medidas de disperso so utilizadas para avaliar o grau de variabilidade, ou disperso, dos valores. valores.
MEDIDAS DE DISPERSO
Exemplo: Notas de trs turmas de Estatstica da UFPB
Observaes importantes
i) ii) iii) iv)
As trs turmas possuem a mesma mdia. As notas esto distribudas sob diferentes formas. A mdia resume o conjunto de dados apenas posio central. A mdia no fornece informaes sobre a variabilidade dos dados. Soluo: Apresentar junto da mdia uma medida que sumarize a Soluo: variabilidade do conjunto de dados. dados.
Amplitude Total: Total: Uma forma simples de medir a disperso em um conjunto de observaes atravs da amplitude total: total: AT = Maior valor Menor valor
Verifica-se que a amplitude como medida de Verificadisperso limitada limitada. . Essa medida s depende dos valores extremos, ou seja, no afetada pela disperso dos valores internos
O desvio mdio uma medida de VARIABILIDADE ABSOLUTA. ABSOLUTA. Ela mede a variabilidade do conjunto em termos de desvios em relao mdia aritmtica. aritmtica. uma quantidade sempre no negativa e expressa na mesma unidade de medida da varivel. varivel.
A varincia de um conjunto de dados (amostra ou populao) uma medida de VARIABILIDADE ABSOLUTA. ABSOLUTA. Ela mede a variabilidade do conjunto em termos de desvios quadrados em relao mdia aritmtica. aritmtica. uma quantidade sempre no negativa e expressa em unidades quadradas do conjunto de dados, sendo de difcil interpretao. interpretao.
a)
MEDIDAS DE DISPERSO DESVIO PADRO uma outra medida de disperso mais comumente empregada do que a varincia, por ser expressa na mesma unidade de medida do conjunto de dados. dados. Mede a "DISPERSO ABSOLUTA" de um conjunto de valores e obtida a partir da varincia varincia. .
S=
Exemplo:
VALORES 1-2-3 100 - 200 - 300 101 - 102 - 103 MDIA 2 200 102 D.P. 1 100 1 C.V. 50 % 50 % 1%
importante expressar a variabilidade em termos relativos porque, por exemplo, um desviodesvio-padro igual a 1 pode ser muito pequeno se a magnitude dos dados da ordem de 1.000, mas pode ser considerado muito elevado se esta magnitude for da ordem de 10. Observe tambm que o coeficiente de variao adimensional e por este motivo permite a comparao das variabilidades de diferentes conjuntos de dados.
Boxplot
Curtose
Exemplo: Na tabela abaixo encontraExemplo: encontra-se a estrutura do produto interno bruto do Brasil, em bilhes de reais, segundo as atividades econmicas. econmicas.
a)
Exemplo: Uma certa empresa que fabrica duas linhas de Exemplo: produtos (A e B) necessita reestruturar sua produo. produo. Foi realizado um estudo para tal finalidade e uma das variveis consideradas foi VENDA (quantidade mensal) de cada tipo de produto (A e B). B). Para este estudo foi tomado como referncia o primeiro semestre de determinado ano, onde foram verificados as seguintes VENDAS VENDAS: : PRODUTO A PRODUTO B
a) b)
13 25
32 20
28 29
25 30
24 26
25 20
Em relao a esta varivel, qual dos produtos (A ou B) apresentou maior estabilidade nas VENDAS mensais? A empresa decide penalizar a equipe que obteve, em algum ms, um volume de venda inferior a X -1,5S. Alguma equipe foi penalizada?