Anda di halaman 1dari 15

Ana Cristina R.

Ferraro

Pgina 1

A estatstica descritiva a parte da estatstica que desenvolve e disponibiliza mtodos para resumo e apresentao de dados estatsticos por meio de medidas descritivas, tabelas, grficos, diagramas ou distribuies de frequncia, com o objetivo de facilitar a compreenso e a utilizao da informao ali contida. Em resumo, a estatstica descritiva tem por finalidade a utilizao de tabelas, grficos, diagramas e medidas descritivas para:

examinar o formato geral da

distribuio

dos dados;

verificar a ocorrncia de valores atpicos; identificar valores tpicos que informem sobre o centro da distribuio; verificao do grau de variao presente nos dados.

, portanto, patente a importncia do conceito de distribuio na metodologia estatstica. Nenhum mtodo poder ser adequadamente compreendido se a idia de distribuio ficar absolutamente clara. Evidentemente, a validade do resumo est intimamente ligada quantidade de informao disponvel e qualidade de obteno dos dados. Pode-se pensar que todo mtodo descritivo possui uma entrada, os dados, e uma sada, que pode ser uma medida descritiva ou um grfico. Se a entrada deficiente a sada tambm ser de m qualidade. Medidas descritivas O resumo da informao contida nos dados na maioria das vezes feito por resumos numricos dos valores de uma ou mais variveis, denominadas medidas descritivas ou estatsticas descritivas. Alguns exemplos do dia a dia (qualquer rgo de divulgao de notcias oferece todos os dias dezenas de outros exemplos) so:

1. Depois de uma rodada de um campeonato de futebol envolvendo um grande nmero

de clubes, se fosse apresentado, para dar uma idia da quantidade de gols na rodada, o conjunto de todos os gols acontecidos em cada partida a compreenso geralmente fica prejudicada. A idia frequentemente passada por meio de uma mdia de gols (por partida), com destaques sobre eventuais goleadas ou de partidas sem gols.

2. Quando rgos governamentais medem a inflao de preos, so pesquisados muitos

preos de produtos e servios. Ao invs da informao sobre cada produto ou servio calculado um ndice de inflao que resume toda informao, eventualmente destacando-se algo que tenha influenciado em demasia a composio do ndice.

3. Numa pesquisa mdica, as vezes envolvendo milhares de indivduos, uma


simples percentagem de indivduos que reagiram ou no ao tratamento informa muito mais do que milhares de indicaes individuais se houve controle ou no.

4. Uma pesquisa eleitoral informa somente o percentual de eleitores consultados que


prefere cada candidato e no a opinio individual de cada eleitor. Os principais grupos de medidas descritivas so:

Medidas de localizao. Medidas de localizao, tambm denominadas medidas de tendncia central ou medidas de posio, so medidas que indicam um ponto central

Ana Cristina R. Ferraro

Pgina 2

onde, em muitas situaes importantes, est localizada a maioria das observaes. Assim, nesses casos, podem ser considerados valores tpicos ou representativos do conjunto.

Medidas de variao. Os dados estatsticos obtidos numa pesquisa qualquer so usualmente diferentes entre si. Uma informao altamente relevante o quanto eles so diferentes. As medidas de variao tem por objetivo informar sobre a variabilidade dos das dados.

Medidas de formato. Uma questo importante a informao sobre o modo como os valores se distribuem, indicando se a maior proporo de valores est no centro ou nas extremidades, como as frequncias de dados crescem ou decrescem, se existe um pico ou mais do que um na amplitude dos dados, etc. Alguns desses resumos so fornecidos por medidas de formato. A distribuio de frequncias importante no s para fornecer uma idia do formato da distribuio mas tambm para a compreenso de outras medidas.

Medidas de associao. Quando se tem mais de uma varivel medida na mesma unidade de observao, uma questo de grande importncia o modo como essas variveis se relacionam, indicando, por exemplo, se o crescimento de uma est associado ao crescimento de outra ou outras variveis.

Medidas separatrizes: Medidas separatrizes so medidas intuitivas, fceis de entender e que tambm podem ser utilizadas para construir medidas de disperso. Indicam limites para propores de observaes em um conjunto.

Existe uma enorme variedade de medidas descritivas, muitas delas competidoras entre si. Um guia geral para escolha da medida mais adequada pode ser visto a seguir:

com que objetivo a medida est sendo obtida? fcil de interpretar? intuitiva? existem valores atpicos que podem afet-la exageradamente? o propsito da anlise meramente descritivo ou planeja-se fazer inferncias?

Medida descritiva e escala de medida Algumas medidas descritivas exigem uma escala de medida mnima para serem obtidas. A tabela relaciona a escala necessria para algumas medidas. Medida Moda Percentis Mdia aritmtica Escala mnima Escala nominal Escala ordinal Escala intervalar

Mdia geomtrica e harmnica Escala de razo Relaes entre as medidas de localizao

Ana Cristina R. Ferraro

Pgina 3

Existem algumas relaes entre algumas medidas de localizao. Assim, para um conjunto de observaes de uma varivel numrica y:

Entre a mdia harmnica, a mdia geomtrica e a mdia aritmtica vlida a desigualdade: mhmgy. A igualdade vale somente quando todos os valores so iguais.

Numa distribuio unimodal e aproximadamente simtrica a mdia aritmtica, a mediana e a moda esto muito prximas. Numa distribuio assimtrica negativa a mdia aritmtica menor valor, seguida da mediana e pela moda. Numa distribuio assimtrica positiva a moda o menor valor, seguida da mediana e, por ltimo, da mdia aritmtica.

Grficos Grfico uma forma de representao visual da informao por meio de sinais, desenhos, figuras ou qualquer outro meio. De especial interesse para a estatstica so os grficos de funo e os grficos estatsticos. O uso dos grficos de fundamental importncia na metodologia estatstica. Como se poder ver, praticamente todas as anlises estatsticas envolver, se no vrios, pelo menos um tipo de grfico. A tabela que segue relaciona algumas formas de resumir a informao e tcnicas relacionadas. Tipo Tcnica ou medida

Localizao Mdia, mediana, moda, mdia geomtrica, mdia harmnica. Disperso Formato Associao Sepatrizes Grfico Varincia, desvio padro, desvio mdio, amplitude interquartlica, amplitude total. Distribuio de frequncias, coeficiente de assimetria, coeficiente de curtose, moda. Covarincia, coeficiente de correlao. Mediana, quartis, percentis. Grfico de funo, histograma, grfico estatstico, estimao por kernel

Grficos aspectos gerais e finalidades


O uso de recursos grficos tem vrios objetivos:

Resumir a informao. Apresentar a informao de uma forma visualmente atraente, facilitando a compreenso.

Assim:

Servir como ferramenta de anlise.

Ana Cristina R. Ferraro

Pgina 4

Um grfico uma representao em alguma superfcie, frequentemente papel ou a tela de um computador, utilizando figuras, textos e smbolos, buscando, de modo visualmente interessante, informar, ilustrar ou entreter. As trs finalidades so importantes e muitas vezes um grfico construdo tendo todas elas em mente. Desse modo, particularmente devido s facilidades computacionais hoje disponveis, a utilizao de recursos grficos um item obrigatrio em qualquer anlise estatstica. A escolha do tipo e a forma de apresentao sempre vo depender do contexto, mas de uma maneira geral um bom grfico deve:

Mostrar a informao de modo to acurado quanto possvel. Utilizar ttulos, rtulos, legendas, etc. para tornar claro o contexto, o contedo e a mensagem.

Complementar ou melhorar a visualizao sobre aspectos descritos ou mostrados numericamente atravs de tabelas.

Utilizar escalas adequadas. Mostrar claramente as tendncias existentes nos dados.

Portanto, grficos so ferramentas valiosas e indispensveis na anlise de dados. Frequentemente revelam aspectos insuspeitos e sugerem caminhos novos ou adicionais anlise. A figura que segue ilustra as reas tpicas de um grfico.

Construo de grficos
Existem alguns tipos bsicos de grficos e uma enorme variao desses tipos ou de combinaes deles. Os tipos bsicos e alguma orientao para seu uso podem ser vistos a seguir:

Ana Cristina R. Ferraro

Pgina 5

Grfico de setores.

Para descrever componentes e ilustrar partes de, percentagem de, o menor de, o maior de, a maior parte de, etc.
Grfico de barras.

Para comparar itens, estabelecer relacionamentos, descrever sries de tempo e ilustrar ordenao, acrscimo, decrscimo, flutuao, dist ribuio, etc.
Grfico de linhas.

Para sries de tempo e distribuio e ilustrar relacionamentos.


Grfico de disperso.

Uso geral para analisar relacionamentos entre variveis e o modo como ocorre a disperso dos pontos.
Grfico de distribuio.

Descrio de modelos de distribuio emprica e terica para variveis aleatrias discretas e variveis aleatrias contnuas.

Grficos de setores Grfico muito utilizado para representar quantidades associadas a classes de uma varivel categorizada que correspondem a partes de um todo. O grfico corresponde a uma forma circular onde cada pedao desenhado a partir do centro com ngulo proporcional magnitude do valor, frequentemente uma percentagem, associado classe.

Grficos de setores, tambm denominados grficos de pizza, so teis representar partes de um todo. Como o prprio nome indica, consiste de um crculo que representa o todo e as partes ou setores so desenhados como pedaos do todo, iniciando no centro do crculo, em sentido horrio ou anti-horrio. O tamanho do setor proporcional ao valor a ser representado. Pode ser desenhado em duas ou trs dimenses e uma ou mais partes podem ser separadas para destacar um determinado valor. O grfico em setores construdo pela transformao do valor em graus ou do valor em percentagem e, posteriormente, em graus, sendo que o todo representa 360 graus. O quanto a percentagem representa em graus pode ser calculada como: 100%360 p%x Desse modo, o valor x=3.6p% ser o nmero de graus do ngulo para o pedao no crculo correspondente percentagem p%.

Ana Cristina R. Ferraro

Pgina 6

Para uma interpretao mais simplificada, interessante colocar os setores em ordem descendente no sentido horrio ou anti-horrio. A existncia de muitos valores a representar pode tornar o grfico de setores ineficiente. Nesse caso, talvez seja mais adequada a representao por um grfico de barras. A figura que segue ilustra um grfico de setores em trs dimenses, com destaque para uma parte.

Neste caso, o nmero total de instituies de ensino superior 2398, sendo que 426 delas esto no nordeste ou 17.76% do total. Em graus, isso corresponde a 3.617.76=63.95 ou 63 graus e 57 minutos. O mesmo valor poderia ter sido obtido de 4263602398=63.95.

Grficos de barras so grficos de uso frequente que utilizam retngulos cujas alturas so proporcionais aos valores a serem representados. Com frequncia, envolve uma varivel nominal. Existe uma grande variedade desses grficos. Os tipos mais comuns so:

Barras verticais

Ana Cristina R. Ferraro

Pgina 7

Tambm denominados grficos em colunas, so retngulos com alturas proporcionais aos valores. A base se localiza no eixo das abscissas e os valores no eixo das ordenadas.

Barras horizontais Grfico de barras com os valores localizados no eixo das abscissas. Muito til quando os rtulos para cada barra excede a largura da barra.

Barras acumuladas

Ana Cristina R. Ferraro

Pgina 8

Uma mesma barra serve para representar valores de uma outra varivel que so pores de um total para o mesmo grupo.

Barras agrupadas As barras para nveis de um mesmo grupo so colocadas de modo contguo lado a lado para facilitar a comparao.

Pirmide Variao do grfico em barras horizontais, destinado ressaltar a variao de dois grupos.

Ana Cristina R. Ferraro

Pgina 9

Histogramas Barras contguas destinadas representao de distribuies de frequncias.

Grfico de linhas o grfico construdo pela unio de pontos (x,y), correspondentes a x subsequentes, por meio de segmentos de retas. um grfico de grande utilidade e muito

Ana Cristina R. Ferraro

Pgina 10

comum na representao de tendncias e relacionamentos de variveis. Assim, a varivel no eixo x uma varivel contnua, frequentemente o tempo. Presta-se muito bem para representar vrias sries simultaneamente, comparando tendncias, e aparece combinado com outros tipos, como o grfico de barra. Alguns exemplos podem ser vistos a seguir:

Em algumas situaes uma determinada escala no possibilita visualizao correta das tendncias. No exemplo que segue, a comparao entre a evoluo da populao dos estados de Roraima e de So Paulo no poderia ser feita pela grande diferena existente entre as duas. A escala logaritmica permite a comparao.

Ana Cristina R. Ferraro

Pgina 11

Uma variao do grficos de linhas o de linhas acumuladas, onde as ordenadas para cada grupo se acumulam e cada espao entre os grficos de linha so identificados e so interpretados de modo acumulado.

Polgonos de frequncia so grficos de linha que unem os pontos (cj,fj), pontos mdios e frequncias da classe j.

Ana Cristina R. Ferraro

Pgina 12

Os grficos de disperso talvez sejam os de uso mais comum da anlise estatstica. Como o nome indica, so utilizados para mostrar o modo como os valores de uma ou mais variveis se dispersam. Um grfico de disperso univariada mostra a disperso em relao a um eixo somente enquanto que o grfico de disperso bivariada ilustra a disperso de pontos, possibilitando verificar o modo como as variveis se relacionam.

Grficos de disperso so particularmente teis na anlise de correlao e na anlise de regresso seja para pesquisa de modelos de regresso, diagnstico de eventuais problemas ou para verificao visual da qualidade de ajustamento.

Ana Cristina R. Ferraro

Pgina 13

Grficos de distribuio tm por finalidade mostrar a forma como se distribuem os valores ou as probabilidades aos valores de uma varivel aleatria. Alguns exemplos podem ser vistos a seguir. Distribuies de frequncia podem ser representadas por meio de histogramas, polgonos de frequncia ou ogivas.

Distribuies contnuas so representadas pelos grficos das funes de densidade, eventualmente com a indicao da rea sob a funo correspondente a um valor de probabilidade e por funes de distribuio.

Ana Cristina R. Ferraro

Pgina 14

Distribuies discretas so definidas por funes de probabilidade, cujos valores so usualmente representados por segmentos de reta com altura proporcional probabilidade associada a cada valor da varivel discreta. O grfico da funo de distribuio no caso discreto uma funo escada.

Ana Cristina R. Ferraro

Pgina 15