Anda di halaman 1dari 38

como fazer

Anlise de dados
3 Introduo

5 Como feita uma boa anlise de dados?

8 Conceitos iniciais para suportar uma boa anlise de dados

11 Quando, como e exemplos para grficos

13 Concluso

15 Sobre o autor
Introduo
INTRODUO

A anlise de dados tem sido uma habilidade cada vez mais requisitada no mercado de trabalho. A quantidade de dados
disponveis enorme, mas poucas pessoas conseguem transform-los em insights para decises de negcios. Muitas vezes
isso acontece porque as pessoas no sabem qual grfico utilizar em cada uma das situaes que lhes so apresentadas.

Pensando em ajudar voc, na hora em que for realizar anlises, a Escola


EDTI montou este guia. Nele, voc encontrar em linguagem simples e
descomplicada a ocasio certa para utilizar cada tipo de grfico, como
interpretar os resultados e exemplos para ajud-lo nas aplicaes prticas.

Voc saber quando e como usar os seguintes


grficos: histograma, boxplot, grfico de disperso
(correlao), grfico de Pareto e grfico de tendncia.
Tambm inclumos uma seo introdutria para voc
preparar melhor sua anlise e aumentar ainda mais a
qualidade dos seus resultados.

Este material para ser utilizado como um guia de bolso e ajud-lo a


melhorar suas decises e apresentaes grficas. Use e abuse!

4
Como feita uma boa
anlise de dados?
Como feita uma boa anlise de dados?

Comece pelas perguntas

Antes de mais nada, preciso ter perguntas! O


que queremos responder? Quais so os pontos
nebulosos em nossa estratgia de negcios? O que
tem gerado muita discusso e poderia ser clareado
com os dados?

Esse ser o ponto de partida para uma anlise rica.


Nesse momento, quanto mais conhecimento sobre
o problema, mais relevantes sero as questes
propostas. Caso voc no seja um expert no assunto
em anlise, procure quem seja para ajud-lo a
preparar perguntas relevantes.

Invista um bom tempo nessa preparao inicial. No


fique afoito para partir direto para a anlise. Uma boa
reflexo nessa etapa um investimento que far voc
ganhar muita qualidade analtica em seus estudos.

6
Como feita uma boa anlise de dados?

Descubra onde e como os


dados sero obtidos

Com as dvidas iniciais em mos, preciso levantar os dados


necessrios para respond-las. Eles j esto disponveis?
Se sim, em qual sistema e quem ter que extrair essas
informaes? Os dados disponveis so confiveis?

Essa fase de questionamento relevante. Afinal, caso os


dados sejam ruins, a anlise gerada tambm ser. Portanto, a
preocupao com a qualidade dos dados de vital importncia.

Tome especial cuidado para que todos os dados necessrios


para responder s perguntas sejam solicitados/coletados,
para evitar perder tempo nas prximas etapas. Organize os
dados em uma estrutura de banco de dados, com variveis nas
colunas e observaes nas linhas, uma vez que a maioria dos
softwares de anlise exige essa organizao.

7
Execute a anlise

Comece avaliando a presena de outliers e investigue a razo da ocorrncia desses valores atpicos ou discrepantes.
Caso eles existam, o que voc far? Eles realmente fazem parte da populao em estudo ou so erros de digitao?
Essa uma fase que nos ajuda a fazer uma limpeza dos dados, deixando-os prontos para a anlise.

8
Como feita uma boa anlise de dados?

Com os dados preparados para a anlise, comece respondendo s perguntas iniciais. Para cada grfico preparado,
anote os aprendizados. Lembre-se de que a anlise iterativa, ou seja, as respostas s perguntas iniciais levam
formulao de novas perguntas e esse ciclo segue-se diversas vezes.

Faa um compilado com os principais grficos e resultados. Discuta com outras pessoas. Veja se aparecem novas
dvidas e volte anlise.

Lembre-se de que a qualidade visual importante, assim, faa ajustes nos eixos e legendas
dos grficos para que esses fiquem claros e visveis para sua audincia, mas cuidado para
no rebuscar demais, evitando que as concluses sejam de difcil compreenso quanto
menos tinta melhor!

importante pontuar que preciso desenvolver a habilidade de interpretao grfica. possvel fazer um paralelo
com mdicos que se especializam em interpretar exames como ressonncia magntica. Para uma pessoa que no
foi treinada, provavelmente seja impossvel entender esse tipo de informao. Com os grficos tambm preciso
treino e, por essa razo, colocamos as nossas interpretaes em cada grfico dos exemplos, para ajud-lo a
desenvolver essa habilidade.

9
Conceitos iniciais
para suportar uma
boa anlise de dados
Conceitos iniciais para suportar uma boa anlise de dados

Estatstica, Anlise de Dados e Variabilidade

A Estatstica um conjunto de conceitos e tcnicas, utilizado no planejamento da coleta e na anlise de dados, com
o objetivo de resolver problemas reais. Claramente, cientistas, engenheiros, economistas e outros profissionais esto
envolvidos com essas atividades e, portanto, necessitam utilizar a Estatstica. Alm disso, de uma forma ou de outra,
todas as pessoas so afetadas pelo uso da Estatstica. Cada vez mais rgos governamentais e empresas baseiam as
prprias decises, as quais afetam o dia a dia das pessoas, em anlises estatsticas, o que faz com que no apenas
profissionais tenham de adquirir algum conhecimento dessa tcnica.

O que torna essa disciplina de grande utilidade, e nica, que a aplicao dela ocorre em
situaes ou processos em que a incerteza e a variabilidade esto presentes.

Um processo definido como uma combinao de pessoas, materiais, procedimentos, mtodos, polticas e meio
ambiente, cujos elementos integrados formam uma srie de aes que conduzem a determinado resultado. Em
nosso caso, o resultado um produto ou servio. Para avaliar a utilidade de um produto para o consumidor, variveis
so medidas no produto. Dois itens produzidos nas mesmas condies no so, em geral, idnticos, com respeito s
variveis consideradas. Existe uma variabilidade inerente em cada processo.

11
Conceitos iniciais para suportar uma boa anlise de dados

Os mtodos estatsticos so desenvolvidos para lidar com a incerteza


e a variabilidade. Eles so fundamentais para se fazer inferncias
sobre processos a partir de uma amostra de uma populao.
Considere, em seguida, exemplos de algumas reas de atividade.

Processos econmicos: renda familiar, ndice de inflao,


taxa de juro etc.

Processos industriais: porcentagem de peas defeituosas,


dimetro de peas, rendimento de um processo industrial etc.

Processos biolgicos: presso arterial, nmero de espcies,


tempo de vida etc.

Em todas as situaes descritas anteriormente, o que obtemos so


respostas, as quais podem assumir diferentes caractersticas: podem
ser resultados numricos (renda familiar, tempo de sobrevivncia)
ou simplesmente resultados qualitativos (opo partidria, local de
nascimento, sobrevivncia ou no de um animal etc.).

12
Conceitos iniciais para suportar uma boa anlise de dados

Para avaliar a performance do processo e a qualidade do que se est produzindo, preciso dados sobre o processo ou
o produto. Os dados devem ser analisados, e as decises devem ser feitas com respeito ao processo, alm de que elas
devem ser tomadas na presena de variabilidade. A Estatstica a ferramenta adequada para se planejar a coleta de
dados, que sejam relevantes para o problema em estudo, bem como para a anlise.

Tipos de dados

Antes de realizar qualquer anlise, preciso entender qual o tipo de dado que est na sua frente. Quando queremos
colocar um prego na parede utilizamos um martelo, j quando queremos apertar um parafuso podemos usar uma
chave de fenda. Da mesma forma, dependendo do tipo de varivel que coletamos, iremos utilizar uma ferramenta
grfica diferente. Em termos gerais, os dados podem ser de trs tipos, como voc pode observar a seguir.

Classificao (qualitativos): os resultados possveis so classificaes (pea defeituosa ou no defeituosa,


entrega atrasada ou no atrasada, cliente satisfeito ou no satisfeito, cor de determinado produto).

Contagem: os resultados so nmeros inteiros (nmero de riscos em uma pea, nmero de acidentes no ms,
nmero de cursos vendidos).

Contnuos: os resultados podem ser quaisquer nmeros dentro de um intervalo (peso, comprimento, gasto mensal).

13
Quando, como e
exemplos para grficos
Quando, como e exemploS para grficos

Com esses conceitos em mente, confira em seguida nossas dicas para voc construir e analisar grficos.
Voc perceber que fcil!

Histograma

Quando utilizar: o histograma uma ferramenta adequada quando temos dados


numricos e desejamos aprender sobre a distribuio deles.

Como interpretar: no histograma olhamos informaes de localizao e de variao


dos dados. Por exemplo, qual o centro (a mdia), qual o mnimo e o mximo, qual a
amplitude (variao)? O objetivo conhecer um pouco sobre os dados que estamos
trabalhando e tambm identificar a possvel presena de outliers. Por essas razes,
o histograma uma das primeiras ferramentas que utilizamos na chamada anlise
descritiva ou exploratria de dados.

15
Quando, como e exemploS para grficos

Exemplo: 60 registros do peso de uma caixa de leite


em p foram coletados durante uma hora de produo.
A distribuio representada graficamente pela figura
ao lado.

Por meio do grfico podemos observar o


comportamento dos pesos e examinar caractersticas
como: simetria da distribuio (nesse caso distribuio
simtrica), regio onde h maior concentrao de
valores (entre 270 e 277), o centro da distribuio (em
torno de 273), a disperso dos valores ao redor de uma
medida central (dados entre 265 e 283). Tambm
possvel perceber que no existe nenhum outlier.

A distribuio nos fornece uma grande quantidade


de informaes sobre o conjunto de dados que
estamos analisando, alm de ser um bom estudo
inicial, que nos permite ganhar mais familiaridade
com a varivel em estudo.

16
Quando, como e exemploS para grficos

Boxplot

Quando utilizar: assim como o histograma, o Boxplot tambm utilizado para


variveis numricas, quando o objetivo for o estudo da distribuio dos dados.
O Boxplot (tambm chamado de box e whisker plot) um mtodo alternativo ao
histograma para representar os dados. O boxplot prefervel ao histograma quando o
objetivo comparar dois ou mais grupos.

Como interpretar: o Boxplot fornece informao sobre as seguintes caractersticas


do conjunto de dados: localizao, disperso, assimetria, comprimento da cauda e
outliers (medidas discrepantes).

17
Quando, como e exemploS para grficos

Exemplo 1: Na figura, a
seguir, voc encontra todas
as informaes apresentadas
em um Boxplot.

18
Quando, como e exemploS para grficos

O centro da distribuio indicado pela linha da mediana (alguns softwares estatsticos tambm representam a mdia
com um smbolo, nesse caso o +). A disperso representada pela altura do retngulo (Q3 Q1), no qual Q3 o terceiro
quartil e Q1 o primeiro quartil. O retngulo contm 50% dos valores do conjunto de dados. A posio da linha mediana no
retngulo informa sobre a assimetria da distribuio. Uma distribuio simtrica teria a mediana no centro do retngulo,
bem prxima mdia no exemplo anterior, o conjunto de dados foi assimtrico. Se a mediana prxima de Q1, ento, os
dados so positivamente assimtricos. Se a mediana prxima de Q3, os dados so negativamente assimtricos.

O comprimento das linhas fora do retngulo (algumas vezes chamadas de whisquers) informam sobre a cauda da distribuio.

Os valores fora de Q1-1.5*(Q3-Q1) e Q3+1.5*(Q3 -Q1) geralmente so chamados de outside e


devem ser investigados como possveis outliers, alm de serem geralmente representados por
um asterisco. Valores outside no so necessariamente outliers, mas um outlier usualmente
aparece no grfico como um outside.

Uma utilidade muito importante do Boxplot na comparao grfica de dois ou mais grupos. Nesse caso, o Boxplot
prefervel ao histograma. Essa comparao pode ser feita desenhando-se os Boxplots para cada conjunto de dados,
paralelamente, em um mesmo grfico.

19
Quando, como e exemploS para grficos

Exemplo 2: O prximo grfico apresenta dados de


viscosidade de trs misturas diferentes. O Boxplot
comparativo apresentado ao lado.

Como podemos ver, as misturas apresentam nveis


mdios diferentes de viscosidade, decrescentes
da mistura 1 para a mistura 3. Supondo que no
exemplo o desejo seja aumentar a viscosidade,
claramente a mistura 1 prefervel nesse critrio.

Tambm possvel perceber que existe razovel


simetria nos dados para as 3 misturas e que para
a mistura 3 existe um outlier (representado pelo
ponto isolado no grfico). Esse ponto deve ser
investigado, e causa dele, identificada.

importante ressaltar que muitas vezes a grande


informao est na causa especial, por isso, no a
ignore simplesmente.

20
Quando, como e exemploS para grficos

Grfico de disperso

Quando utilizar: quando queremos estudar a relao entre duas variveis numricas. O
objetivo responder pergunta: a varivel X influencia a varivel Y? Se conseguirmos entender
como ocorre a relao entre as variveis, pode ser possvel propor novos direcionamentos para
um negcio. Por exemplo, podemos descobrir que o tempo para responder a uma proposta
influencia negativamente a chance de sucesso na venda e, com isso, redesenhar as atividades
da rea comercial de modo a diminuir esse tempo de envio de propostas.

Como interpretar: Veja, em seguida, como interpretar o grfico de disperso.

Direo: positiva (quando x aumenta e y tambm aumenta) ou negativa (quando x


aumenta e y diminui).

Forma: a relao linear (pode ser aproximada por uma reta) ou no linear.

Fora: quanto mais aproximados os pontos esto da forma da relao identificada


entre x e y, maior a fora dessa relao.

21
Quando, como e exemploS para grficos

Exemplo: Uma equipe estava incumbida


de elevar a satisfao dos clientes com a
entrega dos projetos do escritrio. Existia
uma forte convico de que a satisfao
era influenciada pelos dias de atraso. Para
comprovar essa teoria, a equipe coletou o
nvel de satisfao e os dias de atraso (dias
de atraso negativos significam entrega antes
do prazo) de 24 projetos.

Voc consegue perceber, no grfico


de disperso, acima, se a satisfao
influenciada pelos dias de atraso da entrega
do projeto?

Olhando o grfico de disperso, no qual cada


ponto representa um projeto, com os respectivos
atraso e satisfao, fica fcil perceber que,
quanto maior o atraso, menor a satisfao.

22
Quando, como e exemploS para grficos

Alm do grfico, podemos tambm utilizar o Coeficiente de Correlao Linear, que mede o grau de associao entre
duas variveis. Esse coeficiente pode ter valores entre -1 e 1.

Quanto mais prximo de 1 ele estiver, maior ser a relao positiva, e quanto mais
prximo de -1, maior a relao negativa entre as variveis X e Y.

Cuidado especial deve ser tomado em relao a possveis relaes esprias ou viciadas.

23
Quando, como e exemploS para grficos

Grfico de Pareto

Quando utilizar: quando queremos representar a distribuio de dados categricos


e orden-los por frequncia. Muitas vezes essa forma de representao grfica
utilizada para focar esforos, localizando quais so as categoriais vitais de uma
realidade, para atuao posterior.

Como interpretar: quando o grfico construdo de maneira adequada, calculada


uma linha que identifica os percentuais acumulados (veja exemplo a seguir). As
categoriais vitais so definidas quando o crescimento de uma barra para outra se
estabiliza. importante perceber que nem sempre o efeito de Pareto est presente,
no indicando nenhuma grupo de categoria vital.

24
Quando, como e exemploS para grficos

Exemplo: Uma empresa de embalagens


precisava reduzir custos com peas
defeituosas encontradas em sua produo.
Como a empresa no sabia por onde
comear, decidiu-se utilizar o conceito
do Grfico de Pareto para analisar quais
defeitos ocorriam com maior frequncia.
Durante duas semanas os dados foram
coletados, resultando no grfico ao lado.

25
Quando, como e exemploS para grficos

Nesse caso, a anlise do grfico de Pareto permitiu empresa identificar quais eram os defeitos mais recorrentes
e, assim, priorizar a soluo dos problemas relacionados no selagem do topo, no selagem do fundo e no
selagem lateral.

Vamos utilizar esse exemplo para entender como encontrar as categorias vitais. Para isso,
observe a linha azul, que mostra o percentual acumulado.

Perceba, no exemplo analisado, que da primeira para a segunda barra acontece um grande salto.
Da segunda para a terceira barra tambm ocorre um grande salto.

A partir da terceira barra os saltos ficam quase do mesmo tamanho e, com isso, podemos
concluir que encontramos as categorias vitais: as representadas pelas trs primeiras barras.

26
Quando, como e exemploS para grficos

Grfico de tendncia

Quando utilizar: quando o objetivo avaliar o comportamento de um indicador ao


longo do tempo. Pode ser utilizado para variveis numricas ou classificatria, nesse
segundo caso preciso calcular o indicador na escala percentual, para posterior
utilizao no grfico de tendncia.

Como interpretar: o grande objetivo avaliar o comportamento ao longo do tempo


(estabilidade), alm da presena de causas especiais de variao que meream uma
ao pontual ou o impacto de mudanas no indicador.

27
Quando, como e exemploS para grficos

Exemplo 1: a figura, ao lado, um


exemplo de um grfico de tendncias que
mostra o percentual de entregas fora do
40 prazo (observao: essa uma varivel
35 classificatria fora ou dentro do prazo
% de entregas fora do prazo

em que foi calculado um percentual ao


30
longo do tempo para acompanhamento em
25 um grfico de tendncia).

20
fcil perceber, pelo grfico, que houve
15 uma melhoria no indicador entre os meses
10 8 e 9, causando reduo no percentual de
entregas atrasadas.
5

2 4 6 8 10 12 14 16 18 Uma questo importante quando temos


Ms convico de que a melhoria realmente
aconteceu e se sustentou. Vamos discutir
isso no prximo exemplo.

28
Quando, como e exemploS para grficos

Exemplo 2: Em um Grfico de Tendncia


til criar fases no grfico para evidenciar os
impactos produzidos por mudanas. No exemplo,
ao lado, o objetivo era reduzir o tempo de ciclo de
uma atividade, e uma mudana foi realizada entre
a semana 7 e 8. Claramente podemos verificar que
a mudana produziu o efeito desejado. Observe.

Uma dvida recorrente, especialmente de pessoas


que esto iniciando a utilizao de grficos de
tendncia para monitorar indicadores, quando
criar fases em um Grfico de Tendncia. Essa
uma pergunta sempre complicada principalmente
quando estamos reagindo a posteriori (aps ver
os dados), ou seja, j temos dados do indicador
que cobrem um perodo anterior s mudanas, o
perodo em que mudanas foram realizadas e um
perodo aps a implementao das mudanas
(fase de controle).

29
Quando, como e exemploS para grficos

A situao ideal a que denominamos anlise prospectiva. Quando iniciamos um projeto, coletamos dados do
indicador de um perodo anterior (em geral em torno de 10 pontos suficiente). Colocamos esses pontos em um Grfico
de Tendncia e tentamos avaliar se no h evidncia para rejeitar que o indicador estava estvel no perodo (ateno
para o detalhe: se no h evidncia para rejeitar e no se h evidncia para aceitar stil).

Se no h evidncia para rejeitar que o indicador estava estvel, ento, traamos a linha
de base e a projetamos para o futuro. A partir disso comeamos a colocar novos pontos
no grfico e anotamos mudanas que so realizadas no processo. Se a regra de 8 ou mais
pontos acima ou abaixo da linha de base satisfeita, ento, criamos uma nova linha de base
com esses novos pontos.

Se conseguimos associar a mudana de linha de base com alguma mudana realizada de forma intencional no
processo, timo. Se no conseguimos associar a alterao na linha de base com alguma mudana feita de modo
intencional, ento, devemos tentar identificar alguma transformao que foi executada, s vezes sem nosso
conhecimento, que possa explicar esse impacto no indicador. E assim prosseguimos acompanhando o processo,
alterando a linha de base quando o indicador mostra que algo mudou no processo que impactou o indicador.

30
Quando, como e exemploS para grficos

Exemplo de como definir


fases em um grfico de
tendncia

No exemplo anterior, a sequncia


seria a que voc pode ver em
seguida. Acompanhe.

1) Medimos o tempo de ciclo


por sete semanas, antes de se
fazer mudanas no processo,
e construmos um Grfico de
Tendncia com os dados. No h
indicao de que o indicador no
esteja estvel.

31
Quando, como e exemploS para grficos

2) Projetamos a linha de base.

32
Quando, como e exemploS para grficos

3) Coletamos pontos aps a


mudana e colocamo-nos no
Grfico de Tendncia.

33
Quando, como e exemploS para grficos

4) Aps a mudana (realizada


entre a stima e a oitava
semana), h sete pontos abaixo
da linha de base. Ento, o
momento de alterar a linha de
base. O valor 3 para o tempo de
ciclo (mediana dos ltimos sete
pontos) a nossa referncia
agora. Os dados mostram que a
mudana foi uma melhoria.

34
Concluso
Concluso

Percebemos que uma correta anlise de dados auxilia nos


direcionamentos estratgicos das decises que devem ser
tomadas diariamente nas organizaes. Para que voc tenha
sucesso e insights valiosos necessria uma preparao
adequada, levantando perguntas que direcionaro a
construo de grficos.

Para responder s perguntas propostas ser necessrio


o conhecimento e entendimento de quais grficos so
adequados para cada pergunta e para cada varivel, como
descrito no decorrer desse e-book.

A constante anlise grfica e fundamentao de


suas decises em dados e informaes pode ser
o diferencial entre voc e seus concorrentes.

Bons resultados!

36
Sobre o autor

Marcelo Petenate diretor executivo da Escola


EDTI. professor em cursos da Unicamp e tem
mais de 10 anos de experincia em Estatstica
Aplicada e Seis Sigma, tendo coordenado alguns
programas de implantao dessa metodologia.
formado em Estatstica pela Unicamp e mestre
em Estatstica pela USP.

Utiliza a anlise de dados para construir histrias


e basear as decises de negcio da prpria
equipe executiva, alm de gostar de compartilhar
esse conhecimento com quem se interessar
pelo assunto. Acredita que a anlise de dados
uma ferramenta extremamente importante para
melhorar as decises de negcios e aumentar a
competitividade das organizaes brasileiras.
Sobre o autor

A Escola EDTI, com base em uma longa experincia de


trabalho de consultoria em diversas indstrias, est
plenamente capacitada para treinar e orientar equipes em
atividades de melhoria e dar suporte anlise de dados
(inteligncia analtica) para subsidiar decises de negcios.

Ns acreditamos que a formao slida de nossos


consultores e professores, aliada experincia e
conhecimento do mercado, so fundamentais para ajudar
pessoas e empresas a na explorao de oportunidades de
crescimento.

Conhea mais materiais educativos.

Outros links teis

Blog da Escola EDTI Site da Escola EDTI

Anda mungkin juga menyukai