Fundamentos de Análise de Dados - Pesquisa de Mercado

ESCOLA SUPERIOR DE HOTERALIA E TURISMO DE INHAMBANE
Curso de Gestão Pós Laboral
Cadeira: Pesquisa de Mercados
III Grupo
Tema: Fundamentos de Análise de Dados
Nomes:
Adelaide Quentura Matabele
António Manuel Guirrugo
Arsénio Linda Zaqueu
Druty Mansuclal
Ércio Jaime Da Silva
Mácida Amade Abdul Wahabo
Raúl Inácio Laquene
Victória Paulo Muchanga
Docente:
dr. Leonildo Fernando Benjamim
Inhambane, Setembro de 2018

ÍNDICE
1. INTRODUÇÃO .................................................................................................... 1
1.1. Objectivos ....................................................................................................... 2
1.2. Metodologia .................................................................................................... 3
2. FUNDAMENTOS DE ANÁLISE DE DADOS .................................................. 4

2.1. Conceitos Básicos ........................................................................................... 4
2.2. Análise de Dados ............................................................................................ 5
2.3. Escolha do Método para Análise dos Dados ................................................ 6
2.4. Tabulação ....................................................................................................... 8
2.4.1. Métodos Tabular e Gráficos de Apresentação dos Dados ......................... 9
2.5. Métodos Descritivos da Análise de Dados ................................................. 11
2.5.1. Medidas de Posição ................................................................................. 11
2.5.2. Medidas de Dispersão.............................................................................. 16
2.5.3. Medidas de Associação ........................................................................... 18
2.6. Métodos Inferenciais.................................................................................... 18
2.6.1. Testes de Hipóteses ................................................................................. 19
2.7. Métodos de Correlação e Regressão........................................................... 22
2.7.1. Regressão ................................................................................................. 23
2.7.2. Coeficiente de Correlação ....................................................................... 23
3. CONCLUSÃO ..................................................................................................... 25
4. REFERÊNCIAS BIBLIOGRÁFICAS ............................................................. 26

1. INTRODUÇÃO
Os estudos de administração e a teoria organizacional têm-se caracterizado,

fundamentalmente, a partir de instrumentais analíticos calcados nos modelos
mecânico e orgânico de organização, próprios do enfoque quantitativo, o qual não
permite ao pesquisador interpretar a realidade sob novas dimensões, cujos elementos
são de natureza essencialmente qualitativas e pouco passível de mensuração. Diante
deste quadro abordar análise de dados enquanto etapa de processo de pesquisa de
marketing configura-se como relevante, uma vez que a tentativa de identificar
especificidades pode significar melhores condições para o desenvolvimento de novos
estudos, com base num melhor e maior atendimento conceitual do processo alinhado
aos respectivos paradigmas.
Daí, o presente trabalho versa fundamentalmente desenvolver como é feita essa
análise de dados em um processo de pesquisa de marketing, onde por sua vez
traremos os diversos métodos de análise, a sua interpretação e aplicação para resolver
problemas e tomar decisões apropriadas.
O trabalho está estruturado em três tópicos principais. O primeiro inicia-se situando
algumas definições de ciência e de pesquisa científica. Em seguida apresenta aspectos
que constituem um processo de pesquisa. E finalmente, a terceira parte descreve o
processo de análise e interpretação dos dados, identificando especificidades inerentes
à natureza de cada pesquisa.
1.1.Objectivos
Geral:
• Debruçar sobre a análise de dados de uma pesquisa de marketing
Específicos:
• Apresentar os diversos métodos de análise de dados;

• Interpretar os resultados de pesquisa;
• Aplicar os resultados da pesquisa para resolver problemas e tomar decisões
apropriadas.
1.2.Metodologia
Para Dencker (1998:19), metodologia é:

A sucessão de passos pelos quais se descobrem novas relações entre fenómenos
que interessam um determinado ramo científico ou aspectos ainda não revelados
de um determinado fenómeno, identificados através de procedimentos
indispensáveis e que vão auxiliar no alcance do (s) objectivo (s) pretendido (s).
O presente trabalho, quanto aos objectivos caracteriza-se como pesquisa exploratória.

Por proporcionar maior familiaridade com o tema, com vista a torná-lo mais explícito.
O tipo de pesquisa enquadra-se no trabalho na medida em que auxilia na busca de
conceitos e abordagens sobre perspectiva de diversos autores, apoiando na
compreensão da influência que a análise de dados tem sobre a escolha de uma técnica
viável para a melhor tomada de decisão. Entretanto, no tocante aos procedimentos
técnicos, o trabalho caracteriza-se em pesquisa bibliográfica, pois foi desenvolvido
com base em material já elaborado, constituído principalmente por livros, artigos
científicos no formato físico e formato digital disponíveis na internet.
2. FUNDAMENTOS DE ANÁLISE DE DADOS
2.1. Conceitos Básicos
! Pesquisa
Etimologicamente, pesquisar vem do latim perquirěre, que significa “buscar com
cuidado, procurar por toda parte; informa-se, inquirir, perguntar, indagar
profundamente, aprofundar”. O termo conota estudo paciente e investigação científica
em que o pesquisador emprega um olhar diferente e cuidadoso sobre os dados para
descobrir tudo o que é conhecido sobre o assunto. (ZIKMUND, 2006)
! Marketing
KOTLER & ARMSTRONG (2007), definem marketing como sendo um processo
administrativo e social pelo qual indivíduos e organizações obtêm o que necessitam e
desejam por meio da criação e troca de valor com os outros, ou seja, é o processo pelo
qual as empresas criam valor para os clientes e constroem fortes relacionamentos com
eles para capturar seu valor em troca.
! Pesquisa de Marketing
Pesquisa de marketing é a identificação, a colecta, a análise e a disseminação
sistemática e objectiva das informações; e esse conjunto de acções é empreendido
para melhorar as tomadas de decisões relacionadas à identificação e a solução de
problemas (estas também conhecidas como oportunidades) em Marketing.
(MALHOTRA, 2005). Para MATTAR (2001), a pesquisa de marketing é a
investigação sistemática, controlada, empírica e crítica de dados com o objectivo de
descobrir e (ou) descrever factos e (ou) de verificar a existência de relações
presumidas entre factos (ou variáveis) referentes ao marketing de bens, serviços e
ideias, e ao marketing como área de conhecimento de administração. Pesquisa de
marketing é um processo sistemático e objectivo de geração de informação para
ajudar na tomada de decisão de marketing. (ZIKMUND, 2006).
2.2. Análise de Dados

A pesquisa, entendida como um processo sistemático e objectivo de geração de
informação para ajudar na tomada de decisão de marketing, compreende, segundo
AZEVEDO (2004), sete diferentes etapas, cada etapa com diversas fases, e cada fase
com diversos passos. Estas, são apresentados de forma sequencial por questão
meramente didática.
As etapas de processo de marketing são:

1) Definição do problema ou questões de pesquisa;
2) Desenvolvimento do plano de pesquisa;
3) Concepção dos instrumentos de colecta de dados;
4) Aplicação dos instrumentos de colecta de dados;
5) Sistematização dos resultados/ tabulação dos dados;
6) Avaliação dos resultados;
7) Tomar as decisões de marketing.
Portanto, a análise de dados é a quinta fase neste processo de marketing, a

sistematização dos resultados/ tabulação dos dados, isto é, tendo os dados colectados,
já sidos verificados, codificados e devidamente arquivados na memória do
computador, o passo a seguir é a realização dos cálculos e testes estatísticos, análises
e interpretações.
Os processos de análise e de interpretação, apesar de conceitualmente distintos,
aparecem sempre estreitamente relacionados:
A análise tem como objectivo organizar e sumarizar os dados de tal forma que
possibilitem o fornecimento de respostas ao problema proposto para investigação.
Já a interpretação tem como objectivo a procura do sentido mais amplo das
respostas, o que é feito mediante sua ligação a outros conhecimentos
anteriormente obtidos. (GIL, 1999)
Segundo MATTAR (2001), nesta etapa, há o uso intenso de estatística e de

computadores.
2.3.Escolha do Método para Análise dos Dados

Segundo MATTAR (2001), o processo da escolha do método visa apresentar todas as
considerações que devem ser levadas em conta para a correcta escolha da técnica de
análise. Para esta correcta escolha é necessário ter em consideração os seguintes
factores:
• O tipo de escala da(s) variável(eis): este factor é importante na medida em que
serve para a determinação da técnica correcta de análise e o tipo de escala
utilizada para medir a(s) variável(eis). Em função das diferentes características
das escalas, as técnicas possíveis de serem utilizadas na análise variam conforme
a escala seja nominal, ordinal ou intervalar.
• O nível de conhecimento dos parâmetros da população: chamamos de
parâmetros de uma população de pesquisa aos dados reais dessa população como
tipo de distribuição, média, desvio-padrão, entre outros. Uma técnica estatística é
chamada paramétrica quando o modelo do teste específica certas condições sobre
os parâmetros da população da qual a amostra foi obtida, para que possa ser
utilizado.
• O tipo de análise desejada: há dois tipos básicos de análises que podem ser
feitos: descrição dos dados e interferências a partir dos dados e os métodos
correspondentes denominam-se métodos descritivos e métodos inferenciais.
• O tipo de análise a serem analisadas conjuntamente: se o número de variáveis
for respectivamente uma, duas ou mais de duas, o pesquisador encontrará
métodos específicos aplicáveis a cada situação, respectivamente denominados:
univariados, bivariados e multivariados.
• O número de amostras e o seu grau de relacionamento: este factor, pode ter as
seguintes possibilidades: amostra simples, duas amostras relacionadas, duas
amostras não relacionadas, amostras múltiplas relacionadas e amostras múltiplas
não relacionadas.
• A relação de dependência entre variáveis: usa-se nos casos em que houver
mais de uma variável a ser analisada, simultaneamente. Sobre este aspecto, as
variáveis podem ter entre si uma relação de dependência ou de interdependência.
Numa relação de dependência, uma (ou mais de uma) das variáveis é escolhida,
segundo as condições estabelecidas pelo problema de pesquisa, para ser
examinada, no sentido de verificar sua dependência de outras variáveis.
Olhando para a conjuntura de todos os factores acima arrolados, o tipo de análise

compreende dois tipos básicos de análise, a saber: métodos descritivos e métodos
inferências.
! Métodos descritivos
Refere-se a transformação de dados brutos em uma forma que facilite a sua
compreensão e interpretação – reorganizando, ordenando e manipulando os dados
para gerar informações descritivas (ZIKMUND, 2006). Segundo MATTAR (2001),
estes métodos têm o objectivo de proporcionar informações sumarizadas dos dados
contidos no total de elementos da(s) amostra(s) estudada(s). A descrição das respostas
ou observações é o primeiro estágio da análise, o cálculo de médias, distribuições de
frequências e distribuições de frequências acumuladas são as formas mais comuns de
resumir os dados. Após o estágio descritivo, dá-se prosseguimento à análise, com os
pesquisadores aplicando ferramentas de estatística inferencial. (ZIKMUND, 2006)
Para MATTAR (2001), os métodos utilizados em pesquisa de marketing para a
descrição de dados compreendem:
• medidas de posição: servem para caracterizar o que é “típico” no grupo;
• medidas de dispersão: servem para medir como os indivíduos estão distribuídos
no grupo;
• medidas de associação: servem para medir o nível de relacionamento existente
entre duas ou mais variáveis.
! Métodos inferências
Compreendem um conjunto grande de testes que servem para julgar a validade de
hipóteses estatísticas sobre uma população ou para estimar seus parâmetros, a partir
das análises dos dados de uma amostra dessa população. Estes métodos são baseados
nas teorias das probabilidades, de forma que a incerta da inferência pode ser medida,
isto é, o risco de efectuar inferências incorrectas pode ser estabelecido. As técnicas
inferenciais compreendem:
• estimação de parâmetros: é um processo que consiste em utilizar dados
amostrais para estimar parâmetros populacionais desconhecidos;
• testes de hipóteses: fornecem ferramentas que nos permitem rejeitar ou não
rejeitar hipótese estatística através da evidência fornecida pela amostra.
2.4.Tabulação
De acordo com MATTAR (2001), tabulação consiste na contagem de números de
casos que ocorrem em cada categoria. ZIKMUND (2006), refere a tabulação como a
organização ordenada dos dados em uma tabela ou em outro formato resumido.
Contar o número de respostas diferentes para uma pergunta e organizá-las em uma
distribuição de frequência é uma tabulação simples ou tabulação marginal.
Para MATTAR (2001), a tabulação pode ser:
• Simples: quando envolve a simples contagem de números de casos que
ocorrem em cada uma das variáveis do estudo; ou
• Cruzada: quando as ocorrências em duas ou mais variáveis de estudos foram
contadas simultaneamente.
Com o desenvolvimento dos novos recursos tecnológicos é possível concluir a etapa
de tabulação cada vez mais rápida, isto é, a tabulação pode ser internamente manual,
internamente electrónica ou parcialmente manual e parcialmente electrónica.
Principais tipos de tabulação segundo MENDONÇA (2016):

• Tabulação Simples: o número de respostas é o igual ao número das pesquisas
realizadas. Nestes casos, o entrevistado só pode optar por uma das alternativas da
questão.
• Tabulação com Respostas Múltiplas: questões que permitem mais de uma
resposta por parte do entrevistado. Ou seja, o entrevistado pode optar por
responder a uma ou mais alternativas. Assim, o percentual de alternativas é
obtido tendo por base o total de entrevistados/respondentes.
• Tabulação com Perguntas Encadeadas: ocorre quando os dados recolhidos são
provenientes de duas ou mais perguntas encadeadas. Nestes casos, a análise dos
dados deve ser feita em função das duas perguntas.
• Tabulação com Perguntas em Aberto: para fazer tabulação de perguntas
abertas é necessário criar um padrão de respostas (categoria), de acordo com a
análise feita das respostas dos entrevistados.
• Tabulação de Perguntas com Escalas de Diferenciais: por se tratar de uma
análise qualitativa, é comum tabular a esse tipo de pergunta ponderando as
respostas. Isso é feito quando se deseja comparar os resultados entre os itens
avaliados. (Ex: Likert)
2.4.1. Métodos Tabular e Gráficos de Apresentação dos Dados
2.4.1.1.Tabelas
As tabelas são mais úteis para a apresentação de informação numérica, sobretudo
quando aspectos da informação foram colectados sobre cada item discutido.
Entretanto, o propósito de cada tabela é facilitar a síntese e a comunicação do
significado dos dados. (ZIKMUND, 2006: 435)
2.4.1.2.Gráficos
Os gráficos traduzem informações numéricas em uma forma visual, para que os
relacionamentos possam ser facilmente entendidos. Embora existam várias formas
padronizadas de apresentação de dados em gráficos, o pesquisador pode usar a
criatividade para aumentar a eficácia de uma determinada apresentação. As formas
gráficas de apresentação criam fortes impressões visuais. (ibdem: 436)
Alguns tipos de formas gráficas segundo ZIKMUND (2006):
• Gráfico de Pizza
Este é um dos tipos de gráficos mais úteis, que mostra a composição de uma
quantidade total em determinado período. Cada ângulo, ou “fatia”, é proporcional à
sua percentagem em relação ao todo e deve ser rotulado com sua descrição e
percentagem. O redator não deve tentar incluir um número muito grande de fatias;
cerca de seis seria o máximo. As empresas geralmente usam esse tipo de gráfico para
mostrar como as receitas foram usadas ou composição de suas vendas.
• Gráfico de Linha
Gráfico de linha são úteis para mostrar o relacionamento de uma variável com a outra.
A variável dependente geralmente é mostrada no eixo vertical e a independente no
horizontal. A variável independente mais comum nesses gráficos é o tempo, mas não
é a única. A linha para cada variável dependente deve ser de cor ou padrão diferente e
claramente rotulado. O pesquisador não deve tentar “espremer” muitas variáveis; isso
pode confundir em vez de esclarecer.
• Gráfico de barra
Gráfico de barra mostram mudanças no valor de uma variável dependente (plotada no
eixo vertical) a intervalos discretos da variável independente (no eixo horizontal). Um
gráfico de barra simples apresenta a frequência de resposta relacionada à primeira
variável. Nesse caso, cada barra precisa ser claramente identificada com uma cor ou
um padrão diferente. O pesquisador não deve usar muitas divisões ou variáveis
dependentes. Uma quantidade excessiva de detalhes obscurece a vantagem essencial
dos gráfico, que é justamente facilitar a compreensão dos relacionamentos.
• Histograma
Histograma é uma forma gráfica de apresentar a distribuição de frequências de uma
variável, ou seja, é um gráfico de barras verticais construído com os resultados da
tabela de frequência.
Gráfico de Pizza Gráfico de Barras Histograma Gráfico de Linha
Fonte: adaptado pelo grupo
10

2.5. Métodos Descritivos da Análise de Dados
Antes de mais, importa aqui referenciar que, dos métodos descritivos de análise dos
dados, as medidas de tendência central e as medidas de dispersão dependem apenas
do tipo de escala de medição da variável sob análise, e, por isso, serão apresentados a
seguir os conceitos de cada medida e seus respectivos exemplos.
2.5.1. Medidas de Posição

MATTAR (2001), as medidas de posição compreendem as medidas de tendência
central e as separatrizes.
2.5.1.1.Medidas de Tendência Central

Segundo SALSA (2005), medidas de tendência central são valores que, de certa
forma, e de maneira condensada, trazem consigo informações contidas nos dados
estatísticos. Elas funcionam como uma espécie de “medidas-resumo”, pois nos
passam a ideia de comportamento geral das observações estudadas. Podemos dizer
ainda que elas são como valores de referência, em torno dos quais, os outros se
distribuem.
O mesmo autor refere que, existem vários tipos de medidas utilizadas como medidas
de tendência central. Todavia, abordaremos as mais utilizadas, nomeadamente:
média, moda e mediana.
2.5.1.1.1. Média
Média aritmética ou simplesmente média, corresponde ao valor médio de um
conjunto de dados. É uma medida de tendência central de aplicação exclusiva a
variáveis intervalares. Dependendo da forma de apresentação dos dados, existem duas
fórmulas para o cálculo da média. (MATTAR, 2001)
É uma medida que funciona como ponto de equilíbrio de um conjunto de dados, é

representada pela letra grega µ, quando seu cálculo é feito a partir de todos os valores
de uma população. Se usarmos dados amostrais para obtê-la, a mesma é referida como
𝑋 (ler-se “Xis barra”). (SALSA, 2005)
11

Fórmulas para o cálculo da média
Para dados que não estejam na forma de distribuição de frequências:

População Amostra
! !
!!! 𝑋! !!! 𝑋!
𝜇= 𝑋=
𝑁 𝑛
Para dados que estejam na forma de distribuição de frequências:
População Amostra
! !
!!! 𝑓! 𝑋! !!! 𝑓! 𝑋!
𝜇= 𝑋=
𝑁 𝑛
• Exemplo 1: Dados isolados ou não tabelados

Suponha que suas notas em um selecção para um curso de aperfeiçoamento foram:
5,6; 4,8; 8,0; 8,6; 6,4; 4,8; 9,4. Então, se todas tem o mesmo peso, sua média será:
5,6 + 4,8 + 8,0 + 8,6 + 6,4 + 4,8 + 9,4 48
𝑥= = = 6,86
7 7
• Exemplo 2: Dados organizados em uma tabela de frequência

Pontuação (xi) Frequência (fi) xifi
4 6 24
6 8 48
8 5 40
9 5 45
10 3 30
Total 27 187
Neste caso, a média é dada da seguinte forma:

4.6 + 6.8 + 8.5 + 9.5 + 10.3 187
𝑥= = = 6,92
6+8+5+5+3 27
12

• Exemplo 3: Dados agrupados em intervalos de classe

Na tabela abaixo, pode-se observar 3 intervalos de classe. Cada intervalo possui uma
frequência e um ponto médio. O ponto médio é obtido através da soma do limite
superior com o limite inferior, dividida por 2. Para classe 1 tem-se:
4 + 6 10
𝑥! = = =5
2 2
Onde 4 e 6 correspondem, respectivamente, ao limite superior e inferior da 1a classe.
Pontuação (Médias) Frequência (fi) Ponto médio (xi) fixi

4|—6 6 5 30
6|—8 8 7 56
8|—10 13 9 117
Somatórios 27 ... 203
Nesta situação, a média é dada como:

6.5 + 8.7 + 13.9 203
𝑥= = = 7,51
6 + 8 + 13 27
2.5.1.1.2. Moda
Para ZIKMUND (2006), moda é a medida de tendência central que identifica o valor
que ocorre com maior frequência. MATTAR (2001), acrescenta ainda que, é uma
medida típica de tendência central para variáveis nominais, mais que pode também ser
aplicada à variáveis ordinais ou intervalares, desde que tenham sido previamente
agrupadas em classes, neste caso, a classe que obtiver a maior frequência é
denominada classe modal.
Exemplo: Olhando para o exemplo (1) do cálculo da média, onde as notas foram,
respectivamente, 5,6; 4,8; 8,0; 8,6; 6,4; 4,8; 9,4. A moda seria 4,8.
13

2.5.1.1.3. Mediana
Mediana é o ponto central da distribuição, ou o 50o percentil, isto é, o valor abaixo do
qual estão metade dos valores na amostra. (ZIKMUND, 2006). Segundo SALSA
(2005), para obter a mediana precisamos primeiramente analisar o número de
elementos de conjunto n, identificando se este número é par ou ímpar.
− Se for ímpar: quando n é impar haverá apenas um valor central no conjunto
ordenado, cuja posição e calculada pela seguinte fórmula:
𝑛+1
𝐸!! =
2
Exemplo: Para o seguinte conjunto de dados, 5,6; 4,8; 8,0; 8,6; 6,4; 4,8; 9,4;
encontrar a mediana. Primeiramente precisamos construir o rol, ou seja, ordenar os
valores. Desse modo tem-se: 4,8; 4,8; 5,6; 6,4; 8,0; 8,6; 9,4. Para este conjunto o valor
de n é igual a 7.
7+1 8
𝐸!! = = =4
2 2
Com isso, encontramos que a mediana ocupa a 4a posição desse conjunto, logo a
mediana é igual a 6,4.
− Se n for par: neste caso, haverá dois valores centrais, os quais se encontram
nas posições:
𝑛 𝑛
𝑒 +1
2 2
Exemplo: Para o conjunto dado: 5,6; 4,8; 8,0; 8,6; 6,4; 9,4; encontrar a mediana.
Primeiramente, constrói-se o rol: 4,8; 5,6; 6,4; 8,0; 8,6; 9,4. Neste caso, n = 6, logo,
usaremos as duas fórmulas.
6 6
=3𝑒 +1=4
2 2
Neste caso a mediana está entre o 3o e o 4o valor do conjunto, isto é, entre 6,4 e 8,0. A
média desses valor nos dará a mediana. Desse modo tem-se:
!,!!!,!
𝑀! = !
=7,2
Logo, a mediana desse conjunto é igual a 7,2.
De acordo com MURTEIRA (1993), esta é a principal concorrente da média como

medida de localização em distribuições com tendência central, sobretudo simétricas.
14

2.5.1.2.Separatrizes
São valores que separam o rol (os dados ordenados) em quatro (quartis), dez (decis)
ou em cem (percentis) partes iguais. Para sua correcta aplicação, exige-se que os
dados estejam organizados num rol.
2.5.1.2.1. Quartis (Qi)

Segundo MATTAR (2001), são os valores da variável correspondentes aos três
elementos que dividem o conjunto de dados em quatro subgrupos de tamanhos iguais.
São chamados, respectivamente:
• Primeiro Quartil (Q1) – valor do elemento que divide o grupo
numericamente ordenado em duas partes, a primeira com 25%, e a segunda,
com 75% dos elementos do grupo;
• Segundo Quartil (Q2) – valor do elemento que divide o grupo numericamente
ordenado em duas partes iguais;
• Terceiro Quartil (Q3) – valor do elemento que divide o grupo numericamente
ordenado em duas partes, a primeira com 75%, e a segunda, com 25% dos
elementos do grupo.
2.5.1.2.2. Decis (Di)

Segundo UNAMA (s/d), decis são valores que dividem o conjunto de dados
ordenados (rol) em 10 (dez) partes iguais e assim são chamados, respectivamente:
• Primeiro Decil (D1) – valor situado de tal modo na série de dados que 10%
das observações são menores que ele e 90% são maiores;
• Segundo Decil (D2) – valor situado de tal modo na série de dados que 20%
. . . . . . . . . . .
• Nono Decil (D9) – valor situado de tal modo na série de dados que 90% das
observações são menores que ele e 10% são maiores.
15

2.5.1.2.3. Percentis ou Centis (Ci)

Para o mesmo autor, percentis ou centis, são valores que dividem o conjunto de dados
ordenados (rol) em 100 (cem) partes iguais e assim são chamados, respectivamente:
• Primeiro Percentil (C1) – valor situado de tal modo na série de dados que 1%
• Segundo Percentil (C2) – valor situado de tal modo na série de dados que 2%
. . . . . . . . . . .
• Nonagésimo Percentil (C99) – valor situado de tal modo na série de dados que
99% das observações são menores que ele e 1% são maiores.
2.5.2. Medidas de Dispersão

O autor diz ainda que as medidas de dispersão, são medidas estatísticas utilizadas para
avaliar o grau de variabilidade ou dispersão dos valores em torno de um valor central;
geralmente as médias. Servem para medir a representatividade das medidas da
tendência central. Segundo MATTAR (2001), as medidas de tendência central nos
informam a respeito do ponto de concentração da maioria das respostas, porém não
nos informam nada a respeito do grau de concentração dessas respostas nem da
maneira como as observações estão dispersas por toda a distribuição. O conhecimento
da dispersão dos dados de uma variável é importante, não só por esta razão, como
porque permite avaliar a confiabilidade de uma medida de tendência central numa
amostra como parâmetro da população.
Para o mesmo autor, são tipos de medidas de dispersão os seguinte:

• Distribuição de frequência absoluta e relativa
A distribuição de frequência absoluta é resultante da contagem de ocorrências de
respostas por opção possível da variável, e a relativa é resultante da divisão da
frequência absoluta de cada opção pelo total de elementos da amostra. Constituem as
únicas medidas de dispersão que podem ser aplicadas a variáveis nominais.
• Ordenamento
É a disposição de todos os elementos do grupo de forma crescente ou decrescente,
segundo as avaliações efectuadas para a variável ordinal pesquisada.
16

• Distribuição de frequências absoluta acumulada e relativa acumulada

A distribuição de frequência absoluta acumulada é resultante da contagem
acumulativa da ocorrência de respostas até um determinado valor da variável, e a
relativa acumulada, resultante da divisão de frequência absoluta acumulada pelo total
de elementos da amostra. Constituem medidas de dispersão exclusivas de serem
aplicadas a variáveis intervalares.
• Amplitude de uma distribuição

É uma medida de tendência central típica de variáveis intervalares. A amplitude é a
diferença entre o maior e o menor valor da variável observados numa amostra. Desta
forma, ela fornece a dimensão do campo de variação da variável. A fórmula para o
cálculo da amplitude é:
𝐴 = 𝑥 𝑚𝑎𝑖𝑜𝑟 − 𝑥 𝑚𝑒𝑛𝑜𝑟
• Desvio-médio
É também uma medida de dispersão típica de variáveis intervalares, pois indica o grau
de dispersão do total dos indivíduos num grupo, em relação a uma determinada
variável. O desvio-médio é a média aritmética das diferenças (em módulo, ou seja,
despreza-se o sinal) entre cada observação e a média das observações. O desvio-
médio serve para comparar duas distribuições com igual média e saber qual das duas
está mais ou menos dispersa. A fórmula para o desvio-médio é:
População Amostra
! !
!!! 𝑋! − 𝜇 !!! 𝑋! − 𝑋
𝐷𝑀 = 𝐷𝑀 =
𝑁 𝑛
• Desvio-padrão
É a soma dos quadrados das diferenças entre as observações e a média, dividido pelo
número de observações é conhecido como variância. O desvio-padrão é a raiz
quadrada da variância. A fórmula para o cálculo do desvio-padrão é:
População Amostra
Original Computacional Original Computacional
! ! !
(𝑋 − 𝜇)! 𝑋! 𝑋 𝑥−𝑥 𝑥! 𝑥
Dados brutos 𝜎= 𝜎= − 𝑆= 𝑆= −
𝑁 𝑁 𝑁 𝑛 𝑛 𝑛𝑁
Dados em distribuição 𝑓 𝑋 ! 𝑓𝑋
!
𝑓 𝑥 ! 𝑓𝑥
!
𝜎= − 𝑆= −
de frequência 𝑁 𝑁 𝑛 𝑛
17

• Coeficiente da variação
O desvio-padrão é uma medida absoluta da dispersão e é apresentado nas mesmas
unidades de medida originais em que os dados foram colectados. Às vezes, em
pesquisas de marketing, há a necessidade da comparação da dispersão de diversas
distribuições que não possuam as mesmas médias ou que não estejam nas mesmas
escalas ou unidades de medidas e que, por isso, não podem ser feitas com os desvios
padrões. Os coeficientes de variação permite efectuar essas comparações. O
coeficiente de variação é uma medida abstrata da dispersão e é obtido através da
divisão do desvio-padrão pela média.
População Amostra
𝜎 𝑆
𝐶𝑉! = 𝐶𝑉! =
𝜇 𝑥
2.5.3. Medidas de Associação

Para MATTAR (2001), as medidas de associação servem para verificar se dois ou
mais conjuntos de dados estão relacionados para medir o relacionamento existente. É
um método bastante útil em marketing porque ajuda a relacionar quanto a preferência
a um produto está associado a classe social dos consumidores, ajuda nos processos de
segmentação de mercado e no planeamento de marketing; relacionar quanto a
intensidade de gastos promocionais está relacionado aos gastos de venda ou de
participação no mercado.
2.6.Métodos Inferenciais
A inferência diz respeito a como se pode assumir conclusões para toda uma população
a partir das medições e da análise de apenas uma parte dela de forma a que o risco de
se realizar conclusões incorretas possa ser medido. A inferência diz respeito a dois
tipos de problemas: estimar os parâmetros de uma população e realizar testes de
hipóteses. (idem)
É através dos métodos da inferência estatística que se pode assumir, por exemplo com
determinada probabilidade conhecida de estar errado, a média calculada numa
amostra pode ser assumida como estimativa do parâmetro da população. É também
através dos métodos de inferência estatísticas que se pode realizar os teste de
hipóteses a respeito, por exemplo da diferença entre duas distribuições. (idem)
18

2.6.1. Testes de Hipóteses
De acordo com ZIKMUND (2006), em teoria de marketing uma hipótese é uma

proporção ou uma suposição não comprovada que tenta explicar certos factos ou
fenómenos, ou por outra é uma declaração de um pressuposto sobre a natureza do
mundo. Em uma forma mais simples uma hipótese é um palpite.
Segundo MATTAR (2001), hipótese pode surgir através da especulação sobre um
fenómeno de marketing sobre o resultado esperado de uma determinada acção. Uma
vez selecionada hipóteses importantes a serem testadas o próximo passo é a colheita
de dados empíricos que, analisados, permitirão mantê-las ou rejeita-las. Para poder
atingir o objectivo de manutenção, revisão ou rejeição de determinada hipóteses, é
necessário ter procedimentos bem definidos e objectivos para a realização do teste,
que compreendem:
! Estabelece a hipótese nula (𝐻! ) e a hipótese alternativa (𝐻! ) tendo em vista a
hipótese da pesquisa;
! Selecionar o teste estatístico adequado a situação;
! Estabelecer o nível de significância;
! Determinar ou assumir a distribuição amostral da prova estatística sobre a
hipótese nula (𝐻! );
! Com base em 1, 2, 3 e 4 definir a região da hipótese nula (𝐻! );
! Calcular o valor da prova estatística a partir dos dados da amostra;
! Tomar a decisão quanto a aceitação ou rejeição da hipótese nula (𝐻! ).
Hipóteses nula (𝐻! ) – é uma declaração sobre um status quo que afirma que qualquer
modificação do que era tido como verdadeiro se dará inteiramente devido a um erro
aleatório de amostragem.
Hipóteses alternativa (𝐻! ) – é uma expressão que indica o oposto da hipótese nula.
Escolha do teste estatístico – a escolha do teste estatístico depende de vários

factores, nomeadamente:
1. Dependendo da escala dos dados e da disponibilidade ou não de dados da
população, é entre testes paramétricos ou não paramétricos;
19

2. Ocorre quando houver mais de um tipo de teste que possa ser aplicado a
situação. Há dois tipos de erros que podem ser cometidos num teste de
hipótese. O primeiro chamado erro de tipo I é o de rejeitar 𝐻! quando
verdadeira. O segundo é chamado erro do tipo II, é o de aceitar 𝐻! quando
falsa;
3. Deverá ser feita tendo em vista o tipo de escala em que os dados foram
medidos.
4. Deverá ocorrer quando se tratar de apenas uma amostra, duas amostras
relacionadas e não relacionadas ou varias amostras relacionadas e não
relacionadas.
Nível de significância - é uma probabilidade crítica na escolha entre a hipóteses nula

e a hipótese alternativa ou seja o nível de probabilidade que é muito baixa para
garantir suporte para a hipótese nula.
Determinar ou assumir a distribuição amostral – é a distribuição derivada (ou

teórica) de uma população. A distribuição derivada é a distribuição formada por todas
as possíveis amostras probabilísticas de mesmo tamanho de uma população.
Determinar a região de rejeição – é uma região da distribuição amostral. A

distribuição amostral inclui todos os possíveis valores que um teste estatístico pode
assumir sobre 𝐻! .
Calcular o valor da priva estatística – a partir dos dados da amostra pesquisada e

das formulações aplicáveis a distribuição amostral determinada ou assumida, calcular
o valor da prova estatística. Esse valor é também denominado de valor calculado.
Esse valor dependendo do teste pode se apresentar em forma de probabilidade ou em
forma de ordenada.
Decidir – tendo valor tabelado, o valor calculado e a região de rejeição, pode-se

facilmente decidir pela rejeição ou não da hipóteses nula e, consequentemente, pela
adoção da 𝐻! .
20

Exemplo 1: No ano de 2001 foi feita uma pesquisa em uma estância turística e
constatou-se que apenas 60% dos visitantes estavam satisfeitos com a infraestrutura
oferecida. Com o intuito de aumentar essa proporção a prefeitura fez algumas
melhorias na cidade e depois de um ano, resolveu verificar se as mesmas produziram
o efeito desejado. Para isso entrevistou 50 turistas.
(a) Formulação do problema como um problema de teste de hipóteses.

p: proporção de visitantes satisfeitos com a infraestrutura oferecida: Hipótese Nula H
: p = 0,60; Hipótese Alternativa A : p > 0,60.
(b) Significados dos erros tipo I e tipo II.

Erro tipo I: Rejeitar H quando H é verdadeira (afirmar que a proporção de visitantes
satisfeitos com a infraestrutura oferecida é maior que 0,60 quando, na verdade, ela é
0,60). Erro tipo II: Não rejeitar H quando H é falsa (afirmar que a proporção de
visitantes satisfeitos com a infraestrutura oferecida é 0,60 quando, na verdade, ela é
maior que 0,60).
(c) A região crítica para um nível de significância de 10%.

Para termos uma significância de 0,10 precisamos que P(X≥35), ou seja, teremos uma
significância de 0,0954 (9,54%), assim: RC={X ≥ 35}.
(d) A conclusão se, 37 dos 50 turistas entrevistados estavam satisfeitos com a

infraestrutura oferecida.
Como kobservado=37 pertence à Região Crítica, logo rejeitamos a hipótese nula H.
Exemplo 2: Um jornal afirma que 40% dos seus leitores têm curso superior. Um
jornal concorrente afirma que essa proporção é menor. Para verificar sua suspeita, o
concorrente sorteou 30 leitores daquele jornal e consultou-os se têm curso superior.
(a) Formulação do problema como um problema de teste de hipóteses.

Considerando como p = proporção real de leitores do jornal com curso superior
temos: Hipótese Nula H: p = 0,40 (afirmação do jornal); Hipótese Alternativa A : p <
0,40 ( afirmação do concorrente).
21

(b) Interpretação dos erros tipo I e tipo II.

Erro tipo I: Rejeitar H quando H é verdadeira (afirmar que a proporção de leitores do
jornal com curso superior é menor que 0,40 quando, na verdade, ela é 0,40). Erro tipo
II: Não rejeitar H quando H é falsa (afirmar que a proporção de leitores do jornal com
curso superior é 0,40 quando, na verdade, ela é menor que 0,40).
(c) A região crítica para um nível de significância de 10%.

Para termos uma significância de 0,10 precisamos que P(X≤8), ou seja, teremos uma
significância de 0,094 (9,4%), assim: RC={X ≤ 8}.
(d) A conclusão do concorrente se 12 leitores responderam sim, com base na

região crítica construída em (c).
Para o jornal concorrente, kobservado=12 não pertence à Região Crítica, logo não
rejeitamos a hipótese nula H.
2.7.Métodos de Correlação e Regressão

Para MATTAR (2001), a correlação e a regressão são técnicas de análises estatísticas
que têm grande utilidade na identificação e na quantificação do relacionamento entre
uma variável critério e uma ou mais variáveis prognóstico. Com muita frequência, na
prática da pesquisa de marketing, faz-se necessário verificar a existência de
relacionamento entre duas ou mais variáveis. Procura-se expressar esse
relacionamento, com base em dados observados, sob a matemática de uma equação
que interligue as variáveis e permita que conhecendo-se o(s) valor(es) de uma(s)
possa ser previsto o valor da outra.
Os conceitos de correlação e regressão, apesar de diferentes, estão intimamente
relacionados:
A regressão refere-se à natureza da associação estatística, isto é, a
correspondência de uma variável critério em relação a uma ou mais variáveis
prognóstico. A correlação diz respeito ao grau de associação ou correspondência
existente entre uma variável-critério e uma ou mais variáveis-prognóstico.
(MATTAR, 2001)
22

2.7.1. Regressão
Em pesquisas de marketing é frequente a necessidade de, com base em dados
amostrais, prever o valor de uma variável (critério), correspondente ao conhecido
valor de uma, ou mais de uma, variável (prognóstico). Isto pode ser conseguido
mediante a construção de uma equação, ou de uma curva de mínimos quadrados. A
equação, ou curva, resultante é denominada de regressão de Y para X, visto que Y é
avaliado a partir de X. Quando a relação for apenas entre duas variáveis a regressão é
denominada simples; quando for entre uma variável e mais de uma variável, é
denominada múltipla. (MATTAR, 2001)
Regressão linear simples: para o caso particular de uma reta, a curva de regressão
que se ajusta aos dados tem a seguinte equação:
𝑌 = 𝑎! + 𝑎! 𝑋 ∗
Onde: Y = a variável-critério, e representa o valor esperado de Y dado um
determinado valor de X
X = a variável-prognostico
𝑎! = valor de Y pata X = 0 𝑎! = valor médio de Y por unidade de X
Regressão linear múltipla: compreende a regressão linear de uma variável critério em
relação a duas ou mais variáveis prognóstico.
2.7.2. Coeficiente de Correlação

Segundo MATTAR (2001), o coeficiente de correlação é a medida do grau de
associação entre a variável Y (critério) e as variáveis X, Z etc é definido como a raiz
quadrada do coeficiente de determinação e nota-se por r.
𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 (𝑌𝑒𝑠𝑡 − 𝑌)!

𝑟= =
𝑣𝑟𝑖𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙 𝑌−𝑌 !
O coeficiente de correlação varia entre -1 e +1. Sendo -1 significa que ha total

correlação negativa, +1 total correlação positiva e 0 a inexistência de correlação. O
coeficiente de correlação também pode ser expresso por:
𝑆 ! 𝑦. 𝑥
𝑟= 1−
𝑆𝑦 !
Onde:
𝑆 ! 𝑦. 𝑥 = variância de y em relação a x, e 𝑆𝑦 ! = variância de y
23

Define-se como coeficiente de determinação e nota-se por 𝑟! o quociente da variação

explicada pela variação total
𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑌𝑒𝑠𝑡 − 𝑌 !
𝑟! = =
𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙 𝑌−𝑌 !
Este coeficiente nos dá uma medida da quantidade da variação explicada na variável
critério pelas variáveis prognóstico consideradas.
A análise de correlação dedica-se a inferências estatísticas das medidas de associação

linear que se seguem:
− coeficiente de correlação simples: mede a “força” ou “grau” de
relacionamento linear entre duas variáveis, sendo a fórmula matemática que
representa esta associação igual a Y=a1 + a2X;
− coeficiente de correlação múltipla: mede a “força” ou “grau” de
relacionamento entre uma variável dependente e um conjunto de outras
variáveis.
24

3. CONCLUSÃO
Findo trabalho, chegamos a conclusão de que a pesquisa de marketing é

compreendida como um processo ordenado e objectivista de geração de informação
para o auxilio na tomada de decisão de marketing. Portanto, uma vez perfeitamente
definido o problema, desenvolvido o plano, feita a colecta de dados, o passo seguinte
é a sistematização dos resultados e posterior avaliação e a tomada da decisão. Existem
muitas perguntas que pode-se querer responder a partir dos dados colectados. É
imprescindível ter técnicas de resumo que passem informações de uma forma clara e
fácil de entender para podermos resolver problemas de forma eficiente. A estatística
descritiva lida com as formas de obter informações úteis a partir de um conjunto de
dados, de forma a facilitar a resolução de problemas. Ela o faz a partir de medidas-
resumo, gráficos e tabelas. Simplesmente olhar para os dados não fornece um quadro
claro do que pode estar acontecendo, especialmente quando a quantidade de dados for
muito grande. A estatística descritiva possui uma grande quantidade de instrumentos
de resumo que podem ser aplicados às diversas situações. A estatística inferencial por
sua vez, tem o objectivo de tirar conclusões sobre a população com base nos
resultados observados em amostras extraídas dessa população. Esta, baseia-se num
processo de indução, isto é, um processo de raciocínio em que, partindo do
conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo.
Quanto a correlação e a regressão, mesmo apresentado algumas diferenças estão
intimamente ligas, isto é, ambas permitem avaliar se existem relação entre o
comportamento de duas ou mais variáveis e em que medida se dá tal interação.
25

4. REFERÊNCIAS BIBLIOGRÁFICAS
1. AZEVEDO, Gustavo. C. I. (2004). Pesquisa de Mercado. SEBRAE-SP

2. DENCKER, Ada de Freitas Maneti (1998). Métodos e técnicas de pesquisa em
turismo. Sao Paulo.
3. GIL, 1999
4. KOTLER, P. ARMSTRONG, G. (2007). Princípios de Marketing. 12a ed.,
São Paulo: Pearson Prentice Hall.
5. MALHOTRA, Naresh K. et al. (2005). Introdução à Pesquisa de Marketing.
Tradutor Robert Brian Taylor. São Paulo: Pearson Prentice Hall.
6. MATTAR, Fauze Najib (2001). Pesquisa de Marketing. 3a Edição, Editora
Atlas, SP.
7. MENDONÇA, Inês. Tabulação de dados, 2016. Disponível em:
<http://www.delaube.com/pesquisa/?p=387>, Acesso em: 6 de Setembro de
2018
8. MURTEIRA, B. J. (1993). Análise exploratória de dados – Estatística
Descritiva. McGraw-Hills, Portugal.
9. SALSA, I. da S.; Moreira, J. A.; Pereira, M.G.. Matemática e Realidade.
Medidas de tendência central: média, mediana e moda. Natal, RN: EDUFRN
Editora da UFRN, 2005. Disponível em: <http://xa.yimg.com/kq/groups-
/22932771/2143145043/name/4426477- Matematica-e-Realidade-Aula-08-
551.pdf>. Acesso em: 12 de Setembro de 2018.
10. UNAMA. Estatística aplicada à Engenharia. (s/d). Disponível em:
<http://eadcampus.spo.ifsp.edu.br/pluginfile.php/29912/mod_resource/content
/1/medidas%20de%20posição.pdf>. Acesso em: 12 de Setembro de 2018.
11. ZIKMUND, William G. (2006). Princípios da Pesquisa de Marketing. 2a
Edição, Thomson, SP.
26

Fundamentos de Análise de Dados - Pesquisa de Mercado

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Fundamentos de Análise de Dados - Pesquisa de Mercado

Diunggah oleh

Hak Cipta:

Format Tersedia

ESCOLA SUPERIOR DE HOTERALIA E TURISMO DE INHAMBANE

Curso de Gestão Pós Laboral

Cadeira: Pesquisa de Mercados

Tema: Fundamentos de Análise de Dados

Inhambane, Setembro de 2018

2. FUNDAMENTOS DE ANÁLISE DE DADOS .................................................. 4

4. REFERÊNCIAS BIBLIOGRÁFICAS ............................................................. 26

Os estudos de administração e a teoria organizacional têm-se caracterizado,

• Apresentar os diversos métodos de análise de dados;

Para Dencker (1998:19), metodologia é:

O presente trabalho, quanto aos objectivos caracteriza-se como pesquisa exploratória.

2. FUNDAMENTOS DE ANÁLISE DE DADOS

2.1. Conceitos Básicos

2.2. Análise de Dados

As etapas de processo de marketing são:

Portanto, a análise de dados é a quinta fase neste processo de marketing, a

Segundo MATTAR (2001), nesta etapa, há o uso intenso de estatística e de

2.3.Escolha do Método para Análise dos Dados

Olhando para a conjuntura de todos os factores acima arrolados, o tipo de análise

Principais tipos de tabulação segundo MENDONÇA (2016):

2.4.1. Métodos Tabular e Gráficos de Apresentação dos Dados

Alguns tipos de formas gráficas segundo ZIKMUND (2006):

Gráfico de Pizza Gráfico de Barras Histograma Gráfico de Linha

Fonte: adaptado pelo grupo

2.5. Métodos Descritivos da Análise de Dados

2.5.1. Medidas de Posição

2.5.1.1.Medidas de Tendência Central

É uma medida que funciona como ponto de equilíbrio de um conjunto de dados, é

Fórmulas para o cálculo da média

Para dados que não estejam na forma de distribuição de frequências:

• Exemplo 1: Dados isolados ou não tabelados

• Exemplo 2: Dados organizados em uma tabela de frequência

Neste caso, a média é dada da seguinte forma:

• Exemplo 3: Dados agrupados em intervalos de classe

Pontuação (Médias) Frequência (fi) Ponto médio (xi) fixi

Nesta situação, a média é dada como:

Logo, a mediana desse conjunto é igual a 7,2.

De acordo com MURTEIRA (1993), esta é a principal concorrente da média como

2.5.1.2.1. Quartis (Qi)

2.5.1.2.2. Decis (Di)

2.5.1.2.3. Percentis ou Centis (Ci)

2.5.2. Medidas de Dispersão

Para o mesmo autor, são tipos de medidas de dispersão os seguinte:

• Distribuição de frequências absoluta acumulada e relativa acumulada

• Amplitude de uma distribuição

2.5.3. Medidas de Associação

2.6.1. Testes de Hipóteses

De acordo com ZIKMUND (2006), em teoria de marketing uma hipótese é uma

Escolha do teste estatístico – a escolha do teste estatístico depende de vários

Nível de significância - é uma probabilidade crítica na escolha entre a hipóteses nula

Determinar ou assumir a distribuição amostral – é a distribuição derivada (ou

Determinar a região de rejeição – é uma região da distribuição amostral. A

Calcular o valor da priva estatística – a partir dos dados da amostra pesquisada e

Decidir – tendo valor tabelado, o valor calculado e a região de rejeição, pode-se

(a) Formulação do problema como um problema de teste de hipóteses.

(b) Significados dos erros tipo I e tipo II.

(c) A região crítica para um nível de significância de 10%.

(d) A conclusão se, 37 dos 50 turistas entrevistados estavam satisfeitos com a

(a) Formulação do problema como um problema de teste de hipóteses.

(b) Interpretação dos erros tipo I e tipo II.

(c) A região crítica para um nível de significância de 10%.

(d) A conclusão do concorrente se 12 leitores responderam sim, com base na

2.7.Métodos de Correlação e Regressão