III Grupo
Nomes:
Adelaide Quentura Matabele
António Manuel Guirrugo
Arsénio Linda Zaqueu
Druty Mansuclal
Ércio Jaime Da Silva
Mácida Amade Abdul Wahabo
Raúl Inácio Laquene
Victória Paulo Muchanga
Docente:
dr. Leonildo Fernando Benjamim
1. INTRODUÇÃO .................................................................................................... 1
1.1. Objectivos ....................................................................................................... 2
1.2. Metodologia .................................................................................................... 3
3. CONCLUSÃO ..................................................................................................... 25
1. INTRODUÇÃO
1.1.Objectivos
Geral:
• Debruçar sobre a análise de dados de uma pesquisa de marketing
Específicos:
1.2.Metodologia
! Pesquisa
Etimologicamente, pesquisar vem do latim perquirěre, que significa “buscar com
cuidado, procurar por toda parte; informa-se, inquirir, perguntar, indagar
profundamente, aprofundar”. O termo conota estudo paciente e investigação científica
em que o pesquisador emprega um olhar diferente e cuidadoso sobre os dados para
descobrir tudo o que é conhecido sobre o assunto. (ZIKMUND, 2006)
! Marketing
KOTLER & ARMSTRONG (2007), definem marketing como sendo um processo
administrativo e social pelo qual indivíduos e organizações obtêm o que necessitam e
desejam por meio da criação e troca de valor com os outros, ou seja, é o processo pelo
qual as empresas criam valor para os clientes e constroem fortes relacionamentos com
eles para capturar seu valor em troca.
! Pesquisa de Marketing
Pesquisa de marketing é a identificação, a colecta, a análise e a disseminação
sistemática e objectiva das informações; e esse conjunto de acções é empreendido
para melhorar as tomadas de decisões relacionadas à identificação e a solução de
problemas (estas também conhecidas como oportunidades) em Marketing.
(MALHOTRA, 2005). Para MATTAR (2001), a pesquisa de marketing é a
investigação sistemática, controlada, empírica e crítica de dados com o objectivo de
descobrir e (ou) descrever factos e (ou) de verificar a existência de relações
presumidas entre factos (ou variáveis) referentes ao marketing de bens, serviços e
ideias, e ao marketing como área de conhecimento de administração. Pesquisa de
marketing é um processo sistemático e objectivo de geração de informação para
ajudar na tomada de decisão de marketing. (ZIKMUND, 2006).
A análise tem como objectivo organizar e sumarizar os dados de tal forma que
possibilitem o fornecimento de respostas ao problema proposto para investigação.
Já a interpretação tem como objectivo a procura do sentido mais amplo das
respostas, o que é feito mediante sua ligação a outros conhecimentos
anteriormente obtidos. (GIL, 1999)
! Métodos descritivos
Refere-se a transformação de dados brutos em uma forma que facilite a sua
compreensão e interpretação – reorganizando, ordenando e manipulando os dados
para gerar informações descritivas (ZIKMUND, 2006). Segundo MATTAR (2001),
estes métodos têm o objectivo de proporcionar informações sumarizadas dos dados
contidos no total de elementos da(s) amostra(s) estudada(s). A descrição das respostas
ou observações é o primeiro estágio da análise, o cálculo de médias, distribuições de
frequências e distribuições de frequências acumuladas são as formas mais comuns de
resumir os dados. Após o estágio descritivo, dá-se prosseguimento à análise, com os
pesquisadores aplicando ferramentas de estatística inferencial. (ZIKMUND, 2006)
Para MATTAR (2001), os métodos utilizados em pesquisa de marketing para a
descrição de dados compreendem:
• medidas de posição: servem para caracterizar o que é “típico” no grupo;
• medidas de dispersão: servem para medir como os indivíduos estão distribuídos
no grupo;
• medidas de associação: servem para medir o nível de relacionamento existente
entre duas ou mais variáveis.
! Métodos inferências
Compreendem um conjunto grande de testes que servem para julgar a validade de
hipóteses estatísticas sobre uma população ou para estimar seus parâmetros, a partir
das análises dos dados de uma amostra dessa população. Estes métodos são baseados
nas teorias das probabilidades, de forma que a incerta da inferência pode ser medida,
isto é, o risco de efectuar inferências incorrectas pode ser estabelecido. As técnicas
inferenciais compreendem:
• estimação de parâmetros: é um processo que consiste em utilizar dados
amostrais para estimar parâmetros populacionais desconhecidos;
• testes de hipóteses: fornecem ferramentas que nos permitem rejeitar ou não
rejeitar hipótese estatística através da evidência fornecida pela amostra.
2.4.Tabulação
De acordo com MATTAR (2001), tabulação consiste na contagem de números de
casos que ocorrem em cada categoria. ZIKMUND (2006), refere a tabulação como a
organização ordenada dos dados em uma tabela ou em outro formato resumido.
Contar o número de respostas diferentes para uma pergunta e organizá-las em uma
distribuição de frequência é uma tabulação simples ou tabulação marginal.
Para MATTAR (2001), a tabulação pode ser:
• Simples: quando envolve a simples contagem de números de casos que
ocorrem em cada uma das variáveis do estudo; ou
• Cruzada: quando as ocorrências em duas ou mais variáveis de estudos foram
contadas simultaneamente.
Com o desenvolvimento dos novos recursos tecnológicos é possível concluir a etapa
de tabulação cada vez mais rápida, isto é, a tabulação pode ser internamente manual,
internamente electrónica ou parcialmente manual e parcialmente electrónica.
2.4.1.1.Tabelas
As tabelas são mais úteis para a apresentação de informação numérica, sobretudo
quando aspectos da informação foram colectados sobre cada item discutido.
Entretanto, o propósito de cada tabela é facilitar a síntese e a comunicação do
significado dos dados. (ZIKMUND, 2006: 435)
2.4.1.2.Gráficos
Os gráficos traduzem informações numéricas em uma forma visual, para que os
relacionamentos possam ser facilmente entendidos. Embora existam várias formas
padronizadas de apresentação de dados em gráficos, o pesquisador pode usar a
criatividade para aumentar a eficácia de uma determinada apresentação. As formas
gráficas de apresentação criam fortes impressões visuais. (ibdem: 436)
• Gráfico de Pizza
Este é um dos tipos de gráficos mais úteis, que mostra a composição de uma
quantidade total em determinado período. Cada ângulo, ou “fatia”, é proporcional à
sua percentagem em relação ao todo e deve ser rotulado com sua descrição e
percentagem. O redator não deve tentar incluir um número muito grande de fatias;
cerca de seis seria o máximo. As empresas geralmente usam esse tipo de gráfico para
mostrar como as receitas foram usadas ou composição de suas vendas.
• Gráfico de Linha
Gráfico de linha são úteis para mostrar o relacionamento de uma variável com a outra.
A variável dependente geralmente é mostrada no eixo vertical e a independente no
horizontal. A variável independente mais comum nesses gráficos é o tempo, mas não
é a única. A linha para cada variável dependente deve ser de cor ou padrão diferente e
claramente rotulado. O pesquisador não deve tentar “espremer” muitas variáveis; isso
pode confundir em vez de esclarecer.
• Gráfico de barra
Gráfico de barra mostram mudanças no valor de uma variável dependente (plotada no
eixo vertical) a intervalos discretos da variável independente (no eixo horizontal). Um
gráfico de barra simples apresenta a frequência de resposta relacionada à primeira
variável. Nesse caso, cada barra precisa ser claramente identificada com uma cor ou
um padrão diferente. O pesquisador não deve usar muitas divisões ou variáveis
dependentes. Uma quantidade excessiva de detalhes obscurece a vantagem essencial
dos gráfico, que é justamente facilitar a compreensão dos relacionamentos.
• Histograma
Histograma é uma forma gráfica de apresentar a distribuição de frequências de uma
variável, ou seja, é um gráfico de barras verticais construído com os resultados da
tabela de frequência.
10
Antes de mais, importa aqui referenciar que, dos métodos descritivos de análise dos
dados, as medidas de tendência central e as medidas de dispersão dependem apenas
do tipo de escala de medição da variável sob análise, e, por isso, serão apresentados a
seguir os conceitos de cada medida e seus respectivos exemplos.
2.5.1.1.1. Média
Média aritmética ou simplesmente média, corresponde ao valor médio de um
conjunto de dados. É uma medida de tendência central de aplicação exclusiva a
variáveis intervalares. Dependendo da forma de apresentação dos dados, existem duas
fórmulas para o cálculo da média. (MATTAR, 2001)
11
12
2.5.1.1.2. Moda
Para ZIKMUND (2006), moda é a medida de tendência central que identifica o valor
que ocorre com maior frequência. MATTAR (2001), acrescenta ainda que, é uma
medida típica de tendência central para variáveis nominais, mais que pode também ser
aplicada à variáveis ordinais ou intervalares, desde que tenham sido previamente
agrupadas em classes, neste caso, a classe que obtiver a maior frequência é
denominada classe modal.
Exemplo: Olhando para o exemplo (1) do cálculo da média, onde as notas foram,
respectivamente, 5,6; 4,8; 8,0; 8,6; 6,4; 4,8; 9,4. A moda seria 4,8.
13
2.5.1.1.3. Mediana
Mediana é o ponto central da distribuição, ou o 50o percentil, isto é, o valor abaixo do
qual estão metade dos valores na amostra. (ZIKMUND, 2006). Segundo SALSA
(2005), para obter a mediana precisamos primeiramente analisar o número de
elementos de conjunto n, identificando se este número é par ou ímpar.
− Se for ímpar: quando n é impar haverá apenas um valor central no conjunto
ordenado, cuja posição e calculada pela seguinte fórmula:
𝑛+1
𝐸!! =
2
Exemplo: Para o seguinte conjunto de dados, 5,6; 4,8; 8,0; 8,6; 6,4; 4,8; 9,4;
encontrar a mediana. Primeiramente precisamos construir o rol, ou seja, ordenar os
valores. Desse modo tem-se: 4,8; 4,8; 5,6; 6,4; 8,0; 8,6; 9,4. Para este conjunto o valor
de n é igual a 7.
7+1 8
𝐸!! = = =4
2 2
Com isso, encontramos que a mediana ocupa a 4a posição desse conjunto, logo a
mediana é igual a 6,4.
− Se n for par: neste caso, haverá dois valores centrais, os quais se encontram
nas posições:
𝑛 𝑛
𝑒 +1
2 2
Exemplo: Para o conjunto dado: 5,6; 4,8; 8,0; 8,6; 6,4; 9,4; encontrar a mediana.
Primeiramente, constrói-se o rol: 4,8; 5,6; 6,4; 8,0; 8,6; 9,4. Neste caso, n = 6, logo,
usaremos as duas fórmulas.
6 6
=3𝑒 +1=4
2 2
Neste caso a mediana está entre o 3o e o 4o valor do conjunto, isto é, entre 6,4 e 8,0. A
média desses valor nos dará a mediana. Desse modo tem-se:
!,!!!,!
𝑀! = !
=7,2
2.5.1.2.Separatrizes
São valores que separam o rol (os dados ordenados) em quatro (quartis), dez (decis)
ou em cem (percentis) partes iguais. Para sua correcta aplicação, exige-se que os
dados estejam organizados num rol.
15
• Ordenamento
É a disposição de todos os elementos do grupo de forma crescente ou decrescente,
segundo as avaliações efectuadas para a variável ordinal pesquisada.
16
• Desvio-médio
É também uma medida de dispersão típica de variáveis intervalares, pois indica o grau
de dispersão do total dos indivíduos num grupo, em relação a uma determinada
variável. O desvio-médio é a média aritmética das diferenças (em módulo, ou seja,
despreza-se o sinal) entre cada observação e a média das observações. O desvio-
médio serve para comparar duas distribuições com igual média e saber qual das duas
está mais ou menos dispersa. A fórmula para o desvio-médio é:
População Amostra
! !
!!! 𝑋! − 𝜇 !!! 𝑋! − 𝑋
𝐷𝑀 = 𝐷𝑀 =
𝑁 𝑛
• Desvio-padrão
É a soma dos quadrados das diferenças entre as observações e a média, dividido pelo
número de observações é conhecido como variância. O desvio-padrão é a raiz
quadrada da variância. A fórmula para o cálculo do desvio-padrão é:
População Amostra
Original Computacional Original Computacional
! ! !
(𝑋 − 𝜇)! 𝑋! 𝑋 𝑥−𝑥 𝑥! 𝑥
Dados brutos 𝜎= 𝜎= − 𝑆= 𝑆= −
𝑁 𝑁 𝑁 𝑛 𝑛 𝑛𝑁
Dados em distribuição 𝑓 𝑋 ! 𝑓𝑋
!
𝑓 𝑥 ! 𝑓𝑥
!
𝜎= − 𝑆= −
de frequência 𝑁 𝑁 𝑛 𝑛
17
• Coeficiente da variação
O desvio-padrão é uma medida absoluta da dispersão e é apresentado nas mesmas
unidades de medida originais em que os dados foram colectados. Às vezes, em
pesquisas de marketing, há a necessidade da comparação da dispersão de diversas
distribuições que não possuam as mesmas médias ou que não estejam nas mesmas
escalas ou unidades de medidas e que, por isso, não podem ser feitas com os desvios
padrões. Os coeficientes de variação permite efectuar essas comparações. O
coeficiente de variação é uma medida abstrata da dispersão e é obtido através da
divisão do desvio-padrão pela média.
População Amostra
𝜎 𝑆
𝐶𝑉! = 𝐶𝑉! =
𝜇 𝑥
2.6.Métodos Inferenciais
A inferência diz respeito a como se pode assumir conclusões para toda uma população
a partir das medições e da análise de apenas uma parte dela de forma a que o risco de
se realizar conclusões incorretas possa ser medido. A inferência diz respeito a dois
tipos de problemas: estimar os parâmetros de uma população e realizar testes de
hipóteses. (idem)
É através dos métodos da inferência estatística que se pode assumir, por exemplo com
determinada probabilidade conhecida de estar errado, a média calculada numa
amostra pode ser assumida como estimativa do parâmetro da população. É também
através dos métodos de inferência estatísticas que se pode realizar os teste de
hipóteses a respeito, por exemplo da diferença entre duas distribuições. (idem)
18
Hipóteses nula (𝐻! ) – é uma declaração sobre um status quo que afirma que qualquer
modificação do que era tido como verdadeiro se dará inteiramente devido a um erro
aleatório de amostragem.
Hipóteses alternativa (𝐻! ) – é uma expressão que indica o oposto da hipótese nula.
19
2. Ocorre quando houver mais de um tipo de teste que possa ser aplicado a
situação. Há dois tipos de erros que podem ser cometidos num teste de
hipótese. O primeiro chamado erro de tipo I é o de rejeitar 𝐻! quando
verdadeira. O segundo é chamado erro do tipo II, é o de aceitar 𝐻! quando
falsa;
3. Deverá ser feita tendo em vista o tipo de escala em que os dados foram
medidos.
4. Deverá ocorrer quando se tratar de apenas uma amostra, duas amostras
relacionadas e não relacionadas ou varias amostras relacionadas e não
relacionadas.
20
Exemplo 1: No ano de 2001 foi feita uma pesquisa em uma estância turística e
constatou-se que apenas 60% dos visitantes estavam satisfeitos com a infraestrutura
oferecida. Com o intuito de aumentar essa proporção a prefeitura fez algumas
melhorias na cidade e depois de um ano, resolveu verificar se as mesmas produziram
o efeito desejado. Para isso entrevistou 50 turistas.
Exemplo 2: Um jornal afirma que 40% dos seus leitores têm curso superior. Um
jornal concorrente afirma que essa proporção é menor. Para verificar sua suspeita, o
concorrente sorteou 30 leitores daquele jornal e consultou-os se têm curso superior.
21
22
2.7.1. Regressão
Em pesquisas de marketing é frequente a necessidade de, com base em dados
amostrais, prever o valor de uma variável (critério), correspondente ao conhecido
valor de uma, ou mais de uma, variável (prognóstico). Isto pode ser conseguido
mediante a construção de uma equação, ou de uma curva de mínimos quadrados. A
equação, ou curva, resultante é denominada de regressão de Y para X, visto que Y é
avaliado a partir de X. Quando a relação for apenas entre duas variáveis a regressão é
denominada simples; quando for entre uma variável e mais de uma variável, é
denominada múltipla. (MATTAR, 2001)
Regressão linear simples: para o caso particular de uma reta, a curva de regressão
que se ajusta aos dados tem a seguinte equação:
𝑌 = 𝑎! + 𝑎! 𝑋 ∗
Onde: Y = a variável-critério, e representa o valor esperado de Y dado um
determinado valor de X
X = a variável-prognostico
𝑎! = valor de Y pata X = 0 𝑎! = valor médio de Y por unidade de X
Regressão linear múltipla: compreende a regressão linear de uma variável critério em
relação a duas ou mais variáveis prognóstico.
𝑆 ! 𝑦. 𝑥
𝑟= 1−
𝑆𝑦 !
Onde:
𝑆 ! 𝑦. 𝑥 = variância de y em relação a x, e 𝑆𝑦 ! = variância de y
23
24
3. CONCLUSÃO
25
4. REFERÊNCIAS BIBLIOGRÁFICAS
26