Anda di halaman 1dari 8

Tópicos Avançados de Estatística na Pesquisa em Administração de

Empresas - 2003
Dirceu da Silva

Limites e Seleção de métodos e técnicas para análise.

O aspecto mais básico e vital de um tratamento estatístico de dados passa pela


necessidade de se observar que tipo de dados o objeto de estudo permite que sejam
coletados.
Vale a pena lembrar que, um bom planejamento para a coleta de dados e análise das
possibilidades do objeto de conhecimento, poupa muitas horas de trabalho para se saber
como se poderá tratar os dados ou ainda pode-se poupar a necessidade de retomada de
dados.

De pendendo do objeto a ser estudado, suas características e sua natureza, um tipo de


dados, aqui entendido como algo que pode ser convertido em números, pode ser
conseguido através de um processo de mensuração característico ou tradicional.

Há basicamente três tipos básicos com relação à natureza do processo de mensuração:

A. Escala Nominal ou Classificadora (de nomear)


Mensuração em um nível mais baixo ou primitivo das possibilidades, quando números
ou outros símbolos são usados para classificar objeto, pessoas ou características de
ambos ou identificar os grupos a que vários objetos pertencem.
A primeira organização de dados, constitui em colocar características de indivíduos (ou
de objetos) em categorias e contar a freqüência que ocorrem.
Alguns tipos de dados nominais mais comuns em pesquisas são, por exemplo: sexo
(masculino e feminino), classe sócio-econômica (alta, média e baixa), partido político
de preferência, orientação no tempo (presente, passado e futuro) etc.

B. Escala Ordinal ou Escala por Postos (de ordem)


Quando se que ultrapassar a simples atribuição de um rótulo ou nome a um indivíduo ou
objeto, pode-se classificar os dados em categorias de um ordenamento preestabelecido
Por exemplo:
• Ordenação do grau de concordância com uma assertiva: concordo plenamente,
concordo, indiferente, discordo, discordo plenamente.
• Avaliação de um produto ou serviço: Muito insatisfeito, Relativamente insatisfeito,
neutro, Relativamente satisfeito e Muito satisfeito.
• Classificação de alunos: 1º, 2º, 3º, ......30º.

O nível ordinal fornece informações sobre a ordenação, mas não indica a magnitude das
diferenças entre os valores, por exemplo, quando classificamos alunos de uma turma,
sabemos que o 1º apresentou melhor desempenho em um teste, por exemplo, mas não
podemos inferir se ele sabe mais que o 2º, ou mais que o 3º etc. Só podemos falar que
ele foi classificado em primeiro lugar.
C. Escala Intevalar (de intervalos)
Quando a escala tem todas as características de uma escala ordinal e além disso se
conhecem as distâncias entre dois números quaisquer da escala (unidade de medida) e o
zero da escala de medida existe por convenção.
Por exemplo:
• Temperatura (Celsius, Fahrenheit).
• Altura (metro, centímetro, pés)
• receitas de vendas (reais ou dólares)
• Investimento em propaganda (reais ou dólares)
• Tempo (calendário gregoriano e hebraico)

Como detalhe, a escala intervalar é chamada de Escala de Razão ou


proporcionalidade (quarto tipo), quando tem um ponto zero verdadeiro como origem
(função linear: que passa pela origem). Explicando melhor, a razão (r = a/b) entre duas
medidas guarda uma proporcionalidade independente da escala e todas as operações
aritméticas podem ser feitas. Como exemplo, podemos citar várias grandezas físicas,
tais como, pressão, volume, massa, distância etc., bem como contagem de valores
monetários e financeiros.

Em todos os casos podemos ter mensurações com valores discretos, quando são
expressos por números naturais (inteiros positivos), como ocorre com o dinheiro ou
valores contínuos tais como nas unidades físicas, que em tese, podem ser
indefinidamente subdivididos.

É importante frisar que, não podemos tratar qualquer tipo de mensuração com os
mesmos testes ou métodos estatísticos. Devemos sim atentar que há metodologias
específicas. É claro que o tratamento matemático de qualquer coleção de números
sempre pode ser processado ou submetido a uma fórmula, mas se ela não tiver sentido
de validade ou relação causal, não pode ser considerada, pois o resultado, apesar de
existir, não tem qualquer relação com o objeto de conhecimento.

De fato, a Estatística enquanto área do conhecimento, não possui uma teoria geral que
possivelmente poderia ser usada em todas as situações e realidade. Antes de depreciar a
área, esta característica é a marca da natureza dos seus saberes.

Sintetizando, ainda há dois tipos de dados básicos que se pode obter com medições:

Discretos: são números resultantes de contagens. Dias que você trabalhou, número de
livros lidos em um ano, número de alunos em uma sala de aula etc.

Contínuos: são frutos de medidas de grandezas físicas: Altura, comprimento,


temperatura etc.

Figura 1: Relacionamento entre os tipos de mensuração e suas características.


Fonte: Levine et al (2000).

Como visão geral, o quadro1 apresenta uma síntese dos métodos e técnicas adequados
para cada tipo de mensuração.

Quadro1: tipo de mensuração x possíveis testes apropriados.


Tipo de Provas
Relações
Escala Estatísticas Testes Estatísticos Adequados
Definidoras
Adequadas
Nominal Equivalência Não paramétricas Número de casos.
Percentagens.
Moda.
Correlações de contingência (Qui-quadrado.
Teste exato de Fisher.
Freqüência.
Teste binomial.
Mcnemar, Cochran Q.
Coeficiente de contingência.
Moda.
Ordinal Equivalência Não paramétricas Todos os anteriores e mais:
Maior do rs de Spearmam.
que τ de Kendal.
W de Kendall.
Mediana.
Percentis.
Decis, quartis.
Desvio quartílico.
Correlação de postos.
Teste de sinais.
Teste de Kolmogorov-Smirnov.
Teste U, Mann-Whitney.
Teste de Kruskal Wallis.
Intervalar Equivalência Paramétricas e Não Todos os anteriores e mais:
Maior do paramétricas Média.
que Desvio-padrão.
Razão Média aritmética.
conhecida de Desvio padrão, variância.
dois Desvio médio.
intervalos Intervalo, Amplitude total, amplitude média.
quaisquer Correlação de produto-momento (product-moment correlation)
teste-t;
teste-F,
teste-Z,
ANOVA
Razão Equivalência Paramétricas e Não Todos os anteriores e mais:
Maior do paramétricas Coeficiente de variação
que Média geométrica,
Razão Média harmônica
conhecida de
dois
intervalos
quaisquer
Razão
conhecida de
dois valores
quaisquer de
escala
Fonte: Siegel (1979); Levin (1985); Miller (1991); Andrews et al. (1998).

Ainda para cada tipo de amostra, o quadro 1, pode ser desdobrado em outro (quadro2),

Escala Caso de Caso de duas amostras Caso de k amostras Correlação


uma
Amostras Amostras independentes Amostras Amostras
amostra
relacionadas relacionad independentes
as
Nominal • Prov • Prova de • Prova de Fisher. • Prov • Prova de • Coeficiente de
a Binomial McNemar para • Prova de χ 2 para duas a Q de χ 2 para k Contingência C
• Prov a significância amostras independentes. Cochran. amostras
a de χ 2 de das mudanças. independentes
uma
amostra
Ordinal • Prov • Prova • Prova da Mediana • Prov • Prova de • Coeficiente de
a de dos sinais. • Prova U de Mann- a de extensão da correlação de postos de
Kolmogor • Prova de Withney Friedman. mediana Spearmann: rs.
ov- Wilcoxon. • Prova de duas • Prova de
Smirnov amostras de Kolmogorov- Kruskal-Wallis • Coeficiente de
para uma Smirnov. correlação de postos de
amostra • Prova de iterações de Kendall: τ .

a de
Prov Wald-Wolfowitz. • Coeficiente de
• Prova de Moses para correlação parcial de
iterações reações externas. postos de Kendal: τ xy,z
para uma
amostra. • Coeficiente de
Concordância de
Kendal: W.
Intervalar • Prova de aleatoriedade • Coeficiente de
para duas amostras Correlação de Pearson:
independentes. r.
Fonte: Siegel (1979);

ANÁLISES MULTIVARIADAS
Conceitos básicos de análise multivariada
Utilizamos a análise univariada para estudarmos a distribuição de apenas uma variável,
utilizamos a análise bivariada quando trabalhamos com duas variáveis e a análise
multivariada para os casos de mais de duas variáveis.

Podemos definir a análise multivariada pela sua função, que é apresentada de forma
semelhante por vários autores:
“Analisar simultaneamente múltiplas medidas (mais de duas variáveis) de cada
indivíduo ou objeto sob investigação.” (HAIR et al, 1998)1

“Obter informações a partir da análise de medidas simultâneas de muitas variáveis.”


(JOHNSON & WICHERN, 1998:1)

“Em muitas pesquisas científicas é necessário analisar as relações simultâneas entre três
ou mais variáveis.” (DILLON & GOLDSTEIN,1984:1)

Obs.: Utilizamos a análise univariada para estudarmos a distribuição de apenas uma


variável, utilizamos a análise bivariada quando trabalhamos com duas variáveis e a
análise multivariada para os casos de mais de duas variáveis.

Há diversas técnicas para a análise multivariada e cada uma se aplica a um


objetivo de pesquisa específico, como é citado por JOHNSON & WICHERN (1998:2):

a) Redução dos dados ou simplificação estrutural: O fenômeno em estudo é


representado de um modo tão simples quanto possível sem sacrificar informação
valiosa. Tornando a interpretação mais fácil.
b) Agrupar: Grupos de objetos ou variáveis “similares” são criados com base nas
medidas características.
c) Investigação da dependência entre as variáveis: Todas as variáveis são
mutuamente independentes ou uma ou mais variáveis são dependentes de
outras? Se sim, como ?
d) Predição: As relações entre as variáveis devem ser determinadas com o
objetivo de predizer o valor de uma ou mais variáveis com base nas observações
de outras variáveis.
e) Construção de hipóteses e testes: Hipóteses estatísticas específicas, formuladas
em termos dos parâmetros da população multivariada, são testadas. Isto pose ser
feito para validar premissas ou para reforçar convicções prévias.

Uso:
Com os computadores e programas disponíveis atualmente, a análise
multivariada tem sido utilizada para atender muitas finalidades: análise de dados
psicológicos, sociológicos e comportamentais, em áreas como: antropologia, zoologia,
negócios, economia, ecologia, geologia, tanto nas universidades quanto indústria,
governo e centros de pesquisa. (HAIR et al, 1998:3-5; JOHNSON & WICHERN,
1998:2).

DILLON & GOLDSTEIN (1984:2) citam alguns exemplos, dos quais


destacamos o caso do psicólogo social que procura entender os papéis que as atitudes
desempenham na formação do comportamento, bem como operacionalizar o conceito de
atitude em termos de três variáveis relativas às dimensões cognitivas, afetiva e
comportamental, que estão implícitas neste construto.

1
Além disso, afirmam que para que a análise seja multivariada todas as variáveis devem ser aleatórias e
inter-relacionadas de forma que seus efeitos não possam ser corretamente interpretados de forma isolada.
Para cada objetivo de pesquisa definido por JOHNSON & WICHERN (1998)
(apresentados no item “Função”) eles também apresentam alguns exemplos de aplicação
das técnicas multivariadas (3 - 5, 1998):

a) Redução dos dados ou simplificação estrutural:


• Foram usados dados de muitas variáveis relacionadas às respostas dos
pacientes com câncer à radioterapia para construir uma escala de medida
simples da resposta do paciente à radioterapia.
• Registros de muitos países foram usados para desenvolver um índice de
desempenho para os atletas.
b) Agrupar:
• Medidas de muitas variáveis psicológicas foram usadas para desenvolver um
procedimento que discrimina alcoólatras de não-alcoólatras.
• A U.S.Internal Revenue Service usa dados coletados dos impostos pagos
para separar os pagadores em dois grupos: os que serão auditados e aqueles
que não serão.
c) Investigação da dependência entre as variáveis:
• De um lado foram usadas medidas de variáveis relacionadas à inovação, e de
outro variáveis relacionadas ao ambiente e à organização do negócio para
descobrir porque algumas firmas são inovadoras em produtos e outras ao.
• A associação entre medidas de propensão a risco e medidas de características
sócio-econômicas, para executivos, foi usada para avaliar a relação existente
entre o comportamento em relação ao risco (risk-taking) e o desempenho.
d) Predição:
• As associações entre notas em provas, muitas variáveis de desempenho no
colégio e na faculdade foram usadas para desenvolver preditores de sucesso
na faculdade.
• Dados de muitas variáveis relacionadas à distribuição do tamanho dos
sedimentos foram usados para desenvolver regras para predizer diferentes
ambientes de deposição.
e) Construção de hipóteses e testes:
• Muitas variáveis relacionadas à poluição foram medidas para determinar se
os níveis para uma grande metrópole eram constantes durante a semana ou se
eles eram diferentes entre os dias úteis e os fins-de-semana.
Dados de muitas variáveis foram usados para determinar se diferentes tipos de firmas em países recém-
industrializados apresentavam diferentes padrões de inovação.

Tipo de método de análise multivariada

Há 11 métodos que atendem a grande maioria dos problemas presentes nas pesquisas
(vide figura 2):

Figura 2: Taxionomia dos métodos multivariados


Fonte: Dillon e Goldstein (1984)

1) Regressão Múltipla:

Método mais usado e conhecido. Relaciona-se com a dependência de uma única


variável, a variável dependente sobre um conjunto de outras (variáveis preditoras)

2) Análise Discriminante:
Usado quanto se tem uma variável (ou mais) que está relacionada com alguma
característica da amostra. Por exemplo: idade, sexo, tipo de investidor, nível de
escolaridade. E se que saber dentro do grupo da variável, qual é a tendência de
expressar alguma discriminação ou não.

3) Análise Logit
É apropriado quando um critério simples de mensuração é discreto e todas as variáveis
preditoras são categóricas na sua natureza.

4) MANOVA
A análise de variância multivariada é usada quando múltiplos critérios de mensuração
são avaliados e o objetivo é avaliar o impacto de vários níveis de uma ou mais variáveis
experimentais sobre o critério de medida. Assim, o foco primário da MANOVA é testar
as diferenças significantes de um conjunto de variáveis ou o perfil destas devido às
relações sobre uma ou mais variáveis controladas.

5) Análise de Correlação Canônica


Este método busca determinar a associação linear entre o conjunto de variáveis
preditoras e os critérios de mensuração. No processo busca-se ter duas combinações
lineares, uma do conjunto preditor e outra do critério maximizante.

6) Análise de Componentes Principais


É uma técnica de redução de dados onde o objetivo principal é a construção de uma
combinação linear das variáveis principais que representam a totalidade.

7) Análise Fatorial
É uma técnica de redução de dados. Em contraste com o modelo anterior, este visa
apenas a parte da variação total mais robusta do que a totalidade.

8) Análise Escalonada Multidimensional Métrica


É usada para explorar por exemplo, como as pessoas formam percepções sobre as (dis)
similaridades entre as preferências de vários objetos. Um aspecto importante deste
método é um mapa de alternativas que representa este comportamento de (dis)
similaridades

9) Análise de Cluster ou de Pareamento


Pode ser considerado outro método de redução de dados. O objetivo na maioria dos
estudos que usam esta técnica é identificar um número pequeno de agrupamentos para
um todo, que tem aspectos semelhantes. Em geral o subgrupo homogêneo é baseado nas
(dis) similaridades dos perfis dos respondentes.

10) Análise Escalonada Multidimensional Não Métrica


O objetivo deste método é transformar as (dis) similaridades percebidas no interior de
um conjunto de objetos em distâncias no espaço multidimensional.

11) Modelo Loglinear


Este modelo permite ao pesquisador investigar as inter-relações as variáveis categóricas
a partir de uma contingência.Expressa também as probabilidades multidimensionais em
termos dos efeitos principais.

Anda mungkin juga menyukai