O SPSS (Statistical Package for Social Sciences) é uma aplicação de tratamento estatístico
De dados que qualquer utilizador familiarizado com o Windows pode usar. A análise estatística
é acessível para todos os utilizadores, incluindo os menos experientes.
O SPSS é um pacote estatístico usado para a análise de dados que permite manipular,
transformar, criar tabelas e gráficos que resumam a informação obtida. Mas as suas
potencialidades vão mais além do que a simples análise descritiva de um conjunto de dados. È
também possível realizar, com este software, procedimentos mais avançados que vão desde a
Inferência Estatística, teste de hipóteses e estatísticas multivariadas para dados qualitativos e
quantitativos.
Se o SPSS já estiver a ser usado (ou depois de aberto) pode-se seleccionar o menu File >
Open > Data a partir da janela de edição (SPSS Data Editor). Aparecerá a caixa de diálogo
Open File e o procedimento será semelhante ao descrito anteriormente. Nesta caixa de
diálogo usam-se as teclas de direcção do teclado para procurar a base de dados pretendida e
após se seleccionar a base de dados pretendida clique no botão Open.
Para se procurar os dados numa localização diferente usar Open File > Procurar em …Se os
dados armazenados se encontram num outro formato de dados que não o do SPSS (.sav)
selecciona-se a opção Ficheiros do tipo no fundo da janela Open / Other. Por exemplo, se
seleccionarmos a opção Type in data e depois fizermos <OK>, acedemos ao editor de dados
(Data Editor). Se a janela de abertura não aparecer (ou se aparecer, mas fizermos <Cancel>),
entramos directamente no Data Editor (editor de dados).
O SPSS para o ambiente Windows apresenta outro tipo de interfaces, tais como: Janelas,
barras de ferramentas e de estado, caixas de diálogo e menus que tornam mais acessível o
seu manuseamento. A janela de edição (SPSS Data Editor) mostra o conteúdo de uma base
de dados:
2.1. Janela de edição de Dados (Data Editor) com duas janelas;
Janela de dados - (Data View): Ao abrir o SPSS é a primeira janela que é visualizada
e consiste nma matriz (linhas/colunas) onde vão ser inseridos (ou alterados) os
dados. Cada coluna representa uma variável e cada linha é um registo, caso ou
observação.
Janela de Variáveis - (Variable View): O SPSS tem uma janela de vista de variáveis
onde se definem, ou se modificam, todos os aspectos relativos a cada uma das
variáveis.
(OBS: Qualquer ficheiro de dados salvado tem uma extensão tipo *. sav).
As janelas de edição dos dados têm no topo a barra de títulos e, imediatamente por baixo, a
barra de menus e a barra de ferramentas. Na parte inferior da janela, localiza-se a barra de
estado, com informações sobre o progresso do trabalho.
A barra de menu s do Data Editor apresenta as seguintes opções:
? File. Abrir um ficheiro pré-existente (criado ou não no SPSS), criar um novo ficheiro,
gravar um ficheiro ou imprimir um ficheiro. Os ficheiros poderão ser de dados (Data),
de resultados (Output) ou de sintaxe (Syntax).
? Edit. Desfazer a última acção; cortar, copiar e colar texto, dados ou gráficos. O
comando Options permite personalizar a utilização do SPSS.
? View. Ligar/desligar a barra de estado, a barra de ferramentas e as linhas da grelha
da folha do editor de dados; apresentar as etiquetas das observações em vez dos
números de código.
? Data. Fazer alterações de fundo nos ficheiros de dados, tais como transposição de
variáveis ou de casos, criar subconjuntos de dados para análise, inserir novas
variáveis ou casos, juntar ficheiros (com as mesmas variáveis e casos diferentes;
com os mesmos casos e variáveis diferentes), ou ordenar os dados do ficheiro
segundo determinado critério. As alterações produzidas são temporárias, a menos
que se proceda à gravação subsequente do ficheiro.
? Transform. Alterar variáveis já existentes ou calcular novas variáveis a partir das
variáveis pré-existentes no ficheiro. As alterações produzidas são temporárias, a
menos que se proceda à gravação subsequente do ficheiro. É também possível gerar
números aleatórios, atribuir postos às observações ou recodificar variáveis.
? Analyze. Encontram-se nele todos os procedimentos de análise estatística que o
SPSS é capaz de executar (estatística descritiva, tabelas, testes t, análise de
variância, regressão, correlação, testes não paramétricos, etc.).
? Graphs. Permite criar gráficos de barras, gráficos de linhas, gráficos circulares,
gráficos de áreas, histogramas, diagramas de dispersão, diagramas de caixa e
outros tipos de apresentação gráfica, a partir dos dados.
? Utilities. Miscelânea de comandos que parecem não ter cabimento nos outros
menús: listagem das variáveis existentes na folha de dados, informação detalhada
sobre as características destas variáveis, definição de subconjuntos de variáveis que
pretendemos analisar conjuntamente, alteração dos menu s utilizando o editor de
menús, etc.
? Window. Mudar de uma para outra ou alterar os atributos das diferentes janelas do
SPSS (Data Editor, Output, Syntax e Chart).
? Help. Comandos para o sistema de ajuda do SPSS (por tópicos, tutor, guia de
sintaxe e “statistics coach”).
Janela de comandos - Syntax Editor - É, em termos práticos, uma janela de texto para
onde as escolhas feitas nos menús e nas caixas de diálogo do SPSS podem ser
copiadas, aparecendo aí sob a forma de uma sintaxe de comandos. Para esse efeito,
basta clicar no botão Paste de cada caixa de diálogo, depois de introduzida/
seleccionada toda a informação necessária para a execução do procedimento
pretendido. O programa que vai sendo assim construído pode mais tarde ser editado
para inserir certas capacidades especiais de análise estatística que só são acessíveis
no SPSS em modo programado, e não através das caixas de diálogo. Estes comandos
podem ser gravados em ficheiros, e utilizados em sessões de trabalho posteriores.
Para se fazer correr um programa de uma janela de sintaxe, basta seleccionar Run na
barra de menus do Syntax Editor. (Esta janela não será abordada no módulo).que não
será abordada neste módulo .
Regra geral, quando se faz correr o SPSS, há duas janelas Data Editor e Viewer que abrem
automaticamente: Se a janela Viewer não abrir nessa altura, abrirá de forma automática
quando se solicitar uma análise estatística ou um gráfico.
Todas as janelas descritas possuem uma barra de menus (Figura 6) com as opções
disponíveis no topo de cada janela e uma barra de ferramentas (Figura7) que permite um
acesso facilitado às tarefas mais comuns. Se colocar o ponteiro do rato sobre o botão de uma
ferramenta, aparece uma breve descrição dessa ferramenta.
A maioria das selecções feitas em menus gera uma caixa de diálogo (Exemplo1). Estas
caixas servem para seleccionar variáveis e opções de análise.
Os dados são editados na janela SPSS Data Editor. As linhas da grelha de edição
representam casos distintos, enquanto que as colunas representam as variáveis que se
pretendem estudar a partir de uma amostra de uma determinada população. Os nomes das
variáveis aparecem no início de cada coluna. A introdução dos dados é feita como em qualquer
folha de cálculo.
Selecciona-se uma célula e introduz-se o valor correspondente. Também se pode importar
dados de ficheiros mais usuais como seja tipo Excel e do Word ou outros.
Nas variáveis quantitativas introduz -se os valores observados, e para as variáveis qualitativas
introduzimos os valores correspondentes ás etiquetas atribuídas a esses valores. Os valores,
missing , numa variável deixam-se em branco, a menos que esteja definida uma etiqueta
(rótulo) para os valores desconhecidos.
Apresenta-se um exemplo para a construção de uma base de dados (Ficheiro demo da
pasta SPSS\Tutorial\Examples\demo.sav) que pode ser explorado em termos de
introdução no SPSS mas também em Excel e depois copiar e colar para o SPSS.
Variáveis:
? Idade - scale (discreta)
? Estado Civil - nominal (não casado e casado)
? Anos na actual morada - scale (discreta)
? Rendimento familiar- scale (contínua); Rendimento familiar por categorias (1---
rendimentos inferiores a 25 ; 2--- rendimentos entre 25 e 49 ; 3--- rendimentos entre
50 e 74; 4--- rendimentos a partir de 75).
? Preço do veículo principal – scale (contínua); Preço do veículo por categorias
(1=Económico--- preço do veículo inferior a 15; 2=Standard---- preço do veículo
entre 15 e 29; 3=Luxo--- preço do veículo a partir de 30)
? Gender- nominal (Feminino, Masculino).
Esta sub janela, Variable View, apresenta nas linhas as variáveis e nas colunas as
propriedades correspondentes a cada variável que se podem alterarem, seguindo os seguintes
passos:
? N ame- Nome da variável e aquele que vai identificar a variável na janela de dados.
?
Devem ser usados nomes sugestivos e de preferência nomes não muito extensos e
evitar símbolos e acentos.No exemplo: Age, marital, adress, income, inccat, car, carcat,
Gender poderiam ser substituídos por nomes em português: Idade, ECivil, rendimento,
rendcat, carro ,carrocat e Sexo .
? Type- Tipos de Variável. Usualmente assume-se que as variáveis são numéricas
? (Numeric) Mas podemos alterar a sua natureza, clicando na parte direita da célula
correspondente à variável o nome da variável e aquele que vai identificar a variável na
janela de dados. Outros tipos: (Comma-com vírgulas a separar os milhares); (Dot-Com
ponto-ponto separador nos milhares); (Scientific notation- Numéricos com notação
ciêntifica); (Date-data-város formatos); (Dolar-para moeda dólar) (Custom Currency-
outros fomatos para valores monetários); e String- alfanuméricas - mais usada para
posteriormente identificar casos em apresentação gráfica de resultados, ou seja para
variáveis Nominais e Ordinais. Mesmo quando as variáveis são qualitativas é possível
escolher numeric para que se possam realizar posteriormente análises estatísticas com
este tipo de variáveis. Por exemplo, na variável Estado civil apresentamos os valores 1
e 2 para não casado e casado.
? Label- O Rótulo da variável. A etiqueta para o nome da variável é importante, no
sentido em que permite uma descrição sumária de uma variável. Por vezes com o
nome definido (Name) não temos a noção do que a variável significa, e posteriormente
na construção de gráficos e tabelas será a descrição introduzida como rótulo da
variável que será usada. Exemplo: Idade- Idade dos Inquiridos, ECivil- Estado Civil,
rendimento- Rendimento familiar (em milhares), rendcat – Rendimento por
categorias, carro- Preço do veículo principal (em milhares), carrocat- Preço do
veículo principal por categorias, sexo- Género.
? Value Labels- O Rótulo dos valores. Para atribuir etiquetas aos valores da variável
deve-se, na célula correspondente à variável na coluna Value, clicar no botão de
expansão da célula, surgirá então a caixa de diálogo Value Label para introduzir o
valor e a etiqueta respectivamente e posteriormente clica-se no botão Add. Esta caixa
Value Labels permite atribuir etiquetas aos valores de variáveis qualitativas. Como
descrito anteriormente as variáveis qualitativas podem ser introduzidas como tipo
numérico; por exemplo, na variável sexo introduzimos 1 e 2 conforme o sexo do
inquirido seja Feminino ou Masculino. Neste caso pode-se atribuir aos valores numeric
os (1 e 2) uma etiqueta. Value 1 -Value Label –f ou Feminino e Value 2--Value Label –
m ou masculino. E após a introdução de todas as etiquetas clicar em Ok.
Obs: Quando se têm várias categorias será muito mais simples introduzir os valores
numéricos. O uso de valores numéricos no caso de variáveis categóricas permite
Peso que vai ser dividida por classes. Por exemplo: Leve ? ?
1- até 50 Kg; Normal
? ?
2- de 50 a 70 Kg(69.9); Pesado ? ?
3- de 70 a 90 kg; e, Muito Pesado ? ?
4- pelo
menos 90 Kg..
c) Transform, Recode Into Different Variables. Os novos valores serão alterados com o
uso a outra janela. Podemos transformar "Peso" em outra variável Numeric Variable
-> Output Variable box. Designando-a por "PesoCat" em Output Variable Name e
de seguida em Change. Em Old and New Values seleccionamos os intervalos para
cada grupo a definir e no fim de estarem todos definidos OK.
Exemplo, para definir os novos valores com intervalos há a opção Range:
?___ Lowest Through (do menor até 49.9) - escrever em New Value o valor 1 e Add;
?--- Through (de 50 até 69.9) - escrever em New Value o valor 2 e Add.
?--- (de 70 até 89.9) - escrever em New Value o valor 3 e Add.
?__ Through highest (de 90 até ao maior) - escrever em New Value o valor 4 e Add
E para outros exemplos de igual forma.....
Finalmente, clique em Continue e de seguida em Ok, a recodificação estará
terminada.
No Editor de Dados aparecerá mais uma nova coluna com os pesos por categorias. Poderá
depois voltar à Vista de varáveis para rotular os valores 1, 2 , 3 e 4 como Leve, Normal,
Pesado, Muito Pesado.
d) O argumento If. No exemplo anterior algo parece não estar totalmente correcto. O Peso
não é uma variável que tenha o mesmo comportamento para o sexo Feminino e
Masculino. No caso do salário também poderíamos querer só o aumento para aqueles
que trabalham na empresa há mais de 10 anos. Nestes casos, e outros, em que temos
que seleccionar os indivíduos que vão ter aumento de saláriode entre todos, ou alterar
categorias -classes de peso - conforme o indivíduo é mulher ou homem, surge o
argumento - If (condition is satisfied). Ao seleccionar esta opção outra janela abre
que permite escolher somente os casos que verificarem a condição If. Por exemplo no
caso do salário se tivermos a variável anos no emprego -AnosEmp-(há quanto tempo
trabalha na empresa) poderemos seleccionar os casos com valor maior ou igual que
10- If AnosEmp >9. Nos casos nominais ou ordinais colocar entre aspas os nomes ou
colocar o número correspondente. No caso do peso será mais complexo, tendo-se que
formar duas variáveis distintas com 0 (zeros) para valores que não correspondam ao
do sexo em análise e só depois apresentar uma variável final obtida por soma destas.
Obs: Caso fossem introduzidos os dados desta tabela noSPSS e pedido para os valores
sem contabilizados pela variável count (Weight cases by? ?
Count) o valor 15 significaria
que 15 rapazes frequentaram a pré escola enquanto que 17 raparigas frequentaram o
ensino pré-escolar. Estes valores permitem gerar tabelas cruzadas (contingência)
semelhantes às seguintes. Após o uso dessa condição (weight cases by ) as análises
terão a opção seleccionada até se usar a opção de escolher outra variável para (weight
cases by ) ou retirar essa opção
Muitas vezes, por conveniência da análise e dos próprios inquéritos "categorizam-se" variáveis
contínuas. Por exemplo a idade (variável contínua) pode ser "categorizada" em grupos etários
(variável categórica), assim um indivíduo que tenha 24 anos pertence, por exemplo, à categoria
- classe -20 a 30 anos.
A seguir veremos como se pode sumariar a informação segundo os diferentes tipos de
variáveis. Obs: Os dados apresentados nos exemplos deste capítulo constam da base de
dados demo.sav.
Variáveis categóricas
a) Nominais
Uma forma simples de sumariar variáveis nominais é apresentar a informação sumária dessa
variável em tabela tabela de frequências (frequências absolutas e relativas) ou em gráfico (de
barras, circular). A Tabela 2, refere-se à distribuição de 6400 inquiridos relativamente ao
género, sendo esta informação (parcial) também representada em gráfico
Na Tabela, observa-se que 3179 dos inquiridos são do sexo feminino o que corresponde a
49,7% dos inquiridos. A percentagem acumulada embora apresentada não faz muito sentido
para variáveis do tipo nominal. Outra forma de apresentar as frequências é usando informação
gráfica: um gráfico circular, Gráfico 2, ou um gráfico de barras, Gráfico 3. Relativamente ao
gráfico circular, o círculo representa os 100% dos indivíduos e cada 'fatia' é proporcional à
frequência de observações em cada categoria. Relativamente ao gráfico de barras cada barra
representa a frequência relativa (ou absoluta) em cada categoria, isto é percentagem (ou o
número) de indivíduos por classe.
Para obter tabelas de frequências e gráficos de barras no SPSS- Menu Analyze/ Descriptive
Statistics/Frequencies ----Graph/Bar ou Pie
b) Variáveis ordinais
Relativamente às variáveis ordinais, a informação sumária das variáveis é semelhante ao
descrito anteriormente para as variáveis nominais, no entanto não se pode alterar a ordem das
categorias uma vez que estas têm uma ordem própria. O gráfico de barras e a tabela de
frequências (Tabela 3 e Gráfico 4) apresentam a satisfação no emprego relativamente aos
6400 inquiridos. Nesta tabela inclui-se também uma coluna com a percentagem acumulada,
que indica soma da percentagem da categoria respectiva com as percentagens das categorias
anteriores. Na tabela de frequências já faz sentido “ler” as percentagens acumuladas , desta
forma 58,9% (17,3+19,8+21,8) é a percentagem de inquiridos cujo nível de satisfação no
emprego é no máximo neutral (indiferente).
Podem observar que os rótulos e títulos em cada coluna já foram alterados. Para tal deve clicar
duas vezes na tabela e usar o editor de gráficos para alterar as propriedades do gráfico.
classe (de valores). Cada intervalo de valores tem a continuação no intervalo da barra seguinte.
Por isso as barras são representadas todas juntas.
Normalmente o ensino da construção destes histogramas pode implicar dois casos distintos:
classes de amplitude iguais ou amplitudes diferentes. Iremos abordar somente a construção de
classes de amplitudes iguais conforme aparece no SPSS.
Optamos por referir a idade como uma das variáveis que, pelo que se apresenta na curva,
sugere algum arredondamento de idade dos inquiridos. Como sabemos é regra geral as
pessoas arredondarem a idade, as horas,….. e, neste caso o histograma sugere que tal
aconteceu, visto as barras (classes) s às idades com valores das unidades 0 e 5 apresentam
valores de frequência mais elevados que os restantes.
A informação do histograma também pode ser observada num diagrama de caule e folhas
(Stem-and-Leaf) ou de uma maneira mais simple sum histograma com números (onde as
baras são substituídas por números) a leitura é a seguinte e de acordo com os valores a
sublinhado: temos +/-22 indivíduos inquiridos (each leaf (cada folha) ---+/- 22 cases) com a
idade de 18 anos enquanto que com 19 anos temos (+/-) o dobro. De referir que no total temos
55 inquiridos com idade de 18 e 19 anos.
Para reflexão, apresenta-se o seguinte gráfico (Gráfico 7) e a tabela (Tabela 4) para justificar
que o uso “errado” de alguns gráficos e tabelas pode induzir o investigador a conclusões que
deturpam a verdade.
central da distribuição. Uma regra geral muitas vezes utilizada é apresentar a média
em distribuições simétricas e a mediana em distribuições assimétricas. O
parâmetro de simetria (skewness) observa-se na tabela sumário da variável. Outra
forma prática para visualizar essa assimetria tem a ver com a comparação dos valores
de localização média, mediana e moda. Relativamente às medidas de dispersão, estas
dever ser escolhidas em função da medida de tendência central. O desvio padrão só
deverá ser apresentado se estiver associado à média, uma vez que esta medida se
refere a desvios em relação à média. No caso de se apresentar a mediana poder-se-á
optar por indicar o âmbito, por exemplo interquartil, ou apresentar dois percentis. Os
pares de percentis mais frequentemente usados são o (percentil 5, percentil 95) e o
(percentil 25, percentil 75).