Anda di halaman 1dari 13

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

Robson dos Santos Ferreira


Universidade Bandeirante de So Paulo
Brasil
robson1santos@yahoo.com.br
Vernica Yumi Kataoka
Universidade Bandeirante de So Paulo
Brasil
veronicayumi@terra.com.br
Vanderlei Toledo Severino
Universidade Bandeirante de So Paulo
Brasil
vandertoledo@ig.com.br
Jefferson Adevaldo Santos
Universidade Bandeirante de So Paulo
Brasil
profjeffmat@hotmail.com
Resumo
Esta oficina tem como objetivo apresentar o pacote Rcmdr do software R (R, 2010)
para o ensino de conceitos estatsticos bsicos, utilizando como exemplo um banco
de dados de uma turma do 3 ano do ensino mdio de uma escola pblica do estado
de So Paulo. A oficina ser desenvolvida em quatro etapas: instalar o pacote Rcmdr,
importar o banco de dados,determinar medidas estatsticas e tabelas; gerar grficos.
Nas etapas trs e quatro sero exploradas quais as medidas estatsticas e grficos
esto disponveis para as variveis qualitativas, bem como para as quantitativas.
Palavras chave: Ensino, Estatstica, software R, pacote Rcmdr.
Introduo
Vivemos em uma sociedade em que prevalece a rapidez na atualizao das informaes, e,
por conseguinte, se exige uma maior habilidade para se trabalhar de forma mais rpida e
eficiente na interpretao e assimilao das mesmas em prol de um melhor entendimento da
realidade que nos cerca. Geralmente essas informaes so transmitidas aps algum tipo de

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

tratamento estatstico, sendo representadas em forma de tabelas, grficos, medidas, intervalos de


confiana.
Assim, nesse processo acelerado de gerao e repasse de informaes, nota-se uma
necessidade crescente de que o cidado se aproprie de alguns conceitos bsicos de Estatstica,
para auxili-lo na interpretao e compreenso de grande parte dessas informaes, alm de ser
imprescindvel no contexto inferencial para a tomada de decises.
Os Parmetros Curriculares Nacionais (PCN) apontam que a demanda social o que leva a
destacar este tema como um bloco de contedos especfico, evidenciando a sua importncia em
funo do seu uso na sociedade atual. Mais especificamente, os PCN recomendam que ao final
do ensino fundamental os alunos tenham a compreenso da importncia da Estatstica na
atividade humana, observando que ela pode induzir a erros de julgamento, tanto pela
manipulao de dados, como pela apresentao incorreta das informaes, como por exemplo, na
ausncia da freqncia relativa ou em grficos com escalas inadequadas (BRASIL, 1998). Nesta
etapa de ensino recomenda-se que o trabalho com conceitos estatsticos possibilite o
desenvolvimento de formas particulares de pensamento e raciocnio de forma que os alunos,
alm de ler e interpretar grficos, realizar clculos de algumas medidas estatsticas, estejam
habituados a fazer observaes que permitam confiar ou no nos resultados encontrados. J no
ensino mdio o objetivo capacitar o aluno para compreender e interpretar situaes, para se
apropriar de linguagens especficas, argumentar, analisar e avaliar, tirar concluses prprias,
tomar decises, generalizar (BRASIL, 2002, p.111).
Atualmente contamos com uma importante ferramenta para atingir os objetivos supra
citados, o uso da tecnologia, que de acordo com Penteado (2004) vem a cada dia ocupando um
maior espao em nossa sociedade, sobretudo no cotidiano das pessoas. Nesse sentido,
importante integrar ao processo de ensino e aprendizagem de Estatstica, alm do ambiente papel
e lpis, o uso do recurso computacional.
De acordo com os Parmetros Curriculares Nacionais as tecnologias, em suas diferentes
formas e usos, constituem um dos principais agentes de transformao da sociedade, pelas
modificaes que exercem nos meios de produo e por suas conseqncias no cotidiano das
pessoas (BRASIL, 1998, p.43). Destaca-se alguns pontos importantes como: relativizar a
importncia de clculos mecnicos, evidenciar a importncia do papel da linguagem grfica e de
novas formas de representao, entre outros.
Vale ressaltar que, quando apontamos para as vantagens da utilizao do recurso
computacional para o ensino de Estatstica no estamos descartando a importncia do ambiente
papel e lpis no desenvolvimento dos conceitos. O trabalho realizado apenas no ambiente
computacional pode no assegurar uma aprendizagem ativa, uma vez que se corre o risco dos
alunos assumirem uma posio de observadores passivos, tendo desta forma uma baixa
assimilao dos conceitos. Assim, recomendvel que o professor desenvolva paralelamente ao
ambiente computacional, atividades no ambiente papel e lpis explorando desta forma os
conceitos de maneira mais ampla e significativa.
Notamos ainda algumas barreiras no trabalho de Estatstica no ambiente computacional,
quer seja pela dificuldade tanto por parte dos alunos como dos professores no uso do recurso
computacional ou pelo fato de muitos softwares estatsticos no serem gratuitos ou por exigirem
conhecimento de linguagem de programao.

XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

Nesse contexto, esta oficina tem como objetivo apresentar o pacote Rcmdr do software R
(R, 2010) para o ensino de conceitos estatsticos bsicos, utilizando como exemplo um banco de
dados de uma turma do 3 ano do ensino mdio de uma escola pblica do estado de So Paulo.
Software R: Pacote Rcmdr
O software R um ambiente computacional integrado para manipulao, anlise, e
representao grfica de dados baseado em linguagem de programao orientada por objetos e
que disponibiliza uma grande variedade de mtodos estatsticos.
Um dos atrativos desse software estar disponvel sob os termos da GNU General Public
License da Free Software Foundation, na forma de cdigo aberto (open source), podendo ser
compilado e rodado em um grande nmero de plataformas UNIX e similar (incluindo FreeBSD e
Linux), alm do Windows 9x/NT/2000 e MacOS. Outra caracterstica importante do R a
destacar, a possibilidade de utilizao em computadores com configuraes simples, uma vez
que escolas pblicas que no tenham sala de informtica possam conseguir, por meio de doaes,
computadores com capacidade similar.
De fato, uma possvel limitao inicial no uso do software R que necessrio conhecer e
digitar comandos para realizar as operaes. Mas, essa primeira dificuldade pode ser contornada
com o uso do pacote Rcmdr (chamado tambm de R Commander), que foi desenvolvido em
2000, em vrios idiomas (tais como, ingls, portugus, francs, italiano, alemo, espanhol) e
disponibiliza diversos mtodos estatsticos usuais, tanto para auxiliar no ensino da Estatstica
Descritiva como da Inferncia Estatstica.
Uma das vantagens desse pacote que as operaes podem ser feitas por meio de menus e
no diretamente por linhas de comando. Mas, por outro lado, a cada operao realizada
possvel que o usurio visualize na janela do script qual seria a linha de comando necessrio, ou
seja, este pacote permite que o usurio possa aprender passo a passo quais so as linhas de
comando que esto sendo executadas no R.
Existe tambm uma janela para sada dos resultados, sendo que os grficos so gerados
numa janela separada e no rodap so exibidas algumas mensagens que o sistema julga
relevante, como por exemplo, mensagens de erro na execuo, nmero de variveis e linha de
um banco de dados (figura 1).

XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

Figura 1. Tela inicial do pacote Rcmdr.

Para comear a trabalhar com esse pacote o usurio pode encontrar diversos manuais
disponveis gratuitamente na web, tais como, Fox (2005, 2006, 2011), e Mignozzetti (2009).
Desenvolvimento da Oficina
Por conta da limitao do tempo, para o desenvolvimento dessa oficina, ser utilizado
como exemplo um banco de dados pronto de uma turma de 3 ano do ensino mdio, em que
foram investigadas as seguintes variveis: gnero, idade, altura, peso, nota em Matemtica, nota
em Fsica, nota em Portugus, quantidade de irmos, preferncia musical, time favorito, religio,
lazer de preferncia e gosto pela Matemtica (Apndice A).
Vale salientar que numa situao de aula para trabalhar os conceitos bsicos de Estatstica
interessante que o professor possa seguir as etapas de uma pesquisa cientfica, a saber:
elaborao de uma questo de pesquisa (escolha de um tema); formulao de hipteses,
construo do instrumento, coleta, tratamento e interpretao dos dados e comunicao dos
resultados. Outro aspecto a ser observado, que na escolha das variveis, preferencialmente, elas
sejam de natureza diferentes (qualitativa nominal, qualitativa ordinal, quantitativa discreta,
quantitativa contnua), para potencializar a explorao dos diversos conceitos estatsticos e tipos
de grficos, uma vez que dependendo da natureza o tratamento diferenciado.
Essa oficina ser desenvolvida em quatro etapas: instalar o pacote Rcmdr, importar o
banco de dados, determinar medidas estatsticas e tabelas; gerar grficos. Nas etapas trs e quatro
sero exploradas quais as medidas estatsticas e grficos esto disponveis para as variveis
qualitativas, bem como para as quantitativas.
1-Instalao do pacote Rcmdr
Para usar o pacote Rcmdr necessrio inicialmente inst-lo. Ao abrir o R v ao menu
pacotes e depois em instalar pacotes, aparecer um menu com vrias nomes de pases, que
representam onde os pacotes do R e o prprio software esto disponveis. Selecione qualquer
CRAN e esta tela se fechar abrindo outra em que estar disponvel todos os pacotes, nesta tela
escolha o pacote Rcmdr e clique em OK para instal-lo (figura 2).

XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

Figura 2. Etapas para a instalao do pacote Rcmdr.

Depois de instalado basta digitar no console do R: require(Rcmdr) e teclar enter, que uma
janela se abrir disponibilizando o programa. Ressalta-se que, na primeira vez que o pacote for
usado, o R abrir uma janela, perguntado se voc deseja instalar alguns pacotes adicionais, a
resposta deve ser SIM.
2-Importando o banco de dados
Para importar um banco de dados devemos utilizar o menu Dados e escolher a opo
importar arquivos de dados, e posteriormente escolher o programa de onde os dados sero
importados. Para nossa oficina importaremos os dados do Excel (figura 3).

Figura 3. Importando dados do Excel.

No menu ver dados podemos visualizar os dados importados (figura 4).

XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

Figura 4. Visualizao dos dados importados.

3-Obteno das medidas estatsticas.


No menu Estatsticas possvel obter vrias medidas estatsticas e clicando na opo
Resumos- Conjunto de dados ativos, se obtm o resumo de medidas, que no caso das variveis
qualitativas seria o nmero de observaes de cada categoria e para as variveis quantitativas o
valor mnimo, 1 quartil, 2 quartil mediana, mdia, 3 quartil e valor mximo (figura 5 ).

Figura 5. Resumo das medidas para todas as variveis.

Para obter o desvio padro ou um quantil de qualquer varivel quantitativa, ao invs de


optar por Conjunto de dados ativos, basta clicar em Resumos numricos (figura 6). possvel
calcular tambm cada medida estatstica de uma varivel quantitativa de acordo com as
categorias de uma varivel qualitativa (figura 7).

XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

Figura 6. Resumo numrico para a varivel altura.

Figura 7. Resumo numrico para a varivel altura de acordo com o gnero.

Para formar uma tabela de dupla entrada s clicar no menu Tabelas estatsticas e
escolher as duas variveis qualitativas que sero relacionadas (figura 8).

Figura 8. Tabela de dupla entrada para as variveis gnero e gosto pela Matemtica.
XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

4-Grficos.

10
5
0

F requency

15

No menu Grficos apresentado todas as opes de grficos disponveis no pacote e


quando escolhemos, por exemplo, a opo Grfico de Barras apresentado quais so as
variveis disponveis para este tipo de grfico (apenas as variveis qualitativas), escolher a
varivel desejada e clicar em OK que o grfico ser gerado (figura 9).

Muito

No

Pouco Regular

Gosto.Matemtica

Figura 9. Grfico de barras da varivel gosto pela Matemtica.

Vale destacar que, o professor pode aproveitar o momento da gerao dos grficos para
estimular aos alunos a modificar as linhas de comando do default, por exemplo, no caso do
grfico de barras da figura 9, o comando
barplot(table(dados1$Gosto.Matemtica), xlab="Gosto.Matemtica",ylab="Frequency")
O aluno pode mudar o nome dos eixos trocando as expresses em xlab e ylab, pode
modificar tambm a cor das barras, adicionando o comando col aps o ylab, escrevendo as cores
em ingls separadas por aspas, submeter e gerar assim um novo grfico (figura 10):

10
5
0

Frequncia

15

barplot(table(dados1$Gosto.Matemtica), xlab="Gosto pela Matemtica",ylab="Frequncia", col


= c(red,green,blue,black)

Muito

No

Pouco Regular

Gosto pela Matemtica

Figura 10. Grfico de barras da varivel gosto pela Matemtica.

Quando optamos, por exemplo, pela opo Histograma so apresentadas as opes de


variveis disponveis, neste caso as variveis quantitativas (figura 11).
XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

6
4
0

Frequency

10

1.50

.
Figura 11. Histograma da varivel altura.

1.55

1.60

1.65

1.70

1.75

1.80

1.85

dados1$Altura

1.70
1.65
1.55

1.60

Altura

1.75

1.80

possvel gerar um grfico para uma varivel quantitativa de acordo com as categorias de
uma varivel qualitativa, como por exemplo, um boxplot da varivel altura de acordo com o
gnero (figura 12). Pode ser gerado tambm o diagrama de disperso que relaciona duas
variveis quantitativas (figura 13).

M
Gnero

Figura 12. Boxplot da varivel altura de acordo com o gnero.

XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

10

Gnero

65
60

Peso

60

45

45

50

50

55

55

Peso

65

70

70

75

75

F
M

1.55

1.60

1.65
Altura

1.70

1.75

1.80

1.55

1.60

1.65

1.70

1.75

1.80

Altura

(a)
(b)
Figura 13. Diagrama de disperso entre as variveis altura e peso (a) e de acordo com o gnero (b).

Consideraes Finais
Tem-se por hiptese inicial que o trabalho com o software R por meio do pacote Rcmdr
proporcionar novas formas de compreenso de conceitos estatsticos, uma vez que o mesmo
permite exploraes diferenciadas daquelas usualmente tratadas no ambiente papel e lpis, tais
como o acesso rpido e ntido, tanto nas medidas estatsticas como dos grficos.
Por outro lado, em uma primeira anlise, poderamos pensar que esta oficina seria invivel
para a aplicao em sala de aula devido precariedade dos laboratrios de informtica de uma
grande parte das escolas de Educao Bsica e tambm da falta de familiaridade de um nmero
considervel de professores de matemtica com o uso do computador. Contudo, devemos
considerar que segundo Penteado (2004), o movimento, a velocidade, o ritmo acelerado com que
a informtica imprime novos arranjos na vida fora da escola caminham rumo escola, causando
transformaes no ambiente escolar e exigindo transformaes nos sistemas de hierarquias e
prioridades tradicionalmente estabelecidas na profisso docente.
Desta maneira, importante novas propostas de trabalho que contemplem essas
necessidades, e foi pensando nestas dificuldades que para esta oficina optamos pela utilizao de
um software free de baixa configurao e a estruturamos de forma a orientar o seu
desenvolvimento passo a passo, deste a instalao do pacote Rcmdr at a construo dos
grficos, para que mesmo pessoas com pouca familiaridade com o uso do computador, possam
utiliz-lo em suas prticas docentes para o ensino de conceitos bsicos de Estatstica.
Bibliografia e referncias
Brasil, Ministrio da Educao (1998). Secretaria de Educao Fundamental. Parmetros
Curriculares Nacionais: Matemtica. Braslia: Ministrio da Educao/Secretaria de
Educao Fundamental.
Brasil, Ministrio da Educao (2002). Secretaria de Educao Mdia e Tecnolgica. PCN
Ensino Mdio: Orientaes Educacionais complementares aos Parmetros Curriculares
XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

11

Nacionais Cincias da Natureza, Matemtica e suas Tecnologias. Braslia: Ministrio da


Educao/ Secretaria de Educao Mdia e Tecnolgica.
Fox, J (2004). The R Commander: A Basic-Statistics Graphical User Interface to R. Journal of
Statistical Software, 14 (9), 1-42.
Fox, J. (2006) Getting started with R Commander.Disponvel em:
http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/Getting-Started-with-the-Rcmdr.pdf
Fox, J. (2011). Package Rcmdr. Disponvel em: http://cran.rproject.org/web/packages/Rcmdr/Rcmdr.pdf
Mignozzetti, U.G. (2009). Introduo ao R Commander. Disponvel em:
http://www.nadd.prp.usp.br/cis/arqs/aprcmdr.pdf
Penteado, M. G. (2004). Educao matemtica: pesquisa em movimento. So Paulo: Cortez, p.
77-91.
R.Development Core Team (2010). R: A language and environment for statistical computing. R.
Foundation for Statistical Computing, Vienna, Austria, v. 0.02.

XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

12

Apndice A
Banco de dados de uma turma de 3 ano do ensino mdio
Aluno
AlineC.
Andrei
Anderson
Bruna
Carlos
Carolina
Camila
Cristiano
Celso
Daniel
Daniela
Elion
Fabiana
Henrique
Juliana
Julio
Katia
Kelly
Laysla
Leandro
Lincon
Luis
Lilian
MariaAp.
Mariana
Meire
Marcos
Mirian
Murilo
Nilson
Odair
Paula
Priscila
Plinio
Kledson
Rayssa
Rayanna
Rita
Robson
Ruth
Rhuan
Sergio

Gnero Idade Altura Peso Matemtica Fsica Portugus Irmos Msica


F
17
1,58
53
7
7
8
1 Nenhum
M
18
1,76
72
3
5
5
2 Sertanejo
M
17
1,68
68
6
6
5
1 Funk
F
18
1,62
57
3
8
5
0 Sertanejo
M
18
1,82
76
7
3
7
1 Gospel
F
19
1,53
52
2
5
5
3 Funk
F
16
1,65
53
6
9
5
2 Sertanejo
M
17
1,68
62
8
4
5
1 Rock
M
18
1,72
68
3
5
3
2 Pagode
M
17
1,67
64
6
7
5
1 Todos
F
19
1,54
51
7
8
7
2 Gospel
M
18
1,74
68
2
6
4
1 Funk
F
17
1,52
55
7
7
7
2 Sertanejo
M
17
1,79
65
5
1
6
1 Todos
F
18
1,62
57
1
8
8
0 Funk
M
21
1,68
74
6
9
8
2 Todos
F
17
1,57
55
2
6
2
4 Sertanejo
F
17
1,52
48
8
3
5
1 Classica
F
18
1,78
67
5
5
6
2 Funk
M
17
1,64
62
8
5
7
3 Todos
M
19
1,65
64
7
6
7
2 Rap
M
17
1,68
62
8
8
7
1 Forr
F
24
1,71
62
8
7
6
0 Todos
F
17
1,52
46
3
6
8
2 Nenhum
F
17
1,63
54
1
7
6
3 Funk
F
16
1,55
52
7
7
9
2 Sertanejo
M
17
1,68
65
7
5
6
1 Gospel
F
18
1,58
51
2
6
2
3 Funk
M
17
1,78
68
8
2
9
2 Pagode
M
17
1,68
62
6
9
6
1 Pagode
M
18
1,72
68
7
7
5
2 Nenhum
F
19
1,65
72
1
5
1
3 Funk
F
17
1,58
52
7
2
8
2 Sertanejo
M
17
1,68
62
6
6
8
1 Todos
M
17
1,78
68
5
8
6
2 Nenhum
F
18
1,63
54
8
9
8
1 Todos
F
18
1,58
51
7
6
6
2 Sertanejo
F
17
1,73
65
8
8
6
4 Todos
M
17
1,68
62
7
5
7
2 Sertanejo
F
17
1,64
52
9
5
3
1 Todos
M
18
1,72
68
8
6
8
3 Funk
M
21
1,66
62
7
8
8
2 Todos

TimedeFutebol
Palmeiras
Corinthians
S.Paulo
S.Paulo
Nenhum
S.Paulo
Nenhum
Santos
Corinthians
Corinthians
Palmeiras
S.Paulo
Corinthians
S.Paulo
S.Paulo
Corinthians
Corinthians
Palmeiras
Corinthians
S.Paulo
Palmeiras
Corinthians
S.Paulo
Nenhum
Corinthians
S.Paulo
Corinthians
S.Paulo
S.Paulo
Palmeiras
Nenhum
S.Paulo
S.Paulo
Palmeiras
Corinthians
S.Paulo
Corinthians
S.Paulo
Palmeiras
Corinthians
S.Paulo
S.Paulo

Religio
Evanglico
Catlico
Catlico
Catlico
Evanglico
Catlico
Evanglico
Nenhum
Catlico
Catlico
Evanglico
Catlico
Evanglico
Catlico
Catlico
Evanglico
Catlico
Evanglico
Catlico
Catlico
Catlico
Catlico
Evanglico
Evanglico
Catlico
Catlico
Evanglico
Catlico
Catlico
Catlico
Evanglico
Catlico
Catlico
Evanglico
Evanglico
Catlico
Catlico
Evanglico
Catlico
Evanglico
Catlico
Evanglico

Lazer
Tocar
J.Fut.
J.Fut.
Passear
Cantar
Danar
Cantar
Tocar
J.Fut.
Natao
Cantar
Danar
Danar
J.Fut.
Passear
J.Fut.
J.Fut.
Leitura
Danar
Danar
Danar
Correr
OuveMus.
Cantar
Passear
Danar
Tocar
OuveMus.
OuveMus.
J.Fut.
J.Fut.
Danar
J.Fut.
Passear
J.Fut.
Danar
OuveMus.
OuveMus.
Passear
Passear
Danar
OuveMus.

GostoMatemtica
Muito
No
Regular
Pouco
Regular
Pouco
Regular
Regular
Pouco
Regular
No
No
Regular
Regular
No
Regular
Pouco
Muito
Pouco
Muito
Regular
Muito
Regular
Regular
Pouco
Pouco
Regular
Pouco
No
Regular
Muito
No
Regular
Regular
Regular
Muito
Regular
Muito
Muito
Muito
Muito
Muito

XIII CIAEM-IACME, Recife, Brasil, 2011.

Estatstica Descritiva com o uso do software R: Pacote Rcmdr

13

Apndice B
Informaes gerais sobre a oficina
Ttulo da oficina

Estatstica Descritiva com o uso do software R: pacote Rcmdr

Nome dos autores

Robson dos Santos Ferreira, robson1santos@yahoo.com.br


Vernica Yumi Kataoka, veronicayumi@terra.com.br
Vanderlei Toledo Severino, vandertoledo@ig.com.br
Jefferson Adevaldo Santos, profjeffmat@hotmail.com
UNIBAN - Universidade Bandeirantes de So Paulo
Brasil
2 horas

Instituies dos autores


Pas
Nmero de horas mais
convenientes
Nvel de escolarizao
Nmero mximo de
pessoas
Equipamentos
audiovisuais

Ensino Fundamental, Ensino Mdio, Ensino Superior


20
Datashow, laboratrio de informtica com o software R e o pacote Rcmdr
instalados.

XIII CIAEM-IACME, Recife, Brasil, 2011.