Anda di halaman 1dari 28

ao ambiente Breve introduc ao

Idealmente nas aulas prticas usar uma pen onde se cria uma pasta para colocar todo o material necessrio

Manuela Neves Outubro 2013 p. 1/28

ao ambiente Breve introduc ao


Iniciar e terminar uma sesso de Criar uma pasta (ex. EstatR) onde iro guardar-se todos os cheiros de trabalho - cheiros de dados, cheiros de resultados, cheiros do . Iniciar o - abre-se uma janela de trabalho. Especicar logo a pasta de trabalho menu: File Change dir ... Os comandos so dados frente da executados aps pressionar Enter.
prompt > e so

Para terminar uma sesso executar >q(). Se pretender guardar o workspace (sesso de trabalho que contm o conjunto de objectos de trabalho) ca guardado no cheiro .Rdata
Manuela Neves Outubro 2013 p. 2/28

E agora as sessoes de

seguintes?

Para abrir uma sesso de rabalhar e clicar em .RData

entrar na pasta onde esteve a

Fica automaticamente aberto o

na pasta de trabalho

Manuela Neves Outubro 2013 p. 3/28

ao ambiente Breve introduc ao


Todas as funes e comandos em (mdulos) packages. esto armazenados em

Para: - ver quais os packages disponveis >(.packages()) - ver quais os packages instalados >library() - carregar em memria um package instalado >library(nome-package) ou menu: Packages Load Package ... Para instalar um package fazer menu: Packages Install Package ... Numa sesso de o contedo de um package s ca disponvel quando ele carregado em memria.
Manuela Neves Outubro 2013 p. 4/28

ao ambiente Breve introduc ao

Ajudas no Sobre um package >help(package=datasets) Sobre um conjunto de dados >help(InsectSprays) ou Sobre uma funo >help (mean) ou

> ?InsectSprays

> ?mean

Para pesquisar uma sequncia de caracteres >help.search("norm") ou >??norm Indica o package e comando onde aparece a sequncia
stats::Normal The Normal Distribution

Manuela Neves Outubro 2013 p. 5/28

ao ambiente Breve introduc ao


pode ser usado como uma calculadora: Expresses aritmticas: > 2 + 3/4 7 2 [1] 38.75 > exp(-2)/log(sqrt(2)) [1] 0.3904951 > sin(pi/3) 2 + cos(pi/3) 2 [1] 1 Atribuio: e ao aparece, > x< 3 # O resultado n guardado na vari avel x e s o mostra o conte udo fazendo > x
Manuela Neves Outubro 2013 p. 6/28

ao ambiente Breve introduc ao


Os objectos do so entidades que o podem ser guardados num workspace. Para ver a lista dos objectos no workspace: cria, manipula e

> ls()

Para ver a informao sobre os objectos no workspace: > ls.str() Para apagar objectos:
> rm(x, y)

Para apagar todos os objectos no workspace > rm(list=ls()) Para guardar o workspace num cheiro: > save.image() ou menu: FileSave Workspace ... O cheiro workspace por omisso .RData
Manuela Neves Outubro 2013 p. 7/28

ao ambiente Breve introduc ao

Em vez de escrever os comandos directamente na consola do podem ser escritos e guardados em ficheiros de texto para acilitar a sua utilizao posterior. Estes cheiros devem ter extenso .R e devem ser guardados na pasta de trabalho.

Para: Criar um cheiro de script menu: File New script ... Utilizar um cheiro de script menu: File Open script ...

Manuela Neves Outubro 2013 p. 8/28

Objectos no

Vector

Vector: estrutura de dados do mesmo tipo (numrico ou caracteres). Criao de um vector - o uso de c() > x < c(1.2, 5.7, 6.3, 8, 14) > cores < c("Red","Green","Blue") > u < c(F,T,F) > mais.cores < c(cores, "Yellow","Black") Um vector pode conter smbolos especiais: NA (valor desconhecido, missing value), NaN (Not a Number) , Inf , - Inf. z < c(log(0),NA,Inf);z [1] -Inf NA Inf
Manuela Neves Outubro 2013 p. 9/28

Objectos no

Vector

Gerao de sequncias > y < 1:5 > w < seq(1, 1.4, by = 0.1) > w1 < rep(1,7) > w2 < rep(1:3,2) Operaes com vectores > v1 < c(1,3,2,1); v2 < c(2,4,5,1)
Nota: operaes realizadas elemento a elemento o vector de menor dimenso concatenado consigo prprio

> v1+v2; v1*v2; v1*2; 2/v1

Manuela Neves Outubro 2013 p. 10/28

Objectos no

Vector

Operadores lgicos > x>4; x>4 & x<6 (& conjuno) > x<5 |x >= 8 ( | disjuno) > 2==sqrt(4) [1] TRUE Seleco de elementos de um vector - usa-se [ ] > cores[1] - devolve a 1a componente do vector cores > cores[-c(1,3)] - mostra o vector resultante da remoo
dos elementos na posio 1 e 3 do vector cores

> x[u] - devolve as componentes de x correspondentes s


componentes TRUE de u

> x[x>2 & x<14] - devolve as componentes de x entre 2 e 14

Manuela Neves Outubro 2013 p. 11/28

Objectos no

Vector

Algumas funes - realizadas elemento a elemento > length(x) - devolve o numero de elementos do vector x > sort(x) - devolve um vector com os elementos do vector x
ordenados por ordem crescente

> sum(x) - devolve a soma dos elementos do vector vector x > prod(x) - devolve o produto dos elementos do vector x > cumsum(x) - devolve um vector cujos elementos so a soma
acumulada dos elementos do vector x

> max(x); min(x) - devolve mximo e mnimo dos elementos


do vector vector x

> factorial(x) - devolve, para cada componente xi , (xi + 1) > choose(n,k) - devolve n k

Manuela Neves Outubro 2013 p. 12/28

Objectos no

Matrix

Uma matriz uma estrutura de dados, do mesmo tipo, eferenciados por dois ndices (a duas dimenses). Dene-se pelo nmero de linhas nrow e nmero de colunas ncol e um conjunto de nrow ncol valores.

>M <- matrix(1:12,nrow=3,ncol=4);M >rownames(M)<-c("L1","L2","L3") >colnames(M)<-c("C1","C2","C3","C4");M


C1 C2 C3 C4 L1 1 4 7 10 L2 2 5 8 11 L3 3 6 9 12

[,1] [,2] [,3] [,4] [1,] 1 4 7 10 [2,] 2 5 8 11 [3,] 3 6 9 12

Os valores so dispostos por coluna, a menos que seja indicado

> M <- matrix(1:12,3,4,byrow=T)


Manuela Neves Outubro 2013 p. 13/28

Objectos no

Data Frame

Um data frame semelhante a uma matriz em que as colunas podem conter dados de diferentes tipos. Um data frame pode ser visto como uma tabela de uma base de dados, em que cada inha corresponde a um registo e cada coluna corresponde s variveis, propriedades) guardadas para cada registo da tabela. basta fazer

Para ver os dados que existem no


> data( )

Leitura de um data frame existente no


# carrega os dados especificados # v e propriedades # para visualizar # as primeiras linhas # d a a 2a coluna
Manuela Neves Outubro 2013 p. 14/28

> data(ToothGrowth) > str(ToothGrowth)) > head(ToothGrowth)

> ToothGrowth[,2]

Objectos no

Data Frame

a estrutura usual para armazenar tabelas de dados

Como criar um data frame?

> pauta <- data.frame(N.Aluno = c(18355, 17456, 19334, 17 + turma = c("T1", "T2", "T3", "T3"), + notas.Est = c(10.3,9.3, 14.2, 15)) > pauta; pauta$notas.Est

N_Aluno turma notas.Est 1 18355 T1 10.3 2 17456 T2 9.3 3 19334 T3 14.2 4 17756 T3 15.0 ... [1] 10.3 9.3 14.2 15.0

Manuela Neves Outubro 2013 p. 15/28

Leitura de cheiros

Uma das forma mais comuns de armazenar dados para trabalhar no usar cheiros de texto. Por exemplo, num cheiro em formato csv (Comma Separated Values) os valores de cada coluna de uma linha esto separados por vrgulas. O comando read.table() permite ler os dados, podendo ser guardados num data frame:

>read.table("ficheiro",header=TRUE,sep=";",as.is=TRUE)

Manuela Neves Outubro 2013 p. 16/28

Func oes em
tem um vasto conjunto de funes j denidas - exemplos:
a vimos #j

> rep(4,10)

[1] 4 4 4 4 4 4 4 4 4 4

> paste("V",1:5,sep="")

[1] "V1" "V2" "V3" "V4" "V5"

> LETTERS[1:7]

[1] "A" "B" "C" "D" "E" "F" "G"

Funes standard (j referimos algumas atrs) - agora mais alguns exemplos

abs() sign() log() log10() sqrt() round(x,3) exp() sin() cos() tan() gamma() lgamma() choose()
Manuela Neves Outubro 2013 p. 17/28

Func oes em

- mais uns exemplos

Funes de lgebra matricial


t(X) nrow(X) eigen(X) diag(x,nrow,ncol) ... solve(A,b) det(X)

Funes estatsticas
mean() median() quantile(x,prob=p) var() sd() summary() sum() cumsum() sample() plot() hist() boxplot() predict() lm() aov() t.test() ...

Mais adiante veremos muitas mais

Manuela Neves Outubro 2013 p. 18/28

Analise exploratoria de dados

Tabela de frequncias - varivel quantitativa discreta com poucos valores distintos

>data(InsectSprays) > ni<-table(InsectSprays$spray) #freq. absoluta > fi<-ni/sum(ni) > Fi<-cumsum(fi) > Fi.ar<-round(Fi,3) > cbind(ni,fi,Fi,Fi.ar)
ni 12 12 12 12 12 12 fi 0.1666667 0.1666667 0.1666667 0.1666667 0.1666667 0.1666667 Fi 0.1666667 0.3333333 0.5000000 0.6666667 0.8333333 1.0000000 Fi.ar 0.167 0.333 0.500 0.667 0.833 1.000
Manuela Neves Outubro 2013 p. 19/28

A B C D E F

Analise exploratoria de dados

O resultado da funo hist(count,plot=F) ento uma List com as seguintes componentes

breaks - limites das classes counts - frequncia absoluta de cada classe intensities - (frequncia relativa / amplitude) de cada classe density - idem mids - ponto mdio de cada classe equidist - lgico que indica se as classes tm ou no amplitude constante

Manuela Neves Outubro 2013 p. 20/28

Analise exploratoria de dados

Nota: se as classes tm amplitude varivel, a altura de cada ectngulo a frequncia relativa/amplitude da classe) - feito por omisso, no
data(chickwts) head(chickwts) par(mfrow=c(2,2)) # permite representar 4 gr aficos hist(weight,breaks= c(seq(100,250,50),275,seq(300,450,50))) #comparar as alturas das classes 3 e 4 hist(weight, freq=T,breaks= c(seq(100,250,50),275,seq(300,450,50))) #mensagem hist(weight,col="grey",main="Hist. do peso", freq=F,ylab="Freq. relat")

> > > > + + > + > +

Manuela Neves Outubro 2013 p. 21/28

Analise exploratoria de dados


Histogram of weight
15

Histogram of weight

Frequency

Density
100 200 300 weight 400

0.000
100

0.003

10

200

300 weight

400

Histogram of weight
15

Hist. do peso

Frequency

Freq. relat
100 200 300 weight 400

0.000
100

0.003

10

200

300 weight

400

Manuela Neves Outubro 2013 p. 22/28

Analise exploratoria de dados bivariados

Consideremos o data frame

>data(cars) >head(cars)

Covarincia e coeciente de correlao

>attach(cars) >cov(speed,dist) >cor(speed,dist) # coeficiente de correlac ao de Pearson.

[1] 109.9469 [1] 0.8068949

Manuela Neves Outubro 2013 p. 23/28

Gracos para dados bivariados

Se x e y so vectores, plot(x,y) ou plot(y x) produzem um diagrama de disperso de y contra x.

>par(mfrow=c(1,2)) > plot(cars$speed,cars$dist) >plot(cars$speed,cars$dist,col="red",lwd=3)

80 120

dist

40

dist
5 10 15 speed 20 25

0
5

40

80 120

10

15 speed

20

25

Manuela Neves Outubro 2013 p. 24/28

Gracos no

Um grco activo admite interaco do utilizador


locator(n,type="p"): aguarda que o utilizador seleccione n localizaes no grco activo com recurso ao "boto esquerdo do rato", assinalando-os e dando as coordenadas. identify(x, y, labels) : permite identicar pontos denidos por (x,y) text(x,y,"ol a"): escrever texto na coordenada (x,y).

Exemplo
plot(cars$speed,cars$dist) locator(2,type="p",col=3,lwd=3) identify(7,40,col=4,lwd=3) a") text(7,100,"ol

> > > >

Manuela Neves Outubro 2013 p. 25/28

Gracos no

Funes grcas de baixo nvel as funes points(x,y) e lines(x,y) permitem acrescentar, respectivamente, pontos e pontos ligados por linhas; a funo abline(a,b) acrescenta uma recta de declive b e ordenada na origem a; as funes abline(v=x) e abline(h=y) permitem adicionar rectas verticais (de abcissa x) e horizontais (de ordenada y), respectivamente; a funo legend (title) permite acrescentar uma legenda (titulo) ao grco.

Manuela Neves Outubro 2013 p. 26/28

O modelo linear simples

Em o modelo linear simples utiliza as funes: lm(yx) ou lm(y1+x)

> cars.lm <- lm(dist speed) > coef(cars.lm)

(Intercept) -17.579095

speed 3.932409

Manuela Neves Outubro 2013 p. 27/28

Gracos no

>plot(speed,dist) >abline(cars.lm,col=3,lwd=3)

dist

0 5

20

40

60

80 100

10

15 speed

20

25

Manuela Neves Outubro 2013 p. 28/28

Anda mungkin juga menyukai