Anda di halaman 1dari 86

Big Data Analytics: Analises Estatı́stica

Ms. Daniel Matos de Carvalho

UNIPÊ

18 de julho de 2019

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 1 / 28
Projeto R
R pode ser definido como um ambiente de programação com ferramentas para:

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 2 / 28
Projeto R
R pode ser definido como um ambiente de programação com ferramentas para:
manipulação de dados (poderosa ferramenta estatı́stica)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 2 / 28
Projeto R
R pode ser definido como um ambiente de programação com ferramentas para:
manipulação de dados (poderosa ferramenta estatı́stica)
cálculos

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 2 / 28
Projeto R
R pode ser definido como um ambiente de programação com ferramentas para:
manipulação de dados (poderosa ferramenta estatı́stica)
cálculos
apresentação gráfica

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 2 / 28
Projeto R
R pode ser definido como um ambiente de programação com ferramentas para:
manipulação de dados (poderosa ferramenta estatı́stica)
cálculos
apresentação gráfica
Principais aspectos:

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 2 / 28
Projeto R
R pode ser definido como um ambiente de programação com ferramentas para:
manipulação de dados (poderosa ferramenta estatı́stica)
cálculos
apresentação gráfica
Principais aspectos:
uma manipulação de dados eficaz e facilidade de armazenamento
gratuito

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 2 / 28
Projeto R
R pode ser definido como um ambiente de programação com ferramentas para:
manipulação de dados (poderosa ferramenta estatı́stica)
cálculos
apresentação gráfica
Principais aspectos:
uma manipulação de dados eficaz e facilidade de armazenamento
gratuito
disponı́vel para diversos sistemas operacionais

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 2 / 28
Projeto R
R pode ser definido como um ambiente de programação com ferramentas para:
manipulação de dados (poderosa ferramenta estatı́stica)
cálculos
apresentação gráfica
Principais aspectos:
uma manipulação de dados eficaz e facilidade de armazenamento
gratuito
disponı́vel para diversos sistemas operacionais
uma bem desenvolvida, simples e eficaz linguagem de programação a qual inclui condições,
loops e funções recursivas definidas pelo usuário.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 2 / 28
Projeto R
R pode ser definido como um ambiente de programação com ferramentas para:
manipulação de dados (poderosa ferramenta estatı́stica)
cálculos
apresentação gráfica
Principais aspectos:
uma manipulação de dados eficaz e facilidade de armazenamento
gratuito
disponı́vel para diversos sistemas operacionais
uma bem desenvolvida, simples e eficaz linguagem de programação a qual inclui condições,
loops e funções recursivas definidas pelo usuário.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 2 / 28
Projeto R
Por outro lado!

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 3 / 28
Projeto R
Por outro lado!
Fracamente tipida o que traz flexibilidade porem, pode trazer resultados inseperados
R é pouco eficiente para manipular grande quantidade de dados por serem aramazenadas em
memória.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 3 / 28
Projeto R
Por outro lado!
Fracamente tipida o que traz flexibilidade porem, pode trazer resultados inseperados
R é pouco eficiente para manipular grande quantidade de dados por serem aramazenadas em
memória.
Referências básicas para usuários do R: www.r-project.org

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 3 / 28
Projeto R
Por outro lado!
Fracamente tipida o que traz flexibilidade porem, pode trazer resultados inseperados
R é pouco eficiente para manipular grande quantidade de dados por serem aramazenadas em
memória.
Referências básicas para usuários do R: www.r-project.org
programas para download

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 3 / 28
Projeto R
Por outro lado!
Fracamente tipida o que traz flexibilidade porem, pode trazer resultados inseperados
R é pouco eficiente para manipular grande quantidade de dados por serem aramazenadas em
memória.
Referências básicas para usuários do R: www.r-project.org
programas para download
lista de discussão

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 3 / 28
Projeto R
Por outro lado!
Fracamente tipida o que traz flexibilidade porem, pode trazer resultados inseperados
R é pouco eficiente para manipular grande quantidade de dados por serem aramazenadas em
memória.
Referências básicas para usuários do R: www.r-project.org
programas para download
lista de discussão
documentos e ajudas

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 3 / 28
Projeto R
Por outro lado!
Fracamente tipida o que traz flexibilidade porem, pode trazer resultados inseperados
R é pouco eficiente para manipular grande quantidade de dados por serem aramazenadas em
memória.
Referências básicas para usuários do R: www.r-project.org
programas para download
lista de discussão
documentos e ajudas

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 3 / 28
Objetivo dessa etapa
Apresentar o ambiente de programação R no contexto de simulação e análise dados.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 4 / 28
Objetivo dessa etapa
Apresentar o ambiente de programação R no contexto de simulação e análise dados.
Fornecer exemplos claros e simples da funcionalidade e flexibilidade do R

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 4 / 28
Objetivo dessa etapa
Apresentar o ambiente de programação R no contexto de simulação e análise dados.
Fornecer exemplos claros e simples da funcionalidade e flexibilidade do R
Estimular o aproveitamento do Software Livre, evitando as restrições de softwares
comerciais e o uso não autorizado dessas.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 4 / 28
Objetivo dessa etapa
Apresentar o ambiente de programação R no contexto de simulação e análise dados.
Fornecer exemplos claros e simples da funcionalidade e flexibilidade do R
Estimular o aproveitamento do Software Livre, evitando as restrições de softwares
comerciais e o uso não autorizado dessas.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 4 / 28
Interface R

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 5 / 28
Linhas de Comando
O R é um ambiente de linha de comando definios através de funções.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 6 / 28
Linhas de Comando
O R é um ambiente de linha de comando definios através de funções.
As funções pode ou não requerer argumentos.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 6 / 28
Linhas de Comando
O R é um ambiente de linha de comando definios através de funções.
As funções pode ou não requerer argumentos.
Os argumentos devem ser informados entre parenteses logo após a função.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 6 / 28
Linhas de Comando
O R é um ambiente de linha de comando definios através de funções.
As funções pode ou não requerer argumentos.
Os argumentos devem ser informados entre parenteses logo após a função.
Algumas funções básicas sem argumentos

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 6 / 28
Linhas de Comando
O R é um ambiente de linha de comando definios através de funções.
As funções pode ou não requerer argumentos.
Os argumentos devem ser informados entre parenteses logo após a função.
Algumas funções básicas sem argumentos
1 license()
2 contributors()
3 citation()
4 getwd()

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 6 / 28
Linhas de Comando
O R é um ambiente de linha de comando definios através de funções.
As funções pode ou não requerer argumentos.
Os argumentos devem ser informados entre parenteses logo após a função.
Algumas funções básicas sem argumentos
1 license()
2 contributors()
3 citation()
4 getwd()
5 setwd(diretorio)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 6 / 28
Linhas de Comando
O R é um ambiente de linha de comando definios através de funções.
As funções pode ou não requerer argumentos.
Os argumentos devem ser informados entre parenteses logo após a função.
Algumas funções básicas sem argumentos
1 license()
2 contributors()
3 citation()
4 getwd()
5 setwd(diretorio)
6 dir()

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 6 / 28
Linhas de Comando
O R é um ambiente de linha de comando definios através de funções.
As funções pode ou não requerer argumentos.
Os argumentos devem ser informados entre parenteses logo após a função.
Algumas funções básicas sem argumentos
1 license()
2 contributors()
3 citation()
4 getwd()
5 setwd(diretorio)
6 dir()
7 demo()

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 6 / 28
Linhas de Comando
O R é um ambiente de linha de comando definios através de funções.
As funções pode ou não requerer argumentos.
Os argumentos devem ser informados entre parenteses logo após a função.
Algumas funções básicas sem argumentos
1 license()
2 contributors()
3 citation()
4 getwd()
5 setwd(diretorio)
6 dir()
7 demo()

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 6 / 28
Obtendo ajuda
Como toda liguagem popular, o R possui vasto material na Web, foruns, tutoriais ,
documetnos etc.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 7 / 28
Obtendo ajuda
Como toda liguagem popular, o R possui vasto material na Web, foruns, tutoriais ,
documetnos etc.
O proprio r oferece diveros manuais.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 7 / 28
Obtendo ajuda
Como toda liguagem popular, o R possui vasto material na Web, foruns, tutoriais ,
documetnos etc.
O proprio r oferece diveros manuais.
A melhor forma de se obter ajuda é atraves da linha de comando

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 7 / 28
Obtendo ajuda
Como toda liguagem popular, o R possui vasto material na Web, foruns, tutoriais ,
documetnos etc.
O proprio r oferece diveros manuais.
A melhor forma de se obter ajuda é atraves da linha de comando
1 help.star() - abre a página ajuda do projeto R

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 7 / 28
Obtendo ajuda
Como toda liguagem popular, o R possui vasto material na Web, foruns, tutoriais ,
documetnos etc.
O proprio r oferece diveros manuais.
A melhor forma de se obter ajuda é atraves da linha de comando
1 help.star() - abre a página ajuda do projeto R
2 help(getwd) - Obtem informaçoes sobre uma função especifica

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 7 / 28
Obtendo ajuda
Como toda liguagem popular, o R possui vasto material na Web, foruns, tutoriais ,
documetnos etc.
O proprio r oferece diveros manuais.
A melhor forma de se obter ajuda é atraves da linha de comando
1 help.star() - abre a página ajuda do projeto R
2 help(getwd) - Obtem informaçoes sobre uma função especifica
3 apropos(getw) - Se você não tem certeza da função

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 7 / 28
Obtendo ajuda
Como toda liguagem popular, o R possui vasto material na Web, foruns, tutoriais ,
documetnos etc.
O proprio r oferece diveros manuais.
A melhor forma de se obter ajuda é atraves da linha de comando
1 help.star() - abre a página ajuda do projeto R
2 help(getwd) - Obtem informaçoes sobre uma função especifica
3 apropos(getw) - Se você não tem certeza da função
4 args(setwd) - Se souber a função mas não lembrar os argumentos

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 7 / 28
Obtendo ajuda
Como toda liguagem popular, o R possui vasto material na Web, foruns, tutoriais ,
documetnos etc.
O proprio r oferece diveros manuais.
A melhor forma de se obter ajuda é atraves da linha de comando
1 help.star() - abre a página ajuda do projeto R
2 help(getwd) - Obtem informaçoes sobre uma função especifica
3 apropos(getw) - Se você não tem certeza da função
4 args(setwd) - Se souber a função mas não lembrar os argumentos

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 7 / 28
Sintaxe R
Apresenta regras e sintaxes simples

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 8 / 28
Sintaxe R
Apresenta regras e sintaxes simples
Linguagem sensitiva faz distinção entre maı́usculas e minúsculas;

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 8 / 28
Sintaxe R
Apresenta regras e sintaxes simples
Linguagem sensitiva faz distinção entre maı́usculas e minúsculas;

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 8 / 28
Números: R como calculadora
# isto é um comentário
1+2+6
2*9 + sqrt(10)*9
É possı́vel atribuir um número a um objeto por exemplo vamos atribuir 1000 ao objeto x e
500 ao objeto a.
x = 1000
x
[1] 1000
a < −500
a
[1] 500

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 9 / 28
Comandos Básicos - Limpeza
Podemos usar as funções:
ls() = listar os objetos salvos

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 10 / 28
Comandos Básicos - Limpeza
Podemos usar as funções:
ls() = listar os objetos salvos
rm() - remover os objetos salvos

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 10 / 28
Comandos Básicos - Limpeza
Podemos usar as funções:
ls() = listar os objetos salvos
rm() - remover os objetos salvos
ctrl + l

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 10 / 28
Comandos Básicos - Limpeza
Podemos usar as funções:
ls() = listar os objetos salvos
rm() - remover os objetos salvos
ctrl + l

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 10 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)
letras = c(”a”,”b”,”c”)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)
letras = c(”a”,”b”,”c”)
vetor = rep(”a”,5)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)
letras = c(”a”,”b”,”c”)
vetor = rep(”a”,5)
vetor = scan()

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)
letras = c(”a”,”b”,”c”)
vetor = rep(”a”,5)
vetor = scan()
É possı́vel se referir especificamente a uma posição do vetor?

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)
letras = c(”a”,”b”,”c”)
vetor = rep(”a”,5)
vetor = scan()
É possı́vel se referir especificamente a uma posição do vetor?
length(vetor1)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)
letras = c(”a”,”b”,”c”)
vetor = rep(”a”,5)
vetor = scan()
É possı́vel se referir especificamente a uma posição do vetor?
length(vetor1)
vetor1[2]

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)
letras = c(”a”,”b”,”c”)
vetor = rep(”a”,5)
vetor = scan()
É possı́vel se referir especificamente a uma posição do vetor?
length(vetor1)
vetor1[2]
vetor1[v ≤ 2]

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)
letras = c(”a”,”b”,”c”)
vetor = rep(”a”,5)
vetor = scan()
É possı́vel se referir especificamente a uma posição do vetor?
length(vetor1)
vetor1[2]
vetor1[v ≤ 2]
Como podemos substituir o terceiro e quinto elemento do vetor1 pelo numero 10?

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Vetores
Para o R, um vetor é qualquer conjunto unidimensional de valores.
Esses valores podem ser números, strings (palavras) ou valores lógicos (F para falso e T
para verdadeiro).
vetor1 = c(1,2,3,3.5,8)
vetor2 = seq(1,10,0.5)
letras = c(”a”,”b”,”c”)
vetor = rep(”a”,5)
vetor = scan()
É possı́vel se referir especificamente a uma posição do vetor?
length(vetor1)
vetor1[2]
vetor1[v ≤ 2]
Como podemos substituir o terceiro e quinto elemento do vetor1 pelo numero 10?
Utilizem as funções min, max, sort, order em um vetor nativo do R denominado rivers!

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 11 / 28
Comandos Matemáticos
Uma vez criados, os objetos podem ser usados em contas, equações, funções etc.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 12 / 28
Comandos Básicos
str() Retorna os Argumentos de uma função

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 13 / 28
Comandos Básicos
str() Retorna os Argumentos de uma função
mode() Retorna o tipo de dados

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 13 / 28
Comandos Básicos
str() Retorna os Argumentos de uma função
mode() Retorna o tipo de dados
length() Retorna o tamanho do objeto

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 13 / 28
Comandos Básicos
str() Retorna os Argumentos de uma função
mode() Retorna o tipo de dados
length() Retorna o tamanho do objeto
help() ou ? Retorna informações sobre a função

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 13 / 28
Comandos Básicos
str() Retorna os Argumentos de uma função
mode() Retorna o tipo de dados
length() Retorna o tamanho do objeto
help() ou ? Retorna informações sobre a função
help.search() Retorna um lista com as funções que possuem a expressão

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 13 / 28
Comandos Básicos
str() Retorna os Argumentos de uma função
mode() Retorna o tipo de dados
length() Retorna o tamanho do objeto
help() ou ? Retorna informações sobre a função
help.search() Retorna um lista com as funções que possuem a expressão

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 13 / 28
Matriz
Matriz é uma estrutura de dados com duas dimensões: linha e coluna.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 14 / 28
Matriz
Matriz é uma estrutura de dados com duas dimensões: linha e coluna.
Uma matriz é atribuı́da a um objeto pela função matrix().

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 14 / 28
Matriz
Matriz é uma estrutura de dados com duas dimensões: linha e coluna.
Uma matriz é atribuı́da a um objeto pela função matrix().
Essa função tem como argumentos o conjunto de dados, o número de linhas e o número
de colunas da matriz, nessa ordem.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 14 / 28
Matriz
Matriz é uma estrutura de dados com duas dimensões: linha e coluna.
Uma matriz é atribuı́da a um objeto pela função matrix().
Essa função tem como argumentos o conjunto de dados, o número de linhas e o número
de colunas da matriz, nessa ordem.
Escrevam a matriz abaixo utilizando a função matrix!!

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 14 / 28
Matriz
Matriz é uma estrutura de dados com duas dimensões: linha e coluna.
Uma matriz é atribuı́da a um objeto pela função matrix().
Essa função tem como argumentos o conjunto de dados, o número de linhas e o número
de colunas da matriz, nessa ordem.
Escrevam a matriz abaixo utilizando a função matrix!!
 
1 3 13
A =  25 0 12 
0 32 2

Como podemos realizar consultas na matriz?

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 14 / 28
Matriz
Matriz é uma estrutura de dados com duas dimensões: linha e coluna.
Uma matriz é atribuı́da a um objeto pela função matrix().
Essa função tem como argumentos o conjunto de dados, o número de linhas e o número
de colunas da matriz, nessa ordem.
Escrevam a matriz abaixo utilizando a função matrix!!
 
1 3 13
A =  25 0 12 
0 32 2

Como podemos realizar consultas na matriz?


As funções rbind() e cbind() também geram matrizes!

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 14 / 28
Matriz
Matriz é uma estrutura de dados com duas dimensões: linha e coluna.
Uma matriz é atribuı́da a um objeto pela função matrix().
Essa função tem como argumentos o conjunto de dados, o número de linhas e o número
de colunas da matriz, nessa ordem.
Escrevam a matriz abaixo utilizando a função matrix!!
 
1 3 13
A =  25 0 12 
0 32 2

Como podemos realizar consultas na matriz?


As funções rbind() e cbind() também geram matrizes!

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 14 / 28
Matriz
Utilizando a matrix nativa USPersonalExpenditure:
1 Retornar o valor da 1 linha e terceira coluna
2 Retornar a primeira linha e terceira linha e a primeira e terceira colunna
3 As informações para o ano de 1940.
4 As informações para a categoria de ”Food and Tobacco”.
5 Verifiquem a função dim!

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 15 / 28
Array
Ele representa uma hipermatriz,ou seja, um conjunto de números arranjados em mais de 2
dimensões.
array1 = array(0,c(2,2,2))
array1[,,1]=matrix(c(1:4),2,2)
array1[,,2]=matrix(c(4:8),2,2)
Pode-se perguntar qual é o valor que ocupa a primeira linha, da segunda coluna, da
segunda matriz, do objeto f.
m1[1,2,2]

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 16 / 28
Data Frame
Essa estrutura de dados é uma especie de banco de dados, de estrutura bidimensional.
Podem fazer parte de um mesmo data frame números e caracters.
dados=data.frame(Marca=c(”Wolks”,”Fiat”),Preço=c(32000,28000),Repr = c(TRUE,
FALSE))
dados
Marca Preço Repr
1 Wolks 32000 TRUE
2 Fiat 28000 FALSE
Como se realiza consutas em data frames?
Utilizando $
attach
própria dimensão do data frame

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 17 / 28
Data Frame
edit() - editor visual
dados = edit(DNase)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 18 / 28
Lista
Uma lista é um conjunto de objetos de tamanhos e naturezas diferentes.
h = list(3,matrix(c(1,2,3,4),2,2),”lista”,c(5,6,7,8))
Suponha que se deseje consultar o terceiro elemento do vetor que está alocado na quarta
posição da lista h.
h[[4]][3]
1 7

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 19 / 28
Estruturas de Programação
O R possui um amplo conjunto de estruturas tradicioansi de lingugens de programação:
decisão, laços, tratamentos de erros, funções etc.
Estrutra Condicioal - IF - Permite avaliar e executar uma expressão, se a condição for
verdadeira.
a=1
b=5
if(a<b) print(”Menor”) else print(”Maior”)
Operadores lógicos podem ser utilizados como | (ou), & (e), == (igual) e ! = (diferente)
Outro elemento a ser conhecido são as chaves. No R, ele tem a função de agrupar um
conjunto de expressões que pertencem a um mesmo bloco.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 20 / 28
Estruturas de Programação
if(a > 0 & a <= 1){
print(”Verdadeiro”)
print(a ∗ 10)
else{
print(”Falso”)
print(a/10)
}
}

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 21 / 28
Estruturas de Programação
Entre as estruturas de repetição, tambem conhecidas como laços, estão disponı́vies as
mais usuais: repeat, while e for
Repeat - No que segue, repeat é executado até que a variável ”a”seja igual a 5.
a=0
repeat{
if(a==5) break else
a = a+1
print(a)
}

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 22 / 28
Estruturas de Programação
A estrutura while repete enquanto a condição exressa no argumento especificado for
verdadeira, desta forma, não há necessidade de usar break.
a=0
while(a<5){
a = a+1
print(a)
}

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 23 / 28
Estruturas de Programação
A estrutura for permite percorrer um conjunto de valroes, atribuindo o mesmo a uma
variável.
for(i in 1:length(rivers))

print(rivers[i]/sum(rivers)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 24 / 28
Criando funções no R
Funções são blocos de códigos cujo objetivo é reutilização.
o comando function() - diz que estamos criando uma função.
nome = function (argumento1, . . . , argumenton) {
Comandos da função
return()
}

Argumentos
Comandos da função
return() - Um comando não obrigatório. Nossa função vai obter algum resultado e este
comando faz com que o R retorne o objeto dentro dos parênteses de return() no console
Ex. Faça uma função que retorne a media de um conjunto de dados.

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 25 / 28
Criando funções
func1 = function(x)
{
for(i in 1:length(x))
y = x[i]/10
print(x[i]2 + y )
}
func1(x=c(5,12,13))

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 26 / 28
Importação e Exportação de dados
Salvando e Lendo dados R.
a = 1:10
b = letters[1:5]
save(a, b, file=”diretorio/mydatafile.Rdata”)
rm(a, b)
load(”diretorio/mydatafile.Rdata”)
print(a)
Salvando e Lendo dados .CSV
dads = data.frame(tes1 = c(1,2,3), s = c(”M”,”m”,”f”))
write.csv(dads,”diretorio/data.csv”)
read.csv(”diretorio/data.csv”)

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 27 / 28
I Atividade - Operações básicas

Ms. Daniel Matos de Carvalho (UNIPÊ) Big Data Analytics: Analises Estatı́stica 18 de julho de 2019 28 / 28