Anda di halaman 1dari 6

Social Computing & Big Data Analytics Laboraturioum

Faculty of Economics & Business, Telkom University


©2017

WEEK-1: INTRODUCTION TO DATA MINING WITH R

I. R-Studio
 R adalah sebuah perangkat lunak gratis untuk komputasi statistik dan grafik.
 R dapat diekstensikan dengan mudah dengan 4,728 packages yang tersedia di CRAN.
 Many other packages provided, such as on GitHub.
 Banyak packages lain yang tersedia selain di RStudio, seperti di Github.

II. Mengapa harus menggunakan R-Studio?


 R-studio digunakan secara luar baik di bidang Akademis dan di bidang Industri.
 R-studio mendapatkan peringkat 1 pada polling KDNuggets 2013 dalam kategori “Top
Languages for Analytics, Data Mining, and Data Science”
 CRAN Task View menyediakan berbagai packages untuk beberapa kebutuhan, seperti
Clustering or Estimation.

III. User Interface

Environment Tab: Interactive list


of loaded R objects

History Tab: List of key strokes


entered into the Console

Source: It is a built in text editor of R-Studio Files: File explorer to navigate


drive folder
Plots: Output location for plots
Packages: List of installed
packages

Help: List of installed packages


Console: Location where commands are entered
and the output is printed Viewer: Advanced tab for local
web content

1
Social Computing & Big Data Analytics Laboraturioum
Faculty of Economics & Business, Telkom University
©2017

IV. Perintah Dasar Menentukan Tempat Penyimpanan Data


1. setwd( )

OS X/macOS

contoh: setwd("~/Dekstop/ayobigdata")

Windows

contoh: setwd("D:/BIGDATA")

V. Perintah Dasar Save dan Load .Rdata


1. save( )

perintah save data dgn format .Rdata

contoh: save(x, file=“ ”)


2. load( )

perintah load data dgn format .Rdata

contoh: load(“ ”)

3. rm( )

perintah u/ menghapus data pada Workspace


contoh: rm(x)

VI. Perintah Dasar Write dan Read .csv)


1. write.csv( )

perintah export data dgn format .csv

contoh: save(x, file=“dataperternakan.csv”)


2. read.csv( )

perintah import data dgn format .csv

contoh: load(“dataperternakan.csv”)
3. data.frame( )

perintah u/ membuat values/beberapa tabel menjadi 1 file

contoh: data.frame(nomortable, stokhewan, jenishewan)

2
Social Computing & Big Data Analytics Laboraturioum
Faculty of Economics & Business, Telkom University
©2017

VII. Praktikum
Tulis perintah dibawah ini pada Script:

Cara membaca script (dengan perumpamaan):

 line 1, jika nanti saya memiliki data tolong simpan di folder ini .

 line 2, X adalah variable yang akan diisi kumpulan data dari angka 1 sampai dengan 10

 line 3, tolong save data saya ya.

 line 4, tolong hapus (isi) yang ada dalam variable x


 line 5, tolong load data yang sudah saya simpan.

 line 6, perlihatkan kumpulan data pada variable x

3
Social Computing & Big Data Analytics Laboraturioum
Faculty of Economics & Business, Telkom University
©2017

VIII. Latihan
Buatlah R-script untuk membuat tabel dibawah ini:

4
Social Computing & Big Data Analytics Laboraturioum
Faculty of Economics & Business, Telkom University
©2017

IX. Pekerjaan Rumah


Nomor nama_kecamatan jumlah_kk
1 Kepulauan Seribu Selatan 2709
2 Kepulauan Seribu Utara 4177
3 Jagakarsa 83129
4 Pasar Minggu 90794
5 Cilandak 65045
6 Pesanggrahan 67724
7 Kebayoran Lama 92949
8 Kebayoran Baru 50941
9 Mampang Prapatan 45852
10 Pancoran 48620
11 Tebet 74566
12 Setiabudi 37682
13 Pasar Rebo 58686
14 Ciracas 82956
15 Cipayung 67017
16 Makasar 60226
17 Kramat Jati 85199
18 Jatinegara 100236
19 Duren Sawit 121454
20 Cakung 155740
21 Pulo Gadung 99320
22 Matraman 63641
23 Tanah Abang 55585
24 Menteng 28685
25 Senen 40120
26 Johar Baru 42128
27 Cempaka Putih 30805
28 Kemayoran 76715
29 Sawah Besar 43147
30 Gambir 33884
31 Kembangan 72914
32 Kebon Jeruk 94185
33 Palmerah 66824
34 Grogol Petamburan 75438
35 Tambora 86251
36 Taman Sari 45891
37 Cengkareng 143923
38 Kali Deres 110519
39 Penjaringan 91837
40 Pademangan 52976
41 Tanjung Priok 127405
42 Koja 100570
43 Kelapa Gading 40909
44 Cilincing 125642

5
Social Computing & Big Data Analytics Laboraturioum
Faculty of Economics & Business, Telkom University
©2017

Berdasarkan data diatas, buatlah R-script dan dataset (.csv) sesuai dengan isi tabel tersebut. Dari 44 data
kecamatan di Jakarta, Anda hanya perlu membuat 20 data saja (ketentuan pengerjaan dapat dilihat di

note). Pengumpulan tugas paling lambat dikumpulkan H-2 sebelum kelas Big Data ke

bit.ly/pertemuan1mb…..

o Format penamaan file:

harikelasbigdata_jammasuk_pertemuan1_nomorabsenlab
contoh:
 senin_0930_pertemuan1_20.csv

 senin_0930_pertemuan1_20.rscript

Note:

1. Jika absen anda di nomor 5, berarti anda mengerjakan tugas dimulai dengan urutan 5. Jika absen anda

di nomor 3, berarti anda mengerjakan tugas dimulai dengan urutan 3.

2. Jika absensi anda di nomor yang tidak terdapat di tabel, maka mengulang dari urutan nomor 1. Tetapi
data dalam “Jumlah KK” ditambah angka 2000.

Anda mungkin juga menyukai