Anda di halaman 1dari 19

LAPORAN PRAKTIKUM

PERTEMUAN I
DATA MINING

Oleh

Nama : Ratih Rafflesia Kumala Sari

NPM : F1F020033

Dosen Pengampu : Winalia Agwil, S.Si., M.Si.

Asisten Praktikum : 1. Muhammad Arib Alwansyah (F1F018009)

2. Alin Febianti Fikri (F1F018019)

3. Idam Abdurrohim Hasani (F1F019009)

4. Reyvo Valeriyan (F1F019011)

5. Okta Saputra (F1F019023)

LABORATORIUM MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BENGKULU
2022
KATA PENGANTAR
Puji syukur kehadirat Tuhan Yang Maha Esa atas segala limpahan Rahmat dan
Karunia-Nya sehingga penulis dapat menyelesaikan laporan praktikum ini dalam bentuk
maupun isi yang sangat sederhana. Semoga laporan ini dapat dipergunakan sebagai
salah satu acuan dan pedoman yang bermanfaat bagi pembaca.
Harapan penulis semoga laporan ini membantu menambah pengetahuan dan
pengalaman bagi para pembaca, sehingga penulis dapat memperbaiki bentuk maupun isi
laporan ini menjadi lebih baik lagi kedepannya.
Laporan ini penulis akui masih banyak terdapat kekurangan dikarenakan
pengalaman yang penulis miliki masih kurang. Oleh karena itu penulis mengharapkan
para pembaca dapat memberikan kritik dan saran yang bersifat membangun untuk
kesempurnaan laporan ini.

Bengkulu, 04 April 2022

Penulis

ii
DAFTAR ISI
HALAMAN JUDUL.........................................................................................................i
KATA PENGANTAR.....................................................................................................ii
DAFTAR ISI...................................................................................................................iii
DAFTAR GAMBAR......................................................................................................iv
DAFTAR TABEL............................................................................................................v
PENGENALAN PROGRAM R
1.1 Pendahuluan.............................................................................................................1
a. Latar Belakang.......................................................................................................1
b. Rumusan Masalah..................................................................................................1
c. Tujuan....................................................................................................................1
1.2 Landasan Teori.........................................................................................................2
1.3 Langkah Kerja dan Teladan...................................................................................5
a. Langkah Kerja........................................................................................................5
b. Teladan...................................................................................................................7
1.4 Hasil dan Pembahasan.............................................................................................8
a. Hasil.......................................................................................................................8
b. Pembahasan.........................................................................................................10
1.5 Kesimpulan dan Saran...........................................................................................12
a. Kesimpulan..........................................................................................................12
b. Saran....................................................................................................................13
DAFTAR PUSTAKA.....................................................................................................vi

iii
DAFTAR GAMBAR
Gambar 1. Icon Program Rstudio........................................................................................5
Gambar 2. Tampilan Lembar Kerja Program Rstudio.........................................................5
Gambar 3. Sintaks Teladan No 1.........................................................................................6
Gambar 4. Sintaks Teladan No 2.........................................................................................6
Gambar 5. Sintaks Teladan No 3.........................................................................................6
Gambar 6. Hasil Sintaks Teladan No 1...............................................................................8
Gambar 7. Hasil Sintaks Teladan No 2...............................................................................8
Gambar 8. Lanjutan Hasil Sintaks Teladan No 2................................................................9
Gambar 9. Hasil Sintaks Teladan No 3...............................................................................9
Gambar 10. Lanjutan Hasil Sintaks Teladan No 3..............................................................9

iv
DAFTAR TABEL
Tabel 1. Operator untuk Operasi Matriks dan Vektor.........................................................3
Tabel 2. Data Teladan..........................................................................................................7

v
PENGENALAN PROGRAM R
1.1 Pendahuluan
a. Latar Belakang
Dalam dunia teknologi ada beragam jenis software bahasa pemrograman, salah
satunya adalah R. Dikalangan para data scientist mungkin nama R sudah tidak asing
lagi didengar bahkan digunakan dalam menunjang pekerjaan sehari-hari. Pada awalnya,
R sendiri diciptakan oleh Ross Ihaka dan Robert Gentleman pada tahun 1995 sebagai
implementasi dari bahasa program S. Tujuannya untuk mengembangkan bahasa yang
fokus pada analisis data, statistik dan model grafis. Dahulu, R hanya digunakan oleh
para akademisi, namun lama-kelamaan juga banyak digunakan oleh para praktisi di
dunia bisnis. Hal inilah yang membuat R menjadi sangat terkenal di seluruh dunia.
Salah satu keunggulan R adalah komunitas besar yang tergabung dalam satu mailing
list, dokumentasi para pengguna yang mudah diakses, grup stack overflow yang sangat
aktif, dan koleksi packages R yang dibagikan oleh sesama pengguna.
Di masa sekarang, R biasanya lebih banyak digunakan untuk analisis data yang
dikerjakan pada server pribadi. R dapat difungsikan untuk pekerjaan eksplorasi hampir
semua jenis data karena banyaknya jenis packages, test dan tools yang dengan mudah
bisa diadaptasi. Penggunaan rumus - rumus rumit dalam R juga mudah diatur. R sangat
baik dan mudah digunakan dalam visualisasi data. Ada banyak sekali packages yang
mendukung R untuk membangun visualisasi menarik, seperti ggplot2 untuk membuat
grafik, lattice untuk menampilkan hubungan variabel dan rCharts untuk menerbitkan
visualisasi Java Script dengan R. R juga dibangun dalam ekosistem yang baik sehingga
memudahkan penggunanya untuk menemukan packages dalam cran, bioconductor dan
github. R pun dibangun oleh statistisi untuk statistisi, sehingga siapapun yang tidak
memiliki keahlian programming dalam dengan mudah beradaptasi dengan R.
b. Rumusan Masalah
Berdasarkan latar belakang di atas, rumusan masalah yang dapat disimpulkan
adalah bagaimana prosedur penggunaan program R?
c. Tujuan
Berdasarkan rumusan masalah di atas, tujuan praktikum yang dapat disimpulkan
adalah agar mahasiswa dapat mengenal prosedur penggunaan program R.

1
1.2 Landasan Teori
R merupakan suatu sistem analisis statistika yang relatif lengkap sebagai hasil dari
kolaborasi riset berbagai statistikawan di seluruh dunia. Versi paling awal R dibuat pada
tahun 1992 di Universitas Auckland, New Zealand oleh Ross Ihaka dan Robert
Gentlemen. R merupakan software statistika yang open source, sehingga untuk
menggunakannya tidak diperlukan pembayaran lisensi. Selain itu, R bersifat
multiplatforms, dengan file instalasi binary/file tar tersedia untuk sistem operasi
Windows, Mac OS, Mac OS X, Free BSD, NetBSD, Linux, Irix, Solaris, AIX dan
HPUX. R dapat diperoleh secara gratis di CRAN-archive (The Comprehensive R
Archive Network).
Ada beberapa jenis data objek pada program R, yaitu data array satu dimensi atau
data vektor, data matriks, data frame dan data list, dimana:
1. Data Array Satu Dimensi/Data Vektor
Vektor merupakan objek yang paling dasar yang dikenal dalam R, yang merupakan
suatu array (himpunan bilangan), character (string), logical value dan lain-lain. Mode
yang digunakan pada vektor haruslah tunggal, yakni tidak dapat menggabungkan dua
kata atau lebih yang berbeda mode ke dalam satu objek. Sintak yang digunakan adalah
> x=c (U ); dimana U adalah data yang akan di input. Berikut beberapa perintah yang
digunakan untuk menampilkan hasil:
>x # untuk melihat elemen-elemen objek vektor x
> x [1] # menampilkan elemen pertama
> x [c (2,5)] # menampilkan elemen kedua dan kelima
> x [−4 ] # menampilkan semua elemen kecuali elemen keempat
> x [−c (1,3)] # menampilkan semua elemen kecuali elemen kesatu dan ketiga
> x [ x>8 ] # menampilkan semua elemen yang lebih besar dari 8
> y=x [ x >8]#memeberi nama/menyimpan nilai vektor di atas dengan nama y
>y # menampilkan y
(Novianti dkk, 2022)
2. Data Matriks
Matriks atau data array dua dimensi adalah salah satu tipe data yang banyak
digunakan dalam pemrograman statistik. Sebagian besar fungsi-fungsi statistik dalam R
dapat dianalisis dengan menggunakan bentuk matriks. Bentuk matriks ini juga banyak

2
digunakan pada operasi fungsi-fungsi built-in untuk aljabar linear dalam R, seperti
untuk penyelesaian suatu persamaan linear. Proses entry data matriks dilakukan dengan
menggunakan fungsi matrix. Argumen yang diperlukan adalah elemen-elemen dari
matriks dan argumen optional yaitu banyaknya baris nrow dan banyaknya kolom
ncolom.
Nama_Variabel = matrix(object1, object2, …).
Ada beberapa operator yang biasa digunakan untuk operasi matriks dan vektor, antara
lain perkalian, invers matriks, transpose matriks dan crossproduct. Ringkasan dari
operator-operator ini dapat dilihat pada tabel di bawah ini:
Tabel 1. Operator untuk Operasi Matriks dan Vektor
Operator Keterangan
* Perkalian elemen demi elemen dari matriks
%*% Perkalian matriks
%ο % Outer
solve Invers dari suatu matriks
t Transpose dari suatu matriks
crossprod Crossproduct suatu matriks, yaitu t (x)%*% x

3. Data Frame
Data frame merupakan objek yang mempunyai bentuk sama dengan matriks, yaitu
terdiri atas baris dan kolom. Perbedaannya adalah data frame dapat terdiri atas mode
data yang berbeda-beda untuk setiap kolomnya. Misalkan saja, kolom pertama adalah
numeric, kolom kedua adalah string/character dan kolom ketiga adalah logical. Objek
data frame dapat dibuat dengan menggunakan perintah data.frame, seperti pada contoh
berikut ini:
Nama_Variabel = data.frame(object1, object2, …).
(Sumara, 2015)
4. Data List
Data list merupakan bentuk objek yang paling umum dan paling fleksibel di dalam
R. List merupakan objek data yang elemen di dalamnya boleh memiliki mode yang
berbeda. Perintah-perintah untuk membuat list adalah list dan as.list. Umumnya list

3
digunakan untuk menyimpan hasil suatu fungsi. Perintah unlist akan membuat list
menjadi vektor. Akses terhadap list dapat dilakukan melalui beberapa cara, yaitu:
a. By name: menggunakan operator $
b. By position: menggunakan operator [[]]
c. Sebagai vektor: menggunakan operator []
(Soleh, 2019)
R digunakan untuk melakukan perhitungan dan manipulasi data secara statistik
serta untuk menampilkan data dalam bentuk grafis. R mempunyai beberapa fasilitas,
yakni:
1. Pengelolaan dan penyimpanan data.
2. Kumpulan operasi untuk perhitungan pada array atau khususnya matriks.
3. Kumpulan fasilitas pengolahan data yang cukup besar dan komprehensif.
4. Sarana pembuatan grafis dan penampilan untuk penyajian pada layar monitor
ataupun pada kertas , juga untuk dapat disimpan sebagai file komputer; output/hasil
proses yang berbentuk gambar dapat disimpan dalam berbagai bentuk format,
misalnya jpg, png, ps, pdf, emf, pictex dan xfig, walaupun ketersediaan format ini
amat tergantung pada sistem operasi komputer yang digunakan.
5. Bahasa pemrograman R ini kemudian telah dikembangkan dengan baik, tetapi tetap
sederhana dan kemudian disebut sebagai bahasa pemrograman R.
(Hardhono dan Imas, 2022)

4
1.3 Langkah Kerja dan Teladan
a. Langkah Kerja
1. Cari icon program Rstudio pada layar desktop, lalu klik icon tersebut untuk
membuka program.

Gambar 1. Icon Program Rstudio.


2. Tunggu beberapa saat hingga program Rstudio terbuka, sehingga menampilkan
lembar kerja seperti di bawah ini.

Gambar 2. Tampilan Lembar Kerja Program Rstudio.

5
3. Masukkan sintaks teladan yang ingin dijalankan pada R script, block sintaks lalu
klik run atau klik CTRL + Enter pada setiap akhir sintaks untuk melihat hasil
output pada R console.

Gambar 3. Sintaks Teladan No. 1.

Gambar 4. Sintaks Teladan No. 2.

Gambar 5. Sintaks Teladan No. 3.


4. Maka hasil output akan muncul pada menu R console.

b. Teladan

6
1. Buatlah data berikut ke dalam program R!
Tabel 2. Data Teladan 1
FXUDolla
Date CPI SBI Word_Oil_Prices
r
Jan-96 2600 72.58 47.79 51.69
Feb-96 2600 72.72 47.92 51.59
Mar-96 2822 73.86 47.99 53.36
Apr-96 3016 71.15 47.98 54.68
May-96 2926 69.15 47.79 53.02
Jun-96 2130 67.43 47.79 52.46
Jul-96 2468 68.43 47.92 53.46

( ) ( )
44 58 42 43 44
2. Misalkan A= 67 46 49 dan B= 43 43 , maka hitunglah
50 43 51 44 42
a. Perkalian matriks AB
b. At
c. A−1
d. ( AB )t

( ) ( )
49 58 48 56 65 62
3. Misalkan C= 109 51 57 dan D= 59 47 49 , maka hitunglah
67 50 45 51 55 61
a. Perkalian matriks CD
b. D −1
c. C t
d. C−1

7
1.4 Hasil dan Pembahasan
a. Hasil

Gambar 6. Hasil Sintaks Teladan No. 1.

Gambar 7. Hasil Sintaks Teladan No. 2.

8
Gambar 8. Lanjutan Hasil Sintaks Teladan No. 2.

Gambar 9. Hasil Sintaks Teladan No. 3.

Gambar 10. Lanjutan Hasil Sintaks Teladan No. 3.


b. Pembahasan

9
Pada teladan soal nomor 1, praktikan diminta untuk menampilkan sebuah data ke
dalam program R. Terdapat beberapa cara untuk menampilkan data ke dalam program
R. yaitu menggunakan fungsi read.table, read.xlx dan read.delim. Untuk menyelesaikan
soal teladan kali ini, praktikan memilih menggunakan fungsi read.delim karena
pemanggilan data dapat dilakukan dengan lebih mudah seperti sistem copy paste.
Caranya copy data yang ingin ditampilkan dari Excel, dimana data tersebut akan
otomatis masuk ke dalam clipboard. Kemudian beri nama variabel lalu masukkan
sintaks dengan menggunakan fungsi read.delim("clipboard") untuk mendefinisikan data
yang ingin ditampilkan. Panggil kembali nama variabel yang sudah didefinisikan tadi
seperti yang terlihat pada gambar 3. Block semua sintaks yang telah dibuat lalu klik run,
maka data akan mucul pada R console dapat dilihat pada gambar 6.
Pada teladan soal nomor 2, terdapat dua buah matriks A dan B. Matriks A berordo
3 ×3 dan matriks B berordo 3 ×2. Kemudian praktikan diminta untuk mencari hasil
perkalian matriks AB, transpose matriks A , invers matriks A dan transpose hasil
perkalian matriks AB. Dengan menggunakan program R, definisikan terlebih dahulu
matriks A dengan sintaks A <-matrix(c(44,58,42,67,46,49,50,43,51),
nrow=3 ,ncol=3 ,byrow=TRUE) dan matriks B dengan sintaks B<-
matrix(c(43,43,44,44,43,42), nrow=3, ncol=2, byrow=FALSE), dimana penambahan
argumen nrow untuk menentukan baris matriks, ncol untuk kolom matriks dan byrow
untuk mengurutkan angka sesuai dengan jumlah ordo. Terdapat dua cara untuk
mengurutkan angka, yaitu ke samping dan ke bawah. Apabila ingin mengurutkan ke
samping maka tambahkan TRUE pada argumen byrow, jika ingin mengurutkan ke
bawah maka tambahkan FALSE. Setelah selesai mendefinisikan matriks A dan B,
selajutnya dapat dicari hasil perhitungan yang diinginkan dengan memanfaatkan
operator matriks. Untuk teladan 2a, perkalian matriks AB dapat dicari dengan

[ ]
6234 6194
menggunakan sintaks AB<-( A %*% B) sehingga didapatkan hasil 7015 6984 . Untuk
6243 6191
teladan 2b, transpose matriks A dapat dicari dengan menggunakan sintaks transpose A

[ ]
44 67 50
<-t( A ) sehingga didapatkan hasil 58 46 43 . Untuk teladan 2c, invers matriks A
42 49 51
dapat dicari dengan menggunakan sintaks invers A <-solve( A ) sehingga didapatkan hasil

10
[ ]
−0.01129063 0.054421769 −0.04298942
0.04568216 −0.006802721 −0.03108466 . Untuk teladan 2d, transpose perkalian
−0.02744709 −0.047619048 0.08796296
matriks AB dapat dicari dengan menggunakan sintaks transpose AB<-t( AB) sehingga

didapatkan hasil [ 6234


6194
7015 6243
6984 6191 ]
. Semua hasil output teladan 2 dapat dilihat lebih

lengkap pada gambar 7 dan 8.


Pada teladan soal nomor 3 terdapat dua buah matriks C dan D berordo 3 ×3 .
Kemudian praktikan diminta untuk mencari hasil perkalian elemen CD , invers matriks
D , transpose matriks C dan invers matriks C . Sama seperti teladan 2 definisikan
terlebih dahulu matriks C dengan sintaks C <-matrix(c(49,58,48,109,51,57,67,50,45),
nrow=3, ncol=3, byrow=TRUE) dan matriks D dengan sintaks D <-
matrix(c( 56,65,62,59,47,49,51,55,61), nrow=3, ncol=3, byrow=TRUE). Setelah selesai
mendefinisikan matriks C dan D , selajutnya dapat dicari hasil perhitungan yang
diinginkan. Untuk teladan 3a, perkalian elemen CD dapat dicari dengan menggunakan

[ ]
2744 3770 2976
sintaks CD (C * D ) sehingga didapatkan hasil 6431 2397 2793 . Untuk teladan 3b,
3417 2750 2745
invers matriks D dapat dicari dengan menggunakan sintaks invers D <-solve( D ) sehingga

[ ]
−0.01851055 0.05972880 −0.02916487
didapatkan hasil 0.11838140 −0.02733534 −0.09836418 . Untuk teladan 3c,
−0.09126130 −0.02529057 0.12946621
transpose matriks C dapat dicari dengan menggunakan sintaks transposeC <-t(C )

[ ]
49 109 67
sehingga didapatkan hasil 58 51 50 . Untuk teladan 3d, invers matriks C dapat
48 57 45
dicari dengan menggunakan sintaks inversC <-solve(C ) sehingga didapatkan hasil

[ ]
−0.07498987 −0.02837454 0.1159303
−0.14673693 −0.13660316 0.3295501 . Semua hasil output teladan 3 dapat
0.27469261 0.19402783 −0.5165518
dilihat lebih lengkap pada gambar 9 dan 10 .

11
1.5 Kesimpulan dan Saran
a. Kesimpulan
Dari laporan praktikum pertemuan pertama ini, kita dapat mengetahui R merupakan
suatu sistem analisis statistika yang relatif lengkap sebagai hasil dari kolaborasi riset
berbagai statistikawan di seluruh dunia. Versi paling awal R dibuat pada tahun 1992 di
Universitas Auckland, New Zealand oleh Ross Ihaka dan Robert Gentlemen. R
merupakan software statistika yang open source, sehingga untuk menggunakannya tidak
diperlukan pembayaran lisensi. Selain itu, R bersifat multiplatforms, dengan file
instalasi binary/file tar tersedia untuk sistem operasi Windows, Mac OS, Mac OS X,
Free BSD, NetBSD, Linux, Irix, Solaris, AIX dan HPUX. R dapat diperoleh secara
gratis di CRAN-archive (The Comprehensive R Archive Network). Ada beberapa jenis
data objek pada program R, yaitu data array satu dimensi atau data vektor, data matriks,
data frame dan data list.
Adapun prosedur penggunaan program R adalah mencari icon program Rstudio
pada layar desktop, lalu klik icon tersebut untuk membuka program. Kemudian tunggu
beberapa saat hingga program Rstudio terbuka, sehingga menampilkan lembar kerja.
Masukkan sintaks yang ingin dijalankan pada R script, block sintaks lalu klik run atau
klik CTRL + Enter pada setiap akhir sintaks untuk melihat hasil output pada R console.
Maka hasil output akan muncul pada menu R console.
Dari teladan soal nomor 1 dapat diketahui cara menampilkan sebuah data ke dalam
program R dengan menggunakan fungsi read.delim sehingga hasilnya dapat dilihat pada
gambar 6. Dari teladan soal nomor 2 dapat diketahui cara mencari hasil perkalian
matriks AB, transpose matriks A , invers matriks A dan transpose hasil perkalian
matriks AB sehingga hasil output teladan 2 dapat dilihat lebih lengkap pada gambar 7
dan 8. Dari teladan soal nomor 3 dapat diketahui cara mencari hasil perkalian elemen
CD , invers matriks D , transpose matriks C dan invers matriks C sehingga hasil output
teladan 2 dapat dilihat lebih lengkap pada gambar 9 dan 10. Perbedaan teladan 2 dan 3
terletak pada jumlah ordo matriks. Pada teladan soal nomor 2 matriks A berordo 3 ×3
dan matriks B berordo 3 ×2, sedangkan pada teladan soal nomor 3 matriks C dan D
sama-sama berordo 3 ×3 .

12
b. Saran
Walaupun R merupakan bahasa pemrograman tingkat tinggi, tetapi kita harus tetap
teliti dalam memasukkan sintaks. Perhatikan setiap penulisan sintaks dan pastikan untuk
menggunakan fungsi yang tepat. Dengan begitu hasil yang didapatkan akan sesuai
dengan apa yang diinginkan.

13
DAFTAR PUSTAKA
Hardhono, A.P. dan Imas Sukaesih Sitanggang. 2022. Modul 1 Pengenalan dan
Instalasi Perangkat Lunak dan Lingkungan Pemrograman R.
https://pustaka.ut.ac.id/lib/ wp-content/uploads/pdfmk/SATS4111-M1.pdf.
Diakses pada tanggal 01 April 2022 pukul 20.37 WIB.
Novianti dkk. 2022. Modul Praktikum Data Mining. Bengkulu: Laboratorium FMIPA
Universitas Bengkulu.
Soleh, Agus Mohamad. 2019. STK371 Komputasi Statistik 1 Materi 1. Pengantar R dan
Objek Data. https://www.stat.ipb.ac.id/agusms/wp-content/uploads/2019/10/S
TK371-Materi-1.-Pengantar-R-dan-Objek-Data.pdf. Diakses pada tanggal 01
April 2022 pukul 20.23 WIB.
Sumara, Rauzan. 2015. Data Matriks dan Data Frame. file:///C:/Users/ratih_000/Downl
oads/Operasi_Data_Matriks_dan_Data_Frame_di_S.pdf. Diakses pada tanggal
01 April 2022 pukul 20.18 WIB.

vi

Anda mungkin juga menyukai