Anda di halaman 1dari 28

5/1/2021 MACHINE

LEARINING
DISUSUN OLEH :

1. Bayu Hanif Pratama


2. Ivan Chatisa
3. Shellya Meizenty

KELOMPOK 6
POLITEKNIK CALTEX RIAU
PRAKTIKUM 1
Sintak ini merupakan sintak untuk memanggil tools / library pandas

Sintak dibawah ini digunakan untuk memanggil dataset yang kita simpan pada google drive kita,
selanjutnya kita tampilkan 5 data pertama dari dataset tersebut menggunakan sintak head()

Pada praktikum ini, kita hanya menggunakan kolom Survived, Pclass, Sex, Age da Fare. Oleh
karena itu, kita hapus kolom dan data yang tidak kita gunakan. Setelah itu kita tampilkan 5 data
pertama dengan sintak head()

Sintak dibawah ini merupakan sintak yang digunakan untuk memisahkan data untuk dependen
(Y) dan data independen (X). Disini data X merupakan variabel input, dimana isiannya selain
kolom Survived dan data Y merupakan variabel target yang berisikan hanya kolom Survived saja
Tahapan ini merupakan proses untuk convert nilai pada kolom Sex dimana jika nilainya male
maka akan diubah menjadi angka 1 dan jika female bernilai 2

Sekarang kita coba print 10 data pertama dari kolom Age. Disini dapat kita lihat bahwa pada
kolom ini terdapat nilai Null / NaN sehingga kita perlu untuk melakukan cleaning data tersebut.

Tahapan ini merupakan proses untuk mengubah atau mengisi kembali nilai Null / NaN menjadi
nilai median dari Age

Sintak dibawah ini merupakan sintak yang digunakan untuk memisahkan antara data training dan
data testing. Disini data testing kita yaitu 20% dari total data kita

Sekarang kita cek jumlah data training dan testing kita


Sintak ini merupakan sintak untuk proses prediksi menggunakan algoritma DT, jadi terlebih
dahulu kita import dulu tools dan deklarasikan method untuk prediksi menggunakan DT tersebut

Sintak dibawah ini merupakan sintak yang digunakan untuk mendefinisikan dan memasukkan
nilai data training kedalam model DT tadi

Sekarang kita lihat nilai score dari data training yang kita gunakan tersebut

Tahapan ini merupakan proses untuk melakukan pengujian data baru dan mengecek apakah hasil
prediksi tersebut sesuai dengan harapan kita. Disini kita coba mengambil salah satu data pada
dataset tersebut dan kita coba untuk prediksi data baru tersebut

Sekarang kita coba prediksi dengan data lainnya. Dan disini sesuai ouputnya seperti yang
diharapkan

Sintak dibawah ini digunakan untuk mengecek akurasi dari ouput data testing kita. Dan disini
kita dapat lihat bahwa akurasinya yaitu 79%
PRAKTIKUM 2
Sintak ini merupakan sintak yang digunakan untuk memanggil tools atau dependencies yang kita
gunakan pada praktikum kali ini, tools disini seperti pandas untuk load data csv

Sintak dibawah ini digunakan untuk digunakan untuk memanggil dataset data peminjaman
Sintak dibawah ini digunakan untuk melihat informasi dataset yang akan kita gunakan. Informasi
ini berisikan format kolom dari data tersebut

Pada tahapan ini, kita melakukan convert data pada kolom purpose, disini data pada kolom
purpose akan di ubah menjadi beberapa kolom lagi
Pada tahapan ini kita akan melakukan pembagian data training dan data testing yang kita
gunakan. Disini data testing yang kita pakai yaitu 30% dari data kita. Dan untuk kolom
dependennya yaitu variabel y (not.fully.paid)

Pada tahapan ini kita akan melakukan prediksi menggunakan sintak DT. Jadi pertama – tama kita
inisialisasikan tools yang kita gunakan dan memasukkan data training kita kedalam variabel DT
ini

Sekarang kita coba melakukan prediksi dengan data testing kita


Pada tahapan ini kita melakukan proses untuk melihat akurasi prediksi menggunakan
classification_report. Dan dapat kita lihat bahwa akurasi dari algoritma ini yaitu 73%

Sintak dibawah ini digunakan untuk menggambarkan hasil prediksi kedalam Confusion Matrik.
Dan dapat kita lihat disini nilai TP = 1998 dan TN = 95. Maksud TP disini yaitu terdapat nilai
1998 yang hasilnya benar – benar sesuai dengan hasil yang diharapkan dan TN maksudnya
terdapat nilai 95 yang nilainya memang benar – benar salah dari hasil prediksi tersebut. tetapi
disini dapat kita lihat bahwa FP memiliki nilai yang besar yaitu 433 sehingga masih terdapat
banyak data yang salah prediksi

Pada tahapan ini kita melakukan prediksi menggunakan random forest untuk memperbaiki hasil
dan performansi prediksi dari data kita
Tahapan ini merupakan tahapan untuk melakukan prediksi menggunakan RP

Sekarang kita lihat akurasi dari prediksi setelah kita menggunakan RP pada data kita. Disini
dapat kita lihat bahwa nilai akurasi prediksi yaitu 84% dan lebih baik dari pada sebelumnya

Dan ketika kita lihat pada confusion matrik, disini kita lihat bahwa nilai FP sudah lebih kecil
yaitu 12 dan nilai TP lebih besar yaitu 2419
PRAKTIKUM 3
Pada tahapan ini kita melakukan import tools atau paket yang kita gunakan pada analisa kita
nantinya

Sintak dibawah ini kita gunakan untuk mengeload dataset dari konsumsi minyak pada kendaraan.
Dan menampilkan 5 data pertama dengan menggunakan fungsi head

Sekarang kita coba lihat informasi detail dari dataset tersebut seperti jumlah data dan jumlah
kolom, lalu informasi seperti mean, count dan max data pada dataset
Sekarang kita lakukan pemisahan antara variabel independen dan dependen yang kita gunakan
pada proses prediksi. disini untuk variabel dependen nya yaitu patrol_consumption. pada tahapan
ini juga kita melakukan pembagian antara data training dan testing yang kita gunakan. Pada data
testing kita menggunakan 20% dari data

Pada tahapan dibawah ini kita melakukan prediksi menggunakan DT regressor untuk melihat
prediksi banyaknya konsumsi minyak kendaraan tersebut

Sekarang kita lakukan prediksi menggunakan data testing kita


Pada sintak ini kita akan membandingkan antara nilai actual dengan nilai prediksi dari konsumsi
minyak tersebut. dan disini dapat kita lihat bahwa hasil prediksi dan actual sudah hampir
mendekati dan cukup baik juga

Pada tahapan ini kita melihat informasi dari persentase dari prediksi kita. Dan dapat kita lihat
bahwa squared error nya sebesar 72%
PRAKTIKUM 4
Sintak dibawah ini digunakan untuk melakukan import paket yang digunakan pada praktikum
kita kali ini

Pada sintak dibawah ini kita mengubah nama kolom kita lalu mengeload dataset yang disimpan
pada google drive kita

Sehingga Output yang dihasilkan seperti gambar dibawah ini :


Sekarang kita akan melakukan pemisahan antara variabel target atau dependen dengan variabel
independen kita. Disini variabel target kita yaitu kolom label

Pada tahapan ini kita melakukan proses untuk memisahkan data training dan testing kita. Disini
data testing kita yaitu 30% dari data kita

Pada sintak dibawah ini digunakan untuk melakukan deklarasi objek DT dan memasukkan data
training kedalam DT kita tersebut. pada tahapan ini juga kita melakukan prediksi terhadap data
testing kita
Sekarang kita coba lihat hasil akurasi yang didapatkan dari prediksi tersebut. disini kita dapat
lihat bahwa nilai akurasi dari prediksi yaitu 66%

Sekarang kita coba lihat bentuk output dari Tree yang dihasilkan menggunakan DT tersebut
Sintak dibawah ini kita coba memberikan parameter pada method DT kita untuk memperbaiki
performance dari data yang kit prediksi tadi. Dan disini dapat kita lihat bahwa nilai akurasi dari
prediksi meningkat menjadi 77%

Pada tahapan ini kita akan coba untuk menggambarkan output dari Tree yang dihasilkan
menggunakan prediksi Decision Tree ini
PRAKTIKUM 5
Sintak dibawah ini digunakan untuk melakukan import tools yang kita gunakan pada proses
prediksi data

Sekarang kita load dataset kita yang kita simpan pada google drive. Dataset ini berisikan
informasi tentang hasil otentifikasi tagihan.

Sekarang kita bagi data tersebut kedalam 2 variabel yaitu variabel target (Y) dan variabel
independen (X)

Pada tahapan ini kita melakukan proses untuk pembagian data training dan testing yang kita
gunakan. Disini kita menggunakan data testing sebesar 20%
Pada tahapan ini ktia melakukan deklarasi algoritma DT yang kita gunakan. Dan pada tahapan
ini juga kita memasukkan data training kita pada variabel DT kita

Sekarang kita coba prediksi data testing kita


Pada tahapan ini kita akan melihat informasi akurasi prediksi yang dihasilkan. Dan dapat kita
lihat bahwa nilai akurasi tersebut yaitu sebesar 97%. Pada tahapan ini juga kita melihat informasi
hasil dari confusion matrik kita. Dan dapat kita perhatikan bahwa nilai TP yaitu 160 maksudnya
disini yaitu terdapat nilai 160 yang hasilnya benar – benar sesuai dengan prediksi yang
diharapkan dan TN yaitu 108 yang maksudnya yaitu terdapat nilai sebesar 108 yang hasilnya
benar – benar salah sesuai prediksi yang diharapkan

Pada tahapan ini kita akan menggambarkan bentuk Tree dari hasil prediksi yang dilakukan
Berikut ouput dari Tree yang dihasilkan pada proses DT sebelumnya.
PRAKTIKUM 6
Sintak dibawah ini merupakan sintak yang digunakan untuk memanggil tools yang kita gunakan
pada proses analisa data kita

Pada tahapan ini kita memanggil dataset iris yang kita simpan pada google drive kita. Setelah itu
kita tampilkan informasi data dan 5 data pertama dari dataset ini
Sintak dibawah ini merupakan sintak yang digunakan untuk melihat banyaknya nilai null atau
kosong pada dataset ini. Dan dapat kita perhatikan bahwa tidak terdapat nilai null atau kosong
dari setiap kolom dataset tersebut.

Sekarang kita hapus kolom ID karena kita tidak membutuhkan pada proses analisa data kita

Sintak dibawah ini merupakan sintak yang digunakan untuk menggambarkan grafik hubungan
antara setiap kolom dengan kolom Species
Berikut output grafik sebaran spesies yang dihasilkan dari perbandingan setiap kolom data
Pada tahapan ini kita melihat hubungan korelasi setiap kolom. Dan dapat kita lihat bahwa petal
lengt memiliki relasi yang kuat dengan petal width sedangkan pada Sepal length tidak memiliki
hubungan yang kuat terhadap sepal width

Pada tahapan ini kita melakukan backup data kedalam variabel df1. Dimana data ini berasal dari
dataset iris tadi. Selanjutnya pada sintak ini kita juga menghapus kolom Species karena disini
kita mencoba untuk memprediksi nilai spesies tersebut dari tada ini
Pada tahapan ini kita memisahkan antara kolom target (Y) dengan data independen (X). lalu kita
print hasil dari variabel Y ini. Dan dapat kita lihat bahwa isiannya berupa data Spesies

Sekarang kita data spesies tadi yang berbentuk text menjadi berbentuk angka.
Sekarang kita lakukan proses pembagian data training dan testing kita. Disini data testing yang
kita gunakan yaitu sebesar 20% dari data

Sekarang kit deklarasikan dan definisikan algoritma DT ini. Dan jangan lupa juga kita
memasukkan data training kedalam algoritma tersebut untuk proses prediksi kita

Sekarang kita lakukan prediksi terhadap data tersebut dan kita cek akurasi dari prediksi tersebut
Pada tahapan ini kita mencoba menggambarkan confusion matrik dari prediksi tersebut.

Sintak dibawah ini digunakan untuk menggambarkan Tree dari analisa DT yang kita lakukan tadi
Berikut Ouput Tree yang dihasilkan

Anda mungkin juga menyukai