Anda di halaman 1dari 11

Laporan Praktikum Data Mining

Dosen Pengampu

Amalia Anjani Arifiyanti, S.Kom, M.Kom

Disusun oleh :

Ananda Lakunti Ardiatama (18082010010)

JURUSAN SISTEM INFORMASI


FAKULTAS ILMU KOMPUTER
UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN”
JAWA TIMUR TAHUN 2020
1.Laporan Praktikum 2 (Dua)
2. Tujuan Praktikum
Mahasiswa mampu memahami tujuan dari pemahaman data dan mengimplementasikan
pada kasus yang memerlukan ekplorasi data.

3. Teori Dasar
Data understanding/ pemahaman data merupakan tahap yang dilaksanakan setelah tujuan
dan cakupan proyek data mining ditetapkan pada tahap pemahaman bisnis. Dalam tahap
pemahaman data ini dilakukan berbagai kegiatan yaitu
1. Pengumpulan data Berdasarkan tujuan dilakukannya proyek data mining, maka
ditentukan kebutuhan data. Data yang dibutuhkan tersebut dikumpulkan dan dilakukan
pendokumentasian mengenai sumber dan jenis-jenis data maupun variable/atribut dari data
tersebut.
2. Eksplorasi data Eksplorasi data yang dilakukan dapat menggunakan metode statistik
maupun visual. Metode statistik yang dapat digunakan misalnya melihat total data, nilai rata-rata,
nilai minimal maupun maksimal, dan sebagainya. Disamping metode tersebut, dapat juga
digunakan metode visual yang menggunakan diagram sebagai representasi data. Diagram yang
digunakan sebaiknya disesuaikan dengan tujuan eksplorasi data, misalnya diagram batang (bar
chart) digunakan untuk membandingkan nilai, diagram garis (line/ trend chart) digunakan untuk
melihat kenaikan atau penurunan nilai dalam rentang waktu tertentu, maupun diagram lingkaran
(pie chart) yang digunakan untuk melihat proporsi data.
3. Verifikasi kualitas data. Kualitas dari data perlu diketahui pada tahap ini. Hal ini
dikarenakan kualitas data masukan akan berdampak pada hasil akhir. Pada tahap ini dilakukan
verifikasi mengenai kualitas data, jika kualitas data perlu diperbaiki, maka perbaikannya dapat
dilakukan pada tahap selanjutnya. Salah satu yang mempengaruhi kualitas data adalah
kelengkapan sehingga jika terjadi data yang kosong (null) maka pada tahap selanjutnya dibuat
perencanaan scenario untuk mengatasi data kosong tersebut.

4. Tools Dan Software


 Google Colaboratory
 Laptop
 Peramban
5. Langkah Kerja
1. Tambahkan Google Colab pada akun Google.
2. Import bahasa pemrograman phython pada Google Colab.
3. Lakukan mount Google Colab dengan Google Drive.
4. Ketikkan code pada bagian yang disediakan.
5. Jalankan program dengan menekan tombol play.
6. Hasil
6.1 Latihan 1
a. Screenshot
b. Penjelasan
 Pertama kita memanggil library yang diperlukan yaitu pandas.
 Kemudian memanggil dataset .csv. Karena pada praktikum ini menggunakan
google colab maka harus menggunakan io dengan import terlebih dahulu.
 Tahap selanjutnya adalah mengecek data apa saja yang berada di dataset.
6.2 Tugas 1
a. Screenshot

b. Penjelasan
Fungsi describe pada code diatas adalah membuat ringkasan statistic dari train.csv,
dengan ringkasan per kategori.
6.3 Tugas 2
a. Screenshot & Penjelasan

Grafik diatas menjelaskan dalam perjalanan ada berapa banyak penumpang yang
meninggal dan selamat, serta dikategorikan dari gender.
Grafik diatas menjelaskan kategori yang diambil para penumpang.
Grafik diatas menjelaskan kota keberangkatan dari para penumpang.

Gr
Grafik diatas menjelaskan kategori kelas yang diambil dari keberangkatan.
Grafik diatas menjelaskan bahwa penumpang yang mengalami kecelakaan berdasarkan
kota keberangkatan.
Grafik diatas menjelaskan total kecelakaan berdasarkan kota keberangkatan.
6.3 Tugas 3
a. Screenshot

b.
a) Kelebihan metode a yaitu cara tercepat untuk menghilangkan data yang memiliki
atribut null sedangkan kekurangannya adalah kehilangan data yang ada pada
atribut null.
b) Kelebihan metode b adalah kita bisa cepat menyeleksi tanpa harus menghilangkan
atribut yang memiliki data null akan tetapi kita kehilangan data lain yang ada
dalam baris tersebut.
c) Mengisi dengan
 Mengisi manual : dengan mengisi data manual kita akan menghilangkan
null tanpa menghapus data lain. Akan tetapi metode ini menggunakan
waktu yang lama
 Mengisi imputation : lebih cepat dalam pengisian data akan tetapi data
yang didapatkan tidak akurat.

LINK GOOGLE COLAB :


https://colab.research.google.com/drive/11fftZuUX3b1roHKQud9FKZriY94CUw-
2?usp=sharing

Anda mungkin juga menyukai