Anda di halaman 1dari 6

TUGAS 1 CRISP-DM

MATA KULIAH DATA MINING

Disusun oleh :

Nama : Fadillah Febrianto

Nim : 21217167

Kelas : A1/Semester 7/Teknik Industri

PROGRAM STUDI TEKNIK INDUSTRI

FAKULTAS TEKNIK

UNIVERSITAS SERANG RAYA

2020
CRISP-DM

Cross-Industry Standard Process for Data Mining merupakan suatu standar yang
telah dikembangkan pada tahun 1996 yang ditujukan untuk melakukan proses analisis
dari suatu industry sebagai strategi pemecehan masalah dari bisnis atau unit
penelitian. Untuk data yang dapat diproses dengan CRISP-DM ini, tidak ada
ketentuan atau karakteristik tertentu, karena data tersebut akan diproses kembali pada
fase-fase didalamnya. Terdapat enam fase yaitu:

1. Business Understanding/ Pemahaman Bisnis


Mengerti kebutuhan manajerial untuk pengetahuan baru dan spesifikasi eksplisit
dari tujuan bisnis berkaitan dengan studi yang akan dilakukan. Ini adalah tahap
pertama dalam CRISP-DM dan termasuk bagian yang cukup vital dalam proyek
dan selama pengerjaan pada proses selanjutnya. Pada tahap ini membutuhkan
pengetahuan dari objek bisnis, bagaimana membangun atau mendapatkan data,
dan bagaimana untuk mencocokan tujuan pemodelan untuk tujuan bisnis sehingga
model terbaik dapat dibangun.
Contoh : Kemacetan sangat penting untuk segera diselesaikan. Data Survey 50
Responden Juni 2017, 100% menyatakan Kemacetan di Jakarta Penting untuk
diatasi secepatnya dan setuju dengan adanya kendaraan jemputan berbasis
internet, adapun Usia mereka berkisar 21–22 tahun dengan Profesi dominan
sebagai Staff Kantor, mereka menyatakan kemacetan di Jakarta Penting untuk
diatasi secepatnya dan mereka juga setuju dengan adanya kendaraan jemputan
anak sekolah berbasis Internet.
2. Data Understanding/ Pemahaman Data
Kajian dalam data mining adalah khusus membahas mengenai suatu pekerjaaan
bisnis yang sudah terdefinisi dengan baik, dan pekerjaan-pekerjaan bisnis yang
berbeda memerlukan ‘set-data’ yang berbeda pula. Setelah pemahaman terhadap
bisnis, aktivitas utama dari proses data mining berikutnya adalah mengidentifikasi
data yang relevan dari berbagai database yang ada. Beberapa poin kunci harus
dipikirkan dalam proses identifikasi data dan fase pemilihan (data). Yang pertama
dan yang terpenting adalah bahwa sang analis harus jelas dan padat mengenai
deskripsi pekerjaan data mining sehingga data yang relevan bisa identifikasi.
Contoh : Dalam penelitian ini penulis membuat dataset “Prediksi Kemacetan.xls”
dari pengamatan Google Maps selama 1 Bulan dari Tanggal 01- 31 Juni 2017.
Data yang penulis ambil adalah data kemacetan yang sering terjadi setiap hari dari
jam 06:00 dan 07:00 WIB berkategori Pagi (Ketika Anak Sekolah berangkat ke
Sekolah), 08:00 WIB berkategori Siang (Ketika Pegawai Kantor bergegas ke
Kantor atau ada yang telambat ke Kantor), 17:00 WIB berkategori Sore (Ketika
Pegawai Kantor Pulang), setiap garis merah diukur dengan jarak M per Kaki atau
Km per Mil, sedangkan daerah yang diteliti yaitu Jakarta Barat, Jakarta Pusat,
Jakarta Selatan, Jakarta Timur dan Jakarta Selatan. Dari ratusan titik kemacetan
penulis mengambil sampel 14 titik kemacetan diambil secara acak untuk
memprediksikan kemacetan yang akan terjadi dan paling sering mengalami
kemacetan. Kemudian data tersebut diolah dengan Algoritma Data Mining yang
tersedia pada Software RapidMiner Versi 7.5.
3. Data Preparation/ Persiapan Data
Maksud dari persiapan data (atau yang lebih dikenal dengan pra-pemrosesan data)
adalah mengambil data yang diidentifikasi pada tahap sebelumnya dan
menyiapkan nya untuk analisa dengan menggunakan metode-metode data mining.
Contoh : Dalam penelitian ini Dataset yang digunakan adalah dataset “Prediksi
Kemacetan.xls”.
4. Modeling/ Pemodelan

Pada langkah ini,berbagai teknik model diseleksi dan diaplikasikan pada dataset
yang sudah disiapkan untuk menangani kebutuhan bisnis yang spesifik.

a. Pilih dan terapkan permodelan yang sesuai


b. Kalibrasi setting pada model untuk hasil yang optimal
c. Sering-sering ingat bahwa ada beberapa teknik yang berbeda, dapat digunakan
untuk memecahkan permasalahan data mining yang sama.
Jika perlu, ulangi kembali ke tahap PREPARATION PHASE untuk membentuk
data ke jalur yang sesuai dengan kebutuhan teknik data mining tertentu. Pada
tahap ini akhirnya kita dapat menggunakan Statistika dan Machine Learning
untuk mendapatkan insight yang berguna dari data untuk mencapai tujuan proyek.
Beberapa modeling yang biasa dilakukan adalah classification, scoring, ranking,
clustering, finding relation, characterization.

Contoh : Menggunakan Algoritma yang paling mudah dipahami pada Proses Data
Mining yaitu Algoritma Decision Tree C4.5yang berfungsi untuk mendapatkan
pohon keputusan kelompok Kemacetan berdasarkan banyaknya titik kemacetan di
Jakarta dan panjangnya kemacetan di Jakarta. Proses Modelling pada Software
RapidMiner versi 7.5.

5. Evaluation/ Evaluasi

Model yang dikembangkan dievaluasi dan diteliti untuk keakuratan dan


ketidakakuratan. Evaluasi satu atau lebih model demi kualitas dan kefektifannya
sebelum digunakan di lapangan, menentukan apakah model dalam kenyataannya
mencapai tujuan yang diterapkan pada fase awal, menentukan apakah beberapa
aspek penting dari permasalahan bisnis atau riset telah diperhitungkan secara
memadai, buatlah sebuah keputusan mengenai penggunaan hasil data mining.
Setelah mempunyai model, kita harus menentukan apakah sesuai dengan tujuan
kita.

Contoh : Hasil pengujian dilakukan untuk mengetahui Akurasi dari Pohon


Keputusan Algoritma klasifikasi Decision Tree (C4.5) Kemacetan terparah berada
di Daerahdaerah Jakarta. Dapat dilihat bahwa Kemacetan terjadi pada Pagi dan
Siang hari saat terjadinya Jam masuk Sekolah dan Kantor sekitar Jam 07:00 dan
Jam 08:00 WIB. Dapat dilihat juga bahwa hasil Statistik yang diperoleh
Mengendarai Kendaraan Pribadi 9 lebih banyak dari pada yang tidak
Mengendarai Kendaraan Pribadi, terjadi kemacetan Waktu pada Pagi antara Jam
07:00 – 08:00 WIB dan Sore Jam 17:00 WIB, dengan panjang Kemacetan 10,45
Km dengan Tingkat Akurasi Kemacetan tersebar dibeberapa titik kemacetan atau
Jalan Raya yang ada di Jakarta Timur.
6. Deployment/ Penyebaran

Tahap ini adalah tahap yang paling dihargai dari proses CRISP-DM. Perencanaan
untuk Deployment dimulai selama Business Understanding dan harus
menggabungkan tidak hanya bagaimana untuk menghasilkan nilai model, tetapi
juga bagaimana mengkonversi skor keputusan, dan bagaimana untuk
menggabungkan keputusan dalam sistem operasional. Pada akhirnya, rencana
sistem Deployment mengakui bahwa tidak ada model yang statis. Model tersebut
dibangun dari data yang diwakili data pada waktu tertentu, sehingga perubahan
waktu dapat menyebabkan berubahnya karakteristik data. Modelpun harus
dipantau dan mungkin diganti dengan model yang sudah diperbaiki.

Contoh : Setelah hasil penelitian telah muncul maka langkah selanjutnya adalah
Evaluasi Model dan mendapatkan Akurasi Data Mining Kemacetan, maka hasil
penelitian ini dapat segera diterapkan dalam aktifitas sehari-hari dalam
menghindari jam dan lokasi kemacetan yang ada di Jakarta. Apabila kemacetan
terjadi maka Masyarakat diwajibkan menggunakan transportasi umum baik ofline
maupun online.
REFERENSI
Jurnal : PENERAPAN DATA MINING DALAM MENANGANI
KEMACETAN DI JAKARTA

Anda mungkin juga menyukai