Anda di halaman 1dari 10

BAB I

PENDAHULUAN

1.1 Latar Belakang Masalah

Data mining dilatar belakangi dengan keadaan berlimpahnya data (overload

data) dan ledakan informasi (explotion information) yang dialami oleh

perusahaan, institusi atau organisasi yang disimpan selama bertahun-tahun.

Keadaan tersebut juga dialami oleh Universitas Kuningan (UNIKU) yang

menyimpan berbagai macam data pada database. Namun data yang melimpah ini

belum banyak dimanfaatkan dalam menggali informasi atau pengetahuan yang

dapat membantu pimpinan UNIKU dalam membuat rencana yang bersifat

strategis. Salah satu data yang disimpan adalah data calon mahasiswa baru yang

selalu bertambah setiap tahunnya sehingga terjadi penumpukan data.

Dari data penerimaan mahasiswa baru tahun ajaran 2010/2011 jumlah calon

mahasiswa baru yang dinyatakan lulus adalah sebanya 1548, namun calon

mahasiwa baru yang melakukan registrasi adalah sebanyak 1312. Maka terdapat

236 calon mahasiswa baru yang mengundurkan diri dengan tidak melakukan

registrasi. Terdapat 15,2 % calon mahasiswa baru yang mungkin potensial tidak

dapat dipertahankan oleh UNIKU. Jika pengunduran diri calon mahasiswa baru

tersebut dapat diketahui lebih dini, maka pihak pimpinan dapat mengantisipasi

dengan membuat rencana yang bersifat strategis untuk mempertahankan calon

mahasiswa baru, mengingat persaingan dalam dunia pendidikan semakin

meningkat. Namun, permasalahannya hingga saat ini, UNIKU belum memiliki

1
2

standar baku yang dapat dijadikan sebagai alat untuk menganalisis kemungkinan

pengunduran diri calon mahasiswa baru tersebut.

Untuk mengatasi permasalahan tersebut, maka salah satu upaya yang dapat

dilakukan, yaitu membuat aplikasi untuk melakukan analisis kemungkinan

pengunduran diri calon mahasiswa dengan mengimplementasikan teknik

klasifikasi data mining berupa pohon keputusan. Algoritma yang digunakan

dalam pembuatan pohon keputusan adalah C4.5 yang dibuat oleh J. Ross Quinlan

pada tahun 1992. Aplikasi ini dapat digunakan untuk menganalisis kemungkinan

pengunduran diri calon mahasiswa baru berdasarkan data yang telah ada

sebelumnya.

Berdasarkan hal tersebut di atas, maka dilakukan suatu penelitian yang

dituangkan dalam bentuk skripsi yang berjudul “IMPLEMENTASI

ALGORITMA C4.5 UNTUK PREDIKSI PENGUNDURAN DIRI CALON

MAHASISWA BARU DI UNIVERSITAS KUNINGAN”.

1.2 Identifikasi Masalah

Adapun identifikasi masalah dari latar belakang masalah di atas adalah

sebagai berikut:

1. Berlimpahnya data calon mahasiswa baru yang tersimpan bertahun-tahun

yang disimpan hanya sebagai dokumentasi.

2. Belum memiliki standar baku yang dapat dijadikan sebagai alat untuk

menganalisis kemungkinan pengunduran diri calon mahasiswa baru.


3

3. Pimpinan tidak dapat mengetahui lebih dini pengunduran diri calon

mahasiswa baru tersebut, sehingga tidak dapat mempertahankannya.

1.3 Batasan Masalah

Dalam penelitian yang dilakukan ditentukan beberapa batasan sebagai berikut:

1. Algoritma pembentukan pohon keputusan dengan menggunakan algoritma

C4.5.

2. Aplikasi dibangun dengan teknik pendekatan pengembangan sistem

terstruktur, menggunakan bahasa pemrograman Borland Delphi 7 dan basis

data MySQL.

3. Keluaran yang dihasilkan aplikasi ini adalah pola-pola yang digunakan untuk

memprediksi pengunduran diri calon mahasiswa baru berupa pohon keputusan

yang dibentuk menggunakan algoritma C4.5.

4. Variabel-variabel yang digunakan sebagai variabel penentu dalam

pembentukan pohon keputusan adalah jenis kelamin, status pindah,

gelombang, fakultas, jenjang, asal sekolah, dan kelas.

1.4 Pertanyaan Penelitian (Research Question)

Pertanyaan penelitian sesuai dengan identifikasi masalah yang ditemukan

adalah apakah algoritma C4.5 dapat memprediksi kemungkinan pengunduran diri

calon mahasiswa baru dan variabel apa saja yang mendukung calon mahasiswa

melakukan registrasi atau tidak?.


4

1.5 Rumusan Masalah

Dari latar belakang masalah tersebut di atas dapat dirumuskan menjadi

beberapa masalah sebagai berikut:

1. Bagaimana mengklasifikasikan data calon mahasiswa baru untuk

menghasilkan keputusan apakah calon mahasiswa melakukan registrasi atau

tidak?

2. Bagaimana membuat suatu aplikasi untuk memprediksi pengunduran diri

calon mahasiswa baru?

3. Bagaimana mengimplementasikan algoritma C4.5 pada aplikasi untuk

memprediksi pengunduran diri calon mahasiswa baru?

1.6 Metodologi Penelitian

1.6.1 Metode Pengembangan Sistem

Dalam penelitian ini digunakan metodologi System Development Life


Cycle (SDLC) model waterfall dengan menggunakan pendekatan pengembangan
sistem terstruktur. Maka tahapan-tahapan dalam pengembangan sistem ini dapat
dilihat pada Gambar 1.1:
5

Requirement
Analysis and
Definition

System and
Software Design

Implementation
and Unit Testing

Integration and
System Testing

Operation and
Maintenance

Gambar 1.1 Siklus Hidup (Life Cycle) dengan Model Waterfall


(Al Bahra Bin Ladjamuddin, 2006: 18)

1. Requirement Analysis and Definition


Jasa, kendala dan tujuan dihasilkan dari konsultasi dengan pengguna sistem.
Kemudian semuanya itu dibuat dalam bentuk yang dapat dimengerti oleh user
dan staf pengembang (Al Bahra Bin Ladjamuddin, 2006: 16).
2. System and Software Design
Proses desain sistem membagi kebutuhan-kebutuhan menjadi sistem
perangkat lunak atau perangkat keras. Proses tersebut menghasilkan sebuah
arsitektur sistem keseluruhan. Desain perangkat lunak termasuk menghasilkan
fungsi sistem perangkat lunak dalam bentuk yang mungkin ditransformasi ke
dalam satu atau lebih program yang dapat dijalankan (Al Bahra Bin
Ladjamuddin, 2006: 17). Tahap ini menggunakan alat sebagai berikut:
a. Alat Pengembangan Sistem
Karena menggunakan pendekatan pengembangan sistem terstruktur, maka
desain sistem pada tahapan ini menggunakan tools sebagai berikut:
(1) Data Flow Diagram (DFD)
(2) Entity Relationship Diagram (ERD)
6

(3) Model Relasional


(4) Kamus Data
3. Implementation and Unit Testing
Selama tahap ini desain perangkat lunak disadari sebagai sebuah program
lengkap atau unit program. Uji unit termasuk pengujian bahwa setiap unit
sesuai spesifikasi (Al Bahra Bin Ladjamuddin, 2006: 17). Pada tahapan ini
desain perangkat lunak diterjemahkan ke dalam program. Adapun bahasa
pemrograman dan database yang digunakan untuk membuat aplikasi ini
adalah Delphi 7 dan MySQL.
4. Integration and System Testing
Unit program diintegrasikan dan diuji menjadi sistem yang lengkap untuk
menyakinkan bahwa persyaratan perangkat lunak telah dipenuhi. Setelah uji
coba, sistem disampaikan ke customer (Al Bahra Bin Ladjamuddin, 2006: 17).
Pada tahap pengujian sistemini menggunakan pengujian kotak hitam (black-
box testing) dan pengujian kotak putih (white-box testing).
5. Operation and Maintenance
Normalnya, ini adalah phase yang terpanjang. Sistem dipasang dan digunakan.
Pemeliharaan termasuk pembetulan kesalahan yang tidak ditemukan pada
langkah sebelumnya. Perbaikan implementasi unit sistem dan peningkatan
jasa sistem sebagai kebutuhan baru ditemukan.

1.6.2 Metode Pengumpulan Data

Metode ini digunakan untuk mendapatkan data-data baik data primer

maupun data sekunder mengenai objek yang akan diteliti dengan menggunakan

beberapa pendekatan teknik pengumpulan data sebagai berikut:

1. Penelitian Lapangan (Field Research)

Penelitian lapangan adalah aktivitas peninjauan yang dilakukan secara

langsung untuk memperoleh data-data yang diperlukan dalam Laporan


7

Skripsi. Adapun metode penelitian lapangan yang digunakan adalah sebagai

berikut:

a. Wawancara

Wawancara adalah komunikasi dua arah untuk mendapatkan data dari

responden.

b. Teknik Pengambilan Basis Data

Teknik pengambilan basis data, dilakukan untuk mendapatkan data arsip

sekunder.

2. Penelitian Kepustakaan (Library Research)

Penelitian kepustakaan yang dilakukan, yaitu dengan mempelajari serta

mengumpulkan teori-teori yang relevan dengan topik yang dibahas guna

memperoleh data sekunder serta informasi tertulis yang berhubungan dengan

masalah yang dikemukakan. Penelitian ini dilakukan dengan mengadakan

penelaahan terhadap buku-buku litelatur, media informasi, buku teks dan

peraturan-peraturan.

1.6.3 Metode Penyelesaian Masalah

Metode penyelesaian masalah yang digunakan dalam penelitian ini, yaitu

algoritma C4.5. Algoritma C4.5 merupakan metode klasifikasi dan prediksi yang

sangat kuat dan terkenal. Metode keputusan mengubah fakta yang sangat besar

menjadi pohon keputusan yang merepresentasikan aturan. Aturan dapat mudah

dipahami dengan bahasa alami. Dan mereka juga dapat diekspresikan dalam
8

bentuk basis data seperti Structure Query Language untuk mencari record pada

kategori tertentu (Kusrini & Emha Taufiq Luthfi, 2009: 13).

Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah

sebagai berikut (Kusrini & Emha Taufiq Luthfi, 2009: 15 ):

a. Pilih atribut sebagai akar.

b. Buat cabang untuk tiap-tiap nilai.

c. Bagi kasus dalam cabang.

d. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki

kelas yang sama.

Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertingi

dari atribut-atribut yang ada. Untuk menghitung gain digunakan rumus tertera

dalam persamaan berikut (Kusrini & Emha Taufiq Luthfi, 2009: 16 ).


𝑛
|𝑆𝑖 |
𝐺𝑎𝑖𝑛(𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) − ∑ ∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖)
|𝑆|
𝑖=1

Keterangan:

S : himpunan kasus

A : atribut

n : jumlah partisi atribut A

|Si| : jumlah kasus pada partisi ke-i

|S| : jumlah kasus dalam S

Sementara itu, penghitungan nilai entropy dapat dilihat dalam persamaan 2

berikut:
9

𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) = ∑ − 𝑝𝑖 ∗ 𝑙𝑜𝑔2 𝑝𝑖
𝑖=1

Keterangan:

S : himpunan kasus

A : atribut

n : jumlah partisi S

pi : proporsi dari Si terhadap S

1.7 Hipotesis Penelitian

Adapun hipotesis dari penelitian ini adalah sebagai berikut:

1. Algoritma C4.5 dapat menghasilkan pola untuk memprediksi pengundururan

diri calon mahasiswa.

2. Pola yang dihasilkan dapat diimplementasikan untuk memprediksi

kemungkinan pengunduran diri calon mahasiswa baru.

1.8 Tujuan dan Manfaat Penelitian

1.8.1 Tujuan

Adapun tujuan dari penelitian ini adalah sebagai berikut:

1. Mengolah tumpukan data untuk menghasilkan informasi yang berguna.

2. Membuat suatu program aplikasi prediksi pengunduran diri calon mahasiswa

baru dengan mengimplementasikan algoritma C4.5.


10

3. Dengan adanya aplikasi ini diharapkan kemungkinan seorang calon mahasiswa

akan mengundurkan diri dari UNIKU dapat diketahui secara dini, sehingga

dapat membantu pimpinan dalam mengambil keputusan.

1.8.2 Manfaat

Manfaat yang diharapkan dari hasil penelitian ini adalah sebagai berikut:

1. Manfaat untuk UNIKU, dengan aplikasi ini diharapkan kemungkinan seorang

calon mahasiswa akan mengundurkan diri dari UNIKU dapat diketahui secara

dini, sehingga dapat memudahkan pimpinan dalam mengambil keputusan.

2. Manfaat untuk peneliti, sebagai implementasi dari pengetahuan yang

diperoleh selama dibangku kuliah.

1.9 Jadwal Kegiatan Penelitian

Tabel 1.1 Jadwal Kegiatan Penelitian


Bulan / Tahun
No. Kegiatan Februari Maret April Mei
2016 2016 2016 2016
Requirement Analysis
1
and Definition
System and Software
2
Design
Implementation and
3
Unit Testing
Integration and
4
System Testing
Operation and
5
Maintenance

Anda mungkin juga menyukai