Anda di halaman 1dari 9

e-ISSN 2580-9741

p-ISSN 2088-3943

DATA MINING INFORMASI TINGKAT KELULUSAN MAHASISWA STMIK PELITA


NUSANTARA MEDAN

Anita Sindar RM Sinaga

Program Studi Teknik Informatika


STIMIK Pelita Nusantara, Jl. Iskandar Muda No. 1 Medan, Indonesia

haito_ita@yahoo.com

Abstrak

Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data dalam
jumlah besar mendorong untuk melakukan analisis, meringkas dan mengekstrak data.
Pengolahan sistem informasi bagian kemahasiswaan dapat dikembangkan dengan penerapan
teknik data mining. Data mining berguna sebagai data utama untuk diolah, menganalisa data
awal sehingga menghasilkan informasi yang berguna. Dengan memanfaatkan Nomor Induk
Mahasiswa (NIM) dan data kelulusan mahasiswa, diharapkan dapat menghasilkan informasi
tingat kelulusan melalui teknik data mining yang diukur dari lama belajar dan nilai Indeks
Prestasi Komulatif (IPK). Algoritma yang digunakan adalah Algoritma Apriori, informasi yang
ditampilkan berupa nilai support dan confidence dari masing-masing kategori tingkat kelulusan.
Tujuan dari penerapan teknik data mining adalah mengolah data awal untuk memperoleh
informasi yang berguna yaitu mengetahui tingkat kelulusan mahasiswa.

Kata Kunci : Data Mining, Algoritma Aprior, NIM, IPK

1. PENDAHULUAN tinggi. Data warehouse mendukung On-line


Pemanfaatan data mahasiswa sering hanya Analitycal Processing (OLAP), sebuah kasus
diarsipkan tanpa ada pengolahan yang efisien yang digunakan untuk menganalisis secara
guna memperoleh pola, kebiasaan yang dapat interaktif dari bentuk multidimensi yang
ditemukan sebagai bahan analisa perguruan mempunyai data yang rinci. Informasi yang
tinggi untuk meningkatkan kualitas mahasiswa ditampilkan merupakan hubungan antara tingkat
dan kampus. Setiap semester data mahasiswa kelulusan dengan data induk mahasiswa yaitu
bertambah, data mahasiswa yang mendaftar dan berupa nilai support dan confidence.
data mahasiswa yang lulus. Latar belakang
mahasiswa dari asal daerah, lama pembelajaran, 2. TINJAUAN PUSTAKA
bidang yang diminati mempengaruhi tingkat A. Data Mining
kelulusan mahasiswa. Data warehouse merupakan penyimpanan
Teknologi pengolahan data untuk data yang berorientasi objek, terintegrasi,
menghasilkan informasi yang berguna bagi mempunyai variant waktu, dan menyimpan data
mahasiswa dan perguruan tinggi mendorong dalam bentuk non volatile sebagai pendukung
pemanfaatan teknologi informasi. Para manejemen dalam proses pengambilan
pengambil keputusan dari manajemen keputusan (Han, 2006).
membutuhkan data-data mahasiswa diolah
secara komputerisasi sehingga memberikan
tingkat informasi sebagai masukan dalam
meningkatkan pelayanan pada mahasiswa.
Data dalam jumlah besar dikumpulkan,
dibersihkan sehingga diperoleh data warehouse,
yang menunjang pengolahan data mining. Data
mining adalah kegiatan menemukan pola yang
menarik dari data dalam jumlah besar, data
Gambar 1. Arsitektur Data Warehouse
dapat disimpan dalam database, data
warehouse, atau penyimpanan informasi Hoffer dan McFadden mengemukakan
lainnya. Data mining berkaitan dengan bidang bahwa data mining adalah penemuan
ilmu-ilmu lain, seperti database sistem, data pengetahuan dengan menggunakan teknik
warehousing, statistik, machine learning, teknik yang tergabung dari statistik, tradisional,
information retrieval, dan komputasi tingkat kecerdasan dan grafik komputer.

Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 27


e-ISSN 2580-9741
p-ISSN 2088-3943

Secara sederhana data mining merupakan historis untuk menemukan keteraturan, pola
penambangan atau penemuan informasi baru atau hubungan dalam set data berukuran besar.
dengan mencari pola atau aturan tertentu. Data Machine Learning adalah suatu area dalam
mining adalah proses yang menggunakan teknik artificial intelligence atau kecerdasan buatan
statistik, matematika, kecerdasan buatan, dan yang berhubungan dengan pengembangan
mesin learning untuk mengekstraksi dan teknik-teknik yang bisa diprogramkan dan
mengidentifikasi informasi yang bermanfaat dan belajar dari data masa lalu. Pengenalan pola,
pengetahuan yang terkait berbagai database data mining dan machine learning sering
besar (Turban dkk, 2005). dipakai untuk menyebut sesuatu yang sama.
Tahap-tahap data mining : Bidang ini bersinggungan dengan ilmu
1. Pembersihan Data (Data Cleaning) probabilitas dan statistik kadang juga optimasi.
Pembersihan data merupakan proses Machine learning menjadi alat analisis dalam
menghilangkan noise dan data yang tidak data mining.
konsisten atau data tidak relevan.
2. Integrasi Data (Data Integration)
Integrasi data merupakan penggabungan
data dari berbagai database ke dalam satu
database baru.
3. Seleksi Data (Data Selection)
Data yang ada pada database sering tidak Gambar 3. Data Mining merupakan irisan berbagai ilmu
semuanya dipakai, oleh karena itu hanya Istilah antecedent dan consequent,
data yang sesuai untuk dianalisis yang akan antecedent untuk mewakili bagian “jika” dan
diambil dari database. consequent untuk mewakili bagian “maka”.
4. Transformasi Data (Data Transformation) Dalam analisis ini, antecedent dan consequent
Data diubah atau digabung ke dalam format adalah sekelompok item yang tidak punya
yang sesuai untuk diproses dalam data hubungan secara bersama (Santoso, 2007).
mining. Untuk mengukur kekuatan aturan asosiasi
5. Proses Mining ini, digunakan ukuran support dan confidence.
Merupakan suatu proses utama saat metode Support adalah rasio antara jumlah transaksi
diterapkan untuk menemukan pengetahuan yang memuat antecedent dan consequent
berharga dan tersembunyi dari data. dengan jumlah transaksi. Confidence adalah
6. Evaluasi Pola (Pattern Evaluation) rasio antara jumlah transaksi yang meliputi
Untuk mengidentifikasi pola-pola menarik semua item dalam antecedent dan consequent
kedalam knowledge based yang ditemukan. dengan jumlah transaksi yang meliputi semua
7. Presentasi Pengetahuan (knowledge item dalam antecedent.
presentation), merupakan visualisasi dan Analisis asosiasi dikenal juga sebagai
penyajian pengetahuan mengenai metode salah satu metode data mining yang menjadi
yang digunakan untuk memperoleh dasar dari berbagai metode data mining lainnya.
pengetahuan yang diperoleh pengguna. Khususnya salah satu tahap dari analisis
Tahap terakhir dari proses data mining asosiasi yang disebut analisis pola frekuensi
adalah bagaimana memformulasikan tinggi (frequent pattern mining) menarik
keputusan atau aksi dari hasil analisis yang perhatian banyak peneliti untuk menghasilkan
diperoleh. algoritma yang efisien. Penting tidaknya suatu
aturan assosiatif dapat diketahui dengan dua
parameter, support (nilai penunjang) yaitu
prosentase kombinasi item tersebut. dalam
database dan confidence (nilai kepastian) yaitu
kuatnya hubungan antar item dalam aturan
assosiatif.
Analisis asosiasi didefinisikan suatu
proses untuk menemukan semua aturan
assosiatif yang memenuhi syarat minimum
untuk support (minimum support) dan syarat
minimum untuk confidence (minimum
Gambar 2. Tahap-Tahap Data Mining confidence) (Pramudiono, 2007).
Data mining, sering disebut knowledge B. Algoritma Apriori
discovery in database (KDD), adalah kegiatan Dasar ide dari algoritma apriori adalah
yang meliputi pengumpulan, pemakaian data mengembangkan frequent itemset dengan

Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 28


e-ISSN 2580-9741
p-ISSN 2088-3943

menggunakan satu item dan secara rekursif Tidak semua data induk siswa akan dicari
mengembangkan frequent itemset dengan dua hubungannya dengan data kelulusan, hanya
item, tiga item dan seterusnya hingga frequent beberapa atribut yang kira-kira berguna dan
itemset dengan semua ukuran. Untuk sebarannya tidak terlalu acak. Karena data yang
mengembangkan frequent set dengan dua item, terlalu acak akan membuat proses mining
dapat menggunakan frequent set item. memakan waktu lama dan tingkat hubungannya
Alasannya adalah bila set satu item tidak pun rendah. Data induk mahasiswa yang akan
melebihi support minimum, maka sembarang dicari hubungannya meliputi proses masuk, asal
ukuran itemset yang lebih besar tidak akan sekolah, kota asal sekolah, dan program studi.
melebihi support minimum tersebut. Secara Sumber data dalam penentuan tingkat
umum, mengembangkan set dengan fc-item kelulusan dipengaruhi :
menggunakan frequent set dengan k – 1 item 1. Proses Pendaftaran
yang dikembangkan dalam langkah Dari proses pendaftaran mahasiswa dapat
sebelumnya. Setiap langkah memerlukan sekali diperoleh tingkat kelulusan mahasiswa.
pemeriksaan ke seluruh isi database. Dalam Pendaftaran melalui jalur ujian saringan
asosiasi terdapat istilah antecedent dan masuk dan beasiswa.
consequent, antecedent untuk mewakili bagian 2. Asal sekolah dan proses masuk
“jika” dan consequent untuk mewakili bagian 3. Kota asal sekolah
“maka”. Dalam analisis ini, antecedent dan 4. Program Studi
consequent adalah sekelompok item yang tidak Data mahasiswa yang dikumpulkan yaitu
punya hubungan secara bersama (Santoso, data masuk tahun 2012-2015 dan data lulus
2007). tahun 2013-2015, Program Studi Teknik
Informatika di STMIK Pelita Nusantara Medan.
III. METODE PENELITIAN Sumber data pengolahan teknik data mining
Tahap awal pelaksanaan penelitian ini yaitu :
yaitu menetukan rumusan permasalahan : . 1. Data Induk Mahasiswa
a. Tingkat kelulusan mahasiswa dapat dilihat Atribut data induk mahasiswa terdiri yaitu
dari lama studi dan IPK (Indeks Prestasi NIM, Jenis Kelamin, Nama Mahasiswa,
Kumulatif) yang terdapat pada data Tempat Lahir, Tanggal Lahir, Agama,
kelulusan mahasiswa. Proses Masuk, Nama Wali, Alamat Wali,
b. Permasalahan yang dibahas yaitu bagaimana Pendidikan Terakgir Wali, Nama Sekolah,
menghasilkan informasi yang berguna Nama Asal Sekolah, Kota Asal Sekolah,
tentang hubungan tingkat kelulusan dengan Jurusan, Tahun Lulus.
data induk mahasiswa dengan teknik data 2. Data Kelulusan
mining. Atribut data kelulusan yaitu NIM, Nama
c. Informasi yang ditampilkan berupa nilai Mahasiswa, Tempat Lahir, Tanggal Lahir,
support dan confidence hubungan antara Program Studi, Tanggal Lulus, IPK.
tingkat kelulusan dengan data induk B. Penggunaan Algoritma Apriori
mahasiswa Untuk mengukur kekuatan aturan asosiasi
Dari rumusan permasalahan selanjutnya ini, digunakan ukuran support dan
mengembangkan metode penelitian terdiri yaitu confidence.
sebagai berikut :

Analisis Sumber Data

Pengolahan Data Mining

Penggunaan Algoritma Aprion

Rancangan dan Implementasi

Gambar 5. Ukuran Support dan Confidence


Analisis Hasil Uji
Langkah pertama algoritma apriori adalah,
support dari setiap item dihitung dengan men-
Gambar 4. Metode Penelitian scan database. Setelah support dari setiap item
A. Analisis Sumber Data didapat, item yang memiliki support lebih besar
dari minimum support dipilih sebagai pola

Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 29


e-ISSN 2580-9741
p-ISSN 2088-3943

frekuensi tinggi dengan panjang 1 atau sering 3. Perancangan antar muka


disingkat 1-itemset. Singkatan k-itemset berarti Perancangan antar muka mendefinisikan
satu set yang terdiri dari k item. bagaimana pengguna (user) dan perangkat
Untuk selanjutnya iterasi iterasi ke-k dapat lunak berkomunikasi dalam menjalankan
dibagi lagi menjadi beberapa bagian : fungsionalitas perangkat lunak.
1. Pembentukan kandidat itemset D. Analisis Hasil Uji
Kandidat k-itemset dibentuk dari kombinasi Pengujian unit melibatkan verifikasi bahwa
(k-1)-itemset yang didapat dari iterasi setiap unit program telah memenuhi
sebelumnya. Satu ciri dari algoritma apriori spesifikasinya (Sommerville, 2003). Program
adalah adanya pemangkasan kandidat k- sebaiknya dirilis setelah dikembangkan, diuji
itemset yang subset-nya yang berisi k-1 item untuk memperbaiki kesalahan yang ditemukan
tidak termasuk dalam pola frekuensi tinggi pada pengujian untuk menjamin kualitasnya
dengan panjang k-1. (Padmini, 2005).
2. Penghitungan support dari tiap kandidat k- Terdapat dua metode pengujian yaitu :
itemset 1. Metode white box yaitu pengujian yang
Support dari tiap kandidat k-itemset didapat berfokus pada logika internal software
dengan men-scan database untuk (source code program).
menghitung jumlah transaksi yang memuat 2. Metode black box yaitu mengarahkan
semua item di dalam kandidat k-itemset pengujian untuk menemukan kesalahan-
tersebut. Ini adalah juga ciri dari algoritma kesalahan dan memastikan bahwa input
apriori yaitu diperlukan penghitungan yang dibatasi akan memberikan hasil aktual
dengan scan seluruh database sebanyak k- yang sesuai dengan hasil yang dibutuhkan.
itemset terpanjang.
3. Tetapkan pola frekuensi tinggi IV. HASIL DAN PEMBAHASAN
Pola frekuensi tinggi yang memuat k item Hubungan beberapa atribut dari data induk
atau k-itemset ditetapkan dari kandidat k- mahasiswa dengan tingkat kelulusan. Karena
itemset yang support-nya lebih besar dari tidak semua tabel digunakan maka perlu
minimum support. Kemudian dihitung dilakukan pembersihan data agar data yang akan
confidence masing-masing kombinasi item. diolah benar-benar relevan dengan yang
C. Rancangan dan Implementasi dibutuhkan.
Proses perancangan sistem membagi Atribut yang digunakan dalam data induk
persyaratan dalam sistem perangkat keras atau mahasiswa meliputi :
perangkat lunak. Kegiatan ini menentukan 1. Atribut NIM digunakan sebagai primary key
arsitektur sistem secara keseluruhan. untuk menghubungkan dengan data
Perancangan perangkat lunak melibatkan kelulusan
identifikasi dan deskripsi abstraksi sistem 2. Atribut proses masuk digunakan untuk
perangkat lunak yang mendasar dan hubungan- proses mining guna mengetahui hubungan
hubungannya (Sommerville, 2003). antara tingkat kelulusan dengan jalur masuk
Sebagaimana persyaratan, desain yang digunakan mahasiswa.
didokumentasikan dan menjadi bagian dari 3. Atribut nama asal sekolah digunakan untuk
konfigurasi software (Pressman, 1997). proses mining guna mengetahui hubungan
Antarmuka perangkat lunak yang digunakan antara tingkat kelulusan dengan asal
adalah Visual Studio, DBMS SQL Server, Script sekolah.
Editor, Notepad, .Net Framework Tahap desain 4. Atribut kota asal sekolah digunakan untuk
meliputi perancangan data, perancangan proses mining guna mengetahui hubungan
fungsional, dan perancangan antar muka. tingkat kelulusan dengan kota asal
1. Perancangan data mahasiswa
Perancangan data mentransformasikan Atribut yang digunakan dalam data
model data yang dihasilkan oleh proses kelulusan meliputi :
analisis menjadi struktur data yang 1. NIM digunakan sebagai primary key untuk
dibutuhkan pada saat pembuatan program menghubungkan dengan data induk
(coding). Selain itu juga akan dilakukan mahasiswa.
desain terhadap struktur database yang akan 2. Indeks Prestasi Kumulatif (IPK) digunakan
dipakai. sebagai ukuran tingkat kelulusan mahasiswa
2. Perancangan fungsional 3. Lama studi digunakan sebagai ukuran
Perancangan fungsional mendeskripsikan tingkat kelulusan mahasiswa.
kebutuhan fungsi-fungsi utama perangkat
lunak.

Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 30


e-ISSN 2580-9741
p-ISSN 2088-3943

4. Program studi digunakan untuk proses memiliki dua item. Pertama dibuat kandidat 2-
mining guna mengetahui hubungan tingkat itemset dari kombinasi semua 1-itemset. Lalu
kelulusan dengan program studi. untuk tiap kandidat 2-itemset ini dihitung
Untuk proses mining, data kelulusan dan support-nya dengan men-scan database.
data induk mahasiswa digabungkan dengan Support artinya jumlah transaksi dalam
primary key NIM, setelah itu dilakukan proses database yang mengandung kedua item dalam
mining. Proses pengolahan data mining : kandidat 2-itemset. Setelah support dari semua
A. Integrasi Data kandidat 2-itemset didapatkan, kandidat 2-
Proses integrasi data dilakukan ketika proses itemset yang memenuhi syarat minimum
ETL (ekstract, transform, and Load) ketika support dapat ditetapkan sebagai 2-itemset yang
membangun data warehouse, dalam proses juga merupakan pola frekuensi tinggi dengan
ETL data dalam data source digabungkan panjang 2.
menjadi satu dalam data warehouse dengan Contoh proses mining untuk mengetahui
key NIM. hubungan tingkat kelulusan dengan proses
B. Transformasi Data masuk.
Data kelulusan berdasarkan IPK dapat Tabel 4.2 Data Awal
dikategorikan menjadi tiga yaitu : NIM Kategori Lulus Proses Masuk
1. IPK memuaskan : IPK 2,00 – 2,75 1101153 A1 Ujian
2. IPK sangat memuaskan : IPK 2,76 – 3,50 1101154 A2 Ujian
C. IPK tipe dengan pujian : IPK 3,51 – 4,00 1101109 A1 Ujian
Pengkategorian data kelulusan berdasarkan 1101115 A3 Beasiswa
lama studi yaitu : 1101157 B1 Beasiswa
1. Sesuai jadwal, bila lama studi 4 tahun atau 1101158 A2 Ujian
kurang dari 4 tahun. 1101167 A2 Beasiswa
2. Tidak sesuai jadwal, bila lama studi lebih 1101190 A2 Beasiswa
dari 4 tahun. 1101143 A2 Beasiswa
Hasil transformasi data dari 2 kategori di atas,
Tabel 4.3 Kandidat Pertama
Tabel 4.1. Transformasi Data, terdapat enam
Itemset Count
tingkatan untuk mengukur tingkat kelulusan
A1 2
mahasiswa. A2 5
Tabel 4.1 A3 1
Transformasi Data
B1 2
Kategori Keterangan Ujian 4
A1 Lama Studi 4 tahun atau kurang 4 tahun dengan Beasiswa 5
IPK 3,51 – 4,00
A2 Lama Studi 4 tahun atau kurang 4 tahun dengan Tabel 4.4 Hasil Treshold
IPK 2,76 –3,50 Itemset Count
A3 Lama Studi 4 tahun atau kurang 4 tahun dengan A2 4
IPK 2,00 – 2,75 A1 2
B1 Lama Studi lebih 4 tahun atau kurang 4 tahun Ujian 4
dengan IPK 3,51 – 4,00 Beasiswa 5
B2 Lama Studi lebih 4 tahun dengan IPK 2,76 –
3,50 Ditetapkan threshold = 3, maka kandidat
B3 Lama Studi lebih 4 tahun dengan IPK 2,00 –
2,75 yang nilainya kurang dari 3 akan dihapus.
Sehingga, didapat hasil seperti pada tabel 4.5
C. Algoritma Apriori Tabel 4.5 Kandidat Dua
Algoritma apriori dibagi menjadi beberapa
Itemset Count
tahap yang disebut iterasi. Tiap iterasi
A2, Ujian 2
menghasilkan pola frekuensi tinggi dengan A2, Beasiswa 3
panjang yang sama dimulai dari pass pertama A1, Ujian 2
yang menghasilkan pola frekuensi tinggi dengan A1, Beasiswa 0
panjang satu. Di iterasi pertama ini, support dari Tabel 4.6 Hasil Treshold Kedua
setiap item dihitung dengan men-scan database. Itemset Count
Setelah support dari setiap item didapat, item A2, Beasiswa 3
yang memiliki support lebih besar dari A1, Ujian 2
minimum support dipilih sebagai pola frekuensi
Dari pada tabel 4.6 dapat diambil hasil
tinggi dengan panjang 1 atau sering disingkat 1-
sebagai berikut : Support A2, Beasiswa = Count
itemset. Singkatan k-itemset berarti satu set (A2,Besiswa)/jumlah transaksi = 3/9 Support
yang terdiri dari k item. Iterasi kedua A1, Ujian = Count (A1,Ujian) /jumlah transaksi
menghasilkan 2-itemset yang tiap set-nya

Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 31


e-ISSN 2580-9741
p-ISSN 2088-3943

= 2/9 Confidence A2, Beasiswa = E. Fungsi Mining


Count(A2,Beasiswa)/Count (A2) = 3/4 Proses-proses yang terdapat pada Aplikasi
Confidence A3, Ujian = Data Mining :
Count(A3,Ujian)/Count(A3) = 3/3 Dapat dilihat 1. Import Data
bahwa proses mining hubungan tingkat Proses import data adalah proses load data
kelulusan. dari database kelulusan dan database induk
D. Proses Load mahasiswa ke data warehouse. Semua data
Setelah proses mining akan disajikan hasil akan dimasukkan tanpa ada penyaringan.
dari data mining berupa tabel hubungan 2. Cleaning, Integrasi, Selection, dan
kekuatan dengan nilai support dan confidence transformasi.
masing-masing atribut serta threshold yang a) Cleaning data merupakan proses
digunakan. Semakin tinggi nilai confidence dan menghilangkan noise dan data yang tidak
support maka semakin kuat nilai hubungan konsisten atau data yang tidak relevan. Pada
antar atribut. umumnya data yang diperoleh, baik dari
Database Induk mahasiswa dan database database suatu perusahaan maupun hasil
kelulusan merupakan data source dalam eksperimen, memiliki isian-isian yang tidak
pembangunan data warehouse. Dalam proses sempurna seperti data yang hilang, data yang
ETL kedua data source tersebut di load tidak valid atau juga hanya sekedar salah
kedalam data warehouse. Proses ETL ketik. Dalam tahap ini semua data yang akan
mencangkup proses integrasi data dari data digunakan baik data kelulusan, data induk
induk dan data kelulusan menjadi data mahasiswa maupun data nilai semester
gabungan dengan key NIM. dibersihkan dari record data yang tidak
mempunyai atribut lengkap. Selain
pembersihan record data yang tidak valid,
juga dilakukan penghapusan atribut yang
tidak dipakai, misalnya atribut gaji orang
tua, nama orang tua dan lain-lain.
Pembersihan data juga akan mempengaruhi
performasi dari sistem data mining karena
data yang ditangani akan berkurang jumlah
dan kompleksitasnya.
b) Integrasi data merupakan penggabungan
data dari berbagai database ke dalam satu
database baru. Data induk mahasiswa, data
nilai dan data kelulusan tidak disimpan
Gambar 4.1 Proses Load dalam satu database, Integrasi data
Dari skema tersebut dapat dibangun dilakukan pada atribut-aribut yang
database baru untuk menampung data-data dari mengidentifikasikan entitas-entitas dengan
database induk mahasiswa dan database satu atribut unik yaitu NIM
kelulusan mahasiswa. Karena hanya terdapat c) Selection data adalah proses menyeleksi
satu entitas maka tidak ada relasi antar entitas, atribut apa yang akan diproses pada mining
sehingga hanya terbentuk satu tabel. selanjutnya.
Tabel 4.7 d) Transformasi data merupakan proses
Gabungan Atribut mengubah data atau digabung ke dalam
format yang sesuai untuk diproses dalam
data mining. Beberapa metode data mining
membutuhkan format data yang khusus
sebelum bisa diaplikasikan.
Dalam pengolahan teknik data mining, data
yang diubah yaitu :
1) Fungsi Ambil Data
Lama studi dan IPK untuk mengukur tingkat
kelulusan. Atribut lama studi dan IPK dibagi
menjadi beberapa interval.
Nama fungsi : Ambil Data
Deskripsi isi : Digunakan untuk mengambil data
kelulusan dan data induk mahasiswa kemudian

Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 32


e-ISSN 2580-9741
p-ISSN 2088-3943

menggabungkannya dengan key NIM dan disimpan Proses mining asal kota merupakan proses
dalam tabel data gabungan. mining untuk mengetahui hubungan tingkat
Spesifikasi proses/algoritma :
kelulusan dengan asal kota mahasiswa,
Initial State (IS) : tabel data gabungan
kosong digunakan data kota asal sekolah dengan asumsi
Final State (FS) : tabel data gabungan kota asal sekolah merupakan kota asal
terisi
Spesifikasi Proses/algoritma: Ambil data
mahasiswa.
kelulusan dan data induk gabungkan dengan Nama fungsi : Mining Kota Asal
key NIM Simpan dalam tabel data gabungan Deskripsi isi : Digunakan untuk proses mining atribut Kota
Asal
2) Fungsi Bersihkan Data Spesifikasi proses/algoritma :
Initial State (IS) : view data gabungan
Nama fungsi : Bersihkan data bersih terisi data bersih
Deskripsi isi : Digunakan untuk membersihkan data Hitung kombinasi masing-masing item
yang tidak sesuai dan tidak lengkap isiannya dari data kategori dan Kota Asal Hitung nilai
gabungan dan ditampilkan dalam view data gabungan support dan confidence END IF
bersih untuk diolah lebih lanjut. 6) Fungsi Mining Program Studi
Spesifikasi proses/algoritma : Proses mining program studi merupakan proses
Initial State (IS) : view data gabungan mining untuk mengetahui hubungan tingkat
bersih kosong
Final State (FS) : view data gabungan
kelulusan dengan program studi.
bersih terisi data gabungan yang telah Nama fungsi : Mining Program Studi Deskripsi isi :
dibersihkan Digunakan untuk proses mining atribut Program Studi
Spesifikasi Proses/algoritma: Spesifikasi proses/algoritma :
Pemilihan atribut Ambil data gabungan Initial State (IS) : view data gabungan
seleksi atribut yang dipakai dan buang bersih terisi data bersih
atribut yang tidak lengkap isiannya
Final State (FS): Keluar report hasil
3) Fungsi Mining Proses Masuk proses mining program studi
Proses mining proses masuk merupakan Spesifikasi Proses/algoritma:
Hitung masing –masing item dalam Kategori
proses mining untuk mengetahui hubungan Hitung masing-masing item dalam Program
tingkat kelulusan dengan proses masuk Studi IF jumlah masing-masing item >
threshold THEN Hitung kombinasi masing-
mahasiswa. masing item kategori dan Program Studi
Nama fungsi : Mining Proses Masuk Deskripsi isi : Hitung nilai support dan confidence END IF
Digunakan untuk proses mining atribut proses masuk
Spesifikasi proses/algoritma : D. Implementasi Interface
Dalam lembaran aplikasi Data Mining ini
Initial State (IS) : view data gabungan
bersih terisi data bersih terdapat dua buah form :
Final State (FS): Keluar report hasil 1. Form pertama
proses mining proses masuk
Spesifikasi Proses/algoritma:
Halaman awal yang berisi perintah
Hitung masing–masing item dalam Kategori pengambilan data pemilihan atribut data induk
Hitung masing-masing item dalam proses mahasiswa, input threshold, perintah proses
masuk
IF jumlah masing–masing item > threshold mining dan tombol keluar aplikasi.
THEN
Hitung kombinasi masing-masing item
2. Form kedua
kategori dan proses masuk Halaman report data mining yang berisi
Hitung nilai support dan confidence hasil proses data mining yaitu tabel nilai support
END IF
4) Fungsi Mining Asal Sekolah dan confidence.
Proses mining asal sekolah merupakan proses
mining untuk mengetahui hubungan tingkat
kelulusan dengan asal sekolah yang melalui
jalur beasiswa.
Nama fungsi : Mining Asal Sekolah Deskripsi isi :
Digunakan untuk proses mining atribut Asal Sekolah
Spesifikasi proses/algoritma :
Initial State (IS): view data gabungan
bersih terisi data bersih
Final State (FS): Keluar report hasil
proses mining asal sekolah
Spesifikasi Proses/algoritma: Gambar 4.2 Tampilan Form Data Mining
Hitung masing –masing item dalam Kategori Perintah-perintah dalam form pertama berupa
Hitung masing-masing item dalam asal
sekolah dengan proses masuk Beasiswa tombol ambil data untuk melakukan proses
IF jumlah masing-masing item > threshold pengambilan data, inputan teks threshold
THEN
Hitung kombinasi masing-masing item untuk memasukkan nilai threshold, inputan
kategori dan asal sekolah Hitung nilai combo box untuk memilih jurusan, inputan
support dan confidence
END IF combo box untuk memilih atribut yang akan
5) Fungsi Mining Kota Asal diproses mining, tombol proses untuk perintah

Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 33


e-ISSN 2580-9741
p-ISSN 2088-3943

proses mining dan tombol keluar untuk Pengujian Sistem


perintah keluar aplikasi. No Butir Uji Kelas Uji Tingkat Jenis
Pengujian Uji
Hasil keluaran dari proses data mining 1 Fungsi Tombol Pengujian Black
disajikan dalam form report Aplikasi Data pengambi ambil data sistem Box
Mining. Form ini terdiri dari dua informasi lan data
utama, yaitu informasi atribut dengan 2 Fungsi Tombol Pengujian Black
bersihkan Brsihkan sistem Box
confidence tertinggi masing-masing kategori data data
kelulusan dan tabel yang berisi nilai confidence 3 Fungsi Tombol Pengujian Black
dan support masing-masing kombinasi tingkat mining mining data sistem Box
kelulusan dan data
Atribut. Selain itu terdapat dua tombol perintah H. Hasil Uji
yaitu tombol kembali ke menu utama dan Hasil uji dianggap sukses jika pada tabel
tombol untuk keluar aplikasi. pengujian, hasil yang didapat sesuai dengan
kriteria evaluasi hasil dan hasil yang
diharapkan.
Tabel 4.9
Hasil Uji Teknik Data Mining

Gambar 4.2 Tampilan Report Data Mining


Implementasi rancangan data merupakan transformasi
rancangan data yang dihasilkan dari proses perancangan
data menjadi suatu database. Database merupakan suatu
data warehouse dengan nama “data Mining” yang dibangun
untuk menyimpan data kelulusan mahasiswa dan data induk
mahasiswa yang disatukan dengan key NIM dan disimpan
dalam tabel data gabungan.
Hasil rancangan antarmuka Aplikasi Data Mining
diimplementasikan dalam dua form. Form pertama
merupakan halaman awal yang berisi perintah pengambilan
data pemilihan atribut data induk mahasiswa, input
threshold, perintah proses mining dan tombol keluar
aplikasi. Sedangkan form kedua berupa informasi hasil
proses data mining yaitu tabel nilai support dan confidence.
Tombol dan inputan dalam form awal disusun secara V. SIMPULAN DAN SARAN
berurutan dan hanya bisa diakses secara terurut. Karena Kesimpulan yang dapat diperoleh dari
dalam data mining proses tersebut bersifat sekuensial. penerapan teknik data mining dalam
G. Pengujian Aplikasi Data Mining menentukan tingkat kelulusan yaitu :
Dalam pengujian Aplikasi Data Mining ini 1. Informasi yang ditampilkan berupa nilai
digunakan teknik pengujian Black Box. Teknik support dan confidence yaitu hubungan
yang digunakan dalam pengujian Black Box antara tingkat kelulusan dengan data induk
antara lain : mahasiswa. Semakin tinggi nilai confidence
1. Digunakan untuk menguji fungsi-fungsi dan support maka semakin kuat nilai
khusus dari perangkat lunak yang dirancang. hubungan antar atribut.
2. Kebenaran perangkat lunak yang diuji hanya 2. Data induk mahasiswa yang diproses
dilihat berdasarkan keluaran yang mining meliputi data proses masuk, data
dihasilkan dari data atau kondisi masukan asal sekolah, data kota mahasiswa, dan data
yang diberikan untuk fungsi yang ada tanpa program studi.
melihat bagaimana proses untuk 3. Hasil dari proses data mining ini dapat
mendapatkan keluaran tersebut dan digunakan sebagai pertimbangan dalam
bagaimana hasil dari proses mining. mengambil keputusan lebih lanjut tentang
3. Dari keluaran yang dihasilkan, kemampuan faktor yang mempengaruhi tingkat kelulusan
program dalam memenuhi kebutuhan khususnya faktor dalam data induk
pemakai dapat diukur sekaligus dapat mahasiswa.
diketahui kesalahan-kesalahannya. 4. Berdasarkan pengujian, dapat disimpulkan
Tabel 4.8 bahwa pengolahan data dengan

Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 34


e-ISSN 2580-9741
p-ISSN 2088-3943

menggunakan teknik data Mining dapat Witten, I. H and Frank, E. 2005. Data Mining :
digunakan untuk mengetahui hubungan data Practical Machine Learning Tools and
kelulusan dengan data induk mahasiswa. Techniques Second Edition. Morgan
Saran dari penerapan teknik data mining Kauffman : San Francisco.
dalam pemanfaatan data awal mahaiswa yaitu :
1. Untuk pengembangan Aplikasi Data Mining
lebih lanjut, dapat menggunakan algoritma
lain, misal algoritma FP-Growth.
Perbedaannya adalah algoritma apriori harus
melakukan scan database setiap kali iterasi,
sedangkan algoritma FP-Growth hanya
melakukan satu kali scan database diawal.
2. Pengolahan data besar dan tidak beraturan
bila diolah dengan teknik data mining akan
memberikan informasi yang sangat
bermanfaat dalam meningkatkan pelayanan
manajemen pendidikan.
VI. REFERENSI
Anonim, 2009 “Peraturan Akademik
Universitas Diponegoro Bidang
Pendidikan”, Semarang.
Bramer, Max, 2007, “Principles of Data
Mining”, Springer, London.
Chintakayala, Padmini. 2005. “Beginners Guide
for Software Testing : Symbiosys
Technologies”.
Davies, and Paul Beynon, 2004, “Database
Systems Third Edition”, Palgrave
Macmillan, New York.
Elmasri, Ramez and Shamkant B. Navathe,
2000, “Fundamentals of Database
Systems. Third Edition”, Addison Wesley
Publishing Company, New York.
Han, J. and Kamber, M, 2006, “Data Mining
Concepts and Techniques Second Edition”.
Morgan Kauffman, San Francisco.
Kadir, Abdul, 1999, “Konsep dan Tuntunan
Praktis Basis Data”, Penerbit Andi,
Yogyakarta.
Kusrini, dan Emha Taufik Luthfi, 2009,
“Algoritma Data Mining”, Penerbit Andi,
Yogyakarta.
Pramudiono, I. 2007. Pengantar Data Mining :
Menambang Permata Pengetahuan di
Gunung Data.
Rainardi, Vincent, 2008, “Building a Data
Warehouse with Examples in SQL Server”,
Springer, New York.
Pressman, Roger S, 1997, “Software
Engineering:A Practitioner’s Approch.” The
McGraw-Hill Companies, Inc., New York
Santosa, Budi, 2007, “Data Mining Teknik
Pemanfaatan Data untuk Keperluan
Bisnis”, Graha Ilmu, Yogyakarta. Sommerville,
Ian, 2003, “Software Engineering
(Rekayasa Perangkat Lunak)/Edisi 6/Jilid 1”
Erlangga.

Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 35

Anda mungkin juga menyukai