Anda di halaman 1dari 12

PENGEMBANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA NAVE BAYES UNTUK MENEMUKAN POLA PADA REKAM DATA SISWA

TERHADAP PRESTASI BELAJAR DI SMKN 39 JAKARTA Dedi Sugiarto Alumni 2012 Pendidikan Teknik Elektronika Universitas Negeri Jakarta dan Guru di SMKN Perguruan Cikini, Jakarta Widodo Dosen Fakultas Teknik Universitas Negeri Jakarta Bunawan Dosen Fakultas Teknik Universitas Negeri Jakarta
Ari Apriyansa Pendidikan Teknik Elektronika 2011 Universitas Negeri Jakarta Noreg (5215117014)

Development of data mining application is aimed to develop an application that can predict student achievement based on student data records. Data development of data mining applications is taken at SMK 39 Jakarta from March 5, 2011 to May 5, 2011 . Taking 387 students data, 337 students data used as training data and 50 students data used as testing data. Meanwhile the algorithm which is used in data mining applications use Nave Bayes algorithm. The programming language that used is Java and the database application is MySQL. Based on the test result by using data mining applications, the accuracy rate is 94% and the error value is 6%. So it can be conclude that the application of data mining can be used to predict the students who might have a good achievement or the otherwise. Kata kunci: data mining, prediksi, prestasi belajar, algoritma Nave Bayes, akurasi, Java, MySQL.

Semakin

berkembangnya

teknologi

Management System). Dari yang sederhana seperti penggunaan Microsoft Access sampai dengan penggunaan DBMS yang cukup kompleks seperti Oracle Database 11g. Adanya DBMS bertujuan untuk mempermudah dalam hal penyimpanan data

informasi sangat membantu setiap pekerjaan manusia. Seperti dalam hal pengumpulan data, setiap orang dalam suatu organisasi atau perusahaan tidak bisa terlepas untuk menggunakan DBMS (Database

PENGEMBANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA NAVE BAYES

(Dedi Sugiarto) 1

maupun dalam hal manipulasi data, yang nantinya data tersebut dapat digunakan kembali apabila diperlukan. DBMS lainnya adalah data mining, yang berfungsi untuk mencari informasi atau pengetahuan dari sekumpulan data yang jumlahnya cukup besar sehingga memudahkan dalam aktifitas rekam data suatu penelitian dalam beberapa bidang, salah satunya pendidikan. Penelitian ini bertujuan sebuah aplikasi untuk data

Data mining yaitu proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basisdata dengan melakukan penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basisdata. M. Kamber (2006: 13) Data mining biasa juga dikenal nama lain seperti : Knowledge discovery (mining) in databases (KDD), ekstraksi pengetahuan (knowledge extraction) Analisa data/pola dan kecerdasan bisnis (business intelligence) dan merupakan alat yang penting untuk memanipulasi data untuk penyajian informasi sesuai kebutuhan user dengan tujuan untuk membantu dalam analisis koleksi pengamatan perilaku, secara umum definisi data-mining dapat diartikan sebagai berikut: Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar. Ekstraksi dari suatu informasi yang berguna atau menarik (non-trivial, implisit, sebefumnya belum diketahui potensial kegunaannya)

mengembangkan

mining untuk menemukan Pola Prestasi Belajar pada Rekam Data Siswa Di SMKN 38 Jakarta.

Data Mining Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basisdata dengan melakukan penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basisdata.

Pevote Vol.7 No.12 Mei 2012 1 - 12

pola atau pengetahuan dari data yang disimpan dalam jumfah besar. Ekplorasi dari analisa secara otomatis atau semiotomatis terhadap data-data dalam jumlah besar untuk mencari pola dan aturan yang berarti. Data mining sangat perlu dilakukan

Prediksi Prediksi adalah suatu ramalan atau bisa disebut sebuah perkiraan terhadap apa yang sebelumnya belum terjadi atau sesuatu yang belum pernah diketahui. Menurut kamus besar bahasa Indonesia, prediksi adalah hasil dari kegiatan memprediksi atau meramal atau memperkirakan. Prediksi bisa berdasarkan metode ilmiah ataupun subjektif belaka, sehingga prediksi ini juga tidak selalu benar.

terutama dalam mengelola data yang sangat besar untuk memudahkan aktifitas rekam suatu data agar dapat memberikan informasi yang akurat bagi penggunanya dan mampu memberikan peluang kebenaran yang besar. Data mining dapat dikatakan sebagai bidang keilmuan yang menyatukan teknik dari pembelajaran mesin, penanganan pengenalaan pola, pengambian statistic, database, dan visualisasi untuk permasalahan infomasi dari database yang besar. Data mining dapat digunakan untuk

Prestasi Belajar Prestasi belajar terdiri dari dua kata, yakni prestasi dan belajar. Prestasi adalah hasil yang telah dicapai.(Menurut Kamus Besar Bahasa Indonesia). Prestasi dapat disimpulkan pengertiannya, yaitu bukti keberhasilan yang telah dicapai seseorang setelah mengerjakan tugas tertentu yang dapat dilihat dari kemampuan dan penguasaan terhadap kegiatan. Sedangkan belajar dapat diartikan sebagai proses yang mengakibatkan perubahan-perubahan tingkah laku yang terjadi dalam diri individu. W. Winkel (1984:26)

menprediksi siswa yang nantinya akan berprestasi. Sehingga pihak sekolah dapat menyiapkan mendukung. dana dan fasilitas aplikasi yang data Penggunaan

mining ini dilakukan untuk meningkatkan peran sekolah dalam meningkatkan prestasi belajar siswanya.

PENGEMBANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA NAVE BAYES

(Dedi Sugiarto) 3

Peluang Peluang adalah harapan terjadinya sesuatu kejadian atau hasil yang dikuantitatifkan. Peluang juga bisa disebut kesempatan atau kemungkinan peluang besar, terjadinya maka pula sesuatu. Jika besar, begitu kemungkinan jika

dari nilai sebenarnya, maka akurasi dari pengukuran tersebut buruk.

Algoritma Nave Bayes Teorema digunakan menghitung Bayes adalah teorema yang untuk hipotesis.

terjadinya sesuatu atau kesempatannya juga sebaliknya, peluangnya kecil, maka kesempatan atau kemungkinannya terjadinya sesuatu kecil. Data mining ini menggunakan algoritma Nave Bayes karena algoritma ini mempunyai kelebihan yaitu memiliki tingkat akurasi yang cukup tinggi dan mempunyai kecepatan yang cukup baik apabiila diterapkan pada database yang cukup besar. Akurasi menyatakan seberapa dekat nilai hasil pengukuran dengan sebenarnya.

dalam peluang

statistika suatu

Teorema Bayes memiliki bentuk umum sebagai berikut:

P(H|X) = Keterangan: X

= data dengan kelas yang

belum diketahui H = hipotesis data X merupakan suatu kelas spesifik

Akurasi Akurasi adalah sesuatu yang digunakan unuk menyatakan seberapa dekat hasil dari pengukuran atau pun penelitian dengan harga atau nilai yang sebenarnya. Jika suatu pengukuran memiliki nilai yang mendekati nilai sebenarnya, maka akurasi dari baik, pengukuran tersebut dikatakan

P(H|X) = probabilitas hipotesis H sebesar kondisi X P(H) = probabilitas hipotesis H P(X|H) = probabilitas X berdasar kondisi pada hipotesis H P(X) = probabilitas dari X

sedangkan jika nilai hasil pengukuran jauh

Pevote Vol.7 No.12 Mei 2012 1 - 12

Java Bahasa pemrograman yang dipakai pada penelitian ini adalah bahasa pemrograman Java, yaitu salah satu bahasa pemrograman yang berorientasi objek. Pemrograman Java ini menggunakan basis C++ tetapi memiliki tampilan hasil yang lebih bagus jadi bahasa pemrograman Java ini paling banyak dipakai pada saat sekarang. Java pemrograman yang objek James dibuat berorientasi adalah bahasa objek murni

Portable Performance Multithreaded Dinamis Java juga mempunyai platform yaitu: Java Virtual Machine (Java VM) Java Application Programming

berdasarkan kemampuanseperti C++, developer dari Ada, Sun

kemampuan terbaik bahasa pemrograman sebelumnya Gosling, Simula (April 2011). Java diciptakan oleh Microsystems pada tahun 1991. Karakteristik atau bisa disebut kelebihan dari Java: Sederhana (Simple) Berorientasi Objek Terdistribusi Interpreted Robust Aman (secure) Architecture Neutral

Interface (Java API) Java dibagi menjadi 3 platform yaitu J2EE (Java 2 Enterprise Edition) digunakan untuk aplikasi berbasis web, J2SE (Java 2 Standar Edition) yang digunakan untuk aplikasi berbasis desktop, J2ME (Java 2 Micro Edition) yang digunakan untuk aplikasi besbasis mobile. MySQL Database yang digunakan dalam penelitian ini adalah MySQL. MySQL adalah salah satu jenis DBMS, dengan keunggulan dalam kecepatan, digunakan. mengeliminasi downtime, kehandalan Database masalah pemeliharaan dan ini terkait dan mudah mampu dengan modern

administrasi pada aplikasi online (Maret 2011). Kelebihan dari MySQL yaitu:

PENGEMBANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA NAVE BAYES

(Dedi Sugiarto) 5

MySQL

merupakan

Database

MySQL merupakan database server yang Multi User.

Management System (DBMS). MySQL sebagai Relation Database Management System (RDBMS) atau disebut dengan databse relational. MySQL merupakan sebuah database server yang free, artinya kita bebas menggunakan harus database atau ini untuk keperluan pribadi atau usaha tanpa membeli membayar lisensinya. MySQL merupakan sebuah database client. MySQL mampu menerima query yang bertumpuk dalam satu permintaan atau Multi Threading. MySQL merupakan Database yang mampu menyimpan data berkapasitas sangat besar hingga berukuran GigaByte sekalipun. MySQL didukung oleh driver ODBC, artinya database MySQL dapat diakses menggunakan aplikasi apa saja. MySQL adalah database yang

MySQL

mendukung

field

yang

dijadikan sebagai kunci primer dan kunci unique. MySQL memiliki kecepatan dalam pembuatan tabel, Metode yang digunakan adalah eksperimen laboratorium Process. Metode Unified Process merupakan suatu metode rekayasa perangkat lunak yang dikembangkan dengan mengumpulkan berbagai best terative yang terdapat dalam terative pengembangan perangkat lunak. Ciri utama metode ini adalah menggunakan use-case driven dan pendekatan terative untuk siklus pengembangan perankat lunak. Proses penerapan Unified Process dalam penelitian dirangkum pada Tabel 3.1. Setiap fase akan dijelaskan secara langsung sesuai dengan pengembangan software yang akan dibangun. Terutama pada fase Elaboration dan Construction akan dilakukan secara interative dan incremental. dengan pengembangan Software menggunakan metode Unified

menggunakan enkripsi password, jadi database ini cukup aman.

Pevote Vol.7 No.12 Mei 2012 1 - 12

Tabel 3.1. Fase Pengembangan Software No. Fase Unified Process Inception Proses yang dilakukan Setelah Idnifikasi masalah yang akan dipecahkan dilakukan dengan observasi kebutuhan, spesifikasi system, dan menguraikan deskripsi system. Pembuatan diagram use case, analisis class, desain database, dan desain GUI (Graphical User Interface). Pembuatan Activity Diagram, Communication Diagram, dan pengkodingan. Menunggu umpan balik dari pengguna dan melakukan pemeliharaan software. Software HASIL PENELITIAN semua proses pengembangan

1.

selesai dilakukan maka perlu

dilakukan pengujian. Pengujian dilakukan untuk mengetahui apakah software yang telah dikembangkan telah layak digunakan oleh pengguna atau tidak. Apabila software tersebut belum layak digunakan oleh pengguna, maka perlu dilakukan perbaikan. Setelah semua proses perbaikan telah selesai dilakukan dan software tersebut telah layak digunakan oleh pengguna, maka software tersebut telah selesai dikembangkan dan siap digunakan oleh pengguna. Berdasarkan penjelasan di atas maka perlu dijelaskan bagaimana melakukan pengujian software tersebut. PadaTabel 4.1 merupakan hasil pengujian software yang telah dilakukan.

2.

Elaboration

3.

Comstructio n

4.

Transition

Tabel 4.1. Hasil pengujian kebutuhan fungsional.

No. 1.

Skenario Proses User atau admin mengklik tombol Log In dengan username kosong dan password kosong User atau admin mengklik tombol

Sistem Bekerja Ya

Keterangan Keluar pesan error

2.

Ya

Keluar pesan error


(Dedi Sugiarto) 7

PENGEMBANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA NAVE BAYES

Tabel 4.1. (lanjutan) Log In dengan username terisi dan password kosong 3. User atau admin mengklik tombol Log In dengan username kosong dan password terisi User atau admin mengklik tombol Log In dengan username salah dan password benar User atau admin mengklik tombol Log In dengan username benar dan password salah User atau admin mengklik tombol Log In dengan username salah dan password salah User atau admin mengklik tombol Log In dengan username benar dan password benar User atau admin mengklik tombol menu item Home dengan benar pada menu File User atau admin mengklik tombol menu item Data mining dengan benar pada menu File User atau admin mengklik tombol menu item LogOut dengan benar pada menu File User atau admin mengklik tombol menu item About dengan benar pada menu Help User atau admin mengklik tombol menu item Contact dengan benar pada menu Help Mengklik tombol proses dengan nis kosong, nama siswa kosong, umur kosong, jarak kosong, akreditasi SMP kosong, dan nilai rata-rata Ya Keluar pesan error

4.

Ya

Keluar pesan error

5.

Ya

Keluar pesan error

6.

Ya

Keluar pesan error

7.

Ya

Masuk ke sistem

8.

Ya

Benar

9.

Ya

Benar

10.

Ya

Benar

11.

Ya

Benar

12.

Ya

Benar

13.

Ya

Keluar peringatan error

Pevote Vol.7 No.12 Mei 2012 1 - 12

Tabel 4.1. (lanjutan) semester 1 kosong 14. Mengklik tombol proses dengan nis kosong, nama siswa kosong, umur kosong, jarak kosong, akreditasi SMP kosong, dan nilai rata-rata semester 1 terisi Mengklik tombol proses dengan nis kosong, nama siswa kosong, umur kosong, jarak terisi, akreditasi SMP terisi, dan nilai rata-rata semester 1 kosong Mengklik tombol proses dengan nis kosong, nama siswa kosong, umur kosong, jarak terisi, akreditasi SMP terisi, dan nilai rata-rata semester 1 terisi Mengklik tombol proses dengan nis kosong, nama siswa kosong, umur terisi, jarak terisi, akreditasi SMP terisi, dan nilai rata-rata semester 1 terisi Mengklik tombol proses dengan nis terisi, nama siswa kosong, umur kosong, jarak terisi, akreditasi SMP terisi, dan nilai rata-rata semester 1 terisi Mengklik tombol proses dengan nis kosong, nama siswa terisi, umur kosong, jarak terisi, akreditasi SMP terisi, dan nilai rata-rata semester 1 terisi Mengklik tombol proses dengan nis kosong, nama siswa terisi, umur terisi, jarak terisi, akreditasi SMP terisi, dan nilai rata-rata semester 1 terisi Mengklik tombol proses dengan nis terisi, nama siswa kosong, umur terisi, jarak terisi, akreditasi SMP Ya Keluar peringatan error

15.

Ya

Keluar peringatan error

16.

Ya

Keluar peringatan error

17.

Ya

Keluar peringatan error

18.

Ya

Keluar peringatan error

19.

Ya

Keluar peringatan error

20.

Ya

Keluar peringatan error

21.

Ya

Keluar peringatan error

PENGEMBANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA NAVE BAYES

(Dedi Sugiarto) 9

Tabel 4.1. (lanjutan) terisi, dan nilai rata-rata semester 1 kosong 22. Mengklik tombol proses dengan nis terisi, nama siswa kosong, umur terisi, jarak terisi, akreditasi SMP kosong, dan nilai rata-rata semester 1 kosong Mengklik tombol proses dengan nis terisi, nama siswa kosong, umur terisi, jarak kosong, akreditasi SMP kosong, dan nilai rata-rata semester 1 kosong Mengklik tombol proses dengan nis kosong, nama siswa terisi, umur kosong, jarak kosong, akreditasi SMP kosong, dan nilai rata-rata semester 1 kosong Mengklik tombol proses dengan nis kosong, nama siswa terisi, umur kosong, jarak terisi, akreditasi SMP kosong, dan nilai rata-rata semester 1 kosong Mengklik tombol proses dengan nis kosong, nama siswa terisi, umur kosong, jarak kosong, akreditasi SMP kosong, dan nilai rata-rata semester 1 terisi Mengklik tombol proses dengan nis kosong, nama siswa terisi, umur terisi, jarak kosong, akreditasi SMP terisi, dan nilai rata-rata semester 1 terisi Mengklik tombol proses dengan nis kosong, nama siswa terisi, umur terisi, jarak terisi, akreditasi SMP terisi, dan nilai rata-rata semester 1 terisi Mengklik tombol proses dengan nis kosong, nama siswa terisi, umur Ya Keluar peringatan error

23.

Ya

Keluar peringatan error

24.

Ya

Keluar peringatan error

25.

Ya

Keluar peringatan error

26.

Ya

Keluar peringatan error

27.

Ya

Keluar peringatan error

28.

Ya

Keluar peringatan error

29.

Ya

Keluar peringatan error

10

Pevote Vol.7 No.12 Mei 2012 1 - 12

Tabel 4.1. (lanjutan) terisi, jarak terisi, akreditasi SMP kosong, dan nilai rata-rata semester 1 terisi 30. Mengklik tombol proses dengan nis kosong, nama siswa terisi, umur terisi, jarak terisi, akreditasi SMP terisi, dan nilai rata-rata semester 1 kosong Ya Keluar peringatan error

Hasil dari software yang dipakai untuk melihat peluang dari siswa, software berjalan dengan baik. Selain itu, didapat juga hasil dari penelitian siswa SMKN 39 Jakarta dengan 387 siswa yang diambil., 337 siswa digunakan sebagai data training, dan 50 siswa sebagai data testing. Dari penelitian tersebut didapatkan 94% siswa yang cukup baik dan 6% error.

berdasarkan pada rentang waktu saat siswa duduk di semester 2 sampai siswa duduk di semester 6.

SARAN Pada awalnya data yang akan diambil adalah data pendidikan terakhir orang tua/wali murid, ekonomi keluarga, pekerjaan orang dan orang tua, alat tua, keadaan tunjangan yang jumlah

KESIMPULAN Penelitian ini diambil dari 387 siswa SMKN 39 Jakarta. 337 siswa dijadikan sebagai data training, dan 50 siswa digunakan sebagai data testing. Hasil dari testing terhadap aplikasi yang telah dikembangkan didapat data dengan tingkat akurasi yang cukup baik yaitu 94% dan 6% error. Pada aplikasi data nilai mining prediksinya yang hanya

transportasi

digunakan oleh siswa ke sekolah. Tetapi dalam pelaksanaannya data tersebut tidak semuanya penelitian semua. ada, Sehingga maka diharapkandalam dapat mencakup dapat selanjutnya

kemungkinan

meningkatkan tingkat akurasi data mining. Untuk penelitian selanjutnya diharapkan dapat mencoba menggunakan algoritma yang lain, yang kemungkinan mempunyai tingkat akurasi yang lebih tinggi sehingga mempunyai hasil prediksi yang lebih baik.

dikembangkan,

berlaku untuk 2,5 tahun ke depan. Karena

PENGEMBANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA NAVE BAYES

(Dedi Sugiarto) 11

DAFTAR PUSTAKA Bahasa pemrograman Java diunduh dari: http://poss.ipb.ac.id/files/JENIIntro1-Bab02Pengenalan%20Bahasa%20JAVA.pd f [4 Apr 2011] Kusrini, & Lutfi, E. T. 2009. Algoritma Data Mining. Yogyakarta: Andi Offset. Database MySQL diunduh dari website: http://www.mysql.com/about/ Maret 2011] Winkel, W. 1984. Psikologi Pendidikan dan Evaluasi Belajar. Jakarta: PT. Gramedia Widiasrana. [23

12

Pevote Vol.7 No.12 Mei 2012 1 - 12