Anda di halaman 1dari 50

SISTEM COLLECTING FILE SKRIPSI BERBASIS WEB

DENGAN PENGKLASIFIKASIAN DOKUMEN


OTOMATIS MENGGUNAKAN ALGORITMA COSINE
SIMILARITY DI TEKNIK ELEKTRO UNIVERSITAS
NEGERI SEMARANG

Skripsi
Skripsi diajukan sebagai salah satu persyaratan untuk memperoleh gelar Sarjana
Pendidikan Program Studi Pendidikan Teknik Informatika dan Komputer

Oleh
Rizki Tri Wahyuni NIM.5302412041

JURUSAN TEKNIK ELEKTRO


FAKULTAS TEKNIK
UNIVERSITAS NEGERI SEMARANG
2017
MOTTO DAN PERSEMBAHAN

x Sesungguhnya setiap perbuatan tergantung niatnya, dan sesungguhnya semua

orang (akan dibalas) berdasarkan apa yang dia niatkan (HR Bukhari Muslim)

x Dalam setiap masalah yang kita hadapi terdapat suatu pelajaran yang dapat

kita ambil, jangan terpaku pada masalahnya, namun pikirkan apa hikmahnya.

x Selembar daun tidak jatuh dari pohon dengan sia-sia, begitu pula dengan

usaha kita. Tidak ada usaha yang sia-sia, itu semua akan berpengaruh pada

setiap langkah yang kita ambil.

Persembahan:

Skripsi ini saya persembahkan untuk:

1. Ibu dan ayah tercinta Ibu Sunartin dan Bapak Supatmo

2. Kedua kakak tercinta (Yuliati dan Heri Purwanto)

3. Keluarga besar desa Pungpungan Kecamatan Kalitidu Kabupaten Bojonegoro

4. Keluarga besar Kos Latansa

5. Sahabat setia saya

6. Teman-teman PTIK Rombel 1 angkatan 2012

7. Almamaterku UNNES

v
ABSTRAK

Rizki Tri Wahyuni. 2017. Sistem Collecting File Skripsi Berbasis Web dengan
Pengklasifikasian Dokumen Otomatis menggunakan Algoritma Cosine Similarity
di Teknik Elektro Universitas Negeri Semarang. Skripsi. Pembimbing Dr-Ing.
Dhidik Prastiyanto, S.T.,M.T. dan Dr. H. Eko Supraptono, M.Pd. Pendidikan
Teknik Informatika dan Komputer. Universitas Negeri Semarang.
Kegiatan collecting file skripsi menggunakan CD/DVD drive di jurusan
Teknik Elektro menghasilkan limbah elektronik yang semakin bertambah tiap
tahun. Ruang penyimpanan yang terbatas serta kurangnya pengelolaan limbah
elektronik membuat CD/DVD drive bekas pakai terbengkalai begitu saja. Sistem
penyimpanan yang tidak terpusat juga menjadi kendala dalam pengelolaan soft file
skripsi. Diperlukan klasifikasi dokumen secara otomatis dalam menghemat waktu
dan tenaga. Oleh karena itu peneliti membangun sistem collecting file skripsi
dengan database terpusat serta pengkasifikasian secara otomatis.
Jenis metode penelitian yang digunakan adalah metode “Penelitian dan
Pengembangan” (R&D). Merupakan metode penelitian yang digunakan untuk
menghasilkan sebuah produk baru, dan selanjutnya menguji keefektifan produk
tersebut. Analisis data yang digunakan adalah analisis data deskriptif persentase.
Hasil dari penelitian ini adalah sebuah sistem collecting file skripsi
berbasis web yang dibangun menggunakan bahasa pemrograman PHP dan HTML.
Sistem ini mampu mengklasifikasikan skripsi kedalam beberapa kategori
menggunakan algoritma cosine similarity. Hasil pengujian black-box pada sistem
menunjukkan bahwa sistem mampu menjalankan seluruh fungsi-fungsinya
dengan baik. Hasil pengujian ahli sistem memperoleh persentase kelayakan
sebesar 88,3%, hasil pengujian ahli kearsipan memperoleh persentase sebesar
87,5%, hasil pengujian user responsive memperoleh persentase sebesar 85,3% dan
hasil persentase ketepatan klasifikasi sebesar 98%. Maka dapat disimpulkan
bahwa sistem collecting file skripsi sangat layak digunakan dengan hasil
persentase ketepatan klasifikasi sangat tinggi.
Kata Kunci: collecting skripsi, cosine similarity, klasifikasi dokumen, arsip

vi
KATA PENGANTAR

Segala puji dan syukur penulis ucapkan kehadirat Allah SWT dan

mengharapkan ridho yang telah melimpahkan rahmat-Nya sehingga penulis dapat

meneyelesaikan skripsi yang berjudul " Sistem Collecting File Skripsi Berbasis

Web dengan Pengklasifikasian Dokumen Otomatis menggunakan Algoritma

Cosine Similarity di Teknik Elektro Universitas Negeri Semarang ". Skripsi ini

disusun sebagai salah satu persyaratan meraih gelar Sarjana Pendidikan pada

Program Studi S-1 Pendidikan Teknik Informatika dan Komputer Universitas

Negeri Semarang. Shalawat serta salam senantiasa disampaikan kepada junjungan

alam Nabi Muhammad SAW, mudah-mudahan kita semua mendapatkan safaat di

yaumil akhir nanti, Aamiin. Penyelesaian skripsi ini tidak lepas dari bantuan

berbagai pihak, oleh karena itu pada kesempatan ini penulis menyampaikan

ucapan terima kasih serta penghargaan kepada :

1. Bapak Dr-Ing. Dhidik Prastiyanto, S.T.,M.T. selaku pembimbing pertama dan

bapak Dr. H. Eko Supraptono, M.Pd. atas bimbingan, arahan dan motivasinya

dalam penyusunan skripsi ini.

2. Bapak Dr. H. Noor Hudallah, M.T selaku penguji 1 yang telah memberikan

bimbingan dan arahan dalam menyempurnakan skripsi ini.

3. Bapak Drs. R. Kartono M. Pd selaku dosen wali

4. Ketua Jurusan Teknik Elektro Fakultas Teknik Universitas Negeri Semarang,

Bapak Dr. Ing. Dhidik Prastiyanto S.T., M.T.

5. Dekan Fakultas Teknik Universitas Negeri Semarang, Dr. Nur Qudus M.T.

vii
6. Bapak/Ibu Dosen Program Studi Pendidikan Teknik Informatika dan

Komputer yang telah memberikan ilmu serta bimbingannya selama ini.

7. Ibuku, Bapakku, Kedua kakak ku di kota Surabaya dan Jakarta, sehingga

skripsi ini dapat terselesaikan.

8. Teman-teman Pendidikan Teknik Informatika dan Komputer angkatan 2012.

9. Semua pihak yang telah membantu peneliti dalam menyelesaikan skripsi ini

yang tidak dapat penyusun sebutkan satu persatu.

Semoga amal baik dari semua pihak mendapat imbalan yang berlipat

ganda dari Allah SWT. Diharapkan skripsi ini dapat bermanfaat, Aamiin.

Semarang, Juli 2017

Peneliti

viii
DAFTAR ISI

Halaman Judul ......................................................................................................... i


Pernyataan ............................................................................................................... ii
Persetujuan Pembimbing........................................................................................ iii
Perngesahan............................................................................................................ iv
Motto dan Persembahan .......................................................................................... v
Abstrak ................................................................................................................... vi
Kata Pengantar ...................................................................................................... vii
Daftar Isi ................................................................................................................ ix
Daftar Tabel .......................................................................................................... xii
Daftar Gambar...................................................................................................... xiv
Daftar Lampiran ................................................................................................... xvi
BAB I PENDAHULUAN
1.1 Latar Belakang ...................................................................................... 1
1.2 Rumusan Masalah ................................................................................. 6
1.3 Batasan Masalah ................................................................................... 7
1.4 Tujuan Penelitian ................................................................................. 7
1.5 Manfaat Penelitian ............................................................................... 8
1.6 Sistematika Penulisan .......................................................................... 9

BAB II KAJIAN PUSTAKA


2.1 Penelitian Terdahulu .......................................................................... 11
2.2 Landasan Teori .................................................................................... 13
2.2.1 Sistem ............................................................................................ 13
2.2.2 Database ........................................................................................ 15
2.2.3 Perangkat Analisis dan Perancangan Sistem................................. 16
2.2.4 Perangkat Pendukung .................................................................... 20

ix
2.2.5 Pengujian Perangkat Lunak........................................................... 22
2.2.6 Pengarsipan Dokumen................................................................... 23
2.2.7 Pengklasifikasian Dokumen .......................................................... 24
2.2.8 Text Mining ................................................................................... 25
2.2.9 Pembobotan TF-IDF ..................................................................... 27
2.2.10 Cosine Similarity ......................................................................... 27
BAB III METODE PENELITIAN
3.1 Waktu dan Tempat Penelitian ............................................................. 29
3.2 Teknik Pengumpulan Data .................................................................. 30
3.2.1 Observasi ....................................................................................... 30
3.2.2 Studi Pustaka ................................................................................. 31
3.2.3 Dokumentasi.................................................................................. 31
3.3 Desain Penelitian ................................................................................. 31
3.3.1 Tahap Studi Pendahuluan .............................................................. 33
3.3.2 Tahap Pengembangan Produk ....................................................... 33
3.3.3 Tahap Analisis ............................................................................... 34
3.3.3.1 Analisis Kebutuhan Sistem ..................................................... 34
3.3.3.2 Analisis Kebutuhan Input ........................................................ 34
3.3.3.3 Analisis Kebutuhan Output ..................................................... 34
3.3.4 Perancangan Produk ...................................................................... 35
3.3.4.1 Use Case Diagram ................................................................... 35
3.3.4.2 Activity Diagram ..................................................................... 36
3.3.4.3 Flowchart................................................................................. 52
3.3.4.4 Diagram Konteks..................................................................... 54
3.3.4.5 DFD Level 1 ............................................................................ 54
3.3.4.6 Perancangan Basis Data .......................................................... 55
3.3.4.7 Desain Tampilan Sistem.......................................................... 56
3.3.5 Pengujian Produk .......................................................................... 61
3.3.5.1 Pengujian Black-box ............................................................... 61
3.3.5.2 Pengujian Ahli Sistem ............................................................. 61
3.3.5.3 Pengujian Ahli Kepustakaan ................................................... 62

x
3.3.5.4 Pengujian User Skala Terbatas ................................................ 62
3.4 Alat dan Bahan Penelitian ................................................................... 63
3.4.1 Perangkat Keras (Hardware) ......................................................... 63
3.4.2 Perangkat Lunak (Software).......................................................... 63
3.5 Instrumen Penelitian............................................................................ 64
3.5.1 Instrumen Kuisioner ...................................................................... 64
3.6 Teknik Pengambilan Sampel .............................................................. 66
3.7 Teknik Analisis Data ........................................................................... 66
BAB IV HASIL DAN PEMBAHASAN
4.1 Hasil Penelitian ................................................................................... 70
4.1.1 Implementasi Komponen Sistem Collecting File Skripsi ............. 70
4.1.2 Hasil Pengujian Black-box ............................................................ 74
4.1.3 Hasil Pengujian Ahli Sistem ......................................................... 91
4.1.4 Hasil Pengujian Ahli Kearsipan .................................................. 101
4.1.5 Hasil Pengujian User Responsive ............................................... 107
4.1.6 Hasil Perhitungan Data Mining ................................................... 110
4.1.2 Pembahasan .................................................................................... 112
BAB V PENUTUP
5.1 Simpulan............................................................................................ 116
5.2 Saran .................................................................................................. 118
DAFTAR PUSTAKA ....................................................................................... 119

xi
DAFTAR TABEL
Halaman
Tabel 3.1 Struktur Tabel user ................................................................................ 55
Tabel 3.2 Struktur Tabel admin ............................................................................ 56
Tabel 3.3 Struktur Tabel skripsi............................................................................ 56
Tabel 3.4 Struktur Tabel klasifikasi ...................................................................... 57
Tabel 3.5 Struktur Tabel status_upload ................................................................ 57
Tabel 3.6 Spesifikasi Kebutuhan Hardware .......................................................... 63
Tabel 3.7 Spesifikasi Kebutuhan Software ........................................................... 63
Tabel 3.8 Kisi-kisi Umum Instrumen Pakar Sistem.............................................. 65
Tabel 3.9 Kisi-kisi Umum Instrumen Pakar Kearsipan ........................................ 65
Tabel 3.10 Kisi-kisi Umum Instrumen Pakar User (Mahasiswa) ......................... 65
Tabel 3.11 Skala Likert ......................................................................................... 67
Tabel 3.12 Kategori Kelayakan Sistem................................................................. 69
Tabel 4.1 Implementasi Komponen Sistem Level User........................................ 70
Tabel 4.2 Implementasi Komponen Sistem Level Administrator......................... 72
Tabel 4.3 Uji Black-box Sistem Level Administrator .......................................... 74
Tabel 4.4 Uji Black-box Sistem Level User ......................................................... 85
Tabel 4.5 Hasil Pengujian Ahli Sistem ................................................................. 91
Tabel 4.6 Hasil Penilaian Aspek Performace........................................................ 92
Tabel 4.7 Hasil Penilaian Aspek Information ....................................................... 93
Tabel 4.8 Hasil Penilaian Aspek Control .............................................................. 93
Tabel 4.9 Hasil Penilaian Aspek Efficiency ......................................................... 94
Tabel 4.10 Hasil Penilaian Aspek Service ............................................................ 95
Tabel 4.11 Daftar Saran Validator Sistem ............................................................ 96
Tabel 4.12 Hasil Pengujian Ahli Kearsipan ........................................................ 102
Tabel 4.13 Hasil Penilaian Aspek Information ................................................... 103
Tabel 4.14 Hasil Penilaian Aspek Service .......................................................... 103

xii
Tabel 4.15 Daftar Saran Validator Kearsipan ..................................................... 104
Tabel 4.16 Hasil Uji Pengguna ........................................................................... 107
Tabel 4.17 Hasil Penilaian Aspek Isi Perangkat Lunak ...................................... 108
Tabel 4.18 Hasil Penilaian Aspek Kemudahan dalam Penggunaan ................... 109
Tabel 4.19 Hasil Penilaian Aspek Tampilan Aplikasi ........................................ 109
Tabel 4.20 Hasil Penilaian Aspek Kelayakan Aplikasi ...................................... 110
Tabel 4.21 Hasil Pelatihan Data dengan Algoritma ............................................ 111

xiii
DAFTAR GAMBAR
Halaman
Gambar 2.1 Simbol Proses .................................................................................... 17
Gambar 2.2 Simbol Aliran Data ........................................................................... 17
Gambar 2.3 Simbol Penyimpanan Data ................................................................ 18
Gambar 2.4 Simbol Entitas ................................................................................... 18
Gambar 2.5 Simbol Entitas ................................................................................... 19
Gambar 2.6 Simbol Relasi .................................................................................... 19
Gambar 3.1 Diagram Langkah-langkah Penelitian ............................................... 32
Gambar 3.2 Diagram Model Waterfall ................................................................. 33
Gambar 3.3 Use Case Diagram Level User .......................................................... 35
Gambar 3.4 Use Case Diagram Level Administrator ........................................... 36
Gambar 3.5 Activity Diagram Menu Upload Skripsi ........................................... 37
Gambar 3.6 Activity Diagram Menu Ubah Password .......................................... 38
Gambar 3.7 Activity Diagram Menu Referensi Berdasarkan Kata Kunci ............ 39
Gambar 3.8 Activity Diagram Menu Referensi Berdasarkan Kategori ................ 40
Gambar 3.9 Activity Diagram Menu Data Upload Personal ................................ 41
Gambar 3.10 Activity Diagram Menu Rekap User............................................... 42
Gambar 3.11 Activity Diagram Menu Tambah User ............................................ 43
Gambar 3.12 Activity Diagram Menu Rekap Skripsi ........................................... 44
Gambar 3.13 Activity Diagram Menu Klasifikasi File Skripsi............................. 45
Gambar 3.14 Activity Diagram Menu Validasi Upload Skripsi ........................... 46
Gambar 3.15 Activity Diagram Menu Administrator ........................................... 47
Gambar 3.16 Activity Diagram Menu Laporan Keseluruhan ............................... 48
Gambar 3.17 Activity Diagram Menu Laporan Tahunan ..................................... 49
Gambar 3.18 Activity Diagram Menu Hapus Akun Mahasiswa .......................... 50
Gambar 3.19 Activity Diagram Menu Hapus Data Upload Skripsi ..................... 51
Gambar 3.20 Flowchart Prepocessing .................................................................. 52

xiv
Gambar 3.21 Flowchart Klasifikasi Judul Skripsi ................................................ 53
Gambar 3.22 Diagram Konteks Sistem Collecting File Skripsi ........................... 54
Gambar 3.23 DFD Level 1 Sistem Collecting File Skripsi................................... 55
Gambar 3.24 Desain Tampilan Halaman Login ................................................... 58
Gambar 3.25 Desain Tampilan Halaman Muka User ........................................... 58
Gambar 3.26 Desain Tampilan Halaman Input Data ............................................ 59
Gambar 3.27 Desain Tampilan Halaman Pencarian Referensi ............................. 59
Gambar 3.28 Desain Tampilan Halaman Administrator....................................... 60
Gambar 3.29 Desain Tampilan Halaman Rekap User .......................................... 60
Gambar 4.1 Menu Laporan Sebelum Perbaikan ................................................... 96
Gambar 4.2 Menu Laporan Setelah Perbaikan ..................................................... 97
Gambar 4.3 Kode simpan_pendaftaran.php Sebelum Perbaikan.......................... 97
Gambar 4.4 Kode simpan_pendaftaran.php Setelah Perbaikan ............................ 98
Gambar 4.5 Penyimpanan File Sebelum Perbaikan .............................................. 98
Gambar 4.6 Penyimpanan File Setelah Perbaikan ................................................ 99
Gambar 4.7 Halaman Login Sebelum Perbaikan .................................................. 99
Gambar 4.8 Penyimpanan File Setelah Perbaikan .............................................. 100
Gambar 4.9 Data Upload Skripsi Sebelum Perbaikan ........................................ 100
Gambar 4.10 Data Upload Skripsi Setelah Perbaikan ........................................ 101
Gambar 4.11 Data Upload Skripsi Sebelum Perbaikan ...................................... 105
Gambar 4.12 Data Upload Skripsi Setelah Perbaikan ........................................ 105
Gambar 4.13 Menu Pada Halaman Admin Sebelum Perbaikan ......................... 106
Gambar 4.14 Menu Pada Halaman Admin Setelah Perbaikan ........................... 106

xv
DAFTAR LAMPIRAN
Halaman
Lampiran 1. SK Dosen Pembimbing .................................................................. 122
Lampiran 2. Hasil Klasifikasi Judul Skripsi dengan Algoritma ......................... 123
Lampiran 3. Tampilan Antarmuka Sistem .......................................................... 135
Lampiran 4. Lembar Pengujian Ahli Sistem ....................................................... 152
Lampiran 5. Lembar Pengujian Ahli Kearsipan ................................................. 155
Lampiran 6. Lembar Pengujian User Skala Terbatas.......................................... 158
Lampiran 7. Usulan Pembimbing ....................................................................... 161
Lampiran 8. Permohonan Uji Ahli...................................................................... 162
Lampiran 9. Dokumentasi Penelitian .................................................................. 164

xvi
1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Kehadiran teknologi informasi dan komunikasi (TIK) merupakan suatu

kemajuan pesat dalam peradapan manusia. Teknologi informasi dan komunikasi

memberikan banyak manfaat bagi masyarakat, baik manfaat secara langsung

maupun tidak langsung. Teknologi informasi dan komunikasi tidak dapat terlepas

dari kehidupan masyarakat, terlebih di era yang serba canggih seperti saat ini.

Perubahan model dan teknologi yang begitu cepat juga telah merubah gaya hidup

masyarakat untuk selalu mengikuti teknologi terbaru.

Salah satu bentuk teknologi informasi dan komunikasi yang berkembang

pesat adalah internet. Internet dapat menyampaikan informasi dalam jarak yang

sangat jauh seperti lintas benua. Salah satu kegiatan yang berubah seiring adanya

teknologi internet adalah kegiatan surat menyurat. Jika dahulu mengirim surat

menggunakan media kertas, maka sekarang media kertas diubah menjadi media

digital yang langsung dikirim menggunakan teknologi internet. Internet dapat

digunakan untuk berbagai macam kegiatan, seperti mengakses informasi,

mengirim informasi, neyimpan informasi dan masih banyak yang lainnya.

Selain memiliki banyak dampak postif ternyata perkembangan teknologi

informasi dan komunikasi juga memiliki dampak negatif, salah satunya adalah

dampak negatif bagi lingkungan. Banyaknya peralatan elektronik yang digunakan

menghasilkan banyak limbah elektronik. Limbah elektronik digolongkan kedalam


2

limbah Bahan Berhaya dan Beracun (B3) karena sifat, konsentrasi, atau

jumlahnya baik secara langsung atau tidak langsung dapat mencemarkan dan

mambahayakan lingkungan hidup manusia dan makhluk lainnya. Hal ini

berdasarkan penelitian yang dilakukan oleh Sri Wahyono (2012) dengan judul

“Kebijakan Pengelolaan Limbah Elektronik dalam Lingkup Global dan Lokal”.

Universitas Negeri Semarang sebagai salah satu universitas konservasi di

Indonesia memiliki program untuk menyelaraskan kedua permasalahan di atas

melalui pilar-pilar konservasi. Unnes sudah menjalankan kebijakan nirkertas guna

mengurangi penggunaan kertas. Sesuai dengan Peraturan Rektor Universitas

Negeri Semarang No.27 Tahun 2012 tentang Tata Kelola Kampus Berbasis

Konservasi pada Pasal 7 program pilar kebijakan nirkertas diterapkan melalui

optimalisasi sistem berbasis teknologi informasi, efisien penggunaan kertas,

pemanfaatan kertas daur ulang, dan penggunaan kertas ramah lingkungan.

Beberapa teknologi informasi berbasis web sebagai penunjang pilar

kebijakan nirkertas juga telah dikembangkan oleh Unnes, diantaranya Sikadu

(Sistem Akademik Terpadu), Simawa (Sistem Informasi Mahasiswa), Simpeg

(Sistem Informasi Kepegawaian), Sibima (Sistem Informasi Bimbingan

Mahasiswa) dan masih banyak sistem informasi yang lainnya. Sistem yang

dikembangkan memiliki manfaat memudahkan mahasiswa maupun sivitas

akademika dalam mengakses maupun mengirim informasi.

Jurusan Teknik Elektro sebagai bagian dari Universitas Negeri Semarang

memiliki peran untuk ikut andil melaksanakan pilar-pilar konservasi. Di Jurusan

Teknik Elektro kebijakan nirkertas sendiri sudah terlaksana, contohnya adalah


3

adanya mata kuliah e-learning, pengumpulan tugas lewat e-mail, pengumpulan

arsip skripsi dengan CD/DVD drive, adanya sistem informasi pengajuan skripsi

berbasis web dan lain sebagainya.

Kegiatan yang rutin dilakukan oleh jurusan Teknik Elektro adalah

mengoleksi dokumen skripsi dari calon wisudawan sebagai arsip jurusan. Dari

tahun ke tahun jumlah koleksi selalu bertambah seiring bertambahnya jumlah

mahasiswa yang telah lulus mata kuliah skripsi, hal ini membuat pihak jurusan

harus menyiapkan ruang penyimpanan yang lebih besar untuk arsip dokumen

skripsi. Sampai saat ini metode pengumpulan dokumen arsip skripsi dilakukan

dengan dua cara yaitu dengan menggunakan hard file dan soft file dalam bentuk

CD/DVD drive.

Berdasarkan pengamatan dari peneliti, hal ini menimbulkan masalah baru.

Menumpuknya CD/DVD yang sudah tak terpakai menjadi limbah elektronik,

limbah elektronik ini tidak dikelola secara maksimal dan hanya dikumpulkan

dalam ruangan. Selain itu arsip yang telah terkumpul tersebar dalam beberapa

database komputer. Hal ini menjadi kendala dalam pengelolaan arsip. Arsip soft

file tidak dipublikasikan kepada mahasiswa karena sudah tersedia arsip dalam

bentuk hard file di perpustakaan Teknik Elektro. Namun arsip di perpustakaan

tidak terklasifikasi dengan baik sehingga pengunjung perpustakaan sulit untuk

menemukan referensi yang sedang dicari.

Sistem pengarsipan berbasis web sendiri sudah banyak dikembangkan di

Indonesia. Salah satunya adalah penelitian yang dilakukan oleh Bambang Panji

Asmara (2014) dengan judul “Digitalisasi Arsip Dokumen Penting Sebagai File
4

Lokal Interest (LI) Dengan Soft Komputing Sebagai Daya Dukung Informasi

Berbasis ICT”. Menurut Bambang (2014: 9) menyatakan sistem digitalisasi

dokumen membantu memperpanjang ketersediaan dokumen karena tidak akan

mengalami kerusakan secara fisik seiring berjalannya waktu serta mempermudah

penggunanya untuk memperoleh data yang dibutuhkan.

Mengacu pada permasalahan yang ada, cara tradisional dalam

pengumpulan data dan informasi dapat diubah menggunakan teknologi yang baru

dan lebih efisien seperti teknologi web. Penggunaan web dapat mengurangi

penggunaan media penyimpanan seperti CD/DVD drive sekali pakai. Sehingga

banyaknya limbah sisa penggunaan CD/DVD drive dapat berkurang. Karena web

menggunakan teknologi internet yang dapat melakukan pengiriman data secara

real time. Selain itu web juga memiliki model basisdata yang terpusat sehingga

mudah dalam melakukan pengelolaan data. Dari segi user atau pengguna web juga

akan merasa dimudahkan dengan adanya sistem berbasis web.

Untuk mengelola dokumen elektronik dengan jumlah yang banyak,

diperlukan suatu metode agar data dapat diproses menjadi informasi yang tepat.

Selain itu dengan banyaknya dokumen proses pengklasifikasian tidak mungkin

dilakukan secara manual karena memerlukan banyak waktu dan tenaga. Salah satu

metode yang dapat digunakan adalah dengan pengklasifikasian secara otomatis

dengan text mining. Banyak metode text mining yang digunakan dalam

mengklasifikasikan dokumen atau teks, salah satunya adalah algoritma cosine

similarity.
5

Algoritma cosine similarity telah diterapkan pada penelitian Diki dkk

(2016), Ogie dkk (2016), Radiant dkk (2014), Andry dkk (2014), Sugiyamta

(2014), Anubhuti dkk (2016) dan Vicas dkk (2013). Diki dkk (2016)

menggunakan algoritma cosine similarity untuk membandingkan pembobotan

yang lebih efisien antara TF-IDF dan WIDF. Hasilnya adalah pembobotan TF-

IDF dengan cosine similarity menghasilkan ketepatan klasifikasi sebesar 70,7%

sedangkan pembobotan WIDF menghasilkan ketepatan klasifikasi sebesar 70,6%.

Ogie dkk (2016) membandingkan algoritma cosine similaity, jaccard similarity

dan KNN dalam aplikasi pencarian terjemahan Al-Qur’an. Hasilnya adalah

algoritma cosine similarity memiliki ketepatan pencarian sebesar 41%, jaccard

similarity sebesar 19% dan KNN sebesar 40%.

Radiant dkk (2014) membandingkan dua dokumen untuk mendeteksi

plagiarisme menggunakan algoritma cosine similarity dan smith waterman.

Hasilnya adalah Radiant dkk berhasil membuat aplikasi pendeteksi plagiarisme

menggunakan algoritma cosine similarity dan smith waterman dengan akurasi

yang cukup tinggi. Andry dkk (2014) membuat aplikasi pencarian informasi

beasiswa berbasis web menggunakan algoritma cosine similarity. Dan hasilnya

adalah aplikasi ini memiliki persentase keakuratan sebesar 49,1%. Sugiyamta

(2014) membuat sistem deteksi kemiripan teks menggunakan algoritma cosine

similarity dan single pass clustering. Hasilnya adalah pengukuran dengan cosine

similarity pada sistem ini menghasilkan persentase keakuratan sebesar 99%.

Anubhuti dkk (2016) membuat aplikasi klastering dokumen menggunakan

algoritma cosine similarity dengan centroid implication. Hasilnya adalah


6

algoritma cosine similarity mampu untuk mengklasifikasikan dokumen dalam

penelitian Anubhuti dkk kedalam 13 klaster dengan tepat. Vicas dkk (2013)

membandingkan algoritma cosine similarity, jaccard similarity dan dice similarity

untuk pencarian teks pada internet. Hasilnya adalah algoritma cosine similarity

memiliki nilai akurasi tertinggi, kemudian yang kedua adalah dice similarity dan

yang terakhir adalah jaccard similarity.

Oleh karena itu penulis akan mengadakan penelitian dengan judul “Sistem

Collecting File Skripsi Berbasis Web dengan Pengklasifikasian Dokumen

Otomatis menggunakan Algoritma Cosine Similarity di Teknik Elektro

Universitas Negeri Semarang”. Diharapkan penelitian ini dapat membantu jurusan

Teknik Elektro untuk melakukan kegiatan pengarsipan data yang lebih efektif dan

efisien. Serta dapat membantu mahasiswa untuk memudahkan kegiatan collecting

file skripsi ke jurusan Teknik Elektro.

1.2 Rumusan Masalah

Berdasarkan latar belakang di atas, maka dapat dirumuskan permasalahan

sebagai berikut :

1. Bagaimana membangun sistem collecting file skripsi berbasis web?

2. Bagaimana kelayakan sistem collecting file skripsi berbasis web berdasarkan

pengujian ahli dan black-box testing?

3. Seberapa tinggi keakuratan pengklasifikasian file skripsi menggunakan

algoritma cosine similarity?


7

1.3 Batasan Masalah

Batasan masalah dalam sistem yang dibuat dari hasil penelitian yang

dilakukan dan dengan cakupan data serta informasi maka dapat dibuat perumusan

masalah diatas, diantaranya adalah sebagai berikut:

1. Sistem collecting file skripsi berbasis web ini dibuat khusus untuk jurusan

Teknik Elektro Universitas Negeri Semarang.

2. Sistem ini hanya membahas tentang proses collecting file skripsi oleh

mahasiswa serta proses pengklasifikasian file skripsi dengan algoritma cosine

simialrity dalam kegiatan pengarsipan data.

3. Pengguna dari sistem ini hanya mahasiswa jurusan Teknik Elektro serta

kepala laboratorium atau administrator jurusan Teknik Elektro.

4. Dalam pembuatan sistem ini hanya menggunakan bahasa pemrograman

HTML, PHP, MySQL, Database dan Bootsrap dengan berbasis web.

5. Sistem ini hanya mengklasifikasikan dokumen kedalam 9 kategori, yaitu

sistem pakar, sistem berbasis web, sistem berbasis android, jaringan

komputer, model metode dan media pembelajaran, ketenagaan, elektronika

dan komunikasi, instrumentasi dan kendali, serta lainnya.

1.4 Tujuan Penelitian

Berdasarkan rumusan masalah yang telah dikemukakan di atas, tujuan dari

penelitian ini adalah:


8

1. Merancang dan membangun sistem collecting file skripsi berbasis web yang

dapat digunakan di Teknik Elektro Fakultas Teknik Universitas Negeri

Semarang.

2. Menguji kelayakan sistem collecting file skripsi berbasis web berdasarkan

pengujian ahli dan black-box testing.

3. Menganalisis tingkat keakuratan pengklasifikasian file mengguanakan

algoritma cosine similarity.

1.5 Manfaat Penelitian

Penelitian ini dilakukan dengan harapan dapat memberikan manfaat,

diantaranya :

1.5.1 Manfaat Bagi Peneliti

Untuk meningkatkan keterampilan dan memperluas pandangan penulis

dalam mempraktikan teori tentang sistem informasi web yang telah

diterima selama di bangku kuliah.

1.5.2 Manfaat Bagi Instansi (Jurusan Teknik Elektro UNNES)

a. Memudahkan administrasi arsip jurusan dalam pengelolaan data file

skripsi.

b. Memudahkan pengelolaan data oleh kepala laboratorium maupun

pimpinan lainnya.

c. Mengurangi banyaknya limbah elektronik yang ada di Teknik Elektro.


9

1.5.3 Manfaat Bagi Pengguna

a. Penelitian ini diharapkan dapat mempermudah calon wisudawan

sebagai pengguna dalam melakukan pengumpulan dokumen skripsi ke

Jurusan Teknik Elektro.

b. Mempermudah pengguna khususnya mahasiswa dalam mengakses

referensi yang dibutuhkan.

1.6 Sistematika Penulisan

Secara keseluruhan, sistematika penulisan pada penelitian ini adalah

sebagai berikut:

1. Bab I Pendahuluan

Berisi latar belakang masalah, rumusan masalah, pembatasan masalah,

tujuan penelitian, manfaat penelitian dan sistematika penulisan penelitian.

2. Bab II Landasan Teori

Berisi penjabaran teori, dan telaah pustaka berdasarkan teori yang relevan

untuk digunakan sebagai bahan acuan dalam penelitian serta kerangka berfikir

dalam penelitian.

3. Bab III Metode Penelitian

Bab ini menjabarkan model pengembangan sistem yang akan dibuat, serta

sistematika perancangan dan pembuatan sistem dan pengolahan data klasifikasi

file skripsi dengan algoritma cosine simialrity.


10

4. Bab IV Hasil dan Pembahasan

Bab ini akan membahas tentang hasil dari model pengembangan yang

digunakan dalam perancangan dan pembuatan sistem serta data perhitungan

pengolahan file skripsi dengan algoritma cosine simialrity.

5. Bab V Simpulan dan Saran

Berisi tentang kesimpulan dari hasil penelitian dan saran.


11

BAB II KAJIAN

PUSTAKA

2.1 Penelitian Terdahulu

Penelitian terdahulu yang relevan merupakan hal yang cukup penting

untuk dijadikan data pendukung dalam melaksanakan penelitian karena

didalamnya terdapat acuan yang merupakan teori atau hasil dari bagian penelitian.

Penelitian tentang sistem digitalisasi dalam pengarsipan sudah banyak dilakukan.

Kemudian penelitian tentang penggunaan algoritma Cosine Similarity dalam

berbagai model juga sudah dilakukan. Namun penelitian sistem digitalisasi

dokumen arsip dengan pengklasifikasian dokumen menggunakan algoritma

Cosine Similarity belum pernah dilakukan. Untuk itu peneliti ingin melakukan

penelitian tersebut.

Sutirman (2015) melakukan penelitian dengan judul “Urgensi Menejemen

Arsip Elektronik”. Penelitian ini menjelaskan tentang pentingnya menjaga

keutuhan arsip karena arsip sangat penting bagi sebuah organisasi sebagai bahan

pengambilan keputusan dan informasi oleh organisasi. Penggunaan arsip

elektronik memudahkan pencarian file, mengurangi resiko kerusakan file dan

mempermudah kegiatan berbagi arsip. Sutirman mengemukakan bahwa

pengarsipan secara elektronik dapat mengurangi persoalan arsip yang tiap waktu

semakin bertambah banyak jumlahnya.

Bambang (2014) melakukan penelitian yang berjudul “Digitalisasi File

Dokumen Penting Sebagai File Local Interest Dengan Soft Komputing Sebagai
12

Daya Dukung Informasi Berbasis ICT”. Penelitian ini menjelaskan tentang

pentingnya menjaga ketersediaan data-data yang urgent. Dengan mengubah

dokumen dalam bentuk kertas menjadi bentuk digital karena bentuk digital tidak

akan mengalami kerusakan fisik seperti dokumen dalam bentuk kertas. Bambang

melakukan konversi kertas menjadi dokumen dengan melakukan proses scanning

serta mengkonversikan kedalam bentuk PDF. Kemudian data tersebut disimpan

dan dikelola dalam satu database yang terpadu guna mempermudah pengelolaan

data.

Rangga dkk (2015) dengan penelitiannya yang berjudul “Desain Sistem

Informasi Perpustakaan Digital” menjelaskan bahwa banyaknya referensi dalam

bentuk cetak membuat calon pembaca memerlukan waktu lama dalam pencarian

fererensi. Selain itu seiring bertambahnya buku juga akan mempengaruhi

kebutuhan luas ruangan penyimpanan. Akses pengguna pada perpustakaan juga

akan terbatas pada waktu-waktu tertentu saja. Maka dari itu Rangga dkk membuat

sistem perpustakaan digital untuk memudahkan calon pembaca serta pengelola

perpustakaan dalam pengolahan data.

Ogie dkk (2016) dengan penelitiannya yang berjudul “Perbandingan

Metode Cosine Similarity dengan Metode Jaccard Similarity pada Aplikasi

Pencarian Terjemahan Al-Qur’an dalam Bahasa Indonesia” menjelaskan bahawa

metode cosine similarity mempunyai konsep normalisasi panjang vektor data

dengan membandingkan N-gram yang sejajar satu sama lain dari 2 pembanding

sehingga menghasilkan persentase ketepatan pencarian yang tinggi. Data latih

yang digunakan adalah sejumlah 6236 dokumen dan 30 kata kunci untuk
13

kemudian diuji coba pada masing-masing algoritma. Ogie dkk menyimpulkan

berdasarkan penelitian yang dilakukannya bahwa pencarian dengan metode cosine

similarity memiliki nilai kemiripan 41%, metode jaccard similarity 19%, dan

metode KNN 40%.

Diki dkk (2016) dengan penelitiannya yang berjudul “Pemanfaatan Vector

Space Model pada Penerapan Algoritma Nazief Adriani, KNN dan Fungsi

Similarity Cosine untuk Pembobotan IDF dan WIDF pada Prototype Sistem

Klasifikasi Teks Bahasa Indonesia”. Diki dkk membandingkan keefektifan antara

pembobotan IDF dan WIDF dengan menggunakan algoritma cosine similarity

serta KNN. Data latih yang digunakan adalah teks berita yang terbagi atas 3

kategori. Masing-masing kategori terdiri atas 3 dokumen. Hasil dari penelitian ini

adalah persentase ketepatan pembobotan dengan IDF adalah sebesar 70,7% dan

pembobotan dengan WIDF sebesar 70,6%.

2.2 Landasan Teori

2.2.1 Sistem

a. Definisi Sistem

Pengertian sistem menurut beberapa ahli yaitu, Menurut Tata Sutabri

(2012:6) pada buku Konsep Sistem Informasi, pada dasarnya sistem adalah

sekelompok unsur yang erat hubungannya satu dengan yang lain, yang berfungsi

bersama-sama untuk mencapai tujuan tertentu.

Selanjutnya Menurut McLeod (2004) dikutip oleh Yakub dalam buku

Pengantar Sistem Informasi (2012:1) mendefiniskan sistem adalah Sekelompok


14

elemen-elemen yang terintegrasi dengan tujuan yang sama untuk mencapai tujuan.

Sistem juga merupakan suatu jaringan kerja dari prosedur-prosedur yang saling

berhubungan, terkumpul bersama-sama untuk melakukan suatu kegiatan atau

untuk tujuan tertentu.

b. Perancangan Sistem

Aktivitas perancangan sistem secara terstruktur menurut Husni dkk

(1997:6) dalam bukunya yang berjudul Pengantar Perancangan Sistem

melingkupi:

1. Survey; berfungsi untuk mengetahui kebutuhan kesalahan-kesalahan dalam

sistem lama, menetapkan tujuan perancangan, mengajukan usulan otomasi

sistem yang layak dan dapat diterima, dan menyiapkan laporan survey.

2. Analisa sistem; menggabungkan saporan survey dan kebijakan pemakai

menjadi spesifikasi yang terstruktur dengan menggunakan pemodelan.

3. Desain; mengimplementasikan model yang diinginkan pemakai.

4. Implementasi; merepresentasikan hasil desain kedalam pemrograman.

5. Uji coba desain; mrngujicoba seluruh spesifikasi terstruktur.

6. Testing akhir; mengujicoba sistem secara keseluruhan.

7. Deskripsi prosedur; pembuatan laporan teknis tertulis seperti petunjuk

pemakaian dan pengoperasian.

8. Konversi database; mengkonversi data.

9. Instalasi; mencakup serah terima manual book, perangkat serta pelatihan

pemakaian.
15

2.2.2 Basis Data

a. Konsep Dasar Basis Data

Basisdata adalah data-data yang diolah dalam SIBK disimpan dalam media

penyimpan sekunder dengan cara-cara tertentu sehingga mudah untuk digunakan

dan ditampilkan kembali (Edhy, 2011:2).

Basisdata adalah kumpulan data yang secara logik berkaitan dalam

merepresentasikan fenomena/fakta secara terstruktur dalam domian tertentu dalam

mendukung aplikasi pada sistem tertentu. Basisdata merupakan komponen utama

sistem informasi karena semua informasi untuk pengambilan keputusan berasal

dari data di basisdata (Bambang, 20014:4). Basisdata memiliki peran penting bagi

suatu organisasi karena basisdata menyimpan data-data dan informasi yang

penting dan urgent mengenai organisasi tersebut.

b. Komponen Dasar Basis Data

1. Data

Data di dalam sebuah basisdata dapat disimpan secara terintegrasi

(integrated) dan data dapat dipakai secara bersama-sama (shared).

2. Hardware

Terdiri dari semua perangkat komputer yang digunakan untuk pengolahan

sistem basisdata, berupa peralatan untuk penyimpanan basisdata (secondary

storage) dan peralatan input serta output.


16

3. Software

Berfungsi sebagai perantara (interface) antara pemakai dengan data fisik

pada basisdata. Software pada basisdata dapat berupa DBMS (Database

Management System) ataupun program-program aplikasi dan prosedur-prosedur.

4. User atau pemakai

a) Database Administrator, seseorang ataupun tim yang bertugas mengelola

sistem basisdata secara keseluruhan.

b) Programmer, seseorang atau tim yang bertugas membuat program

aplikasi.

c) End User, orang yang mengakses basisdata melalui terminal dengan

bahasa pemrograman atau program aplikasi yang dibuat oleh programmer.

2.2.3 Perangkat Analisis dan Perancangan Sistem

Perangkat yang digunakan dalam analisis dan perancangan sistem yaitu

Activity Diagram, Use Case Diagram, DFD dan Flowchart.

a. DFD

DFD adalah model dari sistem untuk menggambarkan pembagian sistem

ke modul yang lebih kecil. Salah satu keuntungan menggunakan DFD adalah

memudahkan pemakai atau user yang kurang menguasai bidang komputer untuk

mengerti sistem yang akan dikerjakan (Edhy, 2011:2).

Tingkatan DFD dimulai dari diagram konteks yang menjelaskan secara

umum suatu sistem atau batasan sistem aplikasi yang akan dikembangkan.

Kemudian DFD dikembangkan menjadi DFD tingkat 0 atau level 0 dan kemudian
17

DFD level 0 dikembangkan lagi menjadi level 1 dan selanjutnya sampai sistem

tersebut tergambarkan secara rinci menjadi tingkatan-tingkatan lebih rendah lagi.

Simbol-simbol yang digunakan dalam Data Flow Diagram menurut notasi

Yourdan adalah sebagai berikut :

1. Proses

Proses dilambangkan dengan lingkaran, dimana proses ini menunjukan

bagian dari sistem yang mengubah satu atau lebih input dan output. Nama proses

dituliskan dengan satu kata, singkatan atau kalimat sederhana.

Gambar 2.1 Simbol Proses

2. Aliran Data

Aliran data direpresentasikan dengan menggunakan panah yang menuju ke

atau dari proses. Aliran data juga digunakan untuk menunjukan bagian-bagian

informasi dari satu bagian ke bagian lain. Pembagian nama untuk aliran ini

menunjukan sebuah arti untuk sebuah aliran. Untuk kebanyakan sistem yang

dibuat, aliran data sebenarnya mengambarkan data yakni angka, huruf, pesan,

floating point, dan macam-macam informasi lainnya.

Gambar 2.2 Simbol Aliran Data


18

3. Penyimpanan Data

Simpanan data digunakan sebagai penyimpanan bagi paket-paket data.

Notasi penyimpanan data digambarkan dengan garis horizontal yang pararel.

Simpanan data merupakan simpanan data dari data yang berupa suatu file atau

database di sistem komputer ataupun berupa arsip atau catatan manual. Nama dari

simpanan data menunjukan nama filenya.

Gambar 2.3 Simbol Penyimpanan Data

4. Entitas Luar

Entitas luar digambarkan dengan sebuah kotak yang menggambarkan

kesatuan luar (eksternal entitty) yang berhungan dengan sistem. Kesatuan luar

merupakan kesatuan dilingkungan luar sistem yang dapat berupa orang, organisasi

atau sistem lainnya yang berada di lingkungan luarnya yang akan memberikan

input atau output dari sistem.

Gambar 2.4 Simbol Entitas

b. ERD

Entity Relationship Diagram atau biasa dikenal dengan diagram E-R

secara grafis menggambarkan isi sebuah database. Diagram ini memiliki dua
19

komponen utama yaitu entity dan relasi. Untuk melambangkan fungsi diatas maka

digunakan simbol-simbol yang bisa dilihat pada daftar simbol. Elemen-elemen

Entity Relationship Diagram adalah sebagai berikut:

1. Entitas (Entity)

Pada E-R diagram, entitas digambarkan dengan sebuah bentuk persegi

panjang. Entitas adalah sesuatu apa saja yang ada didalam sistem, nyata maupun

abstrak dimana data tersimpan. Entitas diberi nama dengan kata benda dan dapat

dikelompokan dalam empat jenis nama, yaitu : orang, benda, lokasi kejadian

(terdapat unsur waktu didalamnya).

Entitas

Gambar 2.5 Simbol Entitas

2. Relasi

Pada E-R diagram, relasi dapat digambarkan dengan sebuah bentuk belah

ketupat. Relasi adalah hubungan alamiah yang terjadi antara entitas. Pada

umumnya relasi diberi nama dengan kata kerja dasar, sehinga memudahkan untuk

melakukan pembacaan relasinya.

Relasi

Gambar 2.6 Simbol Relasi


20

2.2.4 Perangkat Pendukung

a. XAMPP

XAMPP merupakan sebuah tool yang beberapa paket perangkat lunak ke

dalam satu buah paket. Dengan menginstall XAMPP maka tidak perlu lagi

melakukan instalasi dan konfigurasi web server Apache, PHP dan MySQL secara

manual. XAMPP akan menginstalasi dan mengkonfigurasikannya secara otomatis

untuk anda. XAMPP terdiri dari:

1. Apache

Apache bersifat open source, artinya setiap orang boleh menggunakannya,

mengambil dan bahkan mengubah kode programnya. Tugas utama apache adalah

menghasilkan halaman web yang benar kepada user, berdasarkan kode PHP yang

dituliskan oleh pembuat halaman web. Jika diperlukan juga berdasarkan kode

PHP yang dituliskan, maka dapat saja suatu database diakses terlebih dahulu

untuk mendukung halaman web yang dihasilkan.

2. PHP

PHP merupakan bahasa pemrograman untuk mebuat web yang bersifat

server-side scripting. PHP memungkinkan kita untuk membuat halaman web yang

bersifat dinamis. PHP dapat dijalankan pada berbagai macam Operating System

(OS), misalnya Windows, Linux dan Mac OS. Selain Apache, PHP juga

mendukung beberapa web server lain, misalnya Microsoft IIS, Caudium, PWS

dan lain-lain. Sistem manajemen database yang sering digunakan bersama PHP

adalah MySQL. Namun PHP juga mendukung sistem manajemen Database

Oracle, Microsoft Acces, Interbase, d-Base, PostgreSQL dan sebagainya.


21

Hingga kini PHP sudah berkembang hingga versi ke 5. PHP 5 mendukung

penuh Object Oriented Programing(OOP), integrasi XML, mendukung semua

ekstensi terbaru MySQL, pengembangan web services dengan SOAP dan REST,

serta ratusan peningkatan kemampuan lainnya dibandingkan versi sebelumnya.

Sama dengan web server lainnya PHP juga bersifat open source sehingga setiap

orang dapat menggunakannya dengan gratis.

3. MySQL

Pada awal perkembangannya disebut SQL yang merupakan kepanjangan

dari Structured Query Language. SQL merupakan bahasa terstruktur yang khusus

digunakan untuk mengolah database. SQL pertama kali didefinisikan oleh

American National Standards Institute (ANSI) pada tahun 1986. MySQL adalah

sebuah sistem manajemen database yang bersifat open source. MySQL adalah

pasangan serasi dari PHP. MySQL dibuat dan dikembangkan oleh MySQL AB

yang berada di Swedia.

MySQL dapat digunakan untuk membuat dan mengola database beserta

isinya. Kita dapat memanfaatkan MySQL untuk menambahkan, mengubah dan

menghapus data yang berada dalam database. MySQL merupakan sisitem

manajemen database yang bersifat at relational. Artinya data-data yang dikelola

dalam database akan diletakkan pada beberapa tabel yang terpisah sehingga

manipulasi data akan menjadi jauh lebih cepat.

MySQL dapat digunakan untuk mengelola database mulai dari yang kecil

sampai dengan yang sangat besar. MySQL juga dapat menjalankan perintah-

perintah Structured Query Language (SQL) untuk mengelola database-database


22

yang ada di dalamnya. Hingga kini, MySQL sudah berkembang hingga versi 5.

MySQL 5 sudah mendukung trigger untuk memudahkan pengelolaan tabel dalam

database.

4. PHP My Admin

Pada dasarnya mengelola database dengan MYSQL harus dilakukan

dengan mengetikkan baris-baris perintah yang sesuai (command line) untuk setiap

maksud tertentu. Saat ini banyak sekali perangkat lunak yang dapat dimanfaatkan

untuk mengelola database dalam MySQL, salah satunya adalah phpMyAdmin.

Dengan phpMyAdmin kita dapat membuat tabel, mengisi data dan lain-lain

dengan mudah tanpa harus hafal perintahnya.

2.2.5 Metode Pengujian Perangkat Lunak

a. Pengujian Black-Box

Pengujian black-box berfokus padapersyaratan fungsional perangkat lunak.

Dengan demikian, pengujian black-box memungkinkan perekayasa perangkat

lunak mendapatkan serangkaian kondisi input yang sepenuhnya menggunakan

semua persyaratan fungsional untuk suatu program. Pengujian black-box bukan

merupakan alternatif dari teknik pengujian white box, tetapi merupakan

pendekatan yang mampu mengungkapkan kelas kesalahan daripada metode

pengujian white-box. (Pressman, 2002: 551).

Pengujian black-box berusaha menemukan kesalahan dalam kategori

sebagai berikut:

1. Fungsi-fungsi yang tidak benar atau hilang

2. Kesalahan interface
23

3. Kesalahan dalam struktur data atau akses database eksternal

4. Kesalahan kinerja

5. Instalasi dan kesalahan terminasi

2.2.6 Pengarsipan Dokumen

Arsip adalah rekaman kegiatan atau peristiwa dalam berbagai bentuk

media sesuai dengan perkembangan teknologi informasi dan komunikasi dibuat

dan diterima oleh lembaga negara, pemerintah daerah, lembaga pendidikan,

perusahaan, organisasi politik, organisasi kemasyarakatan, dan perseorangan

dalam pelaksanaan kehidupan bermasyarakat, berbangsa, dan bernegara ( UU

No.43 Tahun 2009 Tentang Kearsipan). Suatu arsip harus dikelola dengan baik

karena nilai dan tingkat kepentingannya berbeda-beda, baik untuk kepentingan

yuridis, bukti historis, maupun kepentingan transaksi bisnis (Sutirman, 2015:99).

Salah satu solusi untuk meningkatkan efektivitas dan efisiensi manajemen

arsip pada suatu organisasi adalah dengan menerapkan sistem manajemen arsip

elektronik (Sutirman, 2015:13). Dokumen dalam bentuk elektronika digital sudah

menjadi kebutuhan dan tuntutan dijaman era teknologi sistem informasi.

Kelebihan dokumen digital disbanding dengan analaog adalah sistem digital lebih

mudah dirancang, informasi lebih mudah disimpan, lebih menghemat ruangan,

dapat diakses oleh banyak orang dalam waktu yang bersamaan, tidak dibatasi oleh

ruang dan waktu, dokumen yang tersimpan dapat diakses dengan cepat dan

akurat, dan yang terakhir dokumen dapat berbentuk file multimedia (Bambang,

2014:3).
24

Pengarsipan dokumen elektronik perlu dikelola secara elektronik untuk

mendapatkan manfaat yang maksimal, antara lain :

1. Pengumpulan informasi yang lebih baik, konsisten dan mudah dicari kembali

2. Memudahkan penggunaan dokumen secara bersama antar unit organisasi

3. Memudahkan penyusunan informasi organisasi secara terstruktur

4. Memudahkan pengambilan keputusan yang lebih cepat dan akurat

5. Meningkatkan kualitas layanan.

6. Mengelola informasi sebagai suatu aset yang tumbuh dan berkembang

7. Lebih responsif pada perubahan (Miftakhul, 2010)

2.2.7 Pengklasifikasian Dokumen

Salah satu permasalahan yang muncul dengan semakin banyaknya

informasi yang ada di dalam situs adalah bagaimana mengorganisasi dan

mengolah data dan konten yang ada menjadi informasi yang dapat digunakan oleh

pengguna. Oleh karena itu, diperlukan aplikasi yang dapat membantu pengunjung

sebuah situs web untuk mencari konten yang sesuai dengan keinginan pengguna.

Salah satu metode yang digunakan adalah dengan klasifikasi dokumen atau

klastering dokumen.

Clustering dokumen adalah proses pengelompokan dataset dokumen yang

merujuk pada similarity (kemiripan) pola data dokumen ke dalam suatu cluster,

sedangkan yang tidak memiliki kemiripan akan dikelompokkan ke dalam cluster

yang lain (Ardytha dkk, 2014). Terdapat beberapa teknik untuk pengklasifikasian

teks, antara lain NaïveBayes, K-Nearest Neighbor, Decision Tree,dan vector space
25

model. Dengan menggunakan Text Classification and Mining dan teknik temu

kembali informasi diharapkan dapat membantupengguna mendapatkan informasi

implisit yang ada pada data konten teks (Favorisen, 2013).

Sistem pencarian informasi secara tradisional yang tidak menggunakan

klastering dokumen tidak akan cukup untuk menangani sejumlah dokumen

dengan volume yang besar. Pengklasteran dokumen berguna untuk melengkapi

sistem pencarian informasi secara tradisional dengan cara mengelompokkan

dokumen berdasarkan topik.

2.2.8 Text Mining

Text Mining adalah sebuah penerapan yang berasal dari information

retrieval (IR) dan natural language processing (NLP). Definisi text mining secara

sempit hanya berupa metode yang dapat menemukan informasi baru yang tidak

jelas atau mudah diketahui dari sebuah kumpulan dokumen. Sedangkan secara

lebih luas, text mining mencakup teknik text-processing yang lebih umum, seperti

pencarian, pengambilan intisari, dan pengkategorian (Radiant dkk, 2014).

Dalam text mining, data teks akan diproses menjadi data numerik agar

dapat dilakukan proses lebih lanjut. Sehingga dalam text mining ada istilah

preprocessing data, yaitu proses pendahulu yang diterapkan terhadap data teks

yang bertujuan untuk menghasilkan data numerik. Pada proses preprosesing

merupakan tahap dimana deskripsi di tangani untuk dapat siap diproses memasuki

tahap text mining (Ogie dkk, 2016). Tahap-tahap tersebut adalah sebagai berikut :
26

1. Parsing/Tokenizing

Parsing yaitu sebuah proses yang dilakukan seseorang untuk menjadikan

sebuah kalimat menjadi lebih bermakna atau berada dengan cara memecah

kalimat tersebut menjadi kata-kata atau frase-frase (“Parsing”).

2. Stopwords Removal/Filtering

Stopwords removal merupakan proses penghilangan kata tidak penting

pada deskripsi melalui pengecekan kata-kata hasil parsing deskripsi apakah

termasuk di dalam daftar kata tidak penting (stoplist) atau tidak. Jika termasuk di

dalam stoplist maka kata-kata tersebut akan di-remove dari deskripsi sehingga

kata-kata yang tersisa di dalam deskripsi di anggap sebagai kata-kata penting atau

keywords.

3. Stemming

Stemming digunakan untuk mengurangi ukuran dari suatu ukuran index

file. Misalnya dalam suatu deskripsi terdapat variant kata “memberikan”,

“diberikan”, “memberi” dan “diberi” hanya memiliki akar kata (stem) yaitu

“beri”. Ukuran file daftar index yang semula berjumlah lima record akan di-

reduce sehingga menjadi satu record saja.

4. Tagging

Tahap tagging merupakan tahap mencari bentuk awal atau root dari tiap

kata lampau atau kata hasil stemming yang bukan bahasa indonesia.

5. Analyzing

Tahap analyzing merupakan tahap penentuan seberapa jauh keterhubungan

antara kata-kata dengan dokumen yang ada.


27

2.2.9 Pembobotan Term Frequency – Invers Document Frequency (TF-IDF)

Tf-Idf yaitu perhitungan yang menggambarkan seberapa pentingnya kata

(term) dalam sebuah dokumen. Proses ini digunakan untuk menilai bobot

relevansi term dari sebuah dokumen terhadap seluruh dokumen. Term frequency

adalah ukuran seringnya kemunculan sebuah term dalam sebuah dokumen. IDF

merupakan banyaknya istilah tertentu dalam keseluruhan dokumen (Ogie dkk,

2016). Rumus Pembobotan TF-IDF yang dikemukakan oleh Musfiroh dkk (2013)

adalah sebagai berikut :

t f = 0,5 + 0,5 x

= log ( )

= x

Keterangan:

D = dokumen ke-d

t = term ke-t dari dokumen

W = bobot dokumen ke-d terhadap term ke-t

tf = banyaknya term i pada sebuah dokumen

idf = Inversed Document Frequency

df = banyak dokumen yang mengandung term i

2.2.10 Cosine Similarity

Consine Similarity digunakan untuk melakukan perhitungan kesamaan dari

dokumen. Rumus yang digunakan oleh consine similarity adalah (Jun Ye, 2014) :
28

σ
Cos α = ȁȁȁȁ = 
 ξσ ξσ

Keterangan :

A : Vektor A, yang akan dibandingkan kemiripannya

B : Vektor B, yang akan dibandingkan kemiripannya

: dot produk antara vektor A dan vektor B

ȁ ȁ: panjang vektor A

|B| : panjang vektor B

|A||B| : cross product antara |A| dan |B|


116

BAB V

PENUTUP

5.1 Kesimpulan

Berdasarkan hasil penelitian dan pengembangan Sistem Collecting File

Skripsi di jurusan Teknik Elektro Universitas Negeri Semarang, maka dapat

diperoleh kesimpulan sebagai berikut :

1. Sistem Collecting File Skripsi telah berhasil dibangun menggunakan

algoritma cosine similarity untuk klasifikasi dokumen secara otomatis. Sistem

ini dibangun dengan dua level pengguna, yaitu level user dan level

administrator. Fitur yang diberikan untuk masing-masing level berbeda-beda,

user hanya dapat menginputkan data diri dan data skripsinya saja, sedangkan

administrator dapat melakukan rekapitulasi data dan pengelolaan data seperti

menambah (input), mengubah (edit) dan menghapus (delete) data dan

mencetak laporan.

2. Berdasarkan beberapa pengujian yang telah dilakukan pada sistem, hasil

pengujian black-box menunjukkan bahwa sistem dapat menjalankan fungsi-

fungsi dan fiturnya dengan sukses. Sedangkan berdasarkan uji validasi ahli

sistem diperoleh persentase kelayakan sebesar 88,3% yang berarti bahwa

sistem masuk dalam kriteria “sangat layak”. Berdasarkan hasil uji validasi

ahli kearsipan diperoleh persentase kelayakan sebesar 87,5% yang berarti

bahwa sistem masuk dalam kriteria “sangat layak”. Berdasarkan hasil uji user

responsive diperoleh persentase kelayakan sebesar 85,3% yang berarti bahwa

sistem masuk dalam kriteria “sangat layak”.


117

3. Berdasarkan hasil perbandingan klasifikasi yang dilakukan oleh sistem dan

klasifikasi secara manual, diperoleh sebesar 49 dari total 50 data yang

berhasil diklasifikasikan secara tepat oleh Sistem Collecting File Skripsi.

Data tersebut menunjukkan persentase ketepatan klasifikasi sebesar 98%

yang berarti sistem masih dianggap dapat mengklasifikasikan dokumen

secara “sangat tepat”.


118

5.2 Saran

Sistem Collecting File Skripsi ini masih memiliki kekurangan, bebrapa hal

yang disarankan untuk penelitian yang selanjutnya adalah sebagai berikut :

1. Apabila sistem ini benar-benar diterapkan di jurusan Teknik Elektro, maka

disarankan instansi terkait dapat menyediakan server untuk menyimpan data

arsip elektronik dokumen skripsi yang cukup memadai. Karena kapasitas data

mungkin akan memerlukan banyak ruang dalam database.

2. Sistem yang dikembangkan belum memiliki fasilitas publish / unpublish

sehingga semua dokumen skripsi yang diunggah oleh mahasiswa ditampilkan

seluruhnya oleh sistem. Untuk penelitian selanjutnya sebaiknya ditambah

fasilitas publish / unpublish pada halaman admin untuk menentukan dokumen

mana yang akan ditampilkan di halaman user. Fasilitas ini digunakan untuk

memfilter dokumen yang bagus dan berkualitas dalam aspek tata penulisan

dan kualitas penelitian yang dilakukan agar mahasiswa selanjutnya dapat

menghasilkan karya ilmiah yang baik pula.

3. Untuk penelitian selanjutnya, disarankan dapat mempertimbangkan pemilihan

kata kunci yang digunakan sebagai term agar dapat meningkatkan kinerja

klasifikasi sistem nantinya. Selain itu perlu diperhatikan dalam pengolahan

kata dengan bahasa asing, sebaiknya diterjemahkan terlebih dahulu sebelum

diolah dengan algoritma cosine similarity.


119

DAFTAR PUSTAKA

Wahyono, S. 2013. Kebijakan Pengelolaan Sampah Elektronik dalam Lingkup


Global dan Lokal. Jurnal Teknologi dan Lingkungan Volume 14, Nomor
1.

Peraturan Rektor Universitas Negeri Semarang Nomor 27 Tahun 2012 Tata


Kelola Kampus Berbasis Konservasi. 28 September 2012. Universitas
Negeri Semarang. Semarang.

Asmara, B. Panji. 2014. Digitalisasi Arsip Dokumen Penting sebagai File Local
Interest (LI) dengan Soft Komputing Sebagai Daya Dukung Informasi
Berbasis ICT. Jurnal Informatika Volume 2, Nomor 2.

Susandi, D. dan Sholahudin, U. 2016. Pemanfaatan Vector Space Model pada


Penerapan Algoritma Nazief Adriani, KNN dan Fungsi Similarity Cosine
untuk Pembobotan IDF dan WIDF pada Prototipe Sistem Klasifikasi Teks
Bahasa Indonesia. Jurnal Teknologi Informasi Volume 3, Nomor 1.

Nurdiana, O., Jumadi., dan Nursantika, D. 2016. Perbandingan Metode Cosine


Similarity dengan Metode Jaccard Similarity pada Aplikasi Pencarian
Terjemahan Al-Qur’an dalam Bahasa Indonesia. Jurnal Online
Informatika Volume 1, Nomor 1.

Imbar, V., Radiant. Adelia, Ayub, M., dan Rehatta, A. 2014. Implementasi Cosine
Similarity dan Algoritma Smith Waterman untuk Mendeteksi Kemiripan
Teks. Jurnal Informatika Volume 10, Nomor 1.

Kurniawan, A. Solihin, F., dan Hastarita, F. 2014. Perancangan dan Pembuatan


Aplikasi Pencarian Informasi Beasiswa dengan Menggunakan Cosine
Similarity. Jurnal SimanteC Volume 4, Nomor 2.

Sugiyamta. 2015. Sistem Deteksi Kemiripan Dokumen dengan Algoritma Cosine


Similarity dan Single Pass Clustering. Jurnal Informatika Volume 7,
Nomor 2.

Thada, V. dan Jaglan, V. 2013. Comparison of Jaccard, Dice, Cosine Similarity


Coefficient To Find Best Fitness Value for Web Retrieved Documents
Using Genetic Algorithm. International Journal of Innovation in
Engineering and Technology Volume 2, Issue 4.
120

Singh, A. Dabas, C., dan Gupta, J., P. 2016. Cosine Similarity with Centroid
Implication for Text Clustering of Document Files. Indian Journal of
Science and Technology Volume 9.

Sutirman. 2015. Urgensi Menejemen Arsip Elektronik. Jurnal Efisiensi Volume 8,


Nomor 1.

Hikmawan, A., Rangga. Astuti, S., Endang., dan Riyadi. 2015. Desain Sistem
Informasi Perpustakaan Digital (Studi Kasus SMA Negeri 1 Pasuruan).
Jurnal Administrasi Bisnis Volume 28, Nomor 2.

Sutabri, T. 2012. Konsep Sistem Informasi (Buku 1). Yogyakarta : Andi.

Yakub. 2012. Pengantar Sistem Informasi, Yogyakarta : Graha Ilmu.

Sutamta, E. 2011. Model Integrasi Database Penduduk Indonesia dengan


Berbagai Sistem Informasi Berbasis Komputer. Jurnal Informatika Volume
5, Nomor 2.

Undang-Undang Republik Indonesia Nomor 43 Tahun 2009 Kearsipan.

Amin, M. Miftakhul. 2010. Pengembangan Electronic Document Management


System (EDMS) Sebagai Alternatif Pengarsipan di Perguruan Tinggi.
Jurnal Informatika Volume 10, Nomor 2.

Luthfiartha, A. Zeniarja, J., dan Salam, A. 2014. Integrasi Peringkas Dokumen


Otomatis dengan Algoritma Latent Semantic Analysis pada Peringkas
Dokumen Otomatis untuk Proses Clustering Dokumen. Jurnal Teknologi
Informasi Volume 13, Nomor 1.

Kurniawan, B. Effendi, S. dan Sitompul, O. Salim. 2012. Klasifikasi Konten


Berita dengan Metode Text Mining. Jurnal Teknologi Informasi Volume 1,
Nomor 1.

Nurjanah, M. Hamdani. dan Astuti, I. Fitri. 2013. Penerapan Algoritma Term


Frequency-Inverse Document Frequency (TF-IDF) untuk Text Mining.
Jurnal Informatika Volume 8, Nomor 3.

Ye, J. 2014. Vector Similarity Measures of Simplified Neutroshopic Sets and Their
Application in Multicriteria Decision Making. Internasional Journal of
Fuzzy Systems Volume 16, Nomor 2.

Pramanik, S., dan Mondal, K. 2015. Cosine Similarity Measure of Rough


Neutroshopic Sets and Its Application in Medical Diagnosis. Global
Journal of Advanced Research Volume 2, Issue 1.
121

Nnorom, I. Chidi, dan Osibanjo, O. 2008. Electronik Waste (e-waste): Material


Flows and Management Practices in Nigeria. Journal Waste Management.

Endra, R. Yuli., Rizal, U., dan Ariyani, F. 2016. E-Arsip Berbasis Image Archives
Management Process Model untuk Meningkatkan Efektifitas Pengelolaan
Arsip. Jurnal Sistem Informasi dan Telematika.

Pressman, Roger S. 1997. Software Engineering: A Practitioner’s Approach.


McGraw-Hill. Terjemahan LN. Harnaningrum. 2002. Rekayasa Perangkat
Lunak Pendekatan Praktisi (Buku I). Edisi II. Andi. Yogyakarta.

Sugiyono. 2015. Metode Penelitian Pendidikan (Pendekatan Kuantitatif,


Kualitatif, dan R&D). Bandung. Alfabeta.

Anda mungkin juga menyukai