Skripsi
Skripsi diajukan sebagai salah satu persyaratan untuk memperoleh gelar Sarjana
Pendidikan Program Studi Pendidikan Teknik Informatika dan Komputer
Oleh
Rizki Tri Wahyuni NIM.5302412041
orang (akan dibalas) berdasarkan apa yang dia niatkan (HR Bukhari Muslim)
x Dalam setiap masalah yang kita hadapi terdapat suatu pelajaran yang dapat
kita ambil, jangan terpaku pada masalahnya, namun pikirkan apa hikmahnya.
x Selembar daun tidak jatuh dari pohon dengan sia-sia, begitu pula dengan
usaha kita. Tidak ada usaha yang sia-sia, itu semua akan berpengaruh pada
Persembahan:
7. Almamaterku UNNES
v
ABSTRAK
Rizki Tri Wahyuni. 2017. Sistem Collecting File Skripsi Berbasis Web dengan
Pengklasifikasian Dokumen Otomatis menggunakan Algoritma Cosine Similarity
di Teknik Elektro Universitas Negeri Semarang. Skripsi. Pembimbing Dr-Ing.
Dhidik Prastiyanto, S.T.,M.T. dan Dr. H. Eko Supraptono, M.Pd. Pendidikan
Teknik Informatika dan Komputer. Universitas Negeri Semarang.
Kegiatan collecting file skripsi menggunakan CD/DVD drive di jurusan
Teknik Elektro menghasilkan limbah elektronik yang semakin bertambah tiap
tahun. Ruang penyimpanan yang terbatas serta kurangnya pengelolaan limbah
elektronik membuat CD/DVD drive bekas pakai terbengkalai begitu saja. Sistem
penyimpanan yang tidak terpusat juga menjadi kendala dalam pengelolaan soft file
skripsi. Diperlukan klasifikasi dokumen secara otomatis dalam menghemat waktu
dan tenaga. Oleh karena itu peneliti membangun sistem collecting file skripsi
dengan database terpusat serta pengkasifikasian secara otomatis.
Jenis metode penelitian yang digunakan adalah metode “Penelitian dan
Pengembangan” (R&D). Merupakan metode penelitian yang digunakan untuk
menghasilkan sebuah produk baru, dan selanjutnya menguji keefektifan produk
tersebut. Analisis data yang digunakan adalah analisis data deskriptif persentase.
Hasil dari penelitian ini adalah sebuah sistem collecting file skripsi
berbasis web yang dibangun menggunakan bahasa pemrograman PHP dan HTML.
Sistem ini mampu mengklasifikasikan skripsi kedalam beberapa kategori
menggunakan algoritma cosine similarity. Hasil pengujian black-box pada sistem
menunjukkan bahwa sistem mampu menjalankan seluruh fungsi-fungsinya
dengan baik. Hasil pengujian ahli sistem memperoleh persentase kelayakan
sebesar 88,3%, hasil pengujian ahli kearsipan memperoleh persentase sebesar
87,5%, hasil pengujian user responsive memperoleh persentase sebesar 85,3% dan
hasil persentase ketepatan klasifikasi sebesar 98%. Maka dapat disimpulkan
bahwa sistem collecting file skripsi sangat layak digunakan dengan hasil
persentase ketepatan klasifikasi sangat tinggi.
Kata Kunci: collecting skripsi, cosine similarity, klasifikasi dokumen, arsip
vi
KATA PENGANTAR
Segala puji dan syukur penulis ucapkan kehadirat Allah SWT dan
meneyelesaikan skripsi yang berjudul " Sistem Collecting File Skripsi Berbasis
Cosine Similarity di Teknik Elektro Universitas Negeri Semarang ". Skripsi ini
disusun sebagai salah satu persyaratan meraih gelar Sarjana Pendidikan pada
yaumil akhir nanti, Aamiin. Penyelesaian skripsi ini tidak lepas dari bantuan
berbagai pihak, oleh karena itu pada kesempatan ini penulis menyampaikan
bapak Dr. H. Eko Supraptono, M.Pd. atas bimbingan, arahan dan motivasinya
2. Bapak Dr. H. Noor Hudallah, M.T selaku penguji 1 yang telah memberikan
5. Dekan Fakultas Teknik Universitas Negeri Semarang, Dr. Nur Qudus M.T.
vii
6. Bapak/Ibu Dosen Program Studi Pendidikan Teknik Informatika dan
9. Semua pihak yang telah membantu peneliti dalam menyelesaikan skripsi ini
Semoga amal baik dari semua pihak mendapat imbalan yang berlipat
ganda dari Allah SWT. Diharapkan skripsi ini dapat bermanfaat, Aamiin.
Peneliti
viii
DAFTAR ISI
ix
2.2.5 Pengujian Perangkat Lunak........................................................... 22
2.2.6 Pengarsipan Dokumen................................................................... 23
2.2.7 Pengklasifikasian Dokumen .......................................................... 24
2.2.8 Text Mining ................................................................................... 25
2.2.9 Pembobotan TF-IDF ..................................................................... 27
2.2.10 Cosine Similarity ......................................................................... 27
BAB III METODE PENELITIAN
3.1 Waktu dan Tempat Penelitian ............................................................. 29
3.2 Teknik Pengumpulan Data .................................................................. 30
3.2.1 Observasi ....................................................................................... 30
3.2.2 Studi Pustaka ................................................................................. 31
3.2.3 Dokumentasi.................................................................................. 31
3.3 Desain Penelitian ................................................................................. 31
3.3.1 Tahap Studi Pendahuluan .............................................................. 33
3.3.2 Tahap Pengembangan Produk ....................................................... 33
3.3.3 Tahap Analisis ............................................................................... 34
3.3.3.1 Analisis Kebutuhan Sistem ..................................................... 34
3.3.3.2 Analisis Kebutuhan Input ........................................................ 34
3.3.3.3 Analisis Kebutuhan Output ..................................................... 34
3.3.4 Perancangan Produk ...................................................................... 35
3.3.4.1 Use Case Diagram ................................................................... 35
3.3.4.2 Activity Diagram ..................................................................... 36
3.3.4.3 Flowchart................................................................................. 52
3.3.4.4 Diagram Konteks..................................................................... 54
3.3.4.5 DFD Level 1 ............................................................................ 54
3.3.4.6 Perancangan Basis Data .......................................................... 55
3.3.4.7 Desain Tampilan Sistem.......................................................... 56
3.3.5 Pengujian Produk .......................................................................... 61
3.3.5.1 Pengujian Black-box ............................................................... 61
3.3.5.2 Pengujian Ahli Sistem ............................................................. 61
3.3.5.3 Pengujian Ahli Kepustakaan ................................................... 62
x
3.3.5.4 Pengujian User Skala Terbatas ................................................ 62
3.4 Alat dan Bahan Penelitian ................................................................... 63
3.4.1 Perangkat Keras (Hardware) ......................................................... 63
3.4.2 Perangkat Lunak (Software).......................................................... 63
3.5 Instrumen Penelitian............................................................................ 64
3.5.1 Instrumen Kuisioner ...................................................................... 64
3.6 Teknik Pengambilan Sampel .............................................................. 66
3.7 Teknik Analisis Data ........................................................................... 66
BAB IV HASIL DAN PEMBAHASAN
4.1 Hasil Penelitian ................................................................................... 70
4.1.1 Implementasi Komponen Sistem Collecting File Skripsi ............. 70
4.1.2 Hasil Pengujian Black-box ............................................................ 74
4.1.3 Hasil Pengujian Ahli Sistem ......................................................... 91
4.1.4 Hasil Pengujian Ahli Kearsipan .................................................. 101
4.1.5 Hasil Pengujian User Responsive ............................................... 107
4.1.6 Hasil Perhitungan Data Mining ................................................... 110
4.1.2 Pembahasan .................................................................................... 112
BAB V PENUTUP
5.1 Simpulan............................................................................................ 116
5.2 Saran .................................................................................................. 118
DAFTAR PUSTAKA ....................................................................................... 119
xi
DAFTAR TABEL
Halaman
Tabel 3.1 Struktur Tabel user ................................................................................ 55
Tabel 3.2 Struktur Tabel admin ............................................................................ 56
Tabel 3.3 Struktur Tabel skripsi............................................................................ 56
Tabel 3.4 Struktur Tabel klasifikasi ...................................................................... 57
Tabel 3.5 Struktur Tabel status_upload ................................................................ 57
Tabel 3.6 Spesifikasi Kebutuhan Hardware .......................................................... 63
Tabel 3.7 Spesifikasi Kebutuhan Software ........................................................... 63
Tabel 3.8 Kisi-kisi Umum Instrumen Pakar Sistem.............................................. 65
Tabel 3.9 Kisi-kisi Umum Instrumen Pakar Kearsipan ........................................ 65
Tabel 3.10 Kisi-kisi Umum Instrumen Pakar User (Mahasiswa) ......................... 65
Tabel 3.11 Skala Likert ......................................................................................... 67
Tabel 3.12 Kategori Kelayakan Sistem................................................................. 69
Tabel 4.1 Implementasi Komponen Sistem Level User........................................ 70
Tabel 4.2 Implementasi Komponen Sistem Level Administrator......................... 72
Tabel 4.3 Uji Black-box Sistem Level Administrator .......................................... 74
Tabel 4.4 Uji Black-box Sistem Level User ......................................................... 85
Tabel 4.5 Hasil Pengujian Ahli Sistem ................................................................. 91
Tabel 4.6 Hasil Penilaian Aspek Performace........................................................ 92
Tabel 4.7 Hasil Penilaian Aspek Information ....................................................... 93
Tabel 4.8 Hasil Penilaian Aspek Control .............................................................. 93
Tabel 4.9 Hasil Penilaian Aspek Efficiency ......................................................... 94
Tabel 4.10 Hasil Penilaian Aspek Service ............................................................ 95
Tabel 4.11 Daftar Saran Validator Sistem ............................................................ 96
Tabel 4.12 Hasil Pengujian Ahli Kearsipan ........................................................ 102
Tabel 4.13 Hasil Penilaian Aspek Information ................................................... 103
Tabel 4.14 Hasil Penilaian Aspek Service .......................................................... 103
xii
Tabel 4.15 Daftar Saran Validator Kearsipan ..................................................... 104
Tabel 4.16 Hasil Uji Pengguna ........................................................................... 107
Tabel 4.17 Hasil Penilaian Aspek Isi Perangkat Lunak ...................................... 108
Tabel 4.18 Hasil Penilaian Aspek Kemudahan dalam Penggunaan ................... 109
Tabel 4.19 Hasil Penilaian Aspek Tampilan Aplikasi ........................................ 109
Tabel 4.20 Hasil Penilaian Aspek Kelayakan Aplikasi ...................................... 110
Tabel 4.21 Hasil Pelatihan Data dengan Algoritma ............................................ 111
xiii
DAFTAR GAMBAR
Halaman
Gambar 2.1 Simbol Proses .................................................................................... 17
Gambar 2.2 Simbol Aliran Data ........................................................................... 17
Gambar 2.3 Simbol Penyimpanan Data ................................................................ 18
Gambar 2.4 Simbol Entitas ................................................................................... 18
Gambar 2.5 Simbol Entitas ................................................................................... 19
Gambar 2.6 Simbol Relasi .................................................................................... 19
Gambar 3.1 Diagram Langkah-langkah Penelitian ............................................... 32
Gambar 3.2 Diagram Model Waterfall ................................................................. 33
Gambar 3.3 Use Case Diagram Level User .......................................................... 35
Gambar 3.4 Use Case Diagram Level Administrator ........................................... 36
Gambar 3.5 Activity Diagram Menu Upload Skripsi ........................................... 37
Gambar 3.6 Activity Diagram Menu Ubah Password .......................................... 38
Gambar 3.7 Activity Diagram Menu Referensi Berdasarkan Kata Kunci ............ 39
Gambar 3.8 Activity Diagram Menu Referensi Berdasarkan Kategori ................ 40
Gambar 3.9 Activity Diagram Menu Data Upload Personal ................................ 41
Gambar 3.10 Activity Diagram Menu Rekap User............................................... 42
Gambar 3.11 Activity Diagram Menu Tambah User ............................................ 43
Gambar 3.12 Activity Diagram Menu Rekap Skripsi ........................................... 44
Gambar 3.13 Activity Diagram Menu Klasifikasi File Skripsi............................. 45
Gambar 3.14 Activity Diagram Menu Validasi Upload Skripsi ........................... 46
Gambar 3.15 Activity Diagram Menu Administrator ........................................... 47
Gambar 3.16 Activity Diagram Menu Laporan Keseluruhan ............................... 48
Gambar 3.17 Activity Diagram Menu Laporan Tahunan ..................................... 49
Gambar 3.18 Activity Diagram Menu Hapus Akun Mahasiswa .......................... 50
Gambar 3.19 Activity Diagram Menu Hapus Data Upload Skripsi ..................... 51
Gambar 3.20 Flowchart Prepocessing .................................................................. 52
xiv
Gambar 3.21 Flowchart Klasifikasi Judul Skripsi ................................................ 53
Gambar 3.22 Diagram Konteks Sistem Collecting File Skripsi ........................... 54
Gambar 3.23 DFD Level 1 Sistem Collecting File Skripsi................................... 55
Gambar 3.24 Desain Tampilan Halaman Login ................................................... 58
Gambar 3.25 Desain Tampilan Halaman Muka User ........................................... 58
Gambar 3.26 Desain Tampilan Halaman Input Data ............................................ 59
Gambar 3.27 Desain Tampilan Halaman Pencarian Referensi ............................. 59
Gambar 3.28 Desain Tampilan Halaman Administrator....................................... 60
Gambar 3.29 Desain Tampilan Halaman Rekap User .......................................... 60
Gambar 4.1 Menu Laporan Sebelum Perbaikan ................................................... 96
Gambar 4.2 Menu Laporan Setelah Perbaikan ..................................................... 97
Gambar 4.3 Kode simpan_pendaftaran.php Sebelum Perbaikan.......................... 97
Gambar 4.4 Kode simpan_pendaftaran.php Setelah Perbaikan ............................ 98
Gambar 4.5 Penyimpanan File Sebelum Perbaikan .............................................. 98
Gambar 4.6 Penyimpanan File Setelah Perbaikan ................................................ 99
Gambar 4.7 Halaman Login Sebelum Perbaikan .................................................. 99
Gambar 4.8 Penyimpanan File Setelah Perbaikan .............................................. 100
Gambar 4.9 Data Upload Skripsi Sebelum Perbaikan ........................................ 100
Gambar 4.10 Data Upload Skripsi Setelah Perbaikan ........................................ 101
Gambar 4.11 Data Upload Skripsi Sebelum Perbaikan ...................................... 105
Gambar 4.12 Data Upload Skripsi Setelah Perbaikan ........................................ 105
Gambar 4.13 Menu Pada Halaman Admin Sebelum Perbaikan ......................... 106
Gambar 4.14 Menu Pada Halaman Admin Setelah Perbaikan ........................... 106
xv
DAFTAR LAMPIRAN
Halaman
Lampiran 1. SK Dosen Pembimbing .................................................................. 122
Lampiran 2. Hasil Klasifikasi Judul Skripsi dengan Algoritma ......................... 123
Lampiran 3. Tampilan Antarmuka Sistem .......................................................... 135
Lampiran 4. Lembar Pengujian Ahli Sistem ....................................................... 152
Lampiran 5. Lembar Pengujian Ahli Kearsipan ................................................. 155
Lampiran 6. Lembar Pengujian User Skala Terbatas.......................................... 158
Lampiran 7. Usulan Pembimbing ....................................................................... 161
Lampiran 8. Permohonan Uji Ahli...................................................................... 162
Lampiran 9. Dokumentasi Penelitian .................................................................. 164
xvi
1
BAB I
PENDAHULUAN
maupun tidak langsung. Teknologi informasi dan komunikasi tidak dapat terlepas
dari kehidupan masyarakat, terlebih di era yang serba canggih seperti saat ini.
Perubahan model dan teknologi yang begitu cepat juga telah merubah gaya hidup
pesat adalah internet. Internet dapat menyampaikan informasi dalam jarak yang
sangat jauh seperti lintas benua. Salah satu kegiatan yang berubah seiring adanya
teknologi internet adalah kegiatan surat menyurat. Jika dahulu mengirim surat
menggunakan media kertas, maka sekarang media kertas diubah menjadi media
informasi dan komunikasi juga memiliki dampak negatif, salah satunya adalah
limbah Bahan Berhaya dan Beracun (B3) karena sifat, konsentrasi, atau
jumlahnya baik secara langsung atau tidak langsung dapat mencemarkan dan
berdasarkan penelitian yang dilakukan oleh Sri Wahyono (2012) dengan judul
Negeri Semarang No.27 Tahun 2012 tentang Tata Kelola Kampus Berbasis
Mahasiswa) dan masih banyak sistem informasi yang lainnya. Sistem yang
arsip skripsi dengan CD/DVD drive, adanya sistem informasi pengajuan skripsi
mengoleksi dokumen skripsi dari calon wisudawan sebagai arsip jurusan. Dari
mahasiswa yang telah lulus mata kuliah skripsi, hal ini membuat pihak jurusan
harus menyiapkan ruang penyimpanan yang lebih besar untuk arsip dokumen
skripsi. Sampai saat ini metode pengumpulan dokumen arsip skripsi dilakukan
dengan dua cara yaitu dengan menggunakan hard file dan soft file dalam bentuk
CD/DVD drive.
limbah elektronik ini tidak dikelola secara maksimal dan hanya dikumpulkan
dalam ruangan. Selain itu arsip yang telah terkumpul tersebar dalam beberapa
database komputer. Hal ini menjadi kendala dalam pengelolaan arsip. Arsip soft
file tidak dipublikasikan kepada mahasiswa karena sudah tersedia arsip dalam
Indonesia. Salah satunya adalah penelitian yang dilakukan oleh Bambang Panji
Asmara (2014) dengan judul “Digitalisasi Arsip Dokumen Penting Sebagai File
4
Lokal Interest (LI) Dengan Soft Komputing Sebagai Daya Dukung Informasi
pengumpulan data dan informasi dapat diubah menggunakan teknologi yang baru
dan lebih efisien seperti teknologi web. Penggunaan web dapat mengurangi
banyaknya limbah sisa penggunaan CD/DVD drive dapat berkurang. Karena web
real time. Selain itu web juga memiliki model basisdata yang terpusat sehingga
mudah dalam melakukan pengelolaan data. Dari segi user atau pengguna web juga
diperlukan suatu metode agar data dapat diproses menjadi informasi yang tepat.
dilakukan secara manual karena memerlukan banyak waktu dan tenaga. Salah satu
dengan text mining. Banyak metode text mining yang digunakan dalam
similarity.
5
(2016), Ogie dkk (2016), Radiant dkk (2014), Andry dkk (2014), Sugiyamta
(2014), Anubhuti dkk (2016) dan Vicas dkk (2013). Diki dkk (2016)
yang lebih efisien antara TF-IDF dan WIDF. Hasilnya adalah pembobotan TF-
yang cukup tinggi. Andry dkk (2014) membuat aplikasi pencarian informasi
similarity dan single pass clustering. Hasilnya adalah pengukuran dengan cosine
penelitian Anubhuti dkk kedalam 13 klaster dengan tepat. Vicas dkk (2013)
untuk pencarian teks pada internet. Hasilnya adalah algoritma cosine similarity
memiliki nilai akurasi tertinggi, kemudian yang kedua adalah dice similarity dan
Oleh karena itu penulis akan mengadakan penelitian dengan judul “Sistem
Teknik Elektro untuk melakukan kegiatan pengarsipan data yang lebih efektif dan
sebagai berikut :
Batasan masalah dalam sistem yang dibuat dari hasil penelitian yang
dilakukan dan dengan cakupan data serta informasi maka dapat dibuat perumusan
1. Sistem collecting file skripsi berbasis web ini dibuat khusus untuk jurusan
2. Sistem ini hanya membahas tentang proses collecting file skripsi oleh
3. Pengguna dari sistem ini hanya mahasiswa jurusan Teknik Elektro serta
1. Merancang dan membangun sistem collecting file skripsi berbasis web yang
Semarang.
diantaranya :
skripsi.
pimpinan lainnya.
sebagai berikut:
1. Bab I Pendahuluan
Berisi penjabaran teori, dan telaah pustaka berdasarkan teori yang relevan
untuk digunakan sebagai bahan acuan dalam penelitian serta kerangka berfikir
dalam penelitian.
Bab ini menjabarkan model pengembangan sistem yang akan dibuat, serta
Bab ini akan membahas tentang hasil dari model pengembangan yang
BAB II KAJIAN
PUSTAKA
didalamnya terdapat acuan yang merupakan teori atau hasil dari bagian penelitian.
Cosine Similarity belum pernah dilakukan. Untuk itu peneliti ingin melakukan
penelitian tersebut.
keutuhan arsip karena arsip sangat penting bagi sebuah organisasi sebagai bahan
pengarsipan secara elektronik dapat mengurangi persoalan arsip yang tiap waktu
Dokumen Penting Sebagai File Local Interest Dengan Soft Komputing Sebagai
12
dokumen dalam bentuk kertas menjadi bentuk digital karena bentuk digital tidak
akan mengalami kerusakan fisik seperti dokumen dalam bentuk kertas. Bambang
dan dikelola dalam satu database yang terpadu guna mempermudah pengelolaan
data.
bentuk cetak membuat calon pembaca memerlukan waktu lama dalam pencarian
akan terbatas pada waktu-waktu tertentu saja. Maka dari itu Rangga dkk membuat
dengan membandingkan N-gram yang sejajar satu sama lain dari 2 pembanding
yang digunakan adalah sejumlah 6236 dokumen dan 30 kata kunci untuk
13
similarity memiliki nilai kemiripan 41%, metode jaccard similarity 19%, dan
Space Model pada Penerapan Algoritma Nazief Adriani, KNN dan Fungsi
Similarity Cosine untuk Pembobotan IDF dan WIDF pada Prototype Sistem
serta KNN. Data latih yang digunakan adalah teks berita yang terbagi atas 3
kategori. Masing-masing kategori terdiri atas 3 dokumen. Hasil dari penelitian ini
adalah persentase ketepatan pembobotan dengan IDF adalah sebesar 70,7% dan
2.2.1 Sistem
a. Definisi Sistem
(2012:6) pada buku Konsep Sistem Informasi, pada dasarnya sistem adalah
sekelompok unsur yang erat hubungannya satu dengan yang lain, yang berfungsi
elemen-elemen yang terintegrasi dengan tujuan yang sama untuk mencapai tujuan.
Sistem juga merupakan suatu jaringan kerja dari prosedur-prosedur yang saling
b. Perancangan Sistem
melingkupi:
sistem yang layak dan dapat diterima, dan menyiapkan laporan survey.
pemakaian.
15
Basisdata adalah data-data yang diolah dalam SIBK disimpan dalam media
dari data di basisdata (Bambang, 20014:4). Basisdata memiliki peran penting bagi
1. Data
2. Hardware
3. Software
aplikasi.
a. DFD
ke modul yang lebih kecil. Salah satu keuntungan menggunakan DFD adalah
memudahkan pemakai atau user yang kurang menguasai bidang komputer untuk
umum suatu sistem atau batasan sistem aplikasi yang akan dikembangkan.
Kemudian DFD dikembangkan menjadi DFD tingkat 0 atau level 0 dan kemudian
17
DFD level 0 dikembangkan lagi menjadi level 1 dan selanjutnya sampai sistem
1. Proses
bagian dari sistem yang mengubah satu atau lebih input dan output. Nama proses
2. Aliran Data
atau dari proses. Aliran data juga digunakan untuk menunjukan bagian-bagian
informasi dari satu bagian ke bagian lain. Pembagian nama untuk aliran ini
menunjukan sebuah arti untuk sebuah aliran. Untuk kebanyakan sistem yang
dibuat, aliran data sebenarnya mengambarkan data yakni angka, huruf, pesan,
3. Penyimpanan Data
Simpanan data merupakan simpanan data dari data yang berupa suatu file atau
database di sistem komputer ataupun berupa arsip atau catatan manual. Nama dari
4. Entitas Luar
kesatuan luar (eksternal entitty) yang berhungan dengan sistem. Kesatuan luar
merupakan kesatuan dilingkungan luar sistem yang dapat berupa orang, organisasi
atau sistem lainnya yang berada di lingkungan luarnya yang akan memberikan
b. ERD
secara grafis menggambarkan isi sebuah database. Diagram ini memiliki dua
19
komponen utama yaitu entity dan relasi. Untuk melambangkan fungsi diatas maka
1. Entitas (Entity)
panjang. Entitas adalah sesuatu apa saja yang ada didalam sistem, nyata maupun
abstrak dimana data tersimpan. Entitas diberi nama dengan kata benda dan dapat
dikelompokan dalam empat jenis nama, yaitu : orang, benda, lokasi kejadian
Entitas
2. Relasi
Pada E-R diagram, relasi dapat digambarkan dengan sebuah bentuk belah
ketupat. Relasi adalah hubungan alamiah yang terjadi antara entitas. Pada
umumnya relasi diberi nama dengan kata kerja dasar, sehinga memudahkan untuk
Relasi
a. XAMPP
dalam satu buah paket. Dengan menginstall XAMPP maka tidak perlu lagi
melakukan instalasi dan konfigurasi web server Apache, PHP dan MySQL secara
1. Apache
mengambil dan bahkan mengubah kode programnya. Tugas utama apache adalah
menghasilkan halaman web yang benar kepada user, berdasarkan kode PHP yang
dituliskan oleh pembuat halaman web. Jika diperlukan juga berdasarkan kode
PHP yang dituliskan, maka dapat saja suatu database diakses terlebih dahulu
2. PHP
server-side scripting. PHP memungkinkan kita untuk membuat halaman web yang
bersifat dinamis. PHP dapat dijalankan pada berbagai macam Operating System
(OS), misalnya Windows, Linux dan Mac OS. Selain Apache, PHP juga
mendukung beberapa web server lain, misalnya Microsoft IIS, Caudium, PWS
dan lain-lain. Sistem manajemen database yang sering digunakan bersama PHP
ekstensi terbaru MySQL, pengembangan web services dengan SOAP dan REST,
Sama dengan web server lainnya PHP juga bersifat open source sehingga setiap
3. MySQL
dari Structured Query Language. SQL merupakan bahasa terstruktur yang khusus
American National Standards Institute (ANSI) pada tahun 1986. MySQL adalah
sebuah sistem manajemen database yang bersifat open source. MySQL adalah
pasangan serasi dari PHP. MySQL dibuat dan dikembangkan oleh MySQL AB
dalam database akan diletakkan pada beberapa tabel yang terpisah sehingga
MySQL dapat digunakan untuk mengelola database mulai dari yang kecil
sampai dengan yang sangat besar. MySQL juga dapat menjalankan perintah-
yang ada di dalamnya. Hingga kini, MySQL sudah berkembang hingga versi 5.
database.
4. PHP My Admin
dengan mengetikkan baris-baris perintah yang sesuai (command line) untuk setiap
maksud tertentu. Saat ini banyak sekali perangkat lunak yang dapat dimanfaatkan
Dengan phpMyAdmin kita dapat membuat tabel, mengisi data dan lain-lain
a. Pengujian Black-Box
sebagai berikut:
2. Kesalahan interface
23
4. Kesalahan kinerja
No.43 Tahun 2009 Tentang Kearsipan). Suatu arsip harus dikelola dengan baik
arsip pada suatu organisasi adalah dengan menerapkan sistem manajemen arsip
Kelebihan dokumen digital disbanding dengan analaog adalah sistem digital lebih
dapat diakses oleh banyak orang dalam waktu yang bersamaan, tidak dibatasi oleh
ruang dan waktu, dokumen yang tersimpan dapat diakses dengan cepat dan
akurat, dan yang terakhir dokumen dapat berbentuk file multimedia (Bambang,
2014:3).
24
1. Pengumpulan informasi yang lebih baik, konsisten dan mudah dicari kembali
mengolah data dan konten yang ada menjadi informasi yang dapat digunakan oleh
pengguna. Oleh karena itu, diperlukan aplikasi yang dapat membantu pengunjung
sebuah situs web untuk mencari konten yang sesuai dengan keinginan pengguna.
Salah satu metode yang digunakan adalah dengan klasifikasi dokumen atau
klastering dokumen.
merujuk pada similarity (kemiripan) pola data dokumen ke dalam suatu cluster,
yang lain (Ardytha dkk, 2014). Terdapat beberapa teknik untuk pengklasifikasian
teks, antara lain NaïveBayes, K-Nearest Neighbor, Decision Tree,dan vector space
25
model. Dengan menggunakan Text Classification and Mining dan teknik temu
retrieval (IR) dan natural language processing (NLP). Definisi text mining secara
sempit hanya berupa metode yang dapat menemukan informasi baru yang tidak
jelas atau mudah diketahui dari sebuah kumpulan dokumen. Sedangkan secara
lebih luas, text mining mencakup teknik text-processing yang lebih umum, seperti
Dalam text mining, data teks akan diproses menjadi data numerik agar
dapat dilakukan proses lebih lanjut. Sehingga dalam text mining ada istilah
preprocessing data, yaitu proses pendahulu yang diterapkan terhadap data teks
merupakan tahap dimana deskripsi di tangani untuk dapat siap diproses memasuki
tahap text mining (Ogie dkk, 2016). Tahap-tahap tersebut adalah sebagai berikut :
26
1. Parsing/Tokenizing
sebuah kalimat menjadi lebih bermakna atau berada dengan cara memecah
2. Stopwords Removal/Filtering
termasuk di dalam daftar kata tidak penting (stoplist) atau tidak. Jika termasuk di
dalam stoplist maka kata-kata tersebut akan di-remove dari deskripsi sehingga
kata-kata yang tersisa di dalam deskripsi di anggap sebagai kata-kata penting atau
keywords.
3. Stemming
“diberikan”, “memberi” dan “diberi” hanya memiliki akar kata (stem) yaitu
“beri”. Ukuran file daftar index yang semula berjumlah lima record akan di-
4. Tagging
Tahap tagging merupakan tahap mencari bentuk awal atau root dari tiap
kata lampau atau kata hasil stemming yang bukan bahasa indonesia.
5. Analyzing
(term) dalam sebuah dokumen. Proses ini digunakan untuk menilai bobot
relevansi term dari sebuah dokumen terhadap seluruh dokumen. Term frequency
adalah ukuran seringnya kemunculan sebuah term dalam sebuah dokumen. IDF
2016). Rumus Pembobotan TF-IDF yang dikemukakan oleh Musfiroh dkk (2013)
t f = 0,5 + 0,5 x
= log ( )
= x
Keterangan:
D = dokumen ke-d
dokumen. Rumus yang digunakan oleh consine similarity adalah (Jun Ye, 2014) :
28
σ
Cos α = ȁȁȁȁ =
ξσ ξσ
Keterangan :
BAB V
PENUTUP
5.1 Kesimpulan
ini dibangun dengan dua level pengguna, yaitu level user dan level
user hanya dapat menginputkan data diri dan data skripsinya saja, sedangkan
mencetak laporan.
fungsi dan fiturnya dengan sukses. Sedangkan berdasarkan uji validasi ahli
sistem masuk dalam kriteria “sangat layak”. Berdasarkan hasil uji validasi
bahwa sistem masuk dalam kriteria “sangat layak”. Berdasarkan hasil uji user
5.2 Saran
Sistem Collecting File Skripsi ini masih memiliki kekurangan, bebrapa hal
arsip elektronik dokumen skripsi yang cukup memadai. Karena kapasitas data
mana yang akan ditampilkan di halaman user. Fasilitas ini digunakan untuk
memfilter dokumen yang bagus dan berkualitas dalam aspek tata penulisan
kata kunci yang digunakan sebagai term agar dapat meningkatkan kinerja
DAFTAR PUSTAKA
Asmara, B. Panji. 2014. Digitalisasi Arsip Dokumen Penting sebagai File Local
Interest (LI) dengan Soft Komputing Sebagai Daya Dukung Informasi
Berbasis ICT. Jurnal Informatika Volume 2, Nomor 2.
Imbar, V., Radiant. Adelia, Ayub, M., dan Rehatta, A. 2014. Implementasi Cosine
Similarity dan Algoritma Smith Waterman untuk Mendeteksi Kemiripan
Teks. Jurnal Informatika Volume 10, Nomor 1.
Singh, A. Dabas, C., dan Gupta, J., P. 2016. Cosine Similarity with Centroid
Implication for Text Clustering of Document Files. Indian Journal of
Science and Technology Volume 9.
Hikmawan, A., Rangga. Astuti, S., Endang., dan Riyadi. 2015. Desain Sistem
Informasi Perpustakaan Digital (Studi Kasus SMA Negeri 1 Pasuruan).
Jurnal Administrasi Bisnis Volume 28, Nomor 2.
Ye, J. 2014. Vector Similarity Measures of Simplified Neutroshopic Sets and Their
Application in Multicriteria Decision Making. Internasional Journal of
Fuzzy Systems Volume 16, Nomor 2.
Endra, R. Yuli., Rizal, U., dan Ariyani, F. 2016. E-Arsip Berbasis Image Archives
Management Process Model untuk Meningkatkan Efektifitas Pengelolaan
Arsip. Jurnal Sistem Informasi dan Telematika.