Arhyproposal
Arhyproposal
OLEH :
ARI BORONG
218 611 109
FAKULTAS : TEKNIK
DISETUJUI OLEH
PEMBIMBING I PEMBIMBING II
MENGETAHUI,
KETUA PROGRAM STUDI
TEKNIK INFORMATIKA,
ii
PRAKATA
Puji dan syukur penulis Panjatkan Kepada Tuhan Yang Maha Esa atas Kasih
waktunya.
terimakasih kepada:
1. Kedua Orang Tua Tercinta yang telah membesarkan penulis sejak dari kecil
hingga saat ini dengan segalah rasa cinta dan kasih sayang yang tidak pernah
surut dan juga yang telah mendidik dan memberian dorongan dan doa kepada
penulis.
3. Ibu Srivan Palelleng, S.Kom., M.T. Selaku ketua Program Study Teknik
Informatika
penulis.
7. Kakak Adikan semua keluarga yang telah memberikan motivasi dan doa serta
iii
8. Sahabat-sahabat penulis yang selalu mendukung , memberikan semangat dan
kritik dan saran yang membangun. Penulis berharap semoga proposal penelitian
Rantepao, 2022
Ari Borong
DAFTAR ISI
iv
LEMBAR PERSETUJUAN PEMBIMBING......................................................ii
PRAKATA.............................................................................................................iii
DAFTAR ISI...........................................................................................................v
DAFTAR TABEL.................................................................................................vi
DAFTAR GAMBAR............................................................................................vii
BAB I.......................................................................................................................1
PENDAHULUAN...................................................................................................1
BAB II.....................................................................................................................5
TINJAUAN PUSTAKA.........................................................................................5
2.2.1 Beasiswa................................................................................................6
v
BAB III..................................................................................................................15
METODOLOGI PENELITIAN.........................................................................15
3.2.1 Bahan...............................................................................................15
3.2.2 Alat...................................................................................................15
3.3.2 Preprocessing...................................................................................17
vi
DAFTAR TABEL
DAFTAR GAMBAR
vii
Tahapan Penelitian ............................................................................................. 14
viii
BAB I
PENDAHULUAN
kehidupan dan salah satu yang paling mendasar dalam mencetak generasi penerus
bangsa. Biaya pendidikan sekarang ini tidak murah lagi dikarenakan kondisi
perekonomian yang tidak stabil, biaya hidup semakin meningkat, dan mahalnya
biaya pendidikan. Salah satu Sekolah yang ada di Kabupaten Toraja Utara yang
memiliki jumlah Siswa 1063 siswa aktif dengan pendapatan orang tua yang
Utara) adalah sekolah yang didirikan oleh Pemerintah pada Tahun 2004. Sekolah
Pemerintah untuk turut serta dalam usaha mencerdaskan kehidupan bangsa dalam
terang iman kristen. SMKN 3 Toraja Utara salah satu sekolah yang biasanya
mendapat bantuan biaya pendidikan kurang mampu dari lembaga untuk diberikan
1
2
computer berbagai metode yang dapat digunakan untuk memilih alternative yang
baik, antara lain Descition tree, ID3, C4.5. Algoritma yang paling tepat dalam
Freerunning dan Postrunning atau pemotongan cabang yang tidak dimiliki oleh
metode lain. Freerunning digunakan pada saat proses sedang berjalan sedangkan
dengan kriteria yang ada. Sehingga diharapkan dengan metode ini dapat
mampu?
kurang mampu
keputusan.
2. Bagi Peneliti
BAB II
TINJAUAN PUSTAKA
tidak bersumber dari pendanaan sendiri atau orang tua, akan tetapi
lembaga pendidik atau peneliti, atau juga dari kantor tempat seseorang
ditempuh
penghargaan tersebut bisa berbentuk akses tertentu pada suatu instansi atau
5
6
dan ada juga diperuntukan untuk orang-orang berprestasi dan sangat baik
tersebut
sipil. Pada penelitian ini mencoba menerapkan algoritma C4.5 yang sudah
2.2.1 Beasiswa
Beasiswa adalah pemberian biaya pendidikan kepada siswa yang masih aktif
sebagai tunjangan yang kepada siswa sebagai bantuan biaya pendidikan. Khusus
6
7
untuk penerima bantuan beasiswa di titik beratkan untuk siswa berprestasi dan
kurang mampu, dengan syarat siswa terdaftar pada sekolah menengah kejuruan
tersebut.
Untuk dapat calaon dan penerima Beasiswa atau bantuan biaya pendidikan
Jenjang SMK paling rendah pada semester II dan paling tinggi pada semester IV
Menurut Nafizah dalam mardiani data mining adalah suatu istilah yang
Data mining adalah salah satu bidang berkembang peast karena besarnya
kebutuhan akan nilai tambah dari database skala besar yang makin banyak
menmukan keteraturan pola, atau hubungan dalam set data berukuran besar.
Keluaran dari data data mining ini bisa dipakai untuk memperbaiki pengambilan
7
8
2.2.3
tidak konsisten atau data yang tidak relevan. Pada umumnya data yang diperoleh,
baik dari dari database suatu perusahaan maupun hasil eksperimen, memiliki
isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid
atau hanya sekedar salah ketik. Selain itu juga, ada juga atribut-atrubut data yang
tidak relevan dengan hipotesa data mining yang dimiliki. Data-data yang tidak
relevan itu juga lebih baik dibuang. Pembersihan data juga mempengaruhui
performasi dari teknik data mining karena data yang ditangani akan berkurang
kedalam satu database baru. Tidak jarang data yang diperlukan untuk data mining
tidak hanya berasal dari satu database tetapi juga dari beberapa database atau file
teks. Integrasi data perlu dilakukkan secara cermat karena kesalahan pada
berbeda maka akan didapatkan korelasi antar produk yang sebenarnya tidak ada.
8
9
dalam datamining. Beberapa metode data mining membutuhkan format data yang
khsus sebelum bisa diaplikasikan. Sebagai contoh beberapa metode standar seperti
analisis asosiasi dan clistering hanya bisa menerima input data kategorikal.
Karena data yang berupa angka numeric yang berlanjut perlu dibagi-bagi menjadi
4. Proses Mining
Proses mining merupakan suatu proses utama saat metode diterapkan untuk
ditemukan. Dalam tahap ini hasil dari tenik dat mining berupa pola-pola khas
maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada
memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai dengan
untuk memperbaiki proses data mining. Mencoba data mining lain yag lebih
sesuai, atau menerima hasil ini sebagai suatu hasil yang diluar dugaan yang
mungkin bermanfaat.
9
10
jumlah calon variabel input dan jumlah variabel target. Pohon keputusan juga
adalah metode yang ada pada teknik klasifikasi dalam data mining.
Algoritma C4.5 adalah satu algoritma data mining yang khususnya yang
tahun 1987. Dalam algoritma ini pemilihan atribut diproses menggunakan gain
ratio. Algoritma ini menghasilkan tree dengan jumlah cabang per node bervariasi.
diperoleh dari percabangan yang terbentk akan dipecah lagi setelanya. Proses
pembuatan tree algoritma C4.5 berhenti sampai perhitungan gain, maka pada nya
akan terus berlanjut sampai sempel subset tidak dapat lagi dibagi. Pada akhirnya
sampel subset yang tidak memiliki kontribusi yang besar bagi model akan ditolak.
10
11
n
Entropy (s)= ∑ −Pi∗log 2 pi
i=1
Keterangan :
S : himpunan
A : atribut
n : jumlah partisi S
n
│ Sv │
Gain (A)=Entropi (S) -∑ ∗Entropy ( Si)
I =1 │s│
Keterangan :
S : himpunan kasus
A : fitur
klasifikasi machine learning dimana keluaran dapat berupa dua kelas atau
11
12
kelas yang asli dari inputan. Tabel confusion matrix ditunjukkan pada
Tabel 2
Classified as
Correct Classification + -
Keterangan :
- True Positive (TP) merupakan banyaknya data yang kelas aktualnya adalah
- False Negative (FN) merupakan banyaknya data yang kelas aktualnya adalah
- False Positive (FP) merupakan banyaknya data yang kelas aktualnya adalah
- True Negative (TN) merupakan banyaknya data yang kelas aktualnya adalah
negatif.
12
13
data yang diklasifikasikan secara benar maka dapat diketahui akurasi hasil
persamaan (1).
TP+TN
Accuary=
TP+ TN + FP+ FN
(1)
yang terambil oleh sistem baik yang relevan maupun tidak. Nilai presisi diukur
TP
Precision= (2)
TP+ FP
relevan yang didapatkan sistem dengan jumlah seluruh informasi relevan yang
ada dalam koleksi informasi (baik yang terambil atau tidak terambil oleh sistem).
13
14
TP
Recal= (3)
TP+ FN
2+ Precision+ Recall
f 1 score= (4)
Precision+ Recall
yang anda letakkan pada canvas atau drawing board , kemudian hubungkan
maka akan memudahkan pengguna untuk bermain dengan data dan melakukan
14
15
antara teori dengan fakta, observasi, dan kajian pustaka yang akan
Solusi :
Prediksi data siswa SMKN 3 Toraja Utara dengan algoritma C4.5
Pendekatan :
Menganalisis data dengan algoritma C4.5
Evaluasi:
Menggunakan Aplikasi Orange3
Hasil :
Model Penerima Beasiswa Berbasis Algoritma C4.5
Gambar 2. 1 Kerangka Pikir
15
BAB III
METODOLOGI PENELITIAN
Waktu yang digunakan untuk penelitian ini dilaksanakan pada bulan Maret
2023 sampai Agustus 2023. Lokasi pelaksanaan penelitian ini adalah di SMKN 3
Toraja Utara.
3.2.1 Bahan
Ada pun bahan yang digunakan dalam penelitian ini adalah data-data nilai
3.2.2 Alat
2. Perangkat Lunak
b. Aplikasi Orange 3
16
17
18
Mulai
Pengumpulan Data
Preprocessing
Identifikasi Masalah
Pembuatan Model
Evaluasi
Pembuatan Laporan
Selesai
sebagai berikut.
a. Metode Pustaka
Pada metode ini peneliti menggunakan data dan mencari referensi dari
pustaka yang berhubungan dengan penelitian ini, baik dari beberapa buku atau
informasi yang didapatkan dari beberapa jurnal.Dalam penelitian ini , sumber data
1.Data Primer
Data Primer jenis data yang diperoleh langsung dari lapangan atau data yang
3.3.2 Preprocessing
Pada tahap ini dilakukam preprocessing data yang telah dikumpulkan serta
aplikasi Orange3.
3.3.5 Evaluasi
Pada tahapan ini yaitu menyimpulkan hasil penelitian yang telah dilakukan
penelitian ini.