Anda di halaman 1dari 12

LAPORAN

MENDETEKSI HATESPEECH MENGGUNAKAN ALGORITMA


METODE HIERARCHIRCAL CLUSTERING

Disusun Sebagai Salah Satu Syarat Menyelesaikan Mata Kuliah

DEEP LEARNING

OLEH:

KELOMPOK 7

Awaluddin 180401078
Gio Aldo Nover 180401104
Muhammad Farhan 180401179

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER

UNIVERSITAS MUHAMMADIYAH RIAU

PEKANBARU

2022
KATA PENGANTAR
Assalamualaikum warahmatullahi wabarakatuh

Puji dan syukur kita curahkan kepada Allah SWT Tuhan yang Maha Esa yang telah
melimpahkan berkat dan rahmat-Nya, sehingga penulis dapat menyelesaikan laporan dengan
judul “Implementasi Hate Speech menggunakan Metode Hierarchircal Clustering” ini dapat
selesai tepat waktu dalam rangka memenuhi tugas mata kuliah Kecerdasan Buatan. Meskipun
banyak hambatan dan rintangan yang kami hadapi saat pengerjaan makalah ini, namun atas
kuasa Allah SWT kami mampu menyelesaikan dengan tepat waktu.

Laporan ini merupakan salah satu persyaratan untuk menyelesaikan program studi strata satu
(S1) pada Program Studi Teknik Informatika Universitas Muhammadiyah Riau Penulis
menyadari bahwa dalam penulisan skripsi ini masih banyak kekurangan dan tidak sempurna,
oleh karena itu kritik dan saran dari pembaca sangat penulis harapkan.

Kami juga mengucapkan banyak terima kasih kepada Dosen mata kuliah Kecerdasan Buatan
yaitu Bapak Febby Apri Wenando, S.Pd., M.Eng, yang telah memberi dukungan dan arahan
sebelum pengerjaan makalah ini. Ucapan terima kasih juga kepada teman-teman Mahasiswa
Teknik Informatika yang secara sengaja maupun tidak sengaja telah memberi konstribusi
nyata untuk pengerjaan makalah ini.

Wassalamualaikum warahmatullahi wabarakatuh

Pekanbaru, 23 Januari 2022

Penulis

ii
DAFTAR ISI
KATA PENGANTAR ...............................................................................................................ii
DAFTAR ISI..............................................................................................................................ii
ABSTRAK .................................................................................................................................ii
ABSTRACT............................................................................................................................. iii
BAB 1 PENDAHULUAN ....................................................................................................... 4
1.1. Latar Belakang ................................................................................................................ 4
1.2. Rumusan Masalah ........................................................................................................... 4
1.3. Maksud dan Tujuan........................................................................................................ 4
1.4. Batasan Masalah ............................................................................................................. 5
BAB II METODE PENELITIAN ............................................................................................. 6
2.1 Analisis Hierarchical Clustering ..................................................................................... 6
2.1.1. Single Linkage.............................................................................................................. 6
2.1.2. Average Linkage .......................................................................................................... 6
2.1.3 Complete Linkage ......................................................................................................... 6
2.2 Model dataset .................................................................................................................. 6
2.3............................................................................................................................................... 6
BAB III HASIL DAN PEMBAHASAN .................................................................................. 7
3.1. Project Hierarchical Clustering ....................................................................................... 7
3.2. Hasil Hierarchical Clustering .......................................................................................... 8
BAB IV PENUTUP .................................................................................................................. 9
4.1. Kesimpulan ......................................................................................................................... 9
4.2. Saran ................................................................................................................................... 9
DAFTAR ISI............................................................................................................................ 10

ii
ABSTRAK
Analisis cluster adalah salah satu teknik analisis statistik yang
digunakan untuk meringkas data dengan cara mengelompokkan obyek-obyek
berdasarkan kesamaan karakteristik tertentu yang dimiliki masing-masing
obyek. Kesamaan karakteristik tersebut dinyatakan dalam ukuran jarak antar
obyek. Pembentukan kelompok-kelompok berdasarkan jarak, obyek yang
mirip seharusnya berada da- lam kelompok yang sama dan mempunyai jarak
yang lebih kecil. Sebaliknya ob- yek yang berbeda berada dalam kelompok
yang berbeda dan mempunyai jarak yang lebih besar.
me- tode hierarki dan metode nonhierarki. Metode hierarki dibagi
menjadi dua kate- gori yaitu agglomerative dan divisive. Metode nonhierarki
yang akan dibahas pa- da skripsi ini adalah metode K-means cluster.

Kata Kunci: cluster, obyek, metode, hierarki

ii
ABSTRACT
Cluster analysis is one of statistical analysis techniques to summarize
data set by grouping objects based on the same specific characteristics of the
objects. These characteristics similarity is represented by the distance
between objects. The determination of groups is based on the distance of the
objects. The identical objects should be placed in the same group and have
shorter distance. Converse- ly, the nonidentical objects should be placed in
different groups and have longer distance.
Those are hierar- chical method and nonhierarchical method.
Hierarchical method is divided into two categories, which are agglomerative
and divisive. The only nonhierarchical method which is discussed in this
thesis is K-means cluster method.

Keywords: cluster, object, method, hierarchy

iii
BAB 1
PENDAHULUAN
1.1. Latar Belakang
Hierarchical Clustering adalah metode analisis kelompok yang berusaha untuk

membangun sebuah hirarki kelompok data. Strategi pengelompokan umumnya ada 2 jenis

yaitu Agglomerative (BottomUp) dan Devisive (Top-Down).

Analisis klaster terdiri dari metode hirarki (Hierarchical Clustering method) dan non-

hirarki (Non-Hierarchical Clustering method). Metode hirarki digunakan apabila belum ada

informasi jumlah klaster yang akan dipilih. Metode ini secara umum dibedakan menjadi dua

yaitu metode aglomeratif (penggabungan) dan metode divisif (pemecahan). Metode

agglomeratif antara lainSingle Linkage, Complete Linkage, Average Linkage, Ward’s Method,

Centroid Method, Median Method dan Equal Variance Maximum Likelihood Method.

Sedangkan metode divisif antara lain monotothic dan politothic. Metode non- hirarki

bertujuan untuk mengelompokkan n objek ke dalam k klaster (𝑘 < 𝑛), di mana nilai k telah

ditentukan sebelumnya. Metode ini antara lain K-Means, dan Fuzzy C-Means.

1.2. Rumusan Masalah


Berdasarkan uraian latar belakang diatas, didapat permasalahan yaitu belum diketahuinya
akurasi yang dihasilkan oleh metode hierarchical cluster dalam kasus analisis sentimen
berdasarkan aspek pada dataset bahasa Indonesia.
1.3. Maksud dan Tujuan
Maksud dari penelitian ini adalah untuk mengimplementasikan hierarchical cluster dalam
kasus analisis sentimen berdasarkan aspek pada dataset bahasa Indonesia. Adapun tujuan
penelitian ini adalah untuk mengukur akurasi yang dihasilkan dari metode hierarchical cluster
di kasus analisis sentimen berdasarkan aspek pada dataset bahasa Indonesia.

4
1.4. Batasan Masalah
1. Format file dataset adalah xlsx
2. Teks yang diklasifikasikan dalam Bahasa Indonesia.
3. Algortima untuk pelatihan menggunakan hierarchical cluster

5
BAB II
METODE PENELITIAN
2.1 Analisis Hierarchical Clustering

Hierarchical clustering adalah analisis pengelompokan yang hasil pengelompokannya


disajikan secara berjenjang dari n, (n-1) sampai terdapat satu kelompok. Metode hierarchical
clustering secara umum dibagi menjadi dua yaitu metode agglomerative dan divisive. Terdapat
beberapa teknik metode 6 agglomerative diantaranya metode single linkage, complete linkage,
average linkage, dan ward.

2.1.1. Single Linkage

Single Linkage adalah pengelompokan yang dilakukan dengan menggabungkan


pengamatan objek yang memiliki kesamaan terdekat.

2.1.2. Average Linkage

Average linkage merupakan perlakuan antara dua cluster sebagai jarak ratarata antara
semua pasangan item dimana salah satu pasangan item milik masingmasing cluster.

2.1.3 Complete Linkage

Metode complete linkage merupakan metode yang mengelompokkan variabel


berdasarkan jarak terjauh, sehingga dua variabel yang memiliki jarak terjauh atau memiliki
kemiripan yang minimum akan ditempatkan pada kelompok pertama dan begitu seterusnya

2.2 Model dataset

Dataset yang digunakan dalam studi ini merupakan dataset kedisiplinan siswa sekolah.
Kelpompok dataset menggunakan metode alogritma hierchical clustering (single lingkage)
dengan manhattan distance. Dari dataset kedisiplinan siswa dimana ada beberapa label yaitu
siswa, disiplin terhadap waktu (DTW), Disiplin terhadap tata tertip (DTT), Disiplin
mengerjakan tugas (DMT) dan Disiplin dalam berpakaian (DDB), dimana masing-msing
memiliki skor 1-5.

2.3

6
BAB III
HASIL DAN PEMBAHASAN
3.1.Project Hierarchical Clustering

1. Import libray untuk Hierarchical Clustering

2. dalam format xls maupun xlsx tidak ada bedanya buat pandas, pada fungsi read_excel
cukup berikan saja nama file yang akan digunakan.

Dan hasilnya setelah di print(data)

3. NumPy merupakan singkatan dari Numerical Python. NumPy merupakan salah satu
library Python yang berfungsi untuk proses komputasi numerik. NumPy memiliki
kemampuan untuk membuat objek N-dimensi array. Array merupakan sekumpulan
variabel yang memiliki tipe data yang sama dan Array adalah
variabel yang mempunyai indeks sehingga dapat menyimpan sejumlah
data yang bertipe sama. Dimensi array adalah jumlah indeks pada variabel array.

7
Pada tahap berikut kami merubah data numpy menjadi array dan seperti gambari di atas
hasil jadi perubahan data aray ke numpy.
4. melalkukan hierachical klastering

5. melakukan plotting dendogram

3.2.Hasil Hierarchical Clustering

Hasil gambar di atas dari penerapan Hierarchical Clustering menggunakan linkage


mendapatkan hasil bahwa pengelompokan dimana nilai 0 digabungkan dengan nilai 3 dan nilai
1 di gabungkan dengan nilai 2 di jadikan 1 kelompok dan hasil akhir di kelpompokkan dengan
nilai 4.

8
BAB IV
PENUTUP
4.1. Kesimpulan

1. Dari hasil pengujian sistem dengan metode Agglomerative Hierarchical Clustering


didapatkan hasil yang bagus, yaitu 100%. Hal ini dapat membuktikan bahwa pengambilan data
yang dilakukakan dan klasifikasi klaster dengan metode ini dikatakan berhasil.

2. Metode hierarki yang terbaik yaitu complete linkage karena nilai agglomerative coefficient
lebih besar dengan metode hierarki lainnya. Perbandingan antara metode hierarki dan non
hierarki bahwa hasil cluster yang terbentuk berbeda.

4.2. Saran

Dapat menggunakan model lain dari metode Agglomerative Hierarchical Clustering


(AHC) selain average link hierarchical clustering seperti single linkage dan complete linkage
hierarchical clustering.

9
DAFTAR PUSTAKA

[1] A. Pratama, D. Arisandi, and N. J. Perdana, “Implementasi Metode Agglomorative


Hierarchical Clustering Pada Website Pemilihan Tempat Futsal Studi Kasus Kota
Depok,” … dan Sist. Inf., 2020, [Online]. Available:
http://journal.untar.ac.id/index.php/jiksi/article/view/11193.

[2] R. Handoyo, R. Rumani, and S. M. Nasution, “Perbandingan metode clustering


menggunakan metode single linkage dan K-Means pada pengelompokan dokumen,”
JSM STMIK Mikroskil, vol. 15, no. 2, pp. 73–82, 2014, [Online]. Available:
https://mikroskil.ac.id/ejurnal/index.php/jsm/article/view/161.

[3] T. Alfina and B. Santosa, “Analisa Perbandingan Metode Hierarchical Clustering, K-


Means dan Gabugan Keduanya dalam Membentuk Cluster Data (Studi Kasus :
Problem Kerja Praktek Jurusan Teknik Industri ITS),” Anal. PerbandinganMetode
Hierarchical Clust. K-means dan Gabungan Keduanya dalam Clust. Data, vol. 1, no.
1, pp. 1–5, 2012.

[4] “View of Penerapan Metode Complete Linkage dan Metode Hierarchical Clustering
Multiscale Bootstrap.pdf.” .

10

Anda mungkin juga menyukai