0% menganggap dokumen ini bermanfaat (0 suara)

130 tayangan13 halaman

Metode Data Mining dan Klasterisasi

Dokumen tersebut membahas tentang tinjauan pustaka mengenai data mining dan analisis klaster. Secara ringkas, data mining digunakan untuk mengekstrak pengetahuan dari basis data, sedangkan analisis klaster digunakan untuk mengelompokkan data ke dalam klaster berdasarkan kemiripan. Terdapat beberapa metode analisis klaster seperti metode berbasis partisi, metode hirarki, dan metode berbasis kepadatan.

Diunggah oleh

GERALD HALIM AL RASYID NOER MHS 2017

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

130 tayangan13 halaman

Metode Data Mining dan Klasterisasi

Diunggah oleh

GERALD HALIM AL RASYID NOER MHS 2017

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd

1

BAB II

TINJAUAN PUSTAKA/LANDASAN TEORI

1. Madrasah
2. Data Mining

Sebagian ahli menyatakan bahwa Data Mining adalah langkah analisis

terhadap proses penemuan pengetahuan di dalam basis data atau knowledge
discovery in databases yang disingkat KDD (Suyanto, 2019). Data mining
menurut David Hand, Heikki Mannila, dan Padhraic Smyth dari MIT adalah
analisis terhadap data (biasanya data yang berukuran besar) untuk menemukan
hubungan yang jelas serta menyimpulkannya yang belum diketahui sebelumnya
dengan cara terkini dipahami dan berguna bagi pemilik data tersebut (Handayanto
et al, 2020).

Data Mining ditujukan untuk mengekstrak (mengambil intisari)

pengetahuan dari sekumpulan data sehingga didapatkan struktur yang dapat
dimengerti mannusia (ACM 2006) serta meliputi basis data dan manajemen data,
prapemprosesan data, pertimbangan model dan inferensi, ukuran ketertarikan,
pertimbangan kompleksitas, pascapemprosesan terhadap struktur yang ditemukan,
visualisasi, dan online updating (ACM 2006) (Suyanto, 2019).

Secara skematis, Gorunescu (2011) membagi langkah proses pelaksanaan

Data Mining dalam tiga aktivitas yaitu:

 Eksplorasi Data, terdiri dari aktivitas pembersihan data, transformasi data,

pengurangan dimensi, pemilihan ciri, dan lain-lain.
 Membuat Model dan Pengujian Validitas Model, merupakan pemilihan
terhadap model-model yang sudah dikembangkan yang cocok dengan kasus
yang dihadapi. Dengan kata lain, dilakukan pemilihan model secara
kompetitif.

UIN Syarif Hidayatullah Jakarta

 Penerapan model dengan data baru untuk menghasilkan perkiraan dari kasus
yang ada. Tahap ini merupakan tahap yang menentukan apakah model yang
telah dibangun dapat menjawab permasalahan yang dihadapi.
Menurut Handayanto dan Herlawati (2020), Aplikasi yang menggunakan
Data Mining bermaksud menyelesaikan permasalahan dengan membangun model
berdasarkan data yang sudah digali untuk diterapkan terhadap data yang lain.
Secara umum ada dua jenis tipologi aplikasi Data Mining:

 Metode Prediksi, yang bermaksud memprediksi nilai yang akan datang

berdasarkan data-data yang telah ada variabelnya seperti klasifikasi, regresi,
detikasi anomali, dan lain-lain.
 Metode Deskriptif, yang bermaksud membantu user agar mudah melihat pola-
pola yang berasal dari data yang ada.

Berdasarkan fungsionalitasnya, tugas-tugas data mining biasa

dikelompokan ke dalam enam kelompok berikut ini (Fayyad et al, 1996):

 Klasifikasi (classification): men-generalisasi struktur yang diketahui untuk

diaplikasikan pada data-data baru.
 Klasterisasi (clustering): mengelompokan data, yang diketahui label kelasnya,
ke dalam sejumlah kelompok tertentu sesuai dengan ukuran kemiripannya.
 Regresi (regression): menemukan suatu fungsi yang memodelkan data dengan
galat (kesalahan prediksi) seminimal mungkin.
 Deteksi anomaly (anomaly detection): mengidentifikasi data yang tidal umum,
bias berupa outlier (pencilan), perubahan atau deviasi, yang mungkin sangat
penting dan perlu investigasi lebih lanjut.
 Pembelajaran aturan sosiasi (association rule learning) atau pemodelan
kebergantungan (dependency modeling): mencari relasi antar variable.
 Perangkuman (summarization): menyediakan representasi data yang lebih
sederhana, meliputi visualisasi dan pembuatan laporan.

UIN Syarif Hidayatullah Jakarta

3. Analisis Klaster (Cluster Analysis)

Klasterisasi atau clustering adalah proses pengelompokan himpunan data

ke dalam beberapa grup atau klaster sedemikian hingga objek-objek dalam suatu
klaster memiliki kemiripan yang tinggi, namun sangat berbeda (memiliki
ketidakmiripan yang tinggi) dengan objek-objek di klaster-klaster lainnya (J Han
et al, 2012). Sedangkan Menurut Dr. Suyanto (2019) pada bukunya yang berjudul
Data Mining untuk Klasifikasi dan Klasterisasi Data, klasterisasi adalah
pengelompokan data secara otomatis tanpa diberitahu label kelasnya.

Klasterisasi berbeda dengan klasifikasi dari sisi data, dimana pada metode
itu data tidak memiliki kelas (sering distilahkan dengan label atau target),
sehingga klasterisasi masuk dalam kategori pembelajaran tak terpandu
(unsupervised learning) (Handayanto et al. 2020). Pada dasarnya clustering
merupakan suatu metode untuk mencari dan mengelompokkan data yang
memiliki kemiripan karakteriktik (similarity) antara satu data dengan data yang
lain. Clustering merupakan salah satu metode data mining yang bersifat tanpa
arahan (unsupervised), maksudnya metode ini diterapkan tanpa adanya latihan
(training)dan tanpa ada guru serta tidak memerlukan target output (Bastian et al.
2018).

Karena itu perlu diketahui teknik-teknik yang digunakan untuk mengukur

tingkat kesamaan atau kemiripan, yaitu (Handayanto et al, 2020):

 Minowski Distance (masuk dalam kelompok ini Manhattan, Eucledian, dan

Chebysev)
 Tanimoto Measure
 Pearson’s r Measure
 Mahalanobis Measure

UIN Syarif Hidayatullah Jakarta

Klasterisasi dikelompokan ke dalam empat kategori: metode-metode

berbasis partisi (partitioning methods), metode-metode berbasis hirarki
(hierarchical methods), metode-metode berbasis kepadatan (density-based
methods), dan metode-metode berbasis kisi (grid-based methods) (Suyanto,
2019).

3.1. Metode Berbasis Partisi (Partitioning Method)

Sesuai dengan Namanya, metode ini bekerja dengan cara membagi atau
mempartisi data ke dalam sejumlah kelompok. Metode ini dikenal juga dengan
metode berbasis pusat atau metode berbasis representative (Zaki et al, 2013).
Menurut Dr. Suyanto (2019), pada metode ini, sebuah klaster C i dipresentasikan
sebagai centroid atau secara konsep disebut titik pusat klaster. Kualitas klaster C i
dapat diukur menggunakan variasi dalam klaster, yaitu jumlah kesalahan kuadrat
atau sum of squared error (SSE) antara semua objek dalam klaster Ci dan centroid
ci, yang didefinisikan sebagai

k
SSE=∑ ∑ dist ( p , ci)
i=1 p ∈Ci

Pada prinsipnya, semua metode berbasis partisi berusaha mengoptimasi

fungsi objektif tersebut, yaitu meminimalkan variasi dalam klaster atau
meminimalkan SSE. Secara komputasional, kompleksitas optimasi variasi dalam
klaster tersebut sangatlah tinggi. Jumlah kemungkinan partisi bersifat
eksponensial terhadap jumlah klaster dan dimensi ruang. Algoritma- algoritma
yang termasuk ke dalam metode berbasis partisi adalah k-means, k-modes, k-
medoids, fuzzy c-means, dan banyak lagi variasi lainnya. (Suyanto, 2019).

UIN Syarif Hidayatullah Jakarta

3.2. Metode Berbasis Hirarki (Hierarchical Method)

Sesuai dengan namanya, metode klasterisasi hirarki (hierarchical

clustering) bekerja dengan cara mengelompokkan objek-objek data ke dalam
sebuah hirarki klister (Suyanto, 2019).

Hierarchical clustering dapat dilakukan menggunakan dua strategi, yaitu:

dari bawah ke atas (bottom-up) yang disebut agglomerative hierarchical
clustering dan dari atas ke bawah (top-down) yang disebut divisive hierarchical
clustering (J Han et al, 2012). Strategi agglomerative dimulai dengan
menganggap setiap objek tunggal sebagai sebuah klaster, kemudian secara iteratif
mengggabungkannya untuk membentuk klaster-klaster yang lebih besar.
Sebaliknya, strategi divisive dimulai dengan sebuah klaster bear yang berisi
semua objek dalam himpunan data, yang selanjutnya secara iterative dipecah ke
dalam klaster-klaster yang lebih kecil. Dengan kedua strategi tersebut,
hierarchical clustering terkadang mengalami masalah terkait dengan keputusan
untuk menggabungkan atau memisahkan klaster. (Suyanto, 2019).

Terdapat banyak metode yang termasuk ke dalam hierarchical clustering,

yang dapat dikelompokkan ke dalam tiga kategori, yaitu: metode algoritmik,
metode probabilistik, dan metode Bayesian (Suyanto, 2019). Contoh algoritma-
algoritma berbasis hirarki adalah metode algoritmik, BIRCH, Chameleon, dan
masih banyak lagi.

3.3. Metode Berbasis Kepadatan (Density-Based Method)

Menurut Suyanto (2019), metode klasterisasi berbasis partisi maupun

hirarki cenderung lemah untuk klaster-klaster yang berbentuk bebas, acak (tidak
bulat), dan memiliki derau atau pencilan.

Density-Based Clustering merupakan algoritma yang membagi area

berdasarkan kepadatan data menjadi cluster. Maing-masing cluster tersebut

UIN Syarif Hidayatullah Jakarta

memiliki bentuk acak dalam database spatial. Algoritma Density-Based

Clustering menegaskan bahwa sebuah cluster memiliki banyak titik.
Neighborhood dari radius yang diberikan dari setiap titik minimal harus memiliki
jumlah minimum poin. Jumlah minimum poin yang dimaksud adalah density dari
neighborhood harus lebih dari beberapa threshold tertentu. (Moreira & Santos,
2005). Contoh metode berbasis kepadatan, yaitu: DBSCAN, OPTICS, dan
DENCLUE.

3.4. Metode Berbasis Kisi (Grid-Based Method)

Metode berbasis kisi menggunakan pendekatan space-driven (disetir rung)

dengan mempartisi embedding space ke dalam sel-sel yang tidak bergantung pada
distribusi objek data. Metode ini menggunakan struktur data kisi multiresolusi.
Metode ini memberikan dua keuntungan: komputasi yang sangat cepat dan tidak
bergantung pada jumlah objek data (melainkan hanya bergantung pada jumlah sel.
(Suyanto, 2019). Contoh dari metode berbasis kisi adalah metode STING dan
metode CLIQUE.

4. Normalisasi Data (Feature Scaling)

5. K-Means Clustering

K-Means pertama kali dipublikasikan oleh Stuart Lloyd pada tahun 1984
dan merupakan algoritma clustering yang banyak digunakan. K-Means bekerja
dengan mensegmentasi objek yang ada ke dalam kelompok atau yang disebut
dengan segmen sehingga objek yang berada dalam masing-masing kelompok
lebih serupa satu sama lain dibandingkan dengan objek dalam kelompok yang
berbeda (Aditya et al. 2020). K-means clustering merupakan salah satu metode
data clustering non-hirarki yang mengelompokan data dalam bentuk satu atau
lebih klaster/kelompok. Data-data yang memiliki karakteristik yang sama
dikelompokan dalam satu klaster/ kelompok dan data yang memiliki karakteristik
yang berbeda dikelompokan dengan klaster/kelompok yang lain sehingga data

UIN Syarif Hidayatullah Jakarta

yang berada dalam satu cluster/kelompok memiliki tingkat variasi yang kecil
(Agusta, 2007).

Gambar 2.1 visualisasi k-means, sumber medium.com, diakses 20 mei

2022
Menurut Suyanto (2019), Ide dasar algoritma k-means sangatlah
sederhana, yaiitu meminimalkan Sum of Squared Error (SSE) antara objek-objek
data dengan sejumlah k centroid. Algoritma k-means bekerja dengan empat
langkah, yang dilustrasikan dalam pseudo code di bawah ini. Pertama, dari
himpunan data yang akan diklasterisasi, dipilih sejumlah k objek secara acak
sebagai centroid awal. Kedua, setiap objek yang bukan centroid dimasukkan ke
klaster terdekat berdasarkan ukuran jarak tertentu. Ketiga, setiap centroid
diperbaruiberdasarkan rata-rata dari objek yang ada di dalam setiap klaster.
Keempat, langkah kedua dan ketiga tersebut diulang-ulang (diiterasi) sampai
semua centroid stabil atau konvergen, dalam arti semua centroid yang dihasilkan
dalam iterasi saat ini sama dengan semua centroid yang dihasilkan pada iterasi
sebelumnya.

Menurut Handayanto dan Herlawati (2020), Tahapan dalam klasterisasi

dengan K-Means antara lain:

 Menentukan jumlah klaster "K” yang akan dibagi.

UIN Syarif Hidayatullah Jakarta

 Menentukan data k sebagai titik pusat (centroid) awal tiap klaster.

 Mengelompokan data ke dalam K klaster sesuai dengan titik pusat
yang telah ditentukan sebelumnya.
 Memperbaharui pusat klaster dan mengulangi langkah ketiga sampai
nilai dari titik centroid tidak berubah.

Kelebihan Algoritma K-means diantaranya adalah mampu

mengelompokkan objek besar dan pencilan obyek dengan sangat cepat sehingga
mempercepat proses pengelompokan. Kekurangan Algoritma K-means yaitu
sangat sensitive pada pembangkitan titik pusat awal secara random (Bastian,
Sujadi, & Febrianto, 2018).

6. Dbscan Clustering

DBSCAN merupakan metode clustering yang membangun cluster

berdasarkan kepadatan, cluster yang tidak termasuk objek dianggap noise
(Wulandari et al. 2022). Tidak seperti k-means clustering, Dbscan tidak perlu
menentukan jumlah kelompok secara manual. Namun, diperlukan jumlah
minimum tetangga untuk dipertimbangkan dalam kelompok dan jarak maksimum
yang diperbolehkan antara titik manapun untuk menjadi bagian dari kelompok
yang sama. Dalam pengguna tertentu, ditentukan jarak disekitar sampel, Dbscan
akan menghitung jumlah tetangga. Ketika jumlah tetangga antar jarak melebihi
ambang batas, Dbscan akan mengelompokan titik data sebagai satu kelompok
(Misra, Li, & He, 2019). Langkah-langkah untuk melengkapi algoritma
DBSCAN menurut Wulandari et al. (2022) adalah sebagai berikut.

a. Inisialisasi parameter Min Pts dan dan parameter Eps.

b. Tentukan titik awal atau p secara acak.
c. Hitung Eps atau semua jarak titik yang kepadatan atau densitasnya
dicapai terhadap p menggunakan rumus Euclidian Distance seperti
dalam persamaan 3.

UIN Syarif Hidayatullah Jakarta

d. Terbentuk sebuah cluster ketika titik yang memenuhi Eps lebih dari
MinPts dan titik p sebagai core point.
e. Ulangi langkah 3 dan 4 sampai terproses pada semua titik. Jika p
merupakan titik border dan tidak ada yang kepadatan atau densitasnya
dapat dicapai p, maka proses dilanjutkan ke titik yang lain.

Salah satu keuntungan Dbscan dibanding k-means adalah Dbscan tidak

terbatas pada jumlah cluster yang ditetapkan saat inisialisasi. Algoritmanya akan
menentukan jumlah cluster berdasarkan kepadatan suatu daerah. Algoritma
Dbscan 22 dibangun dalam konsep kebisingan (noise). Pada umumnya digunakan
untuk mendeteksi outliers dalam data, seperti aktivitas kecurangan dalam kartu
kredit, ecommerce, atau klaim asuransi (Bari, Chaouchi, & Jung, 2014).

7. K Nearest Neighbors (KNN)

K-nearest neighbor (KNN) merupakan kelompok instance-based learning.

KNN dilakukan dengan mencari kelompok k objek dalam data training yang
paling dekat atau mirip dengan objek pada data atau data testing. Algoritma k-
nearest neighbor termasuk ke dalam algoritma klasifikasi. Tujuan dari algoritma
klasifikasi adalah untuk memprediksi kelas baru dari dataset yang mempunyai
kelas. (Alifiyyah, dkk. 2020). Algoritma K-Nearest Neighbor adalah metode yang
berfungsi mengklasifikasikan suatu objek menurut data pembelajaran yang
memiliki jarak sangat dekat ke objek yang diuji. Nearest Neighbor adalah proses
mencari pendekatan dari kasus yaitu menghitung titik dekat antara masalah
setelahnya dengan sebelumnya pada bobot yang sama dari jumlah fitur yang ada.
(Anisah, 2019)

Metode k-Nearest Neighbor Rule atau kNNR bekerja dengan mencari

sejumlah k objek data atau pola (dari semua pola latih yang ada) yang paling
dekat dengan pola masukan, kemudian memilih kelas dengan jumlah pola

UIN Syarif Hidayatullah Jakarta

terbanyak di antara k pola tersebut. Sederhananya, kNNR mengklasifikasikan

pola dengan cara voting. (Suyanto, 2019).

Menurut Suyanto (2019), kNNR memiliki dua kelemahan. Kelemahan

pertama adalah kNNR sangat sensitive terhadap derau maupun data pencilan.
Sedangkan kelemahan kedua adalah pengaturan parameter k untuk
mengklasifikasikan kelas yang berjumlah genap.

8. Principal Component Analysis (PCA)

PCA merupakan teknik dalam analisis multivariat yang tertua dan paling
banyak diketahui yang pertama kali diperkenalkan oleh Pearson (1901) dan
dikembangkan secara umum oleh Hotelling (1933). Secara teori, PCA adalah
sebuah metode matematis yang mentransformasikan data ke dalam ranah baru,
yang menghasilkan sejumlah prinsiple component yang lebih penting dibanding
lainnya. Dengan demikian, dimensi data asl dapat direduksi dengan menggunakan
sebagian prinsiple component yang paling penting. Tujuan PA adalah
memperjelas visualisasi dan mempermudah analisis data. (Suyanto, 2019).

Dengan menggunakan PCA, variabel yang sebelumnya sebanyak 𝑛

variabel akan diseleksi menjadi 𝑘 variabel baru yang disebut principal component,
dengan jumlah 𝑘 lebih kecil dari 𝑛. Dengan hanya menggunakan 𝑘 principal
component akan menghasilkan nilai yang sama dengan 𝑛 variabel. Dimana
variabel hasil dari seleksi disebut sebagai principal component (Kotu &
Deshpande, 2015).

9. Python

Menurut Handayanto dan Herlawati (2020), bahasa Python diluncurkan

pertama kali pada tahun 1991 di Scitching Mathematicsch Centrum, Belanda.
Bahasa ini dirancang oleh Guido van Rossum yang mengambil nama Python dari
grup komedi terkenal asal Inggris, Monty Python. Menurutnya, Bahasa ini sangat

UIN Syarif Hidayatullah Jakarta

diminati karena karakteristiknya yang open source dengan lisensi GPL –

compatible. Beberapa literatur mengungkapkan beberapa kelebihan Python,
diantaranya: Readability, efisien, multifungsi, interoperabilitas yang baik, dan
dukungan komunitas yang kuat.

Python adalah bahasa pemrograman yang bersifat open source. Bahasa

pemrograman ini dioptimalisasikan untuk software quality, developer
productivity, program portability, dan component integration. Python telah
digunakan untuk mengembangkan berbagai macam perangkat lunak, seperti
internet scripting, systems programming, user interfaces, product customization,
numeric programming dll. (Lutz, 2010). Bahasa pemrograman Python memiliki
beberapa fitur yang dapat digunakan oleh pengembang perangkat lunak. Berikut
adalah beberapa fitur yang ada pada bahasa pemrograman Python (Lutz, 2010):

1. Multi Paradigm Design

2. Open Source
3. Simplicity
4. Library Support
5. Portability
6. Extendable
7. Scalability
10. Jupyter Notebook

Jupyter Notebook adalah sebuah piranti lunak yang dapat digunakan untuk
menampilkan dan menganalisis data dengan mudah. (Setiabubidaya, 2015).
Jupyter Notebook merupakan versi terbaru dari python, dikenal dengan istilah
IPython, dengan ekstensi file tersendiri yaitu * ipynb. Selain Jupyter Notebook
yang diinstal di komputer kita, ada juga versi online yang dijalankan lewat
browser, dikenal dengan nama Google Colaboratory. Dengan Jupyter Notebook,

UIN Syarif Hidayatullah Jakarta

penggunaan Python jadi lebih mudah karena karakternya yang interaktif dimana
apa yang kita ketik bisa langsung dieksekusi. (Handayanto & Herlawati, 2020).

Menurut Setiabudidaya (2015), IPython Notebook yang berbasis Web

Browser berkembang sangat cepat yang hanya dengan beberapa tahun dapat
bertransfomasi menjadi Jupyter Notebook App yang memungkinakan penggunaan
Bahasa pemrograman utama yang lebih beragam, yaitu Julia, Python, dan R.

11. Indeks Silhouette

Indeks Silhouette merupakan gabungan dari Metode separasi dan kohesi.

(Kodinariva & Makwana, 2013). Indeks validitas Silhouette menghitung rata-rata
nilai setiap titik pada himpunan data. perhitungan nilai setiap titik adalah selisih
nilai separation dan compactness yang dibagi dengan maksimum antara
keduanya. (Aditya, dkk. 2020).

Menurut Qadrini (2020), tahapan untuk menghitung nilai Silhoutte

Coeffisient adalah sebagai berikut :

1. Untuk setiap objek i, hitung rata-rata jarak dari objek I dengan seluruh
objek yang berada dalam satu kelompok. Akan didapatkan nilai rata-
rata yang disebut 𝑎𝑖 .
2. Untuk setiap objek i, hitung rata-rata jarak dari objek i dengan objek
yang berada di kelompok lainnya. Dari semua jarak rata-rata tersebut
ambil nilai yang paling kecil. Nilai ini disebut 𝑏𝑖 .
3. Setelah itu maka untuk objek i memiliki nilai Silhouette Coefficient :

( bi−ai )
Si=
max ( ai , bi )
hasil perhitungan nilai Silhoutte Coeffisient dapat bervariasi antara -1
hingga 1. Hasil pengelompokan dikatakan baik jika nilai Silhoutte Coeffisient
bernilai positif (𝑎𝑖< 𝑏𝑖) dan 𝑎𝑖 mendekati 0, sehingga akan menghasilkan nilai

UIN Syarif Hidayatullah Jakarta

Silhoutte Coeffisient yang maksimum yaitu 1 saat 𝑎𝑖 = 0. Maka dapat dikatakan,

jika 𝑆𝑖 = 1 berarti objek i sudah berada dalam kelompok yang tepat. Jika nilai 𝑆𝑖
= 0 maka objek i berada di antara dua kelompok sehingga objek tersebut tidak
jelas harus dimasukan ke dalam kelompok A atau kelompok B. Akan tetapi, jika
𝑆𝑖 = −1 artinya struktur kelompok yang dihasilkan overlapping, sehingga objek i
lebih tepat dimasukan ke dalam kelompok yang lain. Nilai rata-rata Silhouette
Coeffisient dari tiap objek dalam suatu kelompok adalah suatu ukuran yang
menunjukan seberapa ketat data dikelompokan dalam kelompok tersebut.
(Qadrini, 2020)

Berikut adalah nilai Silhouette Coefficient berdasarkan (Kaufman &

Rousseeuw, 1990) adalah:

Nilai SC Keterangan
0,7 < 𝑆𝐶 ≤ 1 Struktur Kuat
0,5 < 𝑆𝐶 ≤ 0,7 Struktur Medium
0,25 < 𝑆𝐶 ≤ 0,5 Struktur Lemah
𝑆𝐶 ≤ 0,25 Tidak ada Struktur

12.

UIN Syarif Hidayatullah Jakarta

Anda mungkin juga menyukai

Bab - 3 PKL
Belum ada peringkat
Bab - 3 PKL
10 halaman
Pertemuan 11 Clustering
Belum ada peringkat
Pertemuan 11 Clustering
7 halaman
Kinerja Naive Bayes vs C4.5 Klasifikasi Harga Pangan
Belum ada peringkat
Kinerja Naive Bayes vs C4.5 Klasifikasi Harga Pangan
5 halaman
Ujian Akhir Semester Data Mining 2021
Belum ada peringkat
Ujian Akhir Semester Data Mining 2021
31 halaman
Konsep dan Metode Data Mining
Belum ada peringkat
Konsep dan Metode Data Mining
12 halaman
Penerapan dan Teknik Data Mining
Belum ada peringkat
Penerapan dan Teknik Data Mining
9 halaman
Algoritma K-Means dalam Clustering Data
Belum ada peringkat
Algoritma K-Means dalam Clustering Data
12 halaman
Analisis Data Mining untuk Bisnis dan Olahraga
Belum ada peringkat
Analisis Data Mining untuk Bisnis dan Olahraga
3 halaman
Analisis Clustering Menggunakan Metode K-Means Dalam Pengelompokkan Penjualan Produk Pada Swalayan Fadhila
Belum ada peringkat
Analisis Clustering Menggunakan Metode K-Means Dalam Pengelompokkan Penjualan Produk Pada Swalayan Fadhila
9 halaman
Pengelompokan Mahasiswa dengan K-Means
Belum ada peringkat
Pengelompokan Mahasiswa dengan K-Means
7 halaman
Proses dan Metode Data Mining
Belum ada peringkat
Proses dan Metode Data Mining
18 halaman
Konsep dan Metode Data Mining
Belum ada peringkat
Konsep dan Metode Data Mining
5 halaman
Tugas Personal Ke-2 (Minggu 8 / Sesi 13) : Gambar 1. Contoh
Belum ada peringkat
Tugas Personal Ke-2 (Minggu 8 / Sesi 13) : Gambar 1. Contoh
8 halaman
Laporan Data Mining
0% (1)
Laporan Data Mining
14 halaman
Metode Klasifikasi dalam Data Mining
Belum ada peringkat
Metode Klasifikasi dalam Data Mining
5 halaman
Pengantar Data Mining dan Prosesnya
Belum ada peringkat
Pengantar Data Mining dan Prosesnya
27 halaman
Alwan Munawar - 2130511072 - Tugas 3 Metode Penelitian
Belum ada peringkat
Alwan Munawar - 2130511072 - Tugas 3 Metode Penelitian
4 halaman
Bab Ii
Belum ada peringkat
Bab Ii
22 halaman
Metode Data Mining untuk Bisnis Digital
Belum ada peringkat
Metode Data Mining untuk Bisnis Digital
3 halaman
Herdin Hidayat - Tugas Analisis Data Mining Covid19
Belum ada peringkat
Herdin Hidayat - Tugas Analisis Data Mining Covid19
9 halaman
Klasterisasi Pelanggan E-Commerce dengan Data Mining
Belum ada peringkat
Klasterisasi Pelanggan E-Commerce dengan Data Mining
5 halaman
Proses dan Metode Data Mining
Belum ada peringkat
Proses dan Metode Data Mining
39 halaman
Metode Clustering dalam Data Mining
Belum ada peringkat
Metode Clustering dalam Data Mining
4 halaman
Dasar-Dasar Data Mining dan Clustering
Belum ada peringkat
Dasar-Dasar Data Mining dan Clustering
17 halaman
Implementasi Data Mining dan K-Means
Belum ada peringkat
Implementasi Data Mining dan K-Means
40 halaman
Metode Klasterisasi Data dan Manfaatnya
Belum ada peringkat
Metode Klasterisasi Data dan Manfaatnya
4 halaman
Panduan Lengkap Clustering Analysis
Belum ada peringkat
Panduan Lengkap Clustering Analysis
23 halaman
Proses dan Metode Data Mining
100% (1)
Proses dan Metode Data Mining
18 halaman
Segmentasi Fasilitas Kampus K-Means
Belum ada peringkat
Segmentasi Fasilitas Kampus K-Means
6 halaman
Tugas dalam Data Mining dan Algoritma
Belum ada peringkat
Tugas dalam Data Mining dan Algoritma
4 halaman
Pengertian K-Means Clustering
Belum ada peringkat
Pengertian K-Means Clustering
3 halaman
Teori dan Proses Data Mining KDD
Belum ada peringkat
Teori dan Proses Data Mining KDD
20 halaman
Analisis Data Mining COVID-19 Usia dan Rawat
Belum ada peringkat
Analisis Data Mining COVID-19 Usia dan Rawat
9 halaman
3 - 7705 - MIK620 - 032018 - PDF
Belum ada peringkat
3 - 7705 - MIK620 - 032018 - PDF
15 halaman
K-Means Clustering untuk Data SD Pekalongan
Belum ada peringkat
K-Means Clustering untuk Data SD Pekalongan
10 halaman
Proses dan Tujuan Data Mining
Belum ada peringkat
Proses dan Tujuan Data Mining
5 halaman
Tugas Busines Intelegance 115
Belum ada peringkat
Tugas Busines Intelegance 115
8 halaman
Teori Data Mining dan Algoritma Apriori
Belum ada peringkat
Teori Data Mining dan Algoritma Apriori
15 halaman
Panduan Lengkap Data Mining
Belum ada peringkat
Panduan Lengkap Data Mining
14 halaman
Fungsi Asosiasi
Belum ada peringkat
Fungsi Asosiasi
4 halaman
K-Means untuk Klasifikasi Kelulusan Siswa
Belum ada peringkat
K-Means untuk Klasifikasi Kelulusan Siswa
8 halaman
Konsep dan Metode Data Mining
Belum ada peringkat
Konsep dan Metode Data Mining
3 halaman
Sistem Keputusan Wisata Berbasis K-Means
Belum ada peringkat
Sistem Keputusan Wisata Berbasis K-Means
7 halaman
Landasan Teori Data Mining
Belum ada peringkat
Landasan Teori Data Mining
13 halaman
Teori dan Metodologi Data Mining
Belum ada peringkat
Teori dan Metodologi Data Mining
16 halaman
Data Mining
100% (1)
Data Mining
20 halaman
1 KONSEP DATA MINING PPTX
Belum ada peringkat
1 KONSEP DATA MINING PPTX
14 halaman
Metode Data Mining
Belum ada peringkat
Metode Data Mining
3 halaman
Metode Utama dalam Data Mining
Belum ada peringkat
Metode Utama dalam Data Mining
3 halaman
K-Means Clustering untuk Evaluasi Mahasiswa
Belum ada peringkat
K-Means Clustering untuk Evaluasi Mahasiswa
8 halaman
Bab 2
Belum ada peringkat
Bab 2
23 halaman
Algoritma Clustering dalam Sains Data
Belum ada peringkat
Algoritma Clustering dalam Sains Data
2 halaman
Proses dan Teknik Data Mining
Belum ada peringkat
Proses dan Teknik Data Mining
28 halaman
Peran Utama Data Mining dalam Estimasi
Belum ada peringkat
Peran Utama Data Mining dalam Estimasi
15 halaman
Metode Clustering dalam Data Mining
Belum ada peringkat
Metode Clustering dalam Data Mining
23 halaman
KNIF 2015 33 Integrasi Metode Klasifikasi Dan Clustering Dalam Data Mining
Belum ada peringkat
KNIF 2015 33 Integrasi Metode Klasifikasi Dan Clustering Dalam Data Mining
6 halaman
Makalah TLJ Aan
Belum ada peringkat
Makalah TLJ Aan
18 halaman