Anda di halaman 1dari 4

ALGORITMA DATA MINING

OLEH :

Sabrina Anjani ( 2220055 )


AK 1C

POLITEKNIK ATI PADANG


2022
Data science adalah ilmu yang banyak diperbincangkan akhir-akhir ini. Data science
digunakan untuk mengolah data untuk memperoleh informasi berupa insight dibalik
kumpulan data tersebut. Ilmu ini banyak diterapkan oleh perusahaan maupun instansi
karena manfaatnya. Secara umum, pengolahan data science terdiri dari pengumpulan data,
manipulasi data, pengolahan data, hingga penyajian data. Tahapan ini dilakukan dengan
menggunakan tools-tools yang mendukung karena data pada data science dapat berupa
data terstruktur dan tidak terstruktur. Algoritmaika pengambilan keputusan untuk
pemecahan masalah, bagaimana memecahkan masalah dengan melakukan langkah-langkah
sistematis.
Pada tahap pengolahan data pada data science memerlukan penerapan algortima-algoritma
untuk menjalankan prosesnya. Salah satu ilmu yang termasuk dalam data science adalah
data mining. Proses data mining fokus pada menemukan pola-pola tertentu yang ada pada
data. Dalam penerapannya banyak algoritma data mining yang bisa digunakan sesuai
dengan permasalahan yang ingin dipecahkan.

1. Algoritma Klasifikasi
Algoritma yang paling banyak digunakan dalam data mining.Algoritma klasifikasi
adalah salah satu metode dalam proses KDD yang ada pada tahap data mining untuk
mengidentifikasi setiap kelompok berdasarkan kasus dan kemudian dikelompokkan
datanya berdasarkan atribut. Klasifikasi ini merupakan metode supervised learning
yang mencoba menemukan hubungan antara atribut masukkan dan atribut target.
Tujuan klasifikasi ini untuk meningkatkan kehandalan hasil yang diperoleh dari data.
Lalu algoritma ini juga dibagi menjadi beberapa yaitu contohnya K-Means Dari sini
akan ditemukan pola tertentu yang dapat membantu meningkatkan strategi bisnis. Kita juga bisa
menerapkan algoritma K-Means untuk meningkatkan mutu atau sistem pembelajaran
berdasarkan nilai dan minat mahasiswa.  Lalu juga ada Naive Bayes Naive Bayes adalah algoritma
untuk mengklasifikasikan data menggunakan metode probabilitas dan statistik yang bertujuan
memprediksi peluang di masa depan berdasarkan kejadian atau data di masa lampau. Ciri utama
dari Naive Bayes adalah asumsi yang kuat pada independensi dari masing-masing kejadian.
Beberapa kegunaan Naive Bayes yaitu antara lain untuk mengklasifikasikan dokumen teks,
otomatisasi diagnosa medis, dan mendeteksi serta menyaring spam. Dan juga C 4.5 Algoritma C4.5
atau Decision Tree adalah metode yang populer digunakan dengan bahasa pemrograman R.
Decision Tree adalah metode pengambilan keputusan dengan mengikuti titik awal alur atau
disebut juga dengan root node. Metode ini dapat digunakan untuk membantu analisis risk rating
yang dimanfaatkan perusahaan atau badan yang berjalan di bidang keuangan atau finance.

2. Algoritma Estimasi/ Prediksi


Estimasi algoritma mirip dengan klasifikasi algoritma, tetapi variabel target adalah
berupa bilangan numerik (kontinyu) dan bukan kategorikal (nominal atau diskrit).E
nilai dari variabel target ditentukan berdasarkan nilai dari variabel prediktor
(atribut).
Algoritma estimasi yang biasa digunakan adalah: Linear Regression, Neural Network,
Support Vector Machine.
Contoh Algoritma Estimasi

Algoritma Prediksi
Algoritma prediksi/peramalan sama dengan algoritma estimasi di mana
label/target/kelas bertipe numerik, bedanya adalah data yang digunakan merupakan
data rentet waktu (data time series).Iprediksi terkadang digunakan juga untuk
klasifikasi, tidak hanya untuk prediksi time series, karena sifatnya yang bisa
menghasilkan class berdasarkan berbagai atribut yang kami sediakan. Semua
algoritma estimasi dapat digunakan untuk prediksi/forecasting.

Contoh Algoritma Prediksi

3. Algoritma Clustering
Clustering adalah metode unsupervised learning yang banyak digunakan di
berbagai bidang. Dalam bidang data science, kita menggunakan analisis clustering
untuk mendapatkan beberapa insight berharga. Dalam ilmu machine learning, ada
banyak sekali algoritma clustering yang bisa digunakan untuk berbagai tujuan dan
berbagai jenis data. Jenis algoritmanya pun sangat beragam, mulai dari algoritma
yang sangat sederhana hingga algoritma yang sangat kompleks.
4. Algoritma Asosiasi
Algoritma merupakan suatu bentuk algoritma dalam data mining yang
memberikan informasi hubungan antar item data didatabase. Algoritma tersebut
dapat dimanfaatkan secara luas dalam proses bisnis diantaranya dalam proses
penjualan. Tugas asosiasi dalam data mining adalah Untuk menemukan atribut yang
muncul dalam waktu. Salah satu implementasi dari Asosiasi adalah market basket
analysis atau Analisis keranjang belanja, sebagaimana yang Akan dibahas dalam
penelitian ini.

Anda mungkin juga menyukai