Dosen Pengampu:
1. Ariyandi (3202202050)
2. Seif Raydelfo (3202202048)
3. Septia Rizki (3202202049)
4. Alyasha Syifa (3202202047)
2024
KATA PENGANTAR
Puji syukur kehadirat Allah SWT. Yang telah memberikan rahmat dan hidayah-
Nya sehingga kami dapat menyusun dan menyelesaikan tugas makalah yang berjudul
“Data Mining” dengan baik dan selesai tepat waktunya.
Penulis
2
DAFTAR ISI
KATA PENGANTAR .................................................................................................. 2
BAB I PENDAHULUAN ............................................................................................ 4
1.1. Latar Belakang ............................................................................................... 4
1.2. Rumusan Masalah .......................................................................................... 5
1.3. Tujuan ............................................................................................................. 5
BAB II PEMBAHASAN .............................................................................................. 7
2.1. Pengertian Data Mining .................................................................................. 7
2.2. Tujuan Data Mining ....................................................................................... 7
2.3. Metode data mining ........................................................................................ 9
2.4. Tahapan Data Mining ................................................................................... 10
2.5. Penerapan data mining ................................................................................. 11
BAB III PENUTUP .................................................................................................... 13
3.1. Kesimpulan ................................................................................................... 13
DAFTAR PUSTAKA ................................................................................................. 14
3
BAB I
PENDAHULUAN
Dalam era digital saat ini, pertumbuhan jumlah data yang dihasilkan
setiap hari semakin menggila. Dengan munculnya teknologi-teknologi
baru seperti Internet of Things (IoT), sensor-sensor yang terhubung, dan
penggunaan media sosial yang semakin meluas, aliran data dari
berbagai sumber menjadi semakin melimpah. Data-data ini terdiri dari
informasi bisnis seperti transaksi penjualan, data penggunaan
pelanggan, hingga data sensor dari perangkat IoT yang mencatat
berbagai parameter lingkungan. Selain itu, data dari media sosial juga
menjadi sumber informasi yang sangat kaya, mencakup preferensi
pengguna, perilaku, dan tren yang sedang berkembang.
4
dan pasar, mengoptimalkan proses bisnis, atau bahkan meningkatkan
kualitas pelayanan. Misalnya, sebuah perusahaan ritel dapat
menggunakan data mining untuk menganalisis pola pembelian
pelanggan dan menyesuaikan strategi penjualan mereka. Begitu pula
dalam dunia medis, data mining dapat digunakan untuk menganalisis
rekam medis pasien dan mengidentifikasi pola yang mungkin menjadi
indikator penyakit tertentu.
1.3. Tujuan
5
3. Menganalisis tantangan yang dihadapi dalam
mengimplementasikan teknik data mining dan upaya-upaya
yang dilakukan untuk mengatasi tantangan tersebut.
6
BAB II
PEMBAHASAN
Data mining adalah proses pengumpulan dan pengolahan data yang bertujuan
untuk mengekstrak informasi penting pada data. Proses pengumpulan dan
ekstraksi informasi tersebut dapat dilakukan menggunakan perangkat lunak
dengan bantuan perhitungan statistika, matematika, ataupun teknologi
Artificial Intelligence (AI). Data mining sering disebut juga Knowledge
Discovery in Database (KDD).
Data mining dilakukan untuk memenuhi beberapa tujuan tertentu. Berikut ini
adalah tujuan-tujuan dari data mining:
a) Sebagai sarana menjelaskan (Explanatory)
Data mining dapat digunakan sebagai sarana untuk menjelaskan suatu
kondisi penelitian.
7
data memiliki fungsi lain seperti asosiasi, klasifikasi, clustering, forecasting dan
sequencing.
a) Deskriptif
Deskriptif lebih kepada merujuk ke fungsi dalam pemahaman data, hal
ini membuat pengolahnya bisa teliti lebih mendalam. Tujuan dari proses
ini adalah untuk menemukan pola dan karakteristik yang terdapat pada
data. Fungsi deskriptif dimanfaatkan sebagai pattern tertentu yang
awalnya tidak terlihat di dalam data.
b) Prediktif
Fungsi terkait dengan proses yang nantinya digunakan untuk
mengetahui pola khusus dari data yang digunakan. Pola ini bisa
ditemukan dari beberapa variabel dalam data, ketika sudah menemukan
pola, maka pola yang digunakan dipakai untuk memperkirakan variabel
lain dan masih belum diketahui nilainya karena itu disebut fungsi
prediktif.
c) Asosiasi
Fungsi asosiasi adalah fungsi data mining yang dapat diproses untuk
melakukan identifikasi relasi atau hubungan dari setiap data yang ada.
Data ini bisa merupakan data dahulu maupun data yang didapat saat ini.
d) Klasifikasi
Klasifikasi dilakukan untuk sebagai cara menyimpulkan beberapa
pengertian karakteristik dari suatu grup atau kelompok data. Seperti
data pelanggan yang tak lagi menggunakan produk, karena menganggap
produk kompetitor memberi manfaat lebih banyak dan customer value
untuk para pelanggan.
e) Clustering
8
Clustering merupakan fungsi yang mengarah pada proses identifikasi
kelompok, kemudian produk atau barang yang memiliki karakteristik
khusus. Biasanya digunakan dalam mengetahui kelompok-kelompok
tertentu dalam penyebarannya.
f) Peramalan
Disebut juga dengan teknik forecasting yang dipakai untuk
memperoleh gambaran mengenai nilai dari suatu data di masa
mendatang, Forecasting dan peramalan ini bisa dilakukan dengan
pengumpulan informasi dalam jumlah yang besar, contoh penerapan
forecasting merupakan data terkait peramalan jumlah permintaan
terhadap produk tertentu.
g) Sequencing
Sequencing merupakan fungsi terakhir dari data mining, proses
identifikasi setiap hubungan yang berbeda dalam periode waktu
tertentu. Kemudian sequencing merupakan data pelanggan ketika
melakukan repeat purchase suatu produk yang terjadi atau dilakukan
secara berulang pada pelanggan.
Secara umum, terdapat beberapa metode yang digunakan untuk melakukan data
mining. Berikut ini adalah metodenya:
• Association
Teknik yang pertama adalah association. Association adalah metode
berbasis aturan yang digunakan untuk menemukan asosiasi dan
hubungan variabel dalam satu set data. Biasanya analisis ini terdiri dari
pernyataan “if atau then” sederhana. Association banyak digunakan
dalam mengidentifikasi korelasi produk dalam keranjang belanja untuk
memahami kebiasaan konsumsi pelanggan. Sehingga, perusahaan dapat
9
mengembangkan strategi penjualan dan membuat sistem rekomendasi
yang lebih baik.
• Classification
Selanjutnya classification, ia adalah metode yang paling umum
digunakan dalam data mining. Classification adalah tindakan untuk
memprediksi kelas suatu objek.
• Regression
Regression adalah teknik yang menjelaskan variabel dependen melalui
proses analisis variabel independen. Sebagai contoh, prediksi penjualan
suatu produk berdasarkan korelasi antara harga produk dengan tingkat
pendapatan rata-rata pelanggan.
• Clustering
Terakhir, metode clustering. Clustering digunakan dalam membagi
kumpulan data menjadi beberapa kelompok berdasarkan kemiripan
atribut yang dimiliki. Contoh kasusnya adalah Customer Segmentation.
Ia membagi pelanggan ke dalam beberapa grup berdasarkan tingkat
kemiripannya.
a) Mengumpulkan Data
Tahapan dari pengumpulan data ini berawal dari merapikan data mentah
dan hasilnya berupa pengetahuan atau informasi yang sudah diolah. Di
antaranya adalah data cleansing (buang data yang tak diperlukan), data
integration (proses integrasi), selection (memilih data yang relevan
sebelum proses) dan data transformation atau transformasi data yang
dipilih.
b) Menyiapkan Data
Masuk ke tahap berikutnya yaitu data mining, fungsinya untuk
mengekstrak berbagai pola yang berpotensi dalam mendapatkan data
10
yang berguna. Selain itu dilakukan juga pattern evolution sebagai pola
dari proses menarik data yang sudah ditemukan berdasarkan penekanan
yang diberikan. Knowledge presentation dengan visualisasi data.
c) Proses Modeling
Memasuki proses penambangan data dengan menerapkan predictive
modeling yang terdiri dari dua teknik, yakni classification dan value
prediction. Adapula database segmentation, merupakan partisi database
menjadi sejumlah bagian atau segmen, hingga cluster atau perekaman
yang sama. Digunakan pula link analysis untuk menghubungkan record
satu dengan lainnya.
d) Evaluasi Data
Menggunakan teknik deviation detection, yakni identifikasi outlier
dengan mengekspresikan deviasi dari ekspektasi yang ada. Kemudian
dilakukan nearest neighbour yang dipakai untuk memprediksi
pengelompokan, teknik tertua dalam data mining. Dan terakhir
clustering, mengklasifikasikan data berdasarkan kriteria masing-
masing.
e) Penyajian Data
Digunakan model prediktif seperti decision tree, digambarkan layaknya
seperti pohon karena setiap node di dalam struktur pohon mewakili
sebuah pertanyaan yang digunakan untuk menggolongkan data bisa
didapat dari jurnal data mining.
11
Dalam sektor bisnis, biasanya data mining digunakan untuk pemasaran,
analisis pasar, dan analisis kebutuhan pelanggan.
12
BAB III
PENUTUP
3.1. Kesimpulan
Dalam era digital saat ini, jumlah data yang dihasilkan secara terus-
menerus semakin meningkat dengan cepat, didorong oleh teknologi baru seperti
Internet of Things (IoT) dan media sosial. Data-data ini meliputi informasi
bisnis, perilaku pelanggan, serta data sensor dari berbagai perangkat. Namun,
memiliki sejumlah besar data saja tidak memberikan nilai tambah tanpa analisis
yang tepat. Di sinilah pentingnya penggunaan teknik data mining.
13
DAFTAR PUSTAKA
https://www.sampoernauniversity.ac.id/id/data-mining/
https://www.dicoding.com/blog/apa-itu-data-mining/
14
BERIKUT BEBERAPA KESIMPULAN DARI KELOMPOK 4
1. ARIYANDI
Kesimpulan : Pertumbuhan data digital yang cepat membutuhkan teknik data
mining untuk menggali nilai dari data tersebut: Dalam era digital yang dipenuhi
dengan aliran data yang melimpah, penting untuk memiliki alat dan teknik yang
efektif untuk menganalisis dan mengekstrak informasi yang berharga dari data
tersebut. Tanpa teknik seperti data mining, data hanya akan menjadi
sekumpulan angka dan teks yang tidak berarti. Oleh karena itu, penggunaan
data mining menjadi krusial untuk memahami dan memanfaatkan potensi dari
setiap bit data yang dihasilkan.
2. SEIF RAYDELFO
Kesimpulan : Data mining adalah proses penting dalam mengidentifikasi pola
tersembunyi dan hubungan kausal dari berbagai sumber data: Data mining
bukan hanya sekadar mencari pola yang terlihat, tetapi juga mengeksplorasi
hubungan yang mungkin tidak jelas secara langsung. Ini memungkinkan
organisasi untuk menemukan pola-pola yang tersembunyi, hubungan kausal
yang tidak terduga, dan tren yang dapat membantu dalam pengambilan
keputusan yang lebih baik.
3. SEPTIA RIZKI
Kesimpulan : Penerapan data mining dapat memberikan wawasan baru tentang
pelanggan, mengoptimalkan proses bisnis, dan meningkatkan kualitas layanan:
Dengan memanfaatkan data mining, organisasi dapat memahami perilaku
pelanggan dengan lebih baik, mengidentifikasi preferensi dan kebutuhan
mereka, dan meningkatkan pengalaman pelanggan secara keseluruhan. Selain
itu, data mining juga dapat digunakan untuk mengoptimalkan proses bisnis,
mengidentifikasi efisiensi dan ketidaksempurnaan, serta meningkatkan
produktivitas dan keuntungan.
4. ALYASHA SYIFA
15
Kesimpulan : Meskipun memiliki potensi besar, penerapan data mining juga
dihadapkan pada tantangan seperti kualitas data yang buruk dan kompleksitas
algoritma: Meskipun data mining menawarkan banyak manfaat, penerapannya
juga dihadapkan pada beberapa tantangan yang perlu diatasi. Salah satunya
adalah masalah kualitas data yang buruk, yang dapat mengganggu proses
analisis dan menghasilkan hasil yang tidak akurat. Selain itu, kompleksitas
algoritma dan kebutuhan akan infrastruktur yang kuat juga menjadi tantangan
dalam menerapkan data mining secara efektif.
16