Tugas 1 DM - Yossy Andriani (2022210093P)

TUGAS 1
PENGANTAR DATA MINING
Nama : Yossy Andriani

NPM : 2022210093P
Kelas : Karyawan
Jurusan : Sistem Informasi
Dosen : Abdul Kholik, S.Kom., M.Cs
UNIVERSITAS INDO GLOBAL MANDIRI

TAHUN AJARAN 2022 - 2023
Tugas 1 Pengantar Data Mining
1. Apa yang anda ketahui tentang data mining dan mengapa ada data mining?
Jawaban:
Yang saya ketahui tentang data mining adalah teknologi yang merupakan
campuran metode-metode analisis data dengan algoritme-algoritme untuk memproses
data berukuran besar. Selain itu menurut para ahli, sebagian ahli menyatakan data
mining adalah langkah analisis terhadap proses penemuan pengetahuan dalam basis
data atau knowledge discovery in database yang disingkat KDD (suyanto, 2019).
Pengetahuan bisa berupa pola data atau relasi antar data yang valid(yang tidak
diketahui sebelumnya).
Data mining merupakan gabungan sejumlah disiplin ilmu komputer yang
didefinisikan sebagai penemuan pola-pola baru dari kumpulan data sangat besar,
meliputi metode-metode yang merupakan irisan dari AI, Machine learning, Statistik
dan database system (ACM 2006). Data Mining ditujukan untuk mengekstrak
(mengambil intisari) pengetahuan dari sekumpulan data sehingga didapatkan struktur
yang dapat dimengerti manusia (ACM 2006) serta meliputi basis data dan manajemen
data, pra pemrosesan data, pertimbangan model dan inferensi, ukuran ketertarikan,
pertimbangan kompleksitas, pasca pemrosesan terhadap struktur yang ditemukan,
visualisasi, dan online updating (ACM 2006).
Data mining telah banyak diaplikasikan dalam berbagai bidang, diantaranya
dalam bidang bisnis dan kedokteran. Dalam bidang bisnis, teknik data mining
digunakan untuk mendukung cakupan yang luas dari aplikasi-aplikasi bisnis intelijen
seperti customer profiling, targeted marketing, workflow management, store layout
dan fraud detection.
Mengapa ada data mining?

Data mining ada karena diperlukan untuk mengatasi adanya sejumlah data besar
yang dapat digunakan untuk menghasilkan informasi dan knowledge yang berguna.
Informasi dan knowledge yang didapat tersebut dapat digunakan pada banyak bidang,
mulai manajemen bisnis, control produksi, kesehatan, dan lain-lain.
Beberapa tahun terakhir, data semakin heterogen dan kompleks dengan volume
yang meningkat cepat secara eksponensial. Menurut John Gantz dan David Reinsel
dalam investigasi yang dilakukan di IDC, volume data pada tahun 2011 mencapai 1,8
zettabyte atau 1,8 triliun gigabyte, pada tahun 2012 meningkat lebih dari 50% menjadi
2,8 zettabytes (Gantz et al. 2012). Pada tahun 2013 volume data sudah menjadi 4,4
zettabytes, dan akan terus meningkat dengan cepat hingga diperkirakan mencapai 44
zettabytes di tahun 2020 (Turner 2014). Oleh karena itu, saat ini dikenal istilah big
data, yang menggambarkan volume data sangat besar, terstruktur maupun tidak
terstruktur, yang membanjiri dunia bisnis. Namun, big data dapat dianalisis sehingga
perusahaan dapat mengambil keputusan- keputusan strategis bisnis dengan lebih baik.
Dalam big data, tentu saja akan kesulitan membaca dan mengetahui pola-pola dan
relasi-relasi data jika dilakukan secara manual atau konvensional. Sebagai contoh,
suatu perusahaan operator seluler dengan ratusan juta pelanggan, dalam setahun bisa
menghasilkan miliaran data penggunaan komunikasi suara, SMS, dan internet. Dari
miliaran data tersebut, bagaimana menemukan pola-pola pelanggan dalam
menggunakan komunikasi suara, SMS, dan internet? Pola tersebut bisa dilihat dalam
suatu periode tertentu, misalnya bulan, minggu, hari, bahkan jam. Bagaimana
klasifikasi/ segmentasi pelanggan? Bagaimana relasi antara komunikasi suara, SMS,
dan internet? Bagaimana pola komunikasi antara pelanggan seluler di suatu operator
dengan pelanggan operator lain? Semua pertanyaan tersebut tentu saja sulit dijawab
jika analisis data dilakukan secara konvensional.
Selain itu mengapa perlu data mining karena berdasarkan kegunaan data mining
Secara umum, kegunaan data mining dapat dibagi menjadi dua deskriptif dan prediktif.
Deskriptif berarti data mining digunakan untuk mencari pola-pola yang dapat
dipahami manusia yang menjelaskan karakteristik data. Sedangkan prediktif berarti
data mining digunakan untuk membentuk sebuah model pengetahuan yang akan
digunakan untuk melakukan prediksi. Kemudia berdasarkan fungsionalitasnya, tugas-
tugas data mining bisa dikelompokkan ke dalam enam kelompok berikut ini (Fayyad
et al. 1996):
 Klasifikasi (classification): men-generalisasi struktur yang diketahui untuk
diaplikasikan pada data-data baru. misalkan, klasifikasi penyakit ke dalam sejumlah
jenis, klasifikasi email ke dalam spam atau bukan.
 Klasterisasi (clustering): mengelompokkan data, yang tidak diketahui label
kelasnya, ke dalam sejumlah kelompok tertentu sesuai dengan ukuran
kemiripannya.
 Regresi (regression): menemukan suatu memodelkan data dengan galat (kesalahan
prediksi) seminimal mungkin.
 Deteksi anomali (anomaly detection): mengidentifikasi data yang tidak umum, bisa
berupa outlier (pencilan), perubahan atau deviasi yang mungkin sangat penting dan
perlu investigasi lebih lanjut.
 Pembelajaran aturan asosiasi (association rule learning) atau pemodelan
ketergantungan (dependency modeling): mencari relasi antar variabel.
 Perangkuman (summarization): menyediakan representasi data yang lebih
sederhana, meliputi visualisasi dan pembuatan laporan.

Tugas 1 DM - Yossy Andriani (2022210093P)

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Tugas 1 DM - Yossy Andriani (2022210093P)

Diunggah oleh

Hak Cipta:

Format Tersedia

TUGAS 1

PENGANTAR DATA MINING

Nama : Yossy Andriani

UNIVERSITAS INDO GLOBAL MANDIRI

Mengapa ada data mining?

Anda mungkin juga menyukai