Anda di halaman 1dari 3

Tugas Pertemuan 1 Data Mining

Rifai 20210801403
Agus Kharir Andriana 20180801295
Irvan Eksa Mahendra 20210801371

Teknik Informatika

1. Evolusi Teknologi Sistem Database


a) Hierarchical Database •1970-1980an •Menggambarkan kumpulan record yang
dihubungkan satu sama lain melalui hubungan berdasarkan pointer yang membentuk
struktur pohon.
b) Network database •1970-1980an •Merupakan database yang terdiri atas kumpulan
record yang dihubungkan melalui pointer yang membentuk relasi antar record dalam
bentuk ring. Model ini mempunyai banyak kelemahan, yaitu tidak memungkinkan banyak
relasi. Fleksibelitas dalam menambah atau menyisipkan record sangat rendah dan
kompleks.
c) Relational database •1980-now •Pada model ini data terorganisir dengan baik dan rapi
sehingga dapat dengan mudah dimanipulasi untuk menghasilkan suatu informasi.
d) Object oriented dan multimedia database (OOD) •1990an-now •OOD merupakan
tanggapan terhadap perkembangan teknik pemograman berorientasi objek yang
menekankan kepada objek, atribut dan metode. Dalam beberapa hal OOD sangat berbeda
dengan sistem database sebelumnya, bahkan juga sudah mulai dikembangkan perpaduan
OOD dengan relational database.
e) Web database •1990an-now •Merupakan tempat penyimpanan database atau informasi
yang secara dinamis berinteraksi dengan halaman web.
f) Data warehouse •1990-now •Merupakan database dengan peralatan pembuatan laporan
dan query yang menyimpan data kini dan data history yang dipadukan dari berbagai
sistem operasional.
g) Big Data •2000 – now •sekumpulan data yang memiliki skala besar sehingga tidak dapat
diproses menggunakan alat tradisional biasa dan harus menggunakan cara maupun alat
baru untuk mendapatkan nilai dari data ini, bisa dengan cara di clustering, partisi, dan
digudangkan pada data warehouse.

2. Tahapan Proses KDD (Knowladge Discovery In Database)


a) Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap
penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk
proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
b) Pre-processing/Cleaning
Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang
inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
c) Transformastion
Merupakan proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai
untuk proses data mining. Proses ini merupakan proses kreatif dan sangat tergantung pada
jenis atau pola informasi yang akan dicari dalam basis data.
d) Data Mining
Proses Data mining yaitu proses mencari pola atau informasi menarik dalam data terpilih
dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam
data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat
bergantung pada tujuan dan proses KDD secara keseluruhan.
e) Interpretation/Evaluation
Tahap ini merupakan bagian dari proses KDD yang mencakup pemeriksaan apakah pola
atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada
sebelumnya.
f) Knowledge Presentation
Merupakan proses tahap terakhir, Dalam hal ini digunakan teknik visualisasi yang
bertujuan membantu user dalam mengerti dan menginterpretasikan hasil dari
penambangan data.

3. Fungsionalitas Data Mining


a) Association
Merupakan proses mengidentifikasi relasi (hubungan) dari setiap kejadian atau peristiwa
yang sudah terjadi pada suatu waktu tertentu.
b) Classification
Berfungsi untuk menyimpulkan beberapa definisi karakteristik pada suatu grup atau
kelompok. Contohnya adalah pelanggan yang berpindah layanan disebabkan karena kalah
bersaing dengan pelanggan lain.
c) Clusterization
Merupakan proses mengidentifikasi kelompok dari produk ataupun barang yang memiliki
karakteristik khusus.
d) Descriptive
 Merupakan fungsi untuk tujuan memahami lebih dalam mengenai data, sehingga anda
dapat mengamati setiap perubahan perilaku pada informasi tersebut.
e) Forecasting
Merupakan teknik peramalan data yang dilakukan untuk memperoleh gambaran
mengenai nilai suatu data di masa yang akan datang sesuai pengumpulan informasi
dengan jumlah informasi yang besar. Contoh penerapan forecasting adalah data terkait
peramalan jumlah dosen yang masuk pada perguruan tinggi negeri.
f) Predictive
Adalah fungsi yang digunakan untuk menjelaskan suatu proses dalam menentukan sebuah
pola tertentu pada suatu data. Pola tersebut digunakan oleh berbagai variabel yang ada
pada data tersebut.
g) Sequencing
Adalah proses identifikasi tiap hubungan yang berbeda pada periode waktu tertentu.
Contoh dari sequencing sendiri adalah pelanggan yang mengunjungi sebuah pertokoan
secara terus – menerus (berulang).
4. Teknologi Data Mining
 Data mining adalah suatu proses pengerukan atau pengumpulan informasi penting dari
suatu data yang besar.
 Teknik dalam Proses Penambangan Data
a) Predictive Modeling, Terdapat dua teknik yaitu Classification dan Value Prediction
b) Database Segmentation, Melakukan partisi database menjadi sejumlah segmen, cluster,
atau record yang sama.
c) Link analysis, Sebuah teknik untuk membuat hubungan antara record yang individu atau
sekumpulan record dalam database.
d) Deviation detection, Sebuah teknik untuk mengidentifikasi outlier yang
mengekspresikan sebuah deviasi dari ekspektasi yang sudah diketahui sebelumnya.
e) Nearest Neighbour, Yaitu teknik yang memprediksi pengelompokan, Teknik ini sendiri
merupakan teknik yang tertua yang digunakan dalam data mining.
f) Clustering, merupakan teknik untuk mengklasifikasikan data berdasarkan kriteria
masing-masing data.
g) Decision Tree, Merupakan teknik generasi selanjutnya, dimana teknik ini adalah sebuah
model prediktif yang dapat digambarkan seperti pohon. Setiap node yang terdapat dalam
struktur pohon tersebut mewakili sebuah pertanyaan yang digunakan untuk
menggolongkan data. 

5. Masalah dalam Data Mining


a) Metodologi Mining
 Menambang berbagai jenis pengetahuan dari berbagai tipe data
 Kinerja: efisiensi, efektivitas, dan skalabilitas
 Evaluasi pola: masalah ketertarikan
 Memasukkan pengetahuan latar belakang
 Menangani kebisingan dan data yang tidak lengkap
 Metode penambangan paralel, terdistribusi dan tambahan
 Integrasi pengetahuan yang ditemukan dengan yang ada: fusi pengetahuan

b) User Interaction
 Bahasa kueri penambangan data dan penambangan ad-hoc
 Ekspresi dan visualisasi hasil penambangan data
 Penambangan pengetahuan interaktif di berbagai tingkatan abstraksi
c) Aplication and Social Impacts
 Penambangan data khusus domain & penambangan data tak terlihat
 Perlindungan keamanan data, integritas, dan privasi

Anda mungkin juga menyukai