Anda di halaman 1dari 4

TUGAS SESI 2

DATA MINING EU101


Preparasi Data

Teknik Informatika

Disusun Oleh :
Cindy Ariani Pasha
20200801379
1. Gambar dan jelaskan (dalam 1-2 halaman) tahapan KDD! (petunjuk Chapter 1 hal 7)
2. Gambar dan jelaskan teknologi data mining dalam 1 halaman (sub chapter 1.5)
Jawab :

1. Sejarah dan Penerapan Data Mining (petunjuk Chapter 1 hal 7)


Evolution of Sciences
a) Sebelum 1600: Empirical science
Disebut sains kalau bentuknya kasat mata.
b) 1600-1950: Theoretical science
Disebut sains kalau bisa dibuktikan secara matematis atau eksperimen
Jim Gray and Alex Szalay, The World Wide Telescope:
An Archetype for Online Science, Comm. ACM, 45(11): 50-54, Nov. 2002
c) 1950s-1990: Computational science
 Seluruh disiplin ilmu bergerak ke komputasi
 Lahirnya banyak model komputasi
d) 1990-sekarang: Data science
 Kultur manusia menghasilkan data besar
 Kemampuan komputer untuk mengolah data besar
 Datangnya data mining sebagai arus utama sains
2. Teknologi data mining (petunjuk chapter 1 hal 5)
Penambangan data (Data Mining) adalah studi tentang mengumpulkan,
membersihkan, memproses, menganalisis, dan mendapatkan wawasan berguna dari
data. Terdapat variasi yang luas dalam hal masalah domain, aplikasi, formulasi, dan
representasi data yang ditemui dalam aplikasi nyata. Oleh karena itu, "data mining"
adalah istilah umum yang digunakan untuk menggambarkan berbagai aspek
pemrosesan data ini.
Di zaman modern, hampir semua sistem otomatis menghasilkan beberapa
bentuk data baik untuk tujuan diagnostik atau analisis. Hal ini mengakibatkan banjir
data, yang telah mencapai urutan pentabyte atau hexabyte.

Beberapa contoh dari jenis data yang berbeda adalah sebagai berikut:
a. World Wide Web
Jumlah dokumen di Web yang diindeks sekarang mencapai miliaran,
dan web tak terlihat jauh lebih besar. Akses pengguna ke dokumen tersebut
membuat log akses web di server dan profil perilaku pelanggan di situs
komersial. Lebih jauh lagi, struktur tertaut dari web disebut sebagai grafik web,
yang dengan sendirinya merupakan sejenis data. Jenis data yang berbeda ini
berguna dalam berbagai aplikasi. Misalnya, dokumen web dan struktur tautan
dapat ditambang untuk menentukan asosiasi antara topik yang berbeda di web.
Di sisi lain, log akses pengguna dapat ditambang untuk menentukan pola
akseses yang sering atau pola yang tidak biasa dari perilaku yang mungkin tidak
beralasan.
b. Interaksi keuangan
Transaksi paling umum dalam kehidupan sehari-hari, seperti
menggunakan kartu anjungan tunai mandiri (ATM) atau kartu kredit, dapat
membuat data dengan cara otomatis. Transaksi semacam itu dapat ditambang
untuk banyak wawasan berguna seperti penipuan atau aktivitas tidak biasa
lainnya.
c. Interaksi pengguna
Banyak bentuk interaksi pengguna membuat volume data yang besar.
Misalnya, penggunaan telepon biasanya membuat catatan di perusahaan
telekomunikasi dengan detail tentang durasi dan tujuan panggilan. Banyak
perusahaan telepon secara rutin menganalisis data tersebut untuk menentukan
pola perilaku yang relevan yang dapat digunakan untuk membuat keputusan
tentang kapasitas jaringan, promosi, harga, atau penargetan pelanggan.

d. Teknologi sensor dan Internet of Things


Tren baru-baru ini adalah pengembangan sensor wearable berbiaya
rendah, smartphone, dan perangkat pintar lainnya yang dapat berkomunikasi
satu sama lain. Diperkirakan, jumlah perangkat tersebut melebihi jumlah orang
di planet ini pada tahun 2008. Implikasi dari pengumpulan data besar-besaran
tersebut sangat penting untuk algoritma penambangan.

Anda mungkin juga menyukai