1514620003-M. Yanuar Ihsan - Sie 1

Nama : Muhamad Yanuar
Ihsan
NIM : 1514620003
Sesi :1
KONSEPDATA MINING
Manusiamemproduksiberagamdatayangjumlahdanukurannyasangatbesar.Data
tersebutmulaitumbuhkarenaadanyatsunamidatayangdimulaisejakweb
2.0. Agar data-data tersebut dapat memiliki makna dan bernilai, maka data
harusdiolahmenjadipengetahuan.Denganpengetahuantersebutmanusiadapatmelaku
kan estimasi dan prediksi apa yang terjadi di depan, melakukan analisistentang
asosiasi, korelasi, dan pengelompokkan antar data dan atribut,
membantupengambilankeputusan dan pembuatan kebijakan.
Untuk dapat mengubah data menjadi pengetahuan, digunakan data

mining.Dataminingmerupakandisiplinilmuyangmempelajarimetodeuntukmengekst
rakpengetahuan atau menemukan pola dari suatu data yang besar. Menurut para
ahli,dataminingdapat diartikan:
 Melakukan ekstraksi untuk mendapatkan informasi penting yang

sifatnyaimplisit dan sebelumnya tidak diketahui, dari suatu data (Witten et
al.,2011).
 Kegiatanyangmeliputipengumpulan,pemakaiandatahistorisuntukmenemuk
anketaraturan,pola,danhubungandalamsetdataberukuranbesar(Santosa,200
7).
Alurprosesdatamining:Data–Informasi–Pengetahuan
1. Data:faktayangterekamdantidakmembawaarti
2. Informasi:rekap,rangkuman,penjelasandanstatistikdaridata
3. Pengetahuan:pola,rumus,aturanataumodelyangmunculdaridata
Melaluipengetahuantersebut,dapatdibuatkebijakanuntukmemperbaikisistemyangt
elah berlaku.
Contoh:PrediksiKelulusanMahasiswa
Puluhan ribu data mahasiswa di kampus yang diambil dari sistem

informasiakademik. Data tersebut diolah menggunakan algoritma sehingga
menghasilkanpola.Daripola tersebutdapatdiperolehprediksi mahasiswayang
akanlulus.
Contoh lainnya penggunaan data mining seperti penentuan kelayakan

kredit,deteksi pencucian uang, prediksi kebakaran hutan, profiling dan prediksi
koruptor,polaaturan asosiasi dari data transaksi, danlain sebagainya.
Pengetahuan yang dihasilkan dari data dapat membuat “stupid

application”menjadi“smart apps”, misalnya:
 Sisteminformasiakademiksistemprediksikelulusanmahasiswa
 Sistem pencatatanpemilusistemprediksihasilpemilu
 Sistemlaporankekayaanpejabatsistemprediksikoruptor
 Sistem pencatatan kredit sistem penentu kelayakan
kreditPerusahaanpengelolapengetahuan:
 Uber,perusahaanarmada taksiterbesartapitidakmemilikikendaraan
 Google,perusahaanmediaterbesar tapitidakmemilikikonten
 Alibab,retailerterbesar tapitidak memilikitoko
 Airbnb,perusahaanpenyediaakomodasiterbesar
tetapitidakmemilikiakomodasisendiri
SejarahDataMining
 Sebelum1600:EmpiricalScience.Disebutempiriticalkarenabentuknyatidakk
asat mata
 1600-1950: Theoretical Science. Disebut theoritical karena
dapatdibuktikansecaramatematis atau eksperimen
 1950-
1990:ComputationalScience,seluruhdisiplinilmubergerakkekomputasi.
Padatahun ini lahir banyakmodel komputasi.
 1990-sekarang: Data Science, kultur manusia menghasilkan data
besar,kemampuan komputer untuk mengolah data besar, datangnya data
miningsebagaiarus utama science.
DataMining TasksandRoles
1. Datasource:paper,files,webdocuments,scientificexperiments,databasesyste
ms(dilakukan olehbagianIT/DBA)
2. Dataprocessing,dataintegration,datawarehouse
3. Dataexploration:statisticalsummary,metadata,anddescription(dilakukanDat
aScientist)
4. Datamining:information discoveryandmodeling
5. Datapresentation:visualizationtechniques(dilakukanolehBussinessAnalyst)
6. DecisionMaking(dilakukan olehEndUser)
Masalah-MasalahdiDataMining
1. Databesar
2. Atributdatabanyak
3. Datakompleksdanberanekaragam
4. Penerapannyabaru
PeranUtamaDataMining(Larose,2005)
1. Estimasi,misal estimasi
waktupengirimanpizza,estimasiperformansiCPU.Metodeyangdigunakanse
pertiLinearRegression(LR),NeuralNetwork(NN), dan sebagainya.
2. Forecasting,misalforecastinghargasaham,nilaitukaruang,tingkatinflasi,dans
ebagainya.
3. Klasifikasi,misalklasifikasikelulusanmahasiswa,sentimenanalisis,kebankru
tanperusahaan.Metode yangdigunakansepertiDecisionTree.
4. Klastering,misalklusteringbungairis,jenispelanggan,tingkatkemiskinan.Met
ode yangdigunakansepertiK-Means,K-Medoids,dansebagainya.
5. Asosiasi, misal aturan asosiasi pembelian barang. Metode yang
digunakanseperti FP-Growth.
MetodeLearningAlgoritma DataMining
1. SupervisedLearning
- Pembelajarandengan guru,datasetmemilikitarget/label/kelas
- Sebagianbesaralgoritma dataminingadalahsupervisedlearning
- Algoritmamelakukanprosesbelajarberdasarkannilaidarivariabeltargetyan
gterasosiasi dengannilai darivariabel prediktor
2. Semi-supervisedLearning
- Menggunakan data dengan label dan tidak berlabel sekaligus
dalamprosespembelajarannya
- Datayangmemilikikelasdigunakanuntukmembentukmodel(pengetahuan)
,datatanpalabeldigunakanuntukmembuatbatasanantarakelas
3. UnsupervisedLearning
- Variabel(atribut)yangmenjaditarget/label/kelastidakditentukan
- Algoritmadataminingmencaripola darisemuavariabel(atribut)
- Algoritmaclusteringadalahalgoritmaunsupervisedlearning

1514620003-M. Yanuar Ihsan - Sie 1

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

1514620003-M. Yanuar Ihsan - Sie 1

Diunggah oleh

Hak Cipta:

Format Tersedia

Nama : Muhamad Yanuar

Untuk dapat mengubah data menjadi pengetahuan, digunakan data

 Melakukan ekstraksi untuk mendapatkan informasi penting yang

Puluhan ribu data mahasiswa di kampus yang diambil dari sistem

Contoh lainnya penggunaan data mining seperti penentuan kelayakan

Pengetahuan yang dihasilkan dari data dapat membuat “stupid

Anda mungkin juga menyukai