CIS62283 01 Pendahuluan
CIS62283 01 Pendahuluan
Introduction – Overview
Database
systems
Tugas
Data
Mining
• PredicAon
Methods
• Menggunakan
beberapa
variabel
untuk
memprediksi
nilai
yang
Adak
diketahui
atau
nilai
di
masa
mendatang
dari
variabel
lain.
• DescripAon
Methods
• Menemukan
bentuk
yang
mampu
diarAkan
manusia
(human-‐
interpretable
pa7erns)
yang
dapat
menjelaskan
data
tertentu.
From
[Fayyad,
et.al.]
Advances
in
Knowledge
Discovery
and
Data
Mining,
1996
Data
Mining
Tasks...
• ClassificaAon
[PredicAve]
• Clustering
[DescripAve]
• AssociaAon
Rule
Discovery
[DescripAve]
• Regression
[PredicAve]
• SequenAal
PaOern
Discovery
[DescripAve]
Classi7ication:
De7inition
• Jika
terdapat
sekumpulan
record
(training
set
)
• SeAap
record
terdiri
dari
sekumpulan
a7ributes,
satu
dari
atribut
bisa
merupakan
class.
• Tentukan
suatu
model
untuk
atribut
class
sebagai
suatu
fungsi
nilai
dari
atribut
lain.
• Tujuan:
menentukan
class
dari
sebuah
data
seakurat
mungkin.
• Suatu
test
set
digunakan
untuk
menentukan
keakuratan
suatu
model.
Umumnya,
data
set
yang
diberikan
dibagi
ke
dalam
training
sets
dan
test
sets,
training
set
digunakan
untuk
membentuk
model
dan
test
set
digunakan
untuk
mengujinya.
Classi7ication
Example
Tid Refund Marital Taxable
Status Income Cheat
• Network
Intrusion
DetecAon
Typical network traffic at University level may reach over 100 million connections per day
Tantangan
Data
Mining
• Scalability
• Dimensionality
• Complex
and
Heterogeneous
Data
• Data
Quality
• Data
Ownership
and
DistribuAon
• Privacy
PreservaAon
• Streaming
Data
Any
Questions?
Data
Mining
di
Jurusan
SI
• Fokus
SI
à
lingkungan
bisnis
• SDM,
proses,
data,
informasi,
bisnis,
dan
teknologi
informasi
• PerhaAan
utama
SI
• Mempelajari
perilaku
user
• DBMS
• Perkembangan
teknologi
dan
informasi
• Bidang
terkait
• Database
Management
System
• Management
InformaAon
System
• Data
Mining
• Decission
Support
Systems
Data
Mining
di
Jurusan
SI
• Sistem
Informasi
diimplementasikan
dalam
sebuah
Organisasi
untuk
men-‐support
dan
meningkatkan
Proses
Bisnis
• SI
berperan
penAng
untuk
membuat
dan
meningkatkan
performansi
dari
proses
bisnis
menjadi
lebih
baik
• Data
Mining
di
SI
difokuskan
untuk
mempelajari
metode-‐
metode
dalam
menggali
data
untuk
perkembangan
organisasi
• Analisis
sejumlah
besar
data
untuk
menghasilkan
informasi
tersembunyi
• ClassificaAon
• Clustering
• Regression
Tugas
Pendahuluan
• Cari
informasi
mengenai
suatu
penerapan
data
mining
yang
telah
dikemas
menjadi
produk
perangkat
lunak.
Uraikan
penjelasan
mengenai
data
mining
task
dari
produk
tersebut!
• Cari
informasi
mengenai
perangkat
lunak
yang
merupakan
tools
untuk
melakukan
data
mining.
Uraikan
penjelasan
mengenai
data
mining
task
yang
didukung
oleh
tools
tersebut!
Tugas
Pendahuluan
• Kirim
tugas
melalui
Google
Classroom
dengan
kode:
3fz2qik
• Nama
file:
DMSI01-6A-NIM
• Tugas
diterima
paling
lambat:
Selasa,
04
Februari
2020
11:59
Any
Questions?