Anda di halaman 1dari 42

Universitas Muslim Indonesia

Makassar, Indonesia

DATA

STATISTIKA (2PPA 307) Herdianti Darwis


Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Datum berarti fakta.


Data adalah bentuk jamak dari datum.

Kategori Dapat disimpulkan bahwa:


Data

Data adalah Kumpulan dari fakta-fakta, baik


berupa angka, karakter, simbol, gambar,isyarat,
Kualitas tulisan, suara, bunyi, dll.
Data

Himpunan Data (Dataset)


adalah kumpulan dari objek dan atributnya.
Eksplorasi
Data
Herdianti Darwis 1
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi

Atribut
Kategori
Data Atribut
adalah sifat atau karakteristik dari suatu objek.

Kualitas Contoh: warna mata, suhu, tinggi badan,


Data pendapatan, keuntungan, dll.

Eksplorasi Atribut = Variabel, field, fitur, dimensi


Data
Herdianti Darwis 2
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi

Objek
Kategori
Data Objek
adalah kumpulan dari atribut

Kualitas
Data Objek = sample, titik, entitas, record, instances

Eksplorasi
Data
Herdianti Darwis 3
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi

Kategori
Data

Tipe Atribut
Kualitas
Data

Eksplorasi
Data
Herdianti Darwis 4
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Berdasarkan tipe domainnya,

Atribut

Kategori Atribut  Atribut yang domainnya


Data Kategorik / tidak berbentuk angka
Kualitatif  Atribut yang domainnya
merupakan sebuah
himpunan simbol
Kualitas berhingga.
Data
Contoh:
Atribut Tingkat kepuasan pelanggan,
Numerik / jenis kelamin, status,
Kuantitatif pendidikan,
Eksplorasi
Data
Herdianti Darwis 5
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Berdasarkan tipe domainnya,

Atribut

Kategori Atribut  Atribut yang domainnya


Data Kategorik / berbentuk angka.
Kualitatif
 Atribut yang domainnya
berupa bilangan real
Kualitas ataupun integer.
Data
Contoh:
Atribut Umur, gaji, jarak, tinggi, dll.
Numerik /
Kuantitatif
Eksplorasi
Data
Herdianti Darwis 6
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Berdasarkan bentuknya,

Atribut

Kategori Atribut
Data Nominal
Atribut
Atribut Kategorik
Ordinal
Kualitas
Data
Atribut
Interval Atribut
Eksplorasi
Numerik
Atribut Rasio
Data
Herdianti Darwis 7
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Berdasarkan bentuknya,

Atribut

Kategori Atribut  Atribut yang nilainya tidak


Data Nominal dapat diurutkan

 Atribut mempunyai nilai


Atribut
pembeda (distintcness)
Ordinal
Kualitas
Data Contoh:
Atribut Jenis kelamin {Laki-laki,
Interval perempuan},
warna mata {coklat, biru,
Eksplorasi hijau, hitam, dll}
Atribut Rasio
Data
Herdianti Darwis 8
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Berdasarkan bentuknya,

Atribut

Kategori Atribut  Atribut yang nilainya


Data Nominal dapat diurutkan dengan
berbagai cara.
Atribut
 Atribut memiliki pemdeda
Ordinal
Kualitas dan urutan.
Data
Atribut Contoh:
Interval Rasa {1, 2, …10}

Eksplorasi Pendidikan {SD, SMP, …, S3}


Atribut Rasio
Data
Herdianti Darwis 9
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Berdasarkan bentuknya,


 Atribut yang disusun
Atribut dengan jarak nilai tertentu
sebagai pembeda yang
Atribut sangat berarti.
Kategori
Nominal  Angka dalam data interval
Data
menunjukkan perbedaan,
besar atau kecil, tinggi atau
Atribut rendah. Tidak dikenal nilai
Ordinal nol mutlak.
Kualitas
Data
Atribut Contoh:
Interval Tanggal, suhu dalam Celcius
dan Farenheit.
Eksplorasi “0℃ bukan berati tidak ada
Atribut Rasio suhu”
Data
Herdianti Darwis 10
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Berdasarkan bentuknya,


 Atribut yang disusun
Atribut dengan jarak nilai tertentu
sebagai pembeda yang
Atribut sangat berarti dan memiliki
Kategori
Nominal 0 mutlak
Data
 Angka dalam data rasio
juga menunjukkan
Atribut tingkatan atau perbedaan
Ordinal dengan membandingkan
Kualitas
Data nilainya, besar - kecil, tinggi
Atribut - rendah.
Interval Contoh:
Gaji, jarak, tinggi, dll.
Eksplorasi “Gaji 0 artinya tidak memiliki
Atribut Rasio gaji”
Data
Herdianti Darwis 11
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Berdasarkan jumlah nilai atributnya,

Atribut

Kategori Atribut  Atribut yang tidak dapat


Data diskrit dinyatakan dalam bentuk
pecahan.

 Atribut yang menggunakan


Kualitas nilai berhingga ataupun tak
Data berhingga yang dapat
dihitung.
Atribut
kontinu Contoh:
Eksplorasi Jumlah, zipcodes, biner.
Data
Herdianti Darwis 12
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Berdasarkan jumlah nilai atributnya,

Atribut

Kategori Atribut  Atribut yang dapat


Data diskrit dinyatakan dalam bentuk
pecahan.

 Atribut yang menggunakan


Kualitas nilai real.
Data
Contoh:
Atribut Tinggi badan, suhu, dll
kontinu
Eksplorasi
Data
Herdianti Darwis 13
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Karakteristik umum dataset,

 Jumlah atribut yang


dimiliki oleh dataset
 Data dengan dimensi kecil
Kategori Dimensionality
cenderung berbeda secara
Data kualitatif dengan data yang
berdimensi tinggi.
 Curse of dimensionality
adalah kesulitan yang
Kualitas Sparsity
ditemui yang berhubungan
Data
dengan data dimensi
tinggi.
 Dimensionality reduction
perlu dilakukan pada tahap
Eksplorasi Resolution preprocessing.
Data
Herdianti Darwis 14
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Karakteristik umum dataset,

Kategori Dimensionality  Sebuah kondisi dimana


Data kebanyakan atriut dari
sebuah objek mempunyai
nilai 0, dan kurang dari
1% mempunyai nilai tidak
Kualitas Sparsity 0.
Data
 Sparsity mempunyai
keutungan dalam waktu
komputasi dan
Eksplorasi Resolution penyimpanan.
Data
Herdianti Darwis 15
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Karakteristik umum dataset,

 Sifat dari data berbeda


pada resolusi yang berbeda.

Kategori Dimensionality
 Pola dalam data tergantung
Data pada level resolusi.

 Jika resolusi terlalu baik


(tidaka ada
Kualitas Sparsity
peredaan/halus) pola
Data
mungkin tidak akan
terlihat.

 Jika resolusi terlalu kasar,


Eksplorasi Resolution pola juga akan hilang.
Data
Herdianti Darwis 16
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Kualitas Data ditinjai dari:

Kategori Kesalahan  Mengacu pada


Data Pengukuran permasalahan hasil dari
proses pengukuran.
 Umumnya yang terjadi
adalah perbedaan nilai
Kualitas yang dituliskan dengan
Data nilai yang sebenarnya.
 Kesalahan pengukuran
Kesalahan diantaranya: Noise, Bias,
Pengumpulan Precision, Accuracy
Eksplorasi
Data
Herdianti Darwis 17
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Kualitas Data ditinjai dari:

Kategori Kesalahan  Mengacu pada


Data Pengukuran permasalahan seperti
hilangnya objek data atau
nilai atribut.
 Yang termasuk pada
Kualitas kesalahan pengumpulan
Data adalah: outliers, missing
value
Kesalahan
Pengumpulan
Eksplorasi
Data
Herdianti Darwis 18
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi Tahapan Pengolahan Data

Kategori
Data

Kualitas
Data
Sebelum algoritma diterapkan, perlu untuk memahami dan
mengosplorasi data. Mengapa?

Eksplorasi Agar dapat memilih teknik dan metode preprocessing yang


Data sesuai sehingga menghasilkan data baru yang mudah diolah.

Herdianti Darwis 19
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi
- Mean
- Median
Pemusatan data
- Modus
- Quartil 1,2,3
Kategori
Data
- Range antarkuartil
- Standar deviasi
Penyebaran data
- Variansi
- Z Score
Kualitas
Data
- Histogram & Poligon
- Quantile Plot
Grafik statistik - Quantile-Quantile Plot (QQ Plot)
Eksplorasi - Normal Quantile plot
Data
Herdianti Darwis 20
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 1. Mean

Mean atau Rata-rata 𝑿 merupakan nilai yang


diperoleh dari hasil bagi penjumlahan nilai nilai 𝒙
Kategori dengan banyaknya jumlah data 𝒏.
Data
𝒙𝟏 + 𝒙𝟐 + ⋯ +𝒙𝒏 𝑿𝒊
𝑿= =
𝒏 𝒏

𝑿𝒊
Kualitas 𝑿= , 𝒊 = 𝟏, 𝟐, 𝟑, … , 𝒏
𝒏
Data
Dimana:
𝑿 : Mean
𝑿𝒊 : : Nilai data ke-i
Eksplorasi
𝑛 : Jumlah data
Data
Herdianti Darwis 21
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 1. Mean

Contoh:
Diketahui:

Kategori 65, 67, 68, 69, 70, 71, 72, 73, 74, 75,
Data 76, 77, 78, 79, 80, 81, 82, 83, 84, 85

Hitung mean nya!


Jawab:
Kualitas
Data 𝑿𝒊
𝑿=
𝒏
65+ 67+ 68+ 69+70+ ⋯ + 81 + 82 + 83 + 84 + 85
=
20
1509
=
Eksplorasi 20
Data = 𝟕𝟓. 𝟒𝟓

Herdianti Darwis 22
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 2. Median

𝑴𝒆𝒅𝒊𝒂𝒏 = 𝐌𝐞

Kategori
Data
Median adalah nilai yang membagi data yang
telah diurutkan menjadi 2 bagian yang sama besar
Kualitas
Data
Untuk menentukan letak median yaitu:
(𝒏 + 𝟏)
𝑴𝒆 = 𝐝𝐚𝐭𝐚 𝐤𝐞
𝟐
Eksplorasi
Data
Herdianti Darwis 23
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 2. Median

Contoh:
Diketahui:

Kategori 65, 67, 68, 69, 70, 71, 72, 73, 74, 75,
Data 76, 77, 78, 79, 80, 81, 82, 83, 84, 85
Hitung median nya!
Jawab:
(20 + 1)
𝑀𝑒 = 𝑑𝑎𝑡𝑎 𝑘𝑒
Kualitas 2
21
Data = 𝑑𝑎𝑡𝑎 𝑘𝑒
2
= 𝑑𝑎𝑡𝑎 𝑘𝑒 10.5
= 𝑑𝑎𝑡𝑎 𝑘𝑒 10 + (05 ∗ 𝑠𝑒𝑙𝑖𝑠𝑖ℎ 𝑑𝑎𝑡𝑎 𝑘e11 dan 10)
= 75 + 0.5 ∗ 76 − 75
= 75 + 0.5 ∗ 1
Eksplorasi = 𝟕𝟓, 𝟓
Data
Herdianti Darwis 24
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 3. Modus

Modus adalah nilai yang paling sering muncul atau frekuensinya


paling banyak dari suatu pengukuran.

Kategori Contoh:
Data Diberikan data
65, 67, 68, 69, 70, 71, 72, 73, 74, 75,
76, 77, 78, 79, 80, 81, 82, 83, 84, 84

Kualitas Hitung modusnya!


Data Jawab:

Modus: 84

Eksplorasi
Data
Herdianti Darwis 25
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 4. Quartil

𝐐𝟏 𝐌𝐞 = 𝐐𝟐 𝑸𝟑

Kategori
Data
Median adalah nilai yang membagi data yang
telah diurutkan menjadi 2 bagian yang sama besar
Kualitas
Data
Untuk menentukan letak quartil ke-i yaitu:
𝒊(𝒏 + 𝟏)
𝑸𝒊 = 𝐝𝐚𝐭𝐚 𝐤𝐞
𝟒
Eksplorasi
Data
Herdianti Darwis 26
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 4. Quartil

Contoh:
Diketahui:

Kategori 65, 67, 68, 69, 70, 71, 72, 73, 74, 75,
Data 76, 77, 78, 79, 80, 81, 82, 83, 84, 85

Hitung Quartil 1,2,dan 3!


Jawab: 1(20 + 1)
Kualitas 𝑄1 = 𝑑𝑎𝑡𝑎 𝑘𝑒
4
Data 21
= 𝑑𝑎𝑡𝑎 𝑘𝑒
4
= 𝑑𝑎𝑡𝑎 𝑘𝑒 5,25
= 𝑑𝑎𝑡𝑎 𝑘𝑒 5 + (0.25 ∗ 𝑠𝑒𝑙𝑖𝑠𝑖ℎ 𝑑𝑎𝑡𝑎 𝑘𝑒 6 dan ke 5)
= 70 + 0.25 ∗ 71 − 70
Eksplorasi = 70 + 0.25 ∗ 1
Data = 70,25

Herdianti Darwis 27
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 4. Quartil
2(20 + 1)
𝑄2 = 𝑑𝑎𝑡𝑎 𝑘𝑒
4
42
= 𝑑𝑎𝑡𝑎 𝑘𝑒
4
Kategori = 𝑑𝑎𝑡𝑎 𝑘𝑒 10.5
Data = 𝑑𝑎𝑡𝑎 𝑘𝑒 10 + (05 ∗ 𝑠𝑒𝑙𝑖𝑠𝑖ℎ 𝑑𝑎𝑡𝑎 𝑘e11 dan 10)
= 75 + 0.5 ∗ 76 − 75
= 75 + 0.5 ∗ 1
= 𝟕𝟓, 𝟓
3(20 + 1)
Kualitas 𝑄3 = 𝑑𝑎𝑡𝑎 𝑘𝑒
4
Data 63
= 𝑑𝑎𝑡𝑎 𝑘𝑒
4
= 𝑑𝑎𝑡𝑎 𝑘𝑒 15,75
= 𝑑𝑎𝑡𝑎 𝑘𝑒 15 + (0.75 ∗ 𝑠𝑒𝑙𝑖𝑠𝑖ℎ 𝑑𝑎𝑡𝑎 𝑘𝑒 16 dan ke 15)
= 80 + 0.75 ∗ 81 − 80
Eksplorasi = 80 + 0.75 ∗ 1
Data = 80,75

Herdianti Darwis 28
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 5. Range antar Quartil

Range antar kuartil didefinisikan sebagai sebagai selisih


antara nilai kuartil ketiga dengan nilai kuartil pertama data.
Kategori 𝑹𝑸 = 𝑸𝟑 − 𝑸𝟏
Data
Contoh:
Median= Mean :75

𝑸𝟏 = 𝟕𝟏. 𝟕𝟓 𝑸𝟐 = 𝟕𝟓 𝑸𝟑 = 𝟕𝟖. 𝟐𝟓
Kualitas
Data Atr. A 70 71 72 73 74 76 77 78 79 80
Atr. B 45 56 67 71 72 78 85 86 91 99

𝑸𝟏 = 𝟓𝟖. 𝟕𝟓 𝑸𝟐 = 𝟕𝟓 𝑸𝟑 = 𝟖𝟕. 𝟐𝟓

Eksplorasi
Data 𝑹𝑸 𝑨 = 𝟔. 𝟓 dan 𝑹𝑸 𝑩 = 28. 𝟓

Herdianti Darwis 29
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 6. Standar Deviasi

Standar deviasi untuk sampel disimbolkan dengan s


dan untuk populasi disimbolkan dengan 𝜎.
Kategori
Data Untuk data distribusi tunggal, standar deviasi
Dirumuskan:

(𝑋𝑖 − 𝑋 )2 (𝑋𝑖 − 𝜇)2


Kualitas 𝑠=
𝑛−1
𝛔=
𝑛
Data
𝑠 : standar deviasi sampel,
𝜎 : standar deviasi populasi
𝑋𝑖 : data ke-i
Eksplorasi 𝜇 : mean populasi
𝑋 : mean sampel
Data
Herdianti Darwis 30
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 7. Variansi

Variansi (variance) untuk sampel disimbolkan


dengan 𝑠 2 dan untuk populasi disimbolkan dengan
Kategori 𝜎2.
Data
Untuk data distribusi tunggal, variansi dirumuskan:

2 (𝑋𝑖 − 𝑋 )2 2 (𝑋𝑖 − 𝜇)2


Kualitas 𝑠 = σ =
𝑛−1 𝑛
Data
𝑠2 : Variansi sampel,
𝜎2 : Variansi populasi
𝑋𝑖 : data ke-i
Eksplorasi 𝜇 : mean populasi
𝑋 : mean sampel
Data
Herdianti Darwis 31
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 7. Variansi

No. 𝑿𝒊 𝑿𝒊 − 𝑿 (𝑿𝒊 − 𝑿 )𝟐 (𝑿𝒊 − 𝑿 )𝟐


1 70 -5 25 𝒔𝟐 =
𝒏−𝟏
Kategori 2 71 -4 16 𝟏𝟏𝟎
=
Data 3 72 -3 9 𝟏𝟎 − 𝟏
𝟏𝟏𝟎
4 73 -2 4 =
𝟗
5 74 -1 1 = 𝟏𝟐. 𝟐𝟐
6 76 1 1
Kualitas 7 77 2 4
Data 8 78 3 9 𝐬 = 𝒔𝟐
9 79 4 16 = 𝟏𝟐. 𝟐𝟐
10 80 5 25 = 𝟑. 𝟓
Jumlah 750 110
Eksplorasi Mean 75
Data
Herdianti Darwis 32
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 7. Variansi

No. 𝑿𝒊 𝑿𝒊 − 𝑿 (𝑿𝒊 − 𝑿 )𝟐 (𝑿𝒊 − 𝑿 )𝟐


1 45 -30 900 𝒔𝟐 =
𝒏−𝟏
Kategori 2 56 -19 361 𝟐𝟒𝟐𝟒
=
Data 3 67 -8 64 𝟏𝟎 − 𝟏
𝟐𝟒𝟏𝟐
4 71 -4 16 =
𝟗
5 72 -3 9 = 𝟐𝟔𝟖
6 78 3 9
Kualitas 7 85 10 100
Data 8 86 11 121 𝐬 = 𝒔𝟐
9 91 16 256 = 𝟐𝟔𝟖
10 99 24 576 = 𝟏𝟔. 𝟑𝟕
Jumlah 750 2412
Eksplorasi Mean 75
Data
Herdianti Darwis 33
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi 8. Z Score

Kategori 𝑿𝒊 − 𝑿
𝒛=
Data 𝒔

Kualitas dimana:
Data 𝒔 : standar deviasi sampel
𝑿𝒊 : nilai tengah interval data ke-i
𝑿 : mean sampel
Eksplorasi
Data
Herdianti Darwis 34
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

DATA

Definisi
- Mean
- Median
Pemusatan data
- Modus
- Quartil 1,2,3
Kategori
Data
- Range antarkuartil
- Standar deviasi
Penyebaran data
- Variansi
- Z Score
Kualitas
Data
- Histogram & Poligon
- Quantile Plot
Grafik statistik - Quantile-Quantile Plot (QQ Plot)
Eksplorasi - Normal Quantile plot
Data
Herdianti Darwis 35
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

ROADMAP STATISTIKA & DATA MINING

Herdianti Darwis 36
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

ROADMAP DATA SCIENCE

Herdianti Darwis 37
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

DATA MINING (2KKA602)

ROADMAP DATA SCIENCE

Herdianti Darwis 38
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

STATISTIKA (2PPA307)

POKOK BAHASAN

 Pengantar Data Mining


 Data
 Eksplorasi Data
 Klasifikasi berbasis Decision Tree
 Klasifikasi berbasis ANN
 Klasifikasi berbasis SVM
 Klasifikasi berbasis KNN
 Analisis Klasterisasi
 Klasterisasi berbasis Partisi
 Klasterisasi berbasis Hierarki
 Validasi Klasterisasi
 Trend Data Mining
Herdianti Darwis 19
Program Studi Teknik Informatika - Fakultas Ilmu Komputer - Universitas Muslim Indonesia

STATISTIKA (2PPA307)

REFERENSI

 Suyanto. Data Mining untuk Klasifikasi dan Klasterisasi Data. Penerbit


Informatika, 2018.
 E. Walpole,Ronald., Pengantar Statistika
 Data Mining Concepts and Techniques 3rd edition, Han, Jiawei; Kamber,
Micheline, and Jian Pei, , Morgan Kaufmann, 2011
 Data Mining Mengolah Data Menjadi Informasi Menggunakan MATLAB, Eko
Prasetyo: Penerbit Andi. 2014.
 https://www.simplilearn.com/
 https://bioquest.org/numberscount/statistics-concept-map/

Herdianti Darwis 20
Universitas Muslim Indonesia
Makassar, Indonesia

DATA MINING
Herdianti Darwis

Anda mungkin juga menyukai