Anda di halaman 1dari 32

DATA MINING

PREDIKSI
Pertemuan : 12
Tugas Data Mining
memprediksikan nilai
dari atribut tertentu
Predictive berdasarkan nilai dari
atribut lainnya.

Tugas Utama
Data Mining memperoleh pola
(correlation, trend,
cluster, trajectory,
Descriptive anomaly) untuk
menyimpulkan
hubungan di dalam
data
Metode Dalam Data Mining
Tugas
Data Mining

Predictive Descriptive

Classification Clustering

Time Series
Association Rule
Analysis

Regression Sequence Discovery


Predictive - Classification
• Menemukan fungsi atau model yang membedakan kelas data
• Fungsi atau model tsb dapat berbentuk aturan if-else, descision tree,
formula matematika, atau neural network
• Tujuannya untuk memperkirakan kelas dari suatu objek yang labelnya
tidak diketahui
• Algoritma : Decision Tree (C4.5), Artificial Neural Network, Naïve
Bayes, Genetic Algorithm, Fuzzy, Case-Based Reasoning, k-Nearest
Neighbor
• Supervised Method
Predictive - Regression
• Regression vs Classification :
• Regression diterapkan untuk mengklasifikasikan target data numerik
• Classification untuk mengklasifikasikan target data kategorial
• Aplikasi : prediksi nilai penjualan yang akan datang berdasarkan trend
data penjualan tahun sebelumnya.
• Algoritma : Support Vector Machine (SVM), Generalized Linear Model
(GLM)
Prediksi
• Dalam estimasi kita memperkirakan suatu hal misalnya rata-rata
populasi dari sampel.
• Estimasi dilakukan berdasarkan sampel yang ada di tangan kita
• Prediksi?
Prediksi
• Dalam prediksi kita menggunakan data yang ada di tangan kita untuk
memprediksi hasil dari satu hal baru yang akan muncul selanjutnya.
• Jadi estimasi dilakukan untuk memperkirakan hal yang tidak kita
ketahui (rata-rata populasi, varians populasi)
• Prediksi memperkirakan hasil dari hal yang belum terjadi. Kita dapat
menunggu hingga hal tersebut terjadi untuk membuktikan seberapa
tepat prediksi kita.
Prediksi
• Dalam statistika dikenal dua cara untuk memprediksi yaitu:
• Regresi linear sederhana hanya melibatkan satu
variabel pemberi pengaruh
• Regresi linear berganda melibatkan lebih dari satu
variabel pemberi pengaruh
Regresi
• Variabel: besaran yang berubah nilainya
• Variabel pemberi pengaruh (sebab)
• Variabel terpengaruh (akibat)

Contoh: jarak dan waktu tempuh


jarak sebagai sebab,
Waktu tempuh yang diperlukan sebagai akibat.
Regresi Linear Sederhana
• Regresi linear sederhana menggunakan garis lurus untuk
menggambarkan hubungan diantara dua variabel atau lebih
• Dari kasus ini variabel tersebut adalah jarak dan waktu, dengan jarak
sebagai sumbu x (dalam km), waktu sebagai sumbu y (dalam menit)
• Kita mencari garis yang mendekati titik-titik sehingga garis tersebut
dapat dijadikan acuan untuk prediksi titik berikutnya
• Secara umum garis tersebut dapat dituliskan dalam bentuk
persamaan garis
Regresi Linear Sederhana
Contoh
Regresi Linear Sederhana
• Bagaimana cara mencari garis regresi yang paling baik?
• Menghitung konstanta (β0) dan gradient (β1) dengan rumus:
• Dengan menggunakan
rumus sebelumnya, maka
diperoleh hasil:
Regresi Linear Sederhana

Sehingga persamaan regresi yang diperoleh :


Regresi Linear Sederhana
• Pengetahuan apa yang bisa diperoleh dari pengolahan data di atas?
Kita bisa memprediksikan waktu tempuh pengiriman pesanan sama
dengan 14.58 menit ditambah 4.35 kali jarak rumah pelanggan
• Pelanggan ke 26 berjarak 1.5 km maka waktu tempuh adalah
Y = 14.58 + (4.35) (1.5) = 21.1 (menit)
Latihan:
• Buatlah persamaan regresi
dan simpulkan
pengetahuan yang
diperoleh
• Jika data yang diuji memiliki
kandungan hydrocarbon
sebesar = 0.82 %, maka
berpakan tingkat
kemurnian air tersebut
Regresi Linear Berganda
Persamaan Regresi Linear Berganda
Koefisien Regresi Linear Berganda
Kesimpulan: menghitung nilai koefisien

(σ 𝑉1) ∗ (σ 𝑉2)
෍ 𝑉1 𝑉2 = ෍(𝑉1. 𝑉2) −
𝑛
Lanjutan….
Contoh :

Menurut kajian literatur permintaan suatu produk


ditentukan oleh harga barang dan pendapatan
seseorang. Hasil pengamatan terhadap 12 sampel
atas permintaan suatu barang dalam hal ini gula
diperoleh data harga minyak goreng dan
pendapatan konsumen
Data sbb:
Ketentuan:
• Variabel Bebas : X1 = Harga Minyak Goreng, X2 = Pendapatan
Konsumen
• Variabel Tidak Bebas : Y = Permintaan Minyak Goreng
Penyelesaian:
Sehingga:
Hasil:
• Khusus untuk parameter b1 data adalah dalam ribuan, sehingga hasil
tersebut harus dibagi dengan 1000, diperoleh b1 = -0,000582 = -
0,001.
• Jadi persamaan Regresi Linear Berganda dengan dua variabel bebas
adalah :
Interpretasi Koefisien regresi:
• Nilai a = 12,7753 artinya jika tidak ada harga minyak goreng dan
pendapatan konsumen, namun permintaan akan minyak goreng
sebanyak 12,7753.
• Nilai b1 = -0,001 artinya jika harga minyak goreng meningkat satu
rupiah maka akan terjadi penurunan permintaan sebesar 0,001
satuan dimana pendapatan konsumen dianggap tetap.
• Nilai b2 = - 0,488 artinya jika pendapatan konsumen mengalami
kenaikan sebesar satu rupiah maka akan terjadi penurunan
permintaan minyak goreng sebesar 0,488 satuan dimana harga
minyak goreng dianggap tetap.
SOAL LATIHAN:
Sebuah penelitian dilakukan untuk mengetahui apakah ada pengaruh makanan ikan
(tiap hari dalam seminggu) [X1] dan panjang ikan (mm) [X2] terhadap berat ikan (kg)
[Y] di Desa Tani Tambak Raya Sejahtera. Data sebagai berikut:

Anda mungkin juga menyukai