Anda di halaman 1dari 16

REGRESSION

(Data Mining – Estimation)

Mata Kuliah
Data Warehouse & Data Mining
Apa itu Estimasi ?

• Estimasi adalah sebuah metode dalam Data Mining yang digunakan


untuk menerka atau memperkirakan nilai dari suatu populasi dengan
menggunakan nilai dari sampel.

• Artinya adalah suatu pengukuran yang didasarkan atas hasil


kuantitatif yang tingkat akurasinya dapat diukur dengan angka.

• Definisi lain dari Estimasi adalah Perkiraan, Penilaian, dan Pendapat.


Apa itu Regression ?

Regresi adalah suatu teknik analisis untuk mengidentifikasi relasi atau


hubungan diantara dua variabel atau lebih.

Regresi bertujuan untuk menemukan suatu fungsi yang memodelkan data


dengan meminimalkan error atau selisih antara nilai prediksi dengan nilai
sebenarnya.

Terdapat dua tipe model Regresi


- Simple Regression (Regresi Sederhana)
- Multiple Regression (Regresi Berganda)
Contoh Penggunaan Regression

Prediksi Perkiraan Cuaca


Popularitas Iklan

REGRESSION

Perkiraan Pasar
Prediksi
Pertumbuhan
Penduduk
Memperkirakan
Harapan Hidup
Macam-macam Algoritma Regresi
Apa itu Regresi Linear ?
Regresi Linear adalah alat statistik yang dipergunakan untuk mengetahui
pengaruh antara satu atau beberapa variabel terhadap satu buah variabel.

Ada dua jenis variabel yaitu Dependent variable dan Independent variable.
Variabel dependen (terikat) adalah variabel yang akan kita prediksi atau
pelajari, sedangkan variabel independen (bebas) adalah variabel yang
menjelaskan atau menyebabkan nilai target di variabel dependen.

Variabel independen (bebas) dinotasikan dengan X, sementara variabel


dependen (terikat) dinotasikan dengan Y.
Persamaan Regresi Linear Sederhana

y = α + β.x
y = variabel terikat
x = variabel bebas
α = konstanta / intersep
β = koefisien regresi (kemiringan); besaran Respon yang ditimbulkan oleh variabel
Tahapan Algoritma Regresi Linear

• Siapkan data
• Identifikasi Atribut dan Label
• Hitung X2,Y2, XY dan total (Σ) dari masing-masingnya
• Hitung α dan β berdasarkan persamaan yang sudah ditentukan
Persamaan Regresi Linear Sederhana

α= (Σy) – β.(Σx)
n

β= n.(Σxy) – (Σx).(Σy)
n.(Σx2) – (Σx)2
n = jumlah sampel
Regresi Linear Sederhana
Contoh Kasus:
Pengaruh lama belajar (x) terhadap Nilai Siswa (y)

Data di samping ini adalah data lama belajar


siswa dan nilai yang diperoleh.

Dari data tersebut, kita akan menghitung


persamaan regresi linier sederhananya.
Persamaan Regresi Linear Berganda

Y = α + β1x1 + β2x2 + ..... + βnxn


Y = variabel terikat
x1, x2, .... xn = variabel bebas
α = konstanta
β = koefisien regresi
n = jumlah sampel
Persamaan Regresi Linear Berganda – Tahap 1

Σx1 = ΣX –
2 (ΣX
2 1 ) 2
1
n
Σx2 = ΣX2 –
2 2 (ΣX 2 ) 2

n
Σy = ΣY –
2 (ΣY)
2 2

n
Persamaan Regresi Linear Berganda – Tahap 1

Σx1y = ΣX1Y – (ΣX 1 )(ΣY)


n
Σx2y = ΣX2Y – (ΣX 2 )(ΣY)
n
Σx1x2 = ΣX1X2 – (ΣX 1 )(ΣY2 )
n
Persamaan Regresi Linear Berganda – Tahap 2

β1 = (Σx22).(Σx1y) – (Σx1x2).(Σx2y)
(Σx12).(Σx22) – (Σx1x2)2

β2 = (Σx12).(Σx2y) – (Σx1x2).(Σx1y)
(Σx12).(Σx22) – (Σx1x2)2

α= Σy
n
– β1. Σx
n
1
(– β2. )
Σx
n
2
( )
Regresi Linear Berganda
Contoh Kasus:
pengaruh Pakan Ikan (tiap hari dalam seminggu)
[x1], dan Panjang Ikan (mm) [x2], terhadap Berat
Ikan (kg) [y]
TERIMA KASIH

Mata Kuliah
Data Warehouse & Data Mining

Anda mungkin juga menyukai