Anda di halaman 1dari 19

ANALISIS REGRESI

BY: Deni Rachmat


Pendahuluan
• Hubungan antara dua variable atau lebih variable suatu data pengamatan
dapat dinyatakan dalam rumus matematik sehingga merupakan suatu
model yang disebut dengan model matematik.
• Model ini dapat digunakan untuk menganalisis suatu data pengamatan
misalnya untuk peramalan (prediction), perpanjangan (extension),
memperbaiki atau mengecek ketelitian data, pengisian data pada periode
kosong (interpolasi, ekstrapolasi).
• Suatu analisis yang membahas hubungan dua variable data disebut analisis
regresi.
• Setelah diperoleh model matematik yang sesuai selanjutnya, menentukan
seberapa kuat hubungan-hubungan antara variable tersebut atau sering
disebut derajat asosiasi atau analisis korelasi.
PENGOLAHAN DATA

• Dalam suatu analis data percobaan, hasil pengukuran sering


dilakukan pembuatan suatu kurva (diplot), yang mana kurva
tersebut dapat mewakili rangkaian data yang diberikan. Ploting
dilakukan dalam system kordinat x-y
• Data tersebut dapat berupa hasil percobaan di laboratorium atau pengamatan dilapangan seperti :
1. Hubungan antara data hujan dan debit sungai
2. Pertumbuhan arus barang atau penumpang disuatu pelabuhan, terminal atau bandara dari tahun-ke tahun,
3. Pertumbuhan jumlah penduduk sebagai fungsi waktu,
4. Hubungan antara kandungan oksigen di air dan temperatur .
CONT’D

• Data Percobaan tersebut dapat dianalisis dan dibuat model


matematiknya dengan menggunakan analisis Regresi;
• Regresi terdiri dari:
1. Regresi linier (y = mx, y = a +bx, y = -a +bx, y = a –bx, y = -a - bx)
2. Regresi kuadratik (y = ax²+bx+c)
3. Regresi logaritmik (y = a.log bx)
4. Regresi logaritmik natural (y = a.ln bx)
5. Regresi eksponensial ( )
6. Regresi Siklik ( y = a sin bx, y = a cos bx)
7. Regresi multiple ( y = f(x1, x2, ..., xn))
Analisis regresi

• Dalam Analisis Regresi akan dibuat kurva atau fungsi berdasarkan sebaran titik data.
• Kurva yang terbentuk diharapkan mewakili titik data tersebut
• Seringkali, setelah kurva terbentuk juga dilakukan intrapolasi atau ekstrapolasi untuk mendapatkan
nilai y yang berkaitan dengan nilai x yang berada di dalam dan diluar rangkaian data.
• Metoda yang digunakan adalah metoda Least Square (metoda kuadrat terkecil). Metoda ini
memungkinkan untuk membuat kurva yang paling mendekati titik-titik data.
• Penetapan bentuk kurva, apakah kurva linier, logaritmik atau kuadratik bergantung dari
kecenderungan (trend) dari penyebaran titik data.
• Analisis regresi dengan metoda kuadrat terkecil banyak menggunakan beberapa notasi dan teori
statistik. Oleh karena itu sebelum mempelajari regresi kuadrat terkecil lebih mendalam perlu diingat
kembali beberapa prinsip statistik.
Metoda Least Square (Kuadrat Terkecil)

• Gambar ini menunjukan sebaran titik-titik data dari hasil pengukuran


pada bidang x-y.

• Akan dicari suatu kurva g(x) yang dapat mewakili titik percobaan
tersebut.

• Cara termudah adalah membuat kurva tersebut secara visual yang


merupakan fungsi terbaik g(x) yang digambarkan oleh titik-titik data.

𝑋
CONT’D

• Metode yang lebih pasti untuk mendapatkan kurva tersebut adalah dengan membuat kurva yang meminimumkan perbedaan (selisih) antara titik-titik
data dengan kurva. Teknik ini disebut regresi kuadrat terkecil.

• Prosedurnya sebagai berikut:

1. Titik-titik percobaan digambar pada suatu sistem kordinat. Dari gambar sebaran titik data tersebut dapat diketahui trend atau pola secara umum dari
kumpulan titik-titik data, sehingga dapat ditentukan apakah kurva yang mewakili berupa garis lurus (linier) atau lengkung.

2. Dipilih suatu fungsi g(x) yang dianggap bisa mewakili f(x) yang memiliki bentuk umum sebagai berikut:

3. Fungsi tersebut tergantung dari parameter :


CONT’D

3. Tentukan parameter sedemikian rupa sehingga melalui sedekat


mungkin titik-titik data.
Bentuk mempunyai arti fungsi g (xi) dengan parameter
4. Apabila koordinat dari titik-titik percobaan adalah M(xi,yi)dengan i = 1,2,3,……,n maka selisih ordinat
antara titik-titik tersebut dengan fungsi adalah
dimana Ei = Error/kesalahan dari masing-masing titik data.
CONT’D

• Dipilih suatu fungsi g(x) yang mempunyai kesalaha E terkecil, maka dalam metode ini i

jumlah kuadrat dari kesalahan adalah terkecil.

• Dicari parameter sedemikian hingga D² adalah minimum.


• Nilai D² akan minimum jika turunan pertamanya terhadap adalah nol
sehingga:

• Penyelesaian persamaan tersebut akan memberikan hasil parameter .


• Dengan demikian persamaan kurva terbaik yang mewakili titik-titik data telah diperoleh.
REGRESI LINIER (Y = a + b.x)

• Metoda Kuadrat Terkecil Untuk Kurva Linier


Bentuk yang paling sederhana dari regresi kuadrat terkecil adalah apabila kurva yang mewakili
titik-titik data merupakan garis lurus, sehingga persamaannya adalah:
g(x) = ao + a .x = a + b.x
1

dalam hal ini a = a dan b = a


0 1

Jumlah kuadrat terkecilnya dihitung dengan persamaan sebagai berikut:

Agar supaya nilai D² (error kuadrat) adalah minimum, maka persamaan diatas diturunkan
terhadap parameter a dan b, dan kemudian disama-dengankan nol ( fungsi minimum).
CONT’D

• Turunan pertama terhadap nilai a adalah:

• Turunan pertama terhadap nilai b adalah:


CONT’D

• Persamaan tersebut dapat ditulis: dengan ∑a = n.a

• Penyelesaian untuk mencari a dan b dapat dilakukan dengan metoda


penyelesaian sistem persamaan linier (SPL) yaitu dengan cara substitusi,
matriks, eleminasi gauss, dll.
CONT’D

• Metoda substitusi atau eleminasi gauss untuk mencari nilai a dan b.


• Menentukan a dari persamaan pertama yaitu:

• Ternyata nilai a bergantung pada nilai b, jadi harus mencari nilai b dulu:
CONT’D

• Mencari nilai b dari persamaan ke dua:


CONT’D
• Selanjutnya:
Koefisien korelasi regresi linier

• Persamaan tersebut untuk menghitung koefisien a dan b, sehingga fungsi g (x) dapat dicari.
• Untuk mencari derajat kesesuaian dari persamaan yang didapat, dihitung nilai koefisien korelasi sebagai berikut:

• Dengan r adalah koefisien korelasi, sedang D² (kuadrat terkecil dari selisih nilai data dengan persamaan hasil regresi) dan
Dt² (kuadrat terkecil dari selisih nilai data dengan nilai rata-rata) diberikan dalam bentuk:

• Nilai r bervariasi antar 0 sampai dengan 1. 𝐷2 = 𝑦𝑖 − 𝑎0 − 𝑎1 . 𝑥𝑖 2

• Jika bernilai mendekati +1 artinya persamaan yang diambil dari data y dan x𝑖 berkorelasi positif kuat.
Jika bernilai mendekati -1 artinya y dan x berkorelasi negatif kuat.
CONTOH : REGRESI LINIER 2
Data sebaran cukup banyak. Persamaannya:
Yi = a + bxi
dimana: Yi = variabel dependen/tidak bebas
xi = variabel independen/variabel bebas
a = Intersep/nilai trend pada periode dasar.
b = tingkat perkembangan nilai.
Data sebaran.
• Contoh :
• Diberikan tabel data hasil pengamatan sebagai berikut: Y
No 1 2 3 4 5 6 7 8 9 10 35

X 4 6 8 10 14 16 20 22 24 28 30
𝑌 = 𝑎 + (−𝑏𝑋)
Y 30 18 22 28 14 22 16 8 20 8 25

• Tentukan persamaan garis yang mewakili data berikut. 20

15
Penyelesaian:
10
1. Gambarkan titik-titik data tersebut dalam kordinat X-Y.
5
• Pilih mana data independen dan dependen, jika data pengamatan tersebut
adalah curah hujan dan debit air, tentukan mana yang dependen dan 0 𝑋
0 5 10 15 20 25 30
independen.
• Berarti Debit air bergantung pada curah hujan artinya variable
dependennya adalah debit air dan independennya adalah curah hujan.
• Dependen Y dan independen X (Y bergantung pada X, atau Y adalah fungsi
dari X)

Anda mungkin juga menyukai