Analisis Regresi
Kelas : 12.3D.01
Disusun Oleh:
1. Vega Gusti Ranov NIM 12162838
2. Feby Kuswana NIM 12163112
3. Arif Hidayatulloh NIM 12160032
4. Yoga Hariyadi NIM 12162480
Depok, 2017
KATA PENGANTAR
Puji syukur kehadirat Tuhan Yang Maha Esa atas segala rahmat-Nya,
sehingga kami dapat menyelesaikan penulisan makalah ini tepat pada waktunya.
Makalah ini sebagai salah satu persyaratan untuk memperoleh nilai UAS pada
mata kuliah Statistika Deskriptif.
Akhir kata kami berharap semoga makalah ini dapat memberikan manfaat
maupun inspirasi terhadap pembaca.
1
DAFTAR ISI
B. Saran ........................................................................................ 25
DAFTAR PUSAKA................................................................................. 26
2
BAB I
PENDAHULUAN
A. LATAR BELAKANG
3
B. PERUMUSAN MASALAH
Dalam makalah yang membahas analisa regresi ini, kami akan mengkaji
sejumlah masalah statistika yang telah kami rumuskan sebagai berikut :
4
BAB II
LANDASAN TEORI
5
Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman
untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan,
dengan mengartikannya sebagai “ilmu tentang negara (state)”. Pada awal
abad ke-19 telah terjadi pergeseran arti menjadi “ilmu mengenai
pengumpulan dan klasifikasi data”. Sir John Sinclair memperkenalkan nama
(Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara
prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga
administratif dan pemerintahan. Pengumpulan data terus berlanjut,
khususnya melalui sensus yang dilakukan secara teratur untuk memberi
informasi kependudukan yang berubah setiap saat.
Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak
menggunakan bidang- bidang dalam matematika, terutama peluang.
Cabang statistika yang pada saat ini sangat luas digunakan untuk
mendukung metode ilmiah, statistika inferensi, dikembangkan pada paruh
kedua abad ke-19 dan awal abad ke-20 oleh Ronald Fisher (peletak dasar
statistika inferensi), Karl Pearson(metode regresi linear), dan William Sealey
Gosset (meneliti problem sampel berukuran kecil). Penggunaan statistika
pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu
pengetahuan, mulai dari astronomi hingga linguistika. Bidang-bidang
ekonomi, biologi dan cabang-cabang terapannya, serta psikologi banyak
dipengaruhi oleh statistika dalam metodologinya. Akibatnya lahirlah ilmu-
ilmu gabungan seperti ekonometrika, biometrika (atau biostatistika), dan
psikometrika.
6
variabel) yang lain. Variabel "penyebab" disebut dengan bermacam-macam
istilah: variabel penjelas, variabel eksplanatorik, variabel independen, atau
secara bebas, variabel X (karena seringkali digambarkan dalam grafik
sebagai absis, atau sumbu X). Variabel terkena akibat dikenal sebagai
variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel
Y. Kedua variabel ini dapat merupakan variabel acak (random), namun
variabel yang dipengaruhi harus selalu variabel acak.
Analisis regresi adalah salah satu analisis yang paling populer dan luas
pemakaiannya. Analisis regresi dipakai secara luas untuk melakukan prediksi
dan ramalan, dengan penggunaan yang saling melengkapi dengan bidang
pembelajaran mesin. Analisis ini juga digunakan untuk memahami variabel
bebas mana saja yang berhubungan dengan variabel terikat, dan untuk
mengetahui bentuk-bentuk hubungan tersebut.
7
diketahui dari variabel ekslanatorinya. Selanjutnya menurut Gujarati meski
analisis regresi berkaitan dengan ketergantungan atau dependensi satu
variabel terhadap variabel – variabel lainnya hal tersebut tidak harus
menyiratkan sebab – akibat (causation). Dalam mendukung pendapatnya ini,
Gujarati mengutip pendapat Kendal dan Stuart yang diambil dari buku
mereka yang berjudul “The Advanced Statistics” yang terbit pada tahun 1961
yang mengatakan bahwa,” suatu hubungan statistik betapapun kuat dan
sugestifnya tidak akan pernah dapat menetapkan hubungan sebab akibat
(causal connection); sedang gagasan mengenai sebab akibat harus datang
dari luar statistik, yaitu dapat berasal dari teori atau lainnya”.
8
Karena Levin & Rubin dalam mendefinisikan regresi juga menggunakan
istilah “analisis korelasi”, maka sebaiknya dalam bagian ini penulis perlu
menjelaskan perbedaan antara regresi dan korelasi. Menurut Gujarati (2009:
20) analisis korelasi bertujuan untuk mengukur kekuatan (strength) atau
tingkatan (degree) hubungan linier (linear association) antara dua variabel.
Untuk mengukur kekuatan hubungan linier ini digunakan koefesien korelasi.
Sebaliknya dalam regresi kita tidak melakukan pengukuran seperti itu.
Dalam regresi kita membuat estimasi atau memprediksi nilai rata-rata satu
variabel didasarkan pada nilai – nilai tetap variabel – variabel lain. Perbedaan
yang mendasar antara regresi dan korelasi ialah dalam regresi terdapat
(hubungan) asimetri dalam kaitannya dengan perlakuan terhadap variabel
tergantung dan variabel bebas. Variabel tergantung diasumsikan statistitikal,
acak atau stokhastik, yaitu mempunyai distribusi probabilitas. Sedang
variabel bebas / prediktornya diasumsikan mempunyai nilai – nilai tetap.
Sebaliknya dalam korelasi kita memperlakukan dua variabel atau variabel –
variabel apa saja secara simetris, yaitu tidak ada perbedaan antara variabel
bebas dan variabel tergantung. Sebagai contoh korelasi antara nilai ujian
matematik dan statistik sama dengan korelasi nilai ujian statistik dan
matematik. Lebih lanjut dalam korelasi kedua variabel diasumsikan random.
9
Untuk persamaan regresi dimana Y merupakan nilai sebenarnya
(observasi), maka persamaan menyertakan kesalahan (error term /
residual) akan menjadi:
Dimana:
Sedang garis regresi didefinisikan sebagai garis lurus yang ditarik dari
titik – titik diagram pencar (scattered diagram) dari nilai variabel tergantung
dan variabel bebas sehingga garis tersebut menggambarkan hubungan linier
antara variabel-variabel tersebut. Jika nilai-nilai ini merupakan garis regresi
nilai baku maka garis ini sama dengan garis korelasi. Garis ini disebut juga
sebagai garis kecocokan yang sempurna dimana garis lurus tersebut berada
pada posisi terdekat pada titik-titik diagram pencar. Garis ini dapat
digambarkan dari nilai-nilai persamaan regresi dalam bentuk yang paling
sederhana yaitu:
10
SPSS keluaran yang digunakan dalam koefesien regresi menggunakan
keluaran pada kolom “unstandardized coefficient”.
Persamaannya ialah
Y = a + β1X1
Dengan:
Y= variabel tergantung /
β = kemiringan (slope)
X= variabel bebas
11
1) Hubungan Linier Positif
12
Agar kita memperoleh kejelasan dalam penggunaan istilah, maka di
bawah ini diberikan istilah-istilah yang mewakili pengertian variabel bebas
dan variabel tergantung dalam regresi. Gujarati memberikan istilah sebagai
berikut:
13
Kuatnya hubungan antar variabel yang dihasilkan dari analisis korelasi
dapat diketahui berdasarkan besar kecilnya koefisien korelasi yang harganya
antara minus satu s.d plus satu. Koefisien korelasi yang mendekati minus 1
atau plus 1, berarti hubungan variabel tersebut sempurna negatif atau
sempurna positif. Bila koefisien korelasi (r) tinggi, pada umumnya koefisien
regresi (b) juga tinggi, sehingga daya prediktifnya akan tinggi. Bila koefisien
korelasi minus, maka pada umumnya koefisien regresi juga minus dan
sebaliknya. Jadi antara korelasi dan regresi terdapat hubungan yang
fungsional sebagai alat untuk analisis.
14
I.5 REGRESI LINIER SEDERHANA
Di mana β0, β1, β2, . . .,βk adalah koefisien atau parameter model.
15
Dengan :
Ŷ = nilai penduga bagi variabel Y
b0 = dugaan bagi parameter konstanta β0
b1, b2, . . ., bk = dugaan bagi parameter konstanta β1, β2, . . .,β3
e = galat dugaan (error)
Untuk mencari nilai b0, b1, b2, . . ., bk diperlukan n buah pasang data
(X1, X2, . . ., Xk,Y) yang dapat disajikan dalam tabel sebagai berikut :
Tabel 2.1 : Data hasil pengamatan dari n Responden (X1, X2, . . ., Xk,Y)
RESPONDEN X1 X2 ... XK Y
. . . . . .
. . . . . .
. . . . . .
Dari tabel 2.1 dapat dilihat bahwa Y1 berpasangan dengan X11, X21 ,. .
., XK1, data Y2
16
Diperoleh tiga persamaan normal yaitu :
= b0n + b1X1i +
∑Y
1 b2∑X2i
b
Yi n ∑X1i ∑X2i 0
∑Y
1 X1i = ∑Xi ∑X1i ∑X1i X2i x b1
∑Y b
1 X2i ∑X2i ∑X1i X2i ∑X2i 2
17
BAB III
PEMBAHASAN MASALAH
A. CONTOH KASUS 1
Tabel 3.1
18
Untuk menghitung persamaan regresinya, maka diperlukan tabel
penolong seperti Tabel 3.2.
Tabel 3.2
19
Tabel 3.3. Untuk mempermudah uji Linieritas
Tabel 3.3
20
C. CONTOH KASUS 2
1. Bagaimana cara menyusun data pada tabulasi regresi sederhana ?
2. Bagaimanakah membuat model Persamaan Regresi ?
D. PEMBAHASAN KASUS 2
Seorang Engineer ingin mempelajari Hubungan antara Suhu Ruangan
dengan Jumlah Cacat yang diakibatkannya, sehingga dapat memprediksi
atau meramalkan jumlah cacat produksi jika suhu ruangan tersebut tidak
terkendali. Engineer tersebut kemudian mengambil data selama 30 hari
terhadap rata-rata (mean) suhu ruangan dan Jumlah Cacat Produksi. Data
rata-rata suhu ruangan dan jumalah cacat produksi disusun secara
berurutan selama 30 hari seperti tabel di bawah ini.
Rata-rata Suhu
Tanggal Jumlah Cacat
Ruangan
1 24 10
2 22 5
3 21 6
4 20 3
5 22 6
6 19 4
7 20 5
8 23 9
9 24 11
10 25 13
11 21 7
12 20 4
13 20 6
14 19 3
15 25 12
16 27 13
17 28 16
18 25 12
19 26 14
20 24 12
21 27 16
22 23 9
23 24 13
24 23 11
25 22 7
26 21 5
27 26 12
28 25 11
29 26 13
30 27 14
21
Data tersebut disusun dalam bentuk tabulasi untuk mendapatkan
perhitungan ∑ seperti gambar di bawah ini.
Rata-
rata Jumlah
Tanggal X² Y² XY
Suhu Cacat
Ruangan
1 24 10 576 100 240
2 22 5 484 25 110
3 21 6 441 36 126
4 20 3 400 9 60
5 22 6 484 36 132
6 19 4 361 16 76
7 20 5 400 25 100
8 23 9 529 81 207
9 24 11 576 121 264
10 25 13 625 169 325
11 21 7 441 49 147
12 20 4 400 16 80
13 20 6 400 36 120
14 19 3 361 9 57
15 25 12 625 144 300
16 27 13 729 169 351
17 28 16 784 256 448
18 25 12 625 144 300
19 26 14 676 196 364
20 24 12 576 144 288
21 27 16 729 256 432
22 23 9 529 81 207
23 24 13 576 169 312
24 23 11 529 121 253
25 22 7 484 49 154
26 21 5 441 25 105
27 26 12 676 144 312
28 25 11 625 121 275
29 26 13 676 169 338
30 27 14 729 196 378
Total 699 282 16487 3112 6861
22
Persamaan untuk mencari konstanta a seperti ditunjukkan gambar
berikut.
∑ 𝑦 ∑ 𝑥2− ∑ 𝑥 ∑ 𝑦
𝑎=
𝑛 ∑ 𝑥 2 −(∑ 𝑥)2
∑x = 699
∑y = 282
∑x² = 16487
∑y² = 3112
∑xy = 6861
a = -24,38
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑏=
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2
(30)(6861) − (699)(282)
𝑏=
30 (16487) (699)2
b = 1,45
𝑌 = 𝑎 + 𝑏𝑋
Y = −24,38 + 1,45X
23
Tampilan data dan persamaan garis dari persamaan model regresi
diatas dapat dilihat seperti gambar berikut.
18
16 y = 1.4498x - 24.381
14
12
Jumlah Cacat
10
0
10 12 14 16 18 20 22 24 26 28 30
Suhu Ruangan
Dari gambar terlihat bahwa ada data keterkaitan antara suhu ruangan
dengan jumlah cacat produksi. Bila dianalisa maka dapat disimpulkan
semakin tinggi suhu ruangan maka semakin besar pula jumlah cacat
produksi.
Y = −24,38 + 1,45X
Y = −24,38 + 1,45(30)
Y = 19,12
Jadi jika suhu ruangan sebesar 30°C maka akan dipredisikan terdapat
19,12 unit jumlah barang yang cacat produksi.
24
BAB IV
PENUTUP
A. KESIMPULAN
meramalkan nilai Y.
B. SARAN
25
DAFTAR PUSAKA
Sumber Internet :
https://www.academia.edu/29336490/STATISTIK_UNTUK_PENELITIAN_by_Pr
of._Dr._Sugiyono
http://repository.usu.ac.id/bitstream/handle/123456789/19373/Chapter%2
0II.pdf?sequence=4&isAllowed=y
https://www.slideshare.net/dWaay/analisa-regresi-linier-sederhana
http://repository.usu.ac.id/bitstream/handle/123456789/19373/Chapter%2
0II.pdf?sequence=4&isAllowed=y
http://www.jonathansarwono.info/regresi/regresi.pdf
https://id.wikipedia.org/wiki/Analisis_regresi
26