BIOSTATISTIKA
Genap: 2016-2017
Oleh :
Universitas Jember
2017
KATA PENGANTAR
Puji Syukur Kehadirat Allah SWT, atas limpahan rahmat dan hidayah-
Nya sehingga kami dapat menyelesaiakan Laporan Skill Lab Blok Manajemen
Kesehatan Gigi Masyarakat. Banyak sekali hambatan yang kami alami dalam
pembuatan laporan ini, tetapi berkat dukungan dari berbagai pihak maka kami
bersyukur pada akhirnya dapat menyelesaikan makalah tutorial ini dengan baik.
Kami juga berterimakasih kepada perpustakaan fakultas kedokteran gigi
dan juga UPT Perspustakaan Uiversitas Jember yang telah memberikan banyak
bantuan dalam menyediakan buku-buku referensi dan memberikan pinjaman, serta
kakak tingkat dan juga teman-teman mahasiswa fakultas kedokteran gigi..
Tiada gading yang tak retak, bagitu pula kami sangat menyadari bahwa
dalam pembuatan makalah ini masih jauh dari kesempurnaan. Oleh karena itu
kami sangat mangharapkan kritik dan saran yang membangun demi
kesempurnaan laporan ini.
Semoga laporan ini dapat bermanfaat di kemudian hari, khususnya dalam
bidang kedokteran gigi di kalangan Universitas Jember.
i
DAFTAR ISI
Kata pengantar............................................................................................... ii
ii
iii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Analisis regresi merupakan salah satu alat statistik yang banyak
digunakan dalam berbagai bidang. Analisis tersebut bertujuan untuk
mengetahui hubungan antara variabel dependen dan variabel independen. Ada
beberapa macam tipe dari analisis regresi. Tipe yang pertama adalah analisis
regresi linier sederhana yang berfungsi untuk mengetahui hubungan linier
antara dua variabel, satu variabel dependen dan satu variabel independen. Tipe
kedua adalah analisis regresi linier berganda yang merupakan model regresi
linier dengan satu variabel dependen dan lebih dari satu variabel independen.
Di bidang kedokteran gigi seringkali menggunakan analisis regresi
linier sederhana dan ganda untuk penelitian. Sebagai peneliti seharusnya
faham tentang analisis regresi linier sehingga persamaan regresi yang
dihasilkan valid dan bisa diaplikasikan. Analisis regresi linier sederhana
terdapat satu variabel dependen (Y) dan satu variabel independen (X). Analisis
regresi linier ganda terdapat satu variable dependen (Y) dan lebih dari satu
variable independen (Xi) di mana i=1,2,3p, dengan tujuan memprediksi
nilai Y (variabel dependen) berdasarkan nilai X (variabel independen).
Regresi sendiri memiliki sejarah dan terus dikembangkan. Serangkaian
studi yang dikembangkan oleh para statistisi berhasil menunjukkan bahwa
dalam banyak kasus, regresi menggunakan teknik kuadrat terkecil (khususnya
teknik Ordinary Least Square/OLS) sering memberikan hasil yang kurang
tepat. Oleh sebab itu,banyak bermunculan teknik Regresi Modern, yaitu
regresi yang digunakan pada kondisi dimana asumsi-asumsi klasik tidak
terpenuhi.
Bagaimanakah model regresi linear sederhana dan regresi linear
berganda, asumsi-asumsinya, serta makna dari parameter-parameter regresi
linear berganda dan regresi linear sederhana akan penulis bahas dalam
makalah ini dengan judul REGRESI LINEAR SEDERHANA DAN
REGRESI LINEAR BERGANDA
1
1. Apakah yang dimaksud dengan regresi linear dan regresi linear
berganda ?
2. Apa saja asumsi asumsi klasik regresi linear berganda dan asumsi
regresi linear sederhana ?
3. Bagaimana langkah langkah atau proses pengujian asumsi klasik
regresi linear berganda dan asumsi regresi linear sederhana dengan
menggunakan software R ?
4. Apa makna dari parameter dalam regresi linear dan regresi linear
berganda?
1.3 Tujuan
Tujuan Berdasarkan rumusan masalah di atas, maka tujuan dari penulisan
makalah ini adalah :
1. Untuk mengetahui pengertian regresi linear sederhana dan regresi
linear berganda, agar mahasiswa dapat memahami dan membedakan
antara regresi linear sederhana dan regresi linear berganda.
2. Untuk mengetahui dan memahami asumsi asumsi klasik dalam
regresi linear berganda dan asumsi dalam regresi linear sederhana
3. Untuk mengetahui langkah langkah atau proses pengujian asumsi
klasik regresi linear berganda dan asumsi regresi linear sederhana
dengan menggunakan software R
4. Untuk mengetahui makna dari parameter dalam regresi linear
(sederhana dan berganda)
BAB II
TINJAUAN PUSTAKA
Definisi Regresi
Istilah regresi pertama kali dalam konsep statistik digunakan oleh Sir
Francis Galton dimana yang bersangkutan melakukan kajian yang menunjukkan
2
bahwa tinggi badan anak-anak yang dilahirkan dari para orang tua yang tinggi
cenderung bergerak (regress) kearah ketinggian rata-rata populasi secara
keseluruhan. Galton memperkenalkan kata regresi (regression) sebagai nama
proses umum untuk memprediksi satu variabel, yaitu tinggi badan anak dengan
menggunakan variabel lain, yaitu tinggi badan orang tua. Pada perkembangan
berikutnya hukum Galton mengenai regresi ini ditegaskan lagi oleh Karl Pearson
dengan menggunakan data lebih dari seribu. Pada perkembangan berikutnya, para
ahli statistik menambahkan isitilah regresi berganda (multiple regression) untuk
menggambarkan proses dimana beberapa variabel digunakan untuk memprediksi
satu variabel lainnya. (Sarwono, 2013)
Regresi dalam pengertian moderen menurut Gujarati (2009) ialah sebagai
kajian terhadap ketergantungan satu variabel, yaitu variabel tergantung terhadap
satu atau lebih variabel lainnya atau yang disebut sebagai variabel variabel
eksplanatori dengan tujuan untuk membuat estimasi dan / atau memprediksi rata
rata populasi atau nilai rata-rata variabel tergantung dalam kaitannya dengan nilai
nilai yang sudah diketahui dari variabel ekslanatorinya. (Sarwono, 2013)
Iriawan (2006: 199) mencatat bahwa analisis regresi sangat berguna dalam
penelitian antara lain: (1) model regresi dapat digunakan untuk mengukur
kekuatan hubungan antara variabel respons dan variabel prediktor, (2) model
regresi dapat digunakan untuk mengetahui pengaruh suatu atau beberapa variabel
predictor terhadap variabel respons, (3) model regresi berguna untuk memprediksi
pengaruh suatu variabel atau beberapa variabel predictor terhadap variabel
respons. (Nirmala, 2012)
2.1 Tujuan
Tujuan menggunakan analisis regresi ialah membuat estimasi rata-rata dan nilai
variabel tergantung dengan didasarkan pada nilai variabel bebas. Menguji
hipotesis karakteristik dependensi dan untuk meramalkan nilai rata-rata variabel
bebas dengan didasarkan pada nilai variabel bebas diluar jangkauan sampel.
(Sarwono, 2013)
3
2.2 Asumsi Penggunaan Regresi
Penggunaan regresi linear sederhana didasarkan pada asumsi diantaranya sbb :
Model regresi harus linier dalam parameter
2.3 Syarat-Syarat
Model kelayakan regresi linear dalam IBM SPSS didasarkan pada hal-hal sebagai
berikut :
a. Model regresi dikatakan layak jika angka signifikansi pada ANOVA
sebesar < 0.05
b. Predictor yang digunakan sebagai variabel bebas harus layak. Kelayakan
ini diketahui jika angka Standard Error of Estimate < Standard Deviation
c. Koefesien regresi harus signifikan. Pengujian dilakukan dengan uji t.
Koefesien regresi signifikan jika t hitung > t table (nilai kritis). Dalam
IBM SPSS dapat diganti dengan menggunakan nilai signifikansi (sig)
dengan ketentuan sebagai berikut: Jika sig < 0,05; koefesien regresi
signifikan Jika sig > 0,05; koefesien regresi tidak signifikan
d. Tidak boleh terjadi multikolinieritas, artinya tidak boleh terjadi korelasi
antar variabel bebas yang sangat tinggi atau terlalu rendah. Syarat ini
hanya berlaku untuk regresi linier berganda dengan variabel bebas lebih
dari satu. Terjadi multikolinieritas jika koefesien korelasi antara variable
bebas > 0,7 atau < - 7
4
e. Tidak terjadi otokorelasi jika: - 2 DW 2
f. Keselerasan model regresi dapat diterangkan dengan menggunakan nilai r2
semakin besar nilai tersebut maka model semakin baik. Jika nilai
mendekati 1 maka model regresi semakin baik. Nilai r2 mempunyai
karakteristik diantaranya: 1) selalu positif, 2) Nilai r2 maksimal sebesar 1.
Jika Nilai r2 sebesar 1 akan mempunyai arti kesesuaian yang sempurna.
Maksudnya seluruh variasi dalam variabel tergantung (variabel Y) dapat
diterangkan oleh model regresi. Sebaliknya jika r2 sama dengan 0, maka
tidak ada hubungan linier antara variabel bebas (variabel X) dan variabel
tergantung (variabel Y).
g. Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung
(Y)
h. Data harus berdistribusi normal
i. Data berskala interval atau rasio
j. Terdapat hubungan dependensi, artinya satu variabel merupakan variabel
tergantung yang tergantung pada variabel (variabel) lainnya.
(Sarwono, 2013)
5
yang mempengaruhinya. Contohnya, tinggi bayi sekarang yang dipengaruhi oleh
usia bayi, panjang bayi waktu lahir , berat bayi waktu lahir, dan ukuran dada bayi
waktu lahir. (Wasilaine dkk, 2014)
2.4Analisis Regresi
Analisis regresi adalah hubungan yang didapat dan dinyatakan dalam bentuk
persamaan matematik yang menyatakan hubungan fungsional antar variabel-
variabel. (Suwarsito, 2012)
Regresi dibagi menjadi 2 yaitu :
a) Analisis regresi linier sederhana
Analisis ini digunakan untuk mendapatkan hubungan matematis dalam bentuk
suatu persamaan antara variabel tak bebas dengan variabel bebas tunggal.
(Suwarsito, 2012)
Regresi linier sederhana hanya memiliki satu perubahan regresi linier untuk
populasi adalah
Y= a + bx
Dengan :
Y = Subyek dalam variabel dependen yang diprediksikan
X = Subyek pada variabel independen yang mempunyai nilai tertentu.
a = Parameter intercept
b = Parameter koefisien regresi variabel bebas
Persamaan model regresi sederhana hanya memungkinkan bila pengaruh
yang ada itu hanya dari independent variabel (variabel bebas) terhadap dependent
variabel (variabel tak bebas). Jadi harga b merupakan fungsi dari koefisien
korelasi. Bila koefisien korelasi tinggi, maka harga b juga besar, sebaliknya bila
koefisien korelasi negatif maka harga b juga negatif, dan sebaliknya bila koefisien
korelasi positif maka harga b juga positif. (Suwarsito, 2012)
6
= 0+11+ +
Dimana :
= variabel tidak bebas (dependen)
0 , , = koefisien regresi
1 , , = variabel bebas (independen)
Koefisien-koefisien 0 , , dapat dihitung dengan menggunakan persamaan :
1=+11+22++
1=01+1(1)2+212++1
2=02+112+2(2)2++2
=0+11+22++()
(Suwarsito, 2012)
Tujuan analisis regresi linier adalah untuk mengukur intensitas hubungan antara
dua variabel atau lebih dan memuat prediksi / perkiraan nilai Y dan nilai X.
bentuk umum persamaan regresi linier berganda yang mencakup dua atau lebih
variable. (Suwarsito, 2012)
2. Varian =
3. Tidak ada autokorelasi antara kesalahan pengganggu (galat/error), berarti
kovarian
4. Variabel bebas konstan dalam sampling yang terulang
dan bebas terhadap kesalahan penganggu
5. Tidak ada multikolenieritas diantara variabel bebas
6. artinya kesalahan pengganggu mengikuti distribusi normal
7
Contoh Kasus
Sampel yang diambil masing-masing 5 data selama 5 hari yang meliputi
pengunjung (X1), pembeli (X2) dan nominal pembelian (Y).
Rumus :
Y = a + b1 X1 + b2 X2
Y = variabel terikat
a = konstanta
b1, b2 = variabel bebas
X1, X2 = koefisien regresi
8
variabel (variabel) bebas. Sedang yang kedua, linier dalam parameter merupakan
fungsi linier parameter dan dapat tidak linier dalam variabel. (Sarwono, 2013)
SPSS
SPSS merupakan salah satu sekian banyak software statistika yang telah dikenal
luas dikalangan penggunaannya. Disamping masih banyak lagi software statistika
lainnya seperti Minitab, Syastas, Microstat dan masih banyak lagi. SPSS sebagai
sebuah tools mempunyai banyak kelebihan, terutama untuk aplikasi di bidang
ilmu sosial. (Suwarsito, 2012)
9
2. Membuat nilai taksiran
Pada model regresi, ada asumsi bahwa distribusi residual mengikuti
Karbon
monoksida Nikotin Fit _1 Err_ 1
13.6 0.86 12.32472 1.27528
16.6 1.06 14.8038 1.7962
23.5 2.03 26.82734 -3.32734
10.2 0.67 9.96959 0.23041
5.4 0.4 6.62283 -1.22283
15 1.04 14.55589 0.44411
Output ini memperlihatkan bahwa kandungan nikotin 0,86 mg, perkiraan jumlah
karbon monoksida yang dihasilkan suatu rokok sebesar 12,32 mg.
10
Mean Square Residual (MSE) merupakan varians residual (s2) ingat bahwa
11
atau dengan interpretasi gambar:
Uji kenormalan Residual
Hipotesis:
Uji kecukupan model adalah:
H0 = Residual berdistribusi normal
H1 = Residual tidak berdistribusi normal
Kriteria:
Daerah penolakan adalah KS > KS (1-) pada sejumlah pengamatan
(n)tertentu, atau nilai sig < nilai toleransi.
12
Output taksiran parameter menunjukkan bahwa statsitik t untuk variabel nikotin
dalam rokok adalah 11,759 dan nilai sig bernilai 0 df = 25 2 = 23, nilai
Nilai koefisien determinasi model regresi adalah 0,857 atau 85,7% artinya 85,7%
variasi sampel jumlah karbon monoksida yang dihasilkan suatu rokok dijelaskan
oleh kandungan nikotin dalam rokok, sedangkan hubungan antar variabel dapat
dilihat dari nilai R. diperoleh 0,926 sangat kuat (kriteria kuat R > nilai toleransi)
13
2.7 langkah-langkah dengan SPSS
14
15
16
17
(Rusdi, 2010)
18
BAB III
KESIMPULAN
19
Tujuan menggunakan analisis regresi ialah membuat estimasi rata-rata
dan nilai variabel tergantung dengan didasarkan pada nilai variabel bebas.
Menguji hipotesis karakteristik dependensi dan untuk meramalkan nilai rata-
rata variabel bebas dengan didasarkan pada nilai variabel bebas diluar
jangkauan sampel. (Sarwono, 2013)
DAFTAR PUSTAKA
Al Rasyid, Hadi dkk. 2014. Model Peramalan Konsumsi Bahan Bakar Jenis
Premium Di Indonesia Dengan Regresi Linier Berganda. Jurnal Ilmiah Teknik
Industri, Vol. 13, No. 2
Nirmala Arum J, Dyah. 2012. Statistik Deskriptif & Regresi linier Berganda
dengan SPSS. Semarang: Semarang University Press
Rahmadeni dkk. 2014. Analisis Jumlah Tenaga Kerja Terhadap Jumlah Pasien
Rsud Arifin Achmad Pekanbaru Menggunakan Metode Regresi Gulud. Riau:
Jurnal Sains, Teknologi dan Industri, Vol. 12, No. 1, Desember 2014, pp. 48 57
ISSN 1693-2390 print/ISSN 2407-0939
Sarwono, Jonathan. 2013. 12 Jurus Ampuh SPSS Untuk Riset Skripsi. Jakarta:
Elexmedia Komputindo Kompas Gramedia
20
Suwarsito Pratimo, Dedi. 2012. Analisis Regresi Dan Korelasi Antara
Pengunjung Dan Pembeli Terhadap Nominal Pembelian Di Indomaret
Kedungmundu Semarang Dengan Metode Kuadrat Terkecil. Semarang:
Universitas Dian Nuswantoro, Ilmu Komputer, Teknik Informatika
Wasilaine dkk. 2014. Model Regresi Ridge Untuk Mengatasi Model Regresi
Linier Berganda Yang Mengandung Multikolinieritas. Ambon : Jurnal Barekeng
Vol. 8 No. 1 Hal. 31 37
21