STATISTIK PARAMETRIK
Dosen: Dr. Arief Wibowo, dr., M.S
Oleh :
UNIVERSITAS AIRLANGGA
FAKULTAS KESEHATAN MASYARAKAT
PROGRAM STUDI S2 ILMU KESEHATAN MASYARAKAT
SURABAYA
2017
1
BAB I
PENDAHULUAN
Statistik adalah suatu disiplin ilmu yang mempelajari sekumpulan konsep dan
metode pengumpulan, penyajian, analisis, dan interpretasi data, sampai data pengambilan
keputusan pada situasi dimana terdapat ketidakpastian. Ditinjau dari segi waktu, dalam
statistik dikenal 3 (tiga) jenis data, yaitu data cross section (data antarkejadian), data time
series (data runtun waktu dan data deret berkala), dan data panel (gabungan antara data
cross section dan data time series). Dalam pemodelan statistika, analisisregresi.
Analisis regeresi merupakan alat analisis statistik yang memanfaatkan hubungan
dua variabel atau lebih. Tujuannya adalah untuk membuat perkiraan (prediksi) yang dapat
dipercaya untuk diniai suatu variabel (biasa disebut variabel terikat atau variabel dependen
atau variabel respons), jika nilai variabel lain yang berhubungan degannya diketahui (biasa
disebut variabel bebas atau variabel independen atau variabel prediktor).
Analisis regresi pertama kali diperkenalkan sebagai analisis data statistik pada tahun 1877
oleh Sir Francis Galton yang meneliti hubungan antara tinggi badan orang tua (ayah)
dengan anaknya. Beliau mengungkapkan bahwa terdapat kecenderungan orang tua yang
tinggi badannya akan memiliki anak yang tinggi pula, atau sebaiknya orang tua yang
pendek badannya akan memiliki anak yang pendek pula, tetapi distribusi (penyebaran)
rata-rata tinggi badan dari generasi ke generasi adalah tetap.
Secara umum analisis regresi dikelompokkan menjadi 3 (tiga) yaitu analisis regresi
parametrik, analisis regresi non parametrik, dan analisis regresi semi parametrik
(perpaduan antara regresi parametrik dan non parametrik). Perbedaan utama antara regresi
parametrik dan non parametrik yaitu analisis regresi parametrik memerlukan asumsi-
asumsi baik bentuk fungsional maupun distribusi residualnya. Namun jika asumsi-asumsi
tidak dapat dipenuhi maka analisis regresi non parametrik dapat digunakan. Analisis
regresi parametrik terdiri dari analisis regresi parametrik linier dan analisis regresi
parametrik non linier, kuadrat, kubik, eksponensial, logaritma, dan lain-lain
Makalah ini akan membahas mengenai analisis regresi linier sederhana, makalah
ini merupakan salah satu tugas mata kuliah Statistik Parametrik Program studi Magister
Ilmu Kesehatan Masyaraat peninatan Biostatistika semester dua tahun 2017.
1
BAB II
REGRESI LINIER SEDERHANA
Analaisis regresi linier sederhana adalah analisis regresi linier yang hanya
melibatkan dua variabel, yaitu satu variabel independen dan satu variabel dependen.
Disebut linier sederhana karena variabel dependen diasumsikan berhubungan linier dalam
parameter dan linier dengan variabel independen.
Secara umum terdapat 4 (empat) tahap yang dilakukan dalam analisis regresi dalam
rangka memperoleh model yang baik, yaitu:
1. Identifikasi Model
Pada tahap ini dilakukan perumusan model secara umum termasuk pemilihan variabel baik
variabel independen maupun variabel dependen terhadap permasalahan yang harus
dipecahkan, serta menspesialisasikan hubungan fungsional antar variabel (pilihan model
sementara). Cara mudah yang dapat dilakukan adalah dengan melihat diagram sebar
(scatter diagram).
2. Estimasi /Penaksiran parameter
Langkah kedua adalah melakukan estimasi terhadap parameter-parameter dalam model
sementara. Ada 2 (dua) metode yang biasa digunakan, yaitu metode kuadrat terkecil dan
metode maksimum likelihood.
3. Pengujian (Diagnostik Checking)
Pada tahap ini dilakukan pengujian-pengujian terhadap hasil-hasil pada langkah 3 di atas,
diantaranya uji hipotesis terhadap koefisien-koefisien regresi. Jika hasil yang diperoleh
tidak sesuai yang diharapkan (tidak signifikan) maka tahapan analisis harus dimulai lagi
dari tahap pertama.
4. Penerapan
Tahap terakhir ini merupakan tujuan utama dari analisis regresi, yaitu melakukan prediksi
(perkiraan) yang dapat dipercaya, sehingga dapat dijadikan sebagai dasar dalam
pengambilan keputusan. Kemungkinan kesalahan adalah penggunaan yang tidak pada
tempatnya.
2.1. MODEL REGRESI LINIER SEDERHANA
Secara umum, model regresi linier sederhana dengan satu variabel independen dan
fungsi linier dalam X dapat ditulis :
Y = + X + (2.1)
Di mana
1
Y: Variabel dependen
X: Variabel Independen
: intersep (titik potong) kurva terhadap sumbu Y
: Kemiringan (slope) kurva linier
: Variabel pengganggu (residual)
Diketahui pasangan data berukuran n (Xi, Yj) dimana i= 1,2,. ,n dari sebuah
populasi, maka model regresi linier sederhana dapat ditulis:
Yi = + Xi + i (2.2)
Untuk memperoleh model regresi linier sederhana yang baik, perlu diperhatikan 5
(lima) asumsi dasar yang dikenal dengan Asumsu-asumsi model regresi linier sederhana
yang mempunya peran penting dalam distribusi dan :
1. i adalah sebuah variabel random riil yang memiliki distribusi normal.
1
= E [(( + Xi + i) ( + Xi))2],
= E [i2] = 2
Akibat lebih lanjut dari i N (0, 2) adalah Yi N (( + Xi), 2)
Dapat dibuktikan dengan menggunakan MGF (Moment Generation Function)
2.2. Estimasi Parameter Model Regresi Linier Sederhana
Koefisien regresi dan merupakan parameter dan nilainya tidak diketahui, tetapi
parameter tersebut dapat diestimasi dari data sampel. Ada dua metode estimasi yang bias
digunakan untuk mengestimasinya, yaitu :
1.Metode Kuadrat Terkevil (MKT)/ Ordinary Least Squares (OLS)
Jika dipunyai sampel random berukuran n, yaitu (Xi, Yi) dimana i = 1, 2,..,n dari
sebuah populasi, maka dapat ditulis
Yi = + Xi + Ui Ui = Yi - ( + Xi)
Metode ini berusaha menemukan nilai-nilai estimasi (taksiran) dan dengan
meminimumkan jumlah kuadrat residual atau residual atau factor gangguan.
=1 12 = =1(1 - - Xi)2 (2.3)
n = =1 =1 = - (2.5)
n = =1 =1 = - (2.7)
1
tampak bahwa hasil estimasi koefisien regresi ( ) yang dihasilkan metode kuadrat
terkecil dan metode maksimum likelihood adalah sama.
=1 ( ) ( )
=
Karena =1 ( ) = 0
=1()
=1 ( )
=
=1()
Misalkan
( )
ki =
=1()
Maka
= =1 (2.8)
Karena
( )
ki =
=1()
1
Sehingga diperoleh :
= =1
E ( ) = (2.9)
2
Var ( .) =
(2.11)
=1( )
Sedangkan
2 =1
2
Var () =
(2.12)
=1( )
Sekarang akan dibuktikan Var () dan var ( ) yang memiliki varians minimum.
Untuk membuktikan memiliki variansi minimum, perlu dibandingkan dengan variansi
penaksir lainnya yang memiliki sifat linier dan tidak bias (katakanlah ).
E( ) = =1 + =1 (2.13)
Karena * adalah penaksir yang tidak bis untuk [E( )] = , maka pada persamaan [ E
(*)=], maka pada persamaan (2.13) diatas, nilai =1 = 0 dan =1 = 1
Dari variansi dari * adalah :
Var ( ) = 2 =1 + 2 =1 (2.14)
Oleh karena =1 2 > 0 (selalu positif) , maka var (*) > Var ( ) . Hal ini
menunjukan bahwa memiliki sifat best (variansi minimum) . dan dengan cara yang sama
dapat pula dibuktikan memiliki sifat best (varians minimum).
1
2.4. Penaksir Tidak Bias Untuk 2
1
Sekarang akan diselidiki apakah persamaan = =1(1 ) memiliki sifat yang
Untuk mendapatkan penaksir tidak bias yntuk 2 adalah dengan mengalikan persamaan
(2.14) dengan ((2))diperoleh:
1
((2)) E [ =1( )] =
Tampak bahwa varians dari , dan i memuat 2 . Namun demikian dalam aplikasinya,
=1( ) =
=1( )
harga estimasi 2 (2) biasa diganti dengan s2 = (2) (2)
.
Maka S2 ()
adalah estimasi untuk var (), S2 () adalah estimasi untuk var ( ), dan s2 (i) adalah
estimasi untuk varian (i)
A. Inferensi tentang
Untuk transformasi tentang dapat digunakan transformasi:
= () (2.16)
Dengan :
2
S() = 1
( )
s
1
1
Interval konfidensi untuk , pada tingkat kepercayaan (1 - ) 100% .
Uji hipotesis untuk digunakan untuk mengetahui apakah garis regresi melalui
titik pusat (pangkal)/tidak
Ho : = 0 {garis regresi melalui titik pusat/pangkal)
H1 : # 0
Karena Ho =0 maka statistic uji yang digunakan adalah :
= ()
Ho ditolak pada tingkat kepercayaan (1 - ) 100% , jika nilai t hitung > t tabel
B. Inferensi tentang
Untuk inferensia tentang dapat digunakan transformasi :
= () (2.17)
Dengan:
2
S( ) =
1( )
Ho ditolak pada tingkat kepercayaan (1- )*100%, jika nilai |t huting | > t tabel
C. Inferensi Tentang i
Untuk inferensi tentang i dapat digunakan transformasi :
= (2.18)
()
Dengan :
1 ( )
S() = ( + ( )) 2
1
1
Untuk mengestimasi i , yaitu nilai mean semua harga Y yang berkaitan dengan Xi,
maka dapat dibuat interval konfidensi untuk i pada tingkat kepercayaan ( 1- ) * 100%.
2.6. Pendekatan Analisis Variansi
Seringkali analisis tentang kualitas regresi dilakukan dengan pendekatan analisis
varians. Dasar dari analisis variansi adalah jumlah kuadrat simpangan total (JKT).
JKT = =1( )
Pendekatan analisis variansi digunakan untuk menguji garis regresi (uji hipotesis koefisien
) dengan Ho : = 0 dan H1 : #0 digunakan transformasi :
F* = = 1
=
2
(2)
1
Untuk menghitung kedua jumlah kuadrat tersebut maka ditempuh cara sebagai
berikut ini. Misalkan:
11 12 11 adalah 1 ulangan observasi Y pada 1
21 22 22 adalah 2 ulangan observasi Y pada 2
.
.
.
1 2 adalah ulangan observasi Y pada
1
Selanjutnya dihitung Y = =1
dan kontribusi pada JKM dari observasi
1
ulangan pada X1 adalah Y = =1( 1 )
Sehingga:
JKK = JKS JKM
Karena:
E [( ] = dan E [(2)] = = + suku bias jika modelnya tidak sesuai.
0 )
dengan h = n n0 + k
Maka dapat dirumuskan uji hipotesisnya:
Ho: Model sesuai (model linier)
H1: Model tidak sesuai (model tidak linier)
Statistik uji yang digunakan:
(2)
F* =
(0 )
Ho ditolak jika F* > F tabel atau disimpilkan model yang diestimasi cenderung tidak
sesuai (tidak linier) dengan data yang ada. Dengan kata lain, ada kemungkinan model yang
sesuai adalah model kuadrat , kubik, atau model nonlinier lainnya.
Hasil-hasil analisis biasanya diringkas dalam tabel analisis varians (ANOVA) sebagai
berikut:
TABEL 2.2. ANOVA UNTUK UJI KESESUAIAN MODEL
Sumber Kuadrat Rata F Ratio
Db Jumlah Kuadrat (JK)
Variansi Rata (KR)
Regresi 1 JKR
KRR = 1 F= 2
1
Sesatan (n-2) JKS
KRS = (2)
(Residual)
Kurang (h-2) JKK=JKS-JKM
KRK = (2) F= 2
Sesuai
1
Murni (n0-k) JKM = + =1 =1
( )
1
BAB III
ANALISIS REGRESI LINIER SEDERHANA MENGGUNAKAN IBM SPSS
Analisis tentang pengaruh kenaikan berat badan ibu terhadap berat badan bayi saat lahir
di Puskesmas Kota Kab. Timor Tengah Selatan Bulan Januari Sampai Dengan April Tahun
2017. Berikut adalah data yang diperoleh dari Puskesmas Kota Kabupaten Timor Tengah Selatan
yaitu sebanyak 97 ibu maka data diperoleh sebagai berikut:
Tabel I. Data Berat Badan Ibu dan Berat Badan Bayi Saat Lahir di Puskesma Kota Kab TTS.
Berat Berat
Kenaikan Berat
Badan Ibu Badan Saat
Berat Badan Bayi
NO Awal Sebelum
Badan Ibu Saat Lahir
Kehamilan Melahirkan
(Kg) (Kg)
(Kg) (Kg)
1 45 66 21 5
2 56 68 12 3.4
3 55 64 9 2.7
4 48 62 14 3.4
5 50 62 12 3.6
6 70 79 9 2.6
7 69 74 5 2.7
8 54 67 13 3.8
9 77 87 10 2.9
10 65 69 4 2.4
11 49 60 11 2.9
12 50 59 9 2.9
13 65 77 12 3
14 55 61 6 2.6
15 50 72 22 5
16 60 69 9 2.8
17 67 84 17 4.7
18 57 80 23 5.2
19 49 65 16 4.8
20 47 60 13 3.8
21 52 60 8 2.5
22 52 68 16 4.2
23 65 69 4 2.2
24 73 81 8 2.5
25 55 67 12 4
26 63 72 9 2.7
27 49 65 16 4.4
28 45 61 16 4.3
29 55 68 13 4
30 60 68 8 2.6
31 65 86 21 4.6
32 49 55 6 2.6
33 50 72 22 4.7
34 65 70 5 2.4
35 55 69 14 4.2
36 50 62 12 4.1
37 60 62 2 1.8
38 67 79 12 3.1
39 57 69 12 3.2
40 49 77 28 5
41 47 67 20 4.5
42 52 59 7 2.4
43 52 70 18 3.8
44 65 71 6 2.3
45 73 92 19 4.2
46 55 58 3 1.8
47 63 77 14 3.2
48 45 72 27 4
49 56 70 14 3.7
50 55 79 24 4.1
51 48 62 14 3.3
52 50 62 12 3.4
53 70 79 9 3
54 69 73 4 2.3
55 54 67 13 3.5
56 77 87 10 3.1
57 65 67 2 2
58 49 60 11 3
59 50 59 9 2.9
60 65 82 17 3.6
61 55 61 6 2.6
62 50 77 27 4.4
63 60 65 5 2.4
64 67 84 17 3.4
65 57 80 23 3.7
66 49 75 26 4.1
67 47 60 13 3.3
68 52 60 8 2.7
69 52 68 16 3.2
70 65 67 2 2.3
71 73 75 2 2.4
72 55 67 12 3.1
73 63 72 9 2.7
74 49 65 16 3.6
75 45 61 16 3.4
76 55 68 13 2.9
77 60 68 8 2.9
78 65 86 21 4.1
79 49 53 4 2.5
80 50 72 22 4.4
81 65 70 5 2.5
82 55 69 14 3.2
83 50 62 12 3.2
84 60 62 2 2
85 67 79 12 2.9
86 57 69 12 2.9
87 49 77 28 4.6
88 47 67 20 4.4
89 52 54 2 2
90 52 60 8 3
91 65 71 6 2.6
92 57 66 9 3.1
93 49 55 6 2.6
94 47 61 14 3.3
95 52 61 9 2.6
96 52 58 6 2.7
97 65 79 14 3.4
Tujuan Penelitian:
Untuk mengetahui pengaruh kenaikan berat badan ibu terhadap berat badan bayi saat lahir
(Menggunakan = 5%)
Memodelkan keadaan keadaan (khususnya model linier).
Langkah Analisis
Asumsi Regresi Linier:
1. Variabel tergantung minimal berskala interval (kenaikan Berat Badan Ibu saat hamil)
2. Variabel bebas minimal berskala interval (Berat Badan Bayi saat sahir)
3. Linieritas pola hubungan var. tergantung dan var. bebas berbentuk linier
4. Homoscedasticity
5. Sisaan (eror) berdistribusi normal
6. Sisaan (eror) saling bebas
Simulasi dengan Menggunakan SPSS:
1. Menginput data kedalam IBM SPSS
2. Uji Normalitas
3. Pembuktian Asumsi Regresi Linieritas
4. Analisis Regresi Linier
Klik: Analyze Regression Linear Masukkan var. tergantung ke kolom Dependent
dan masukkan semua var. bebas ke kolom Independent Klik Statistics Klik Plots
Klik Save OK
5. Membaca Hasil Output Analisis
a. Dari hasil uji normalitas menggunakan 1-sample Kolmogorov-Smirnov) diperoleh hasil bahwa
data berdistribusi normal (Sig 0,09 > 0,05) dan (Sig 0,16 > 0,05)
b. Model Summary
Tabel model summary memuat tentang kekuatan hubungan antara variabel independen
dengan variabel dependen. Model regresi diatas mempunyai:
1) Nilai R sebesar 0,891 artinya keeratan hubungan antara variabel independen dengan
variabel dependenadalah sebesar 0.891. Nilai R merupakan nilai multiple coefficient
correlation.
2) Nilai R2 (Koeffisien Determinasi) sebesar 0,794 artinya keragaman variabel
independen (pemberian protein) dapat menjelaskan 79% keragaman variabel BB bayi baru
lahir. Model dikatakan baik karena mendekati 100%.
3) Nilai R2 Adjusted (Nilai R yang sudah diadjusted) sebesar 0,792 artinya keragaman
variabel independen (kenaikan berat badan ibu) menjelaskan 79,2% keragaman variabel BB
Bayi saat Lahir. Model dikatakan baik karena mendekati 100%.
4) Nilai Std. Eror of Estimate merupakan nilai standart deviasi eror dimana eror adalah nilai
duga (estimate) dikurangi nilai sebenarnya.
5) Nilai Durbin Watson merupakan nilai uji statistic Durbin Watson yang digunakan untuk
menguji kebebasan sisaan eror. Nilai ini dibandingkan dengan tabel Durbin Watson. Nilai
yang diperoleh sebesar D = 1,511 dan nilai DL = 1,6540 Du = 1,6944 maka Ho diterima
artinya sisaan saling bebas (asumsi terpenuhi) tabel durbin Watson n sample 97 dan k = 1
(variabel bebas) (4-D)>Du tidak ada autokorelasi negatif (2,487 > 1,6944)
c. Uji Hipotesis
Hipotesis statistik
Ho : 1= 0
H1 : 1 0
Hipotesis Penelitian
Hipotesis Nol : Kenaikan Berat Badan (BB) ibu saat hamil tidak berpengaruh terhadap
Berat Badan (BB) bayi saat lahir
Hipotesis alternatif: Kenaikan Berat Badan (BB) ibu saat hamil berpengaruh terhadap
Berat Badan (BB) bayi saat lahir )
Berdasarkan tabel anova diperoleh bahwa p < yaitu sig 0,000 < 0,05 ( = 5%) , Ho
ditolak sehingga terdapat pengaruh antara variabel kenaikan berat badan ibu terhadap
variabel BB Bayi saat Lahir.
Berdasarkan tabel coefficient (uji secara parsial) juga diperoleh bahwa p value < yaitu
sig 0,000 < 0,05 ( = 5%) Ho ditolak sehingga terdapat pengaruh antara variabel
kenaikan berat badan ibu terhadap variabel BB Bayi saat Lahir.
d. Chart
e. Homoscedasticity
6. KESIMPULAN
Kenaikan Berat Badan Ibu Saat Hamil berpengaruh terhadap Berat Badan (BB) Bayi saat
Lahir.)
Analaisis regresi linier sederhana adalah analisis regresi linier yang hanya melibatkan dua
variabel, yaitu satu variabel independen dan satu variabel dependen. Disebut linier sederhana
karena variabel dependen diasumsikan berhubungan linier dalam parameter dan linier dengan
variabel independen.
Asumsi Regresi Linier:
1. Variabel tergantung minimal berskala interval (kenaikan Berat Badan Ibu saat hamil)
2. Variabel bebas minimal berskala interval (Berat Badan Bayi saat sahir)
3. Linieritas pola hubungan var. tergantung dan var. bebas berbentuk linier
4. Homoscedasticity
5. Sisaan (eror) berdistribusi normal
6. Sisaan (eror) saling bebas
Kesimpulan dari simulasi analisis tentang pengaruh kenaikan berat badan ibu terhadap
berat badan bayi saat lahir di Puskesmas Kota Kab. Timor Tengah Selatan Bulan Januari Sampai
Dengan April Tahun 2017 sebanyak 97 ibu adalah Kenaikan Berat Badan Ibu Saat Hamil
berpengaruh terhadap Berat Badan (BB) Bayi saat Lahir.) dan Model yang didapatkan adalah y
= 1.906 + 0,112 (Berat Badan Ibu)
DAFTAR PUSTAKA
Wibowo Arief, Soenartalina, Rachmah Indawati, Mahmudah, Indriani Diah. 2008. Modul
SPSS Fakultas Kesehatan Masyarakat Universitas Airlangga. Surabaya.