Anda di halaman 1dari 6

Regresi Logistik Dengan MINITAB 5

Model regresi logistic

Regresi Logistik dengan Minitab


Seorang peneliti ingin mengetahui pengaruh 10 kelompok tingkat pendapatan pertahun
terhadap status keluarga sehat. Data sebagai berikut :

Kelompo
k
1
2
3
4
5
6
7
8
9
10

Tingkat pendapatan
(juta)
6
8
10
13
15
20
25
30
35
40

jumlah
keluarga
40
50
60
80
100
70
65
50
40
25

keluarga
sehat
8
12
18
28
45
36
39
33
30
20

Langkah-langkah :
Buat layout untuk dimasukkan kedalam worksheet minitab. Layoutnya menjadi :

Tingkat pendapatan
(juta)

status
6
8
10
13
15
20
25
30
35
40
6
8
10

frekuensi
1
1
1
1
1
1
1
1
1
1
0
0
0

8
12
18
28
45
36
39
33
30
20
32
38
42

13
15
20
25
30
35
40

0
0
0
0
0
0
0

52
55
34
26
17
10
5

keterangan :
status = 1 sehat
status = 0 tidak sehat
Langkah analisis dimulai dengan memilih menu Stat Regression Binary Logistic Regression

Masukkan data peubah respon yaitu status ke Response, lalu masukkan data dalam kolom frekuensi ke
dalam kolom frequency, pada model masukkan peubah penjelas yaitu tingkat pendapatan.

Klik Option Link Function Logit OK

Hasil Output :
Binary Logistic Regression: status versus Tingkat pendapatan (juta)
Link Function: Logit

Response Information
Variable
status

Value
1
0
Total

Count
269
311
580

(Event)

Frequency: frekuensi

Logistic Regression Table

Predictor
Constant
Tingkat pendapatan (juta)

Coef
-1.60234
0.0790658

Predictor
Constant
Tingkat pendapatan (juta)

Upper

SE Coef
0.204034
0.0101125

Z
-7.85
7.82

P
0.000
0.000

Odds
Ratio

95%
CI
Lower

1.08

1.06

1.10

Output di atas ini sesungguhnya merupakan output untuk uji Wald (uji parsial) yang digunakan untuk
menguji manakah dari perubah penjelas yang berpengaruh terhadap peubah respon. Hipotesis yang diuji
adalah:
H0 : tingkat pendapatan tidak berpengaruh terhadap status
H1 : tingkat pendapatan berpengaruh terhadap status
Tolak H0 jika p-value < alpha (0,05)

Kesimpulan : p-value (0.00) < alpha (0.05) maka tolak H0 yang artinya cukup bukti untuk menyatakan
bahwa jumlah pendapatan berpengaruh nyata terhadap status kesehatan pada taraf nyata 5%.
Selain uji Wald output di atas menunjukkan koefisien regresi logistik. Sehingga persamaan
regresi logistiknya adalah:
Dengan model peluang logit adalah g(x) = -1.60234+0.0791tingkat pendapatan
Log-Likelihood = -365.301
Test that all slopes are zero: G = 70.404, DF = 1, P-Value = 0.000

Uji G merupakan uji simultan yang digunakan untuk mengetahui peran seluruh peubah penjelas dalam
model. Hipotesis yang diuji adalah:
H0 : Semua peubah penjelas tidak berpengaruh terhadap status kesehatan
H1 : minimal ada 1 peubah penjelas berpengaruh terhadap status kesehatan
Tolak H0 jika p-value < alpha (0,05)
Kesimpulan : Pada output di atas terlihat p-value (0.000) < alpha (0.05) berarti tolak H0. Hal ini berarti
bahwa minimal ada 1 peubah penjelas yang berpengaruh nyata terhadap status kesehatan pada taraf
nyata 5%.
Goodness-of-Fit Tests
Method
Pearson
Deviance
Hosmer-Lemeshow

Chi-Square
2.34682
2.35415
2.31913

DF
8
8
6

P
0.968
0.968
0.888

Pengujian model logit dilakukan dengan melihat nilai statistic Goodness of fit. Metode yang sering
digunakan untuk Goodness of fit data kategori adalah Pearson, Deviance dan Hosmer-Lemeshow.
Hipotesis yang diuji adalah:
H0 : model layak
H1 : model tidak layak
Tolak H0 jika p-value < alpha (0,05)
Kesimpulan : Dari ketiga metode yang digunakan, terlihat bahwa semua p-value nya bernilai > 0,05
sehingga terima H0 jadi dapat disimpulkan bahwa model layak.
Table of Observed and Expected Frequencies:
(See Hosmer-Lemeshow Test for the Pearson Chi-Square Statistic)
Value
1
Obs
Exp
0
Obs
Exp
Total

Group
4
5

20
23.5

18
18.5

28
28.8

45
39.7

70
66.5
90

42
41.5
60

52
51.2
80

55
60.3
100

Total

36
34.6

39
38.5

63
64.7

20
20.7

269

34
35.4
70

26
26.5
65

27
25.3
90

5
4.3
25

311
580

Measures of Association:
(Between the Response Variable and Predicted Probabilities)
Pairs

Number

Percent

Summary Measures

Concordant
Discordant
Ties
Total

54118
20943
8598
83659

64.7
25.0
10.3
100.0

Somers' D
Goodman-Kruskal Gamma
Kendall's Tau-a

0.40
0.44
0.20

Sedangkan output bagian terakhir menjelaskan tentang keragaman peubah Y yang dapat dijelaskan oleh
peubah penjelas.
Untuk melihat sejauh mana keragaman peubah Y yang dapat dijelaskan oleh peubah-peubah
penjelas, digunakan persen keragaman concordant.
Pada kasus ini terlihat nilai percent untuk concordant 64,7%. Hal ini berarti bahwa keragaman peubah
respon (status kesehatan) dapat dijelaskan oleh peubah-peubah penjelas dalam model sebesar 64,7%
sedangkan sisanya dijelaskan oleh factor lain di luar model.
Untuk mengetahui nilai odd ratio pada setiap kategori dapat dilakukam dengan memasukkan peubah
penjelas (tingkat pendapatan) ke factors (optional) - OK

hasil output :
Logistic Regression Table

Predictor
Constant
Tingkat pendapatan (juta)
8
10
13
15
20
25
30
35
40

Coef
-1.38629

SE Coef
0.395282

Z
-3.51

P
0.000

0.233615
0.538997
0.767255
1.18562
1.44345
1.79176
2.04959
2.48491
2.77259

0.515652
0.485400
0.459557
0.443454
0.461993
0.469415
0.495353
0.538127
0.637373

0.45
1.11
1.67
2.67
3.12
3.82
4.14
4.62
4.35

0.651
0.267
0.095
0.008
0.002
0.000
0.000
0.000
0.000

Predictor
Constant

Upper

Odds
Ratio

95%
CI
Lower

1.26
1.71
2.15
3.27
4.24
6.00
7.76
12.00
16.00

0.46
0.66
0.88
1.37
1.71
2.39
2.94
4.18
4.59

Tingkat pendapatan (juta)


8
10
13
15
20
25
30
35
40

3.47
4.44
5.30
7.81
10.47
15.06
20.50
34.45
55.80

Interpretasi :
Hasil output menunjukkan bahwa peluang penduduk dengan tingkat pendapatan 8 juta/tahun memiliki
status sehat lebih besar 1,26 kali dari penduduk dengan tingkat pendapatan 6 juta/tahun. dst.

Anda mungkin juga menyukai