Anda di halaman 1dari 41

KORELASI

Korelasi merupakan suatu hubungan antara satu variabel dengan variabel lainnya.
Hubungan antara variabel tersebut bisa secara korelasional dan secara kausal.

a. Korelasi dikatakan korelasional jika hubungan tersebut tidak menunjukkan


sebab akibat, artinya sifat hubungan variabel satu dengan variabel lainnya tidak
jelas mana variabel sebab, dan mana variabel akibat.
b. Korelasi dikatakan kausal jika hubungan tersebut menunjukkan sifat sebab
akibat, artinya jika variabel yang satu merupakan sebab, maka variabel lainnya
merupakan akibat.

Untuk mengukur seberapa kuat hubungan antara variabel, maka digunakan metode
analisis korelasi. Analisis korelasi adalah alat statistik yang dapat digunakan untuk
mengetahui derajat keeratan (tingkat hubungan) linear antara satu variabel dengan
variabel yang lain.

Umumnya analisis korelasi digunakan dalam hubungan dengan analisis regresi,


yaitu untuk mengukur ketepatan garis regresi dalam menjelaskan variasi nilai
variabel dependen (variabel tak bebas/ terikat).

Dalam analisis korelasi tidak mempersoalkan apakah variabel yang satu tergantung
pada variabel yang lain atau sebaliknya. Jadi metode korelasi dapat dipakai untuk
mengukur derajat hubungan antara variabel bebas satu dengan variabel bebas yang
lainnya, atau antar dua variabel.

Hubungan dua variabel ada yang positif dan ada yang negatif. Hubungan 𝑋 dan 𝑌
dikatakan positif apabila kenaikan (penurunan) 𝑋 pada umumnya diikuti oleh
kenaikan (penurunan) 𝑌. Sebaliknya, dikatakan negatif jika kenaikan (penurunan)
𝑋 pada umumnya diikuti oleh penurunan (kenaikan) 𝑌.

Berikut diagram pencar yang menggambarkan hubungan antara variabel 𝑋 dan


variabel 𝑌.

1
Gambar Diagram Pencar

Korelasi Positif Korelasi Negatif

Tidak Ada Korelasi Korelasi Sempurna

Contoh Soal
Berikut data tentang hubungan antara hasil penjualan dengan biaya iklan suatu
perusahaan.
Biaya Iklan Biaya Penjualan
(Juta Rupiah) (Juta Rupiah)
0.50 5.00
1.00 10.00
1.75 12.50
2.75 20.00
3.25 30.00
4.00 35.00
5.50 40.00
5.25 42.50
6.50 50.00

a. Buatlah diagram pencar dari data tersebut!


b. Sebutkan jenis korelasi yang terjadi!

2
Jawab:
a. Gambar diagram pencar (Scatter plot)

b. Jenis korelasi yang terbentuk adalah korelasi positif.

Jika variabel 𝑋 dan 𝑌 ada hubungan, maka diagram pencarnya adalah lurus
atau teratur. Apabila diagram pencarnya tidak teratur, artinya kenaikan atau
penurunan 𝑋 pada umumnya tidak diikuti oleh naik turunnya 𝑌, maka
dikatakan 𝑋 dan 𝑌 tidak berkorelasi. Kuat dan tidaknya hubungan antara 𝑋 dan
𝑌 apabila dapat dinyatakan dengan fungsi linear (paling mendekati), diukur
dengan suatu nilai yang disebut koefisien korelasi (𝑟). Nilai koefisien korelasi
ini paling sedikit −1 dan paling banyak +1. Jadi, jika 𝑟 sama dengan koefisien
korelasi, maka 𝑟 dapat dinyatakan sebagai berikut.
−1 ≤ 𝑟 ≤ +1

Kuat (−) Kuat (+)

Lemah (−) Lemah (+)

3
Jika : 𝑟 = + korelasi positif mendekati +1 (kuat)
𝑟=− korelasi negatif mendekati −1 (kuat)
𝑟=0 tidak ada korelasi.

JENIS-JENIS KOEFISIEN KORELASI

1. Koefisien Korelasi Linear (Korelasi Pearson)


Untuk mencari koefisien korelasi dapat digunakan rumus koefisien korelasi
Pearson atau koefisien korelasi produk momen (Product Moment Corelation).
Syarat:
- Berskala interval atau rasio
- Keduanya memiliki rentangan nilai yang relatif sama.

𝑛 ∙ ∑𝑛𝑖=1 𝑋𝑖 𝑌𝑖 − ∑𝑛𝑖=1 𝑋𝑖 ∑𝑛𝑖=1 𝑌𝑖


𝑟𝑥𝑦 =
√𝑛 ∙ ∑𝑛𝑖=1 𝑋𝑖 2 − (∑𝑛𝑖=1 𝑋𝑖 )2 √𝑛 ∙ ∑𝑛𝑖=1 𝑌𝑖 2 − (∑𝑛𝑖=1 𝑌𝑖 )2

atau
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖
𝑟𝑥𝑦 =
√∑𝑛𝑖=1 𝑥𝑖 2 √∑𝑛𝑖=1 𝑦𝑖 2
Dimana:
𝑥 = 𝑋 − 𝑋̅
𝑦 = 𝑌 − 𝑌̅

Koefisien korelasi dikuadratkan disebut Koefisien Determinasi (𝑟 2 ) artinya


pengaruh variabel 𝑋 terhadap variabel 𝑌 sebesar:
𝑟 2 × 100%

2. Koefisien Korelasi Rank


Koefisien korelasi rank adalah indeks angka-angka yang digunakan untuk
mengukur keeratan (erat atau tidaknya) korelasi antara dua variabel yang
digunakan ranking (tingkatan).

4
Rumus:
6 ∑ 𝑑2
𝑟 = 1−
𝑛(𝑛2 − 1)
dengan,
𝑟 : koefisien korelasi rank
𝑑 : selisih ranking (beda)
𝑛 : banyaknya pasangan rank.

Catatan:
Pemberian rank disini dimulai dari data terbesar atau terkecil.

Contoh Soal
Berikut merupakan data nilai matematika dan statistika dari 10 Mahasiswa.

Matematika 82 75 85 70 77 60 63 66 88 89
Statistika 79 80 89 65 67 62 61 68 81 84

a. Hitunglah koefisien korelasi rank-nya


b. Sebutkan jenis korelasinya, dan apa artinya
Penyelesaian:

Matematika Statistika Rank Rank


𝒅 𝒅𝟐
(𝑿) (𝒀) (𝑿) (𝒀)
82 79 4 5 -1 1
75 80 6 4 2 4
85 89 3 1 2 4
70 65 7 8 -1 1
77 67 5 7 -2 4
60 62 10 9 1 1
63 61 9 10 -1 1
66 68 8 6 2 4
88 81 2 3 -1 1
89 84 1 2 -1 1
∑ 28

a. Menentukan koefisien korelasi rank-nya

5
6 ∑ 𝑑2
𝑟 = 1−
𝑛(𝑛2 − 1)
6 ∙ (22)
=1−
10 ∙ (102 − 1)
132
=1−
990
= 0,87

b. Jenis korelasinya adalah korelasi positif kuat (mendekati +1)


𝑟 2 × 100% = (0,87)2 × 100%
= 75%
Artinya, nilai matematika siswa mempengaruhi nilai statistika siswa
sebesar 75%.

3. Korelasi Kontingensi (Koefisien Korelasi Bersyarat)


Korelasi kontingensi digunakan jika data berbentuk kualitatif (data yang tak
berbentuk angka atau bilangan).
Rumus:

𝝌𝟐
𝓒= √
𝝌𝟐 + 𝒏

dengan,
𝑝 𝑞 2
(𝑓𝑖𝑗 − 𝑒𝑖𝑗 )
𝜒2 = ∑ ∑
𝑒𝑖𝑗
𝑖=1 𝑗=1

0≤𝓒≤1
dimana,
𝑖 : baris
𝑗 : kolom
𝑛 : jumlah semua frekuensi
(𝑛𝑖 −𝑛𝑗 )
𝑒𝑖𝑗 : frekuensi harapan, yaitu 𝑒𝑖𝑗 = 𝑛

𝑓𝑖𝑗 : frekuensi per sel.

6
Contoh Soal
Seseorang ingin mengetahui apakah ada hubungan antara tingkat pendidikan
dan kebiasaan rekreasi diambil sampel sebanyak 400 orang untuk diteliti.

Tabel Kontingensi
Rekreasi
Pendidikan Jumlah
Tidak pernah Jarang Sering
Tidak ada 145 58 8 211
Menengah 77 13 27 117
Sarjana 21 32 19 72
Jumlah 243 103 54 400

𝑳𝟏 : menentukan 𝑒𝑖𝑗
211 × 243
∗ 𝑒11 = = 128,1825
400
211 × 103
∗ 𝑒12 = = 54,3325
400
211 × 54
∗ 𝑒13 = = 28,485
400
117 × 243
∗ 𝑒21 = = 71,0775
400
117 × 103
∗ 𝑒22 = = 30,1275
400
117 × 54
∗ 𝑒23 = = 15,795
400
72 × 243
∗ 𝑒31 = = 43,74
400
72 × 103
∗ 𝑒32 = = 18,54
400
72 × 54
∗ 𝑒33 = = 9,72
400

2
(𝑓𝑖𝑗 −𝑒𝑖𝑗 )
𝑳𝟐 : menentukan 𝑒𝑖𝑗

(𝑓11 − 𝑒11 )2 (145 − 128,1825)2


∗ = = 2,20
𝑒11 128,1825
(𝑓12 − 𝑒12 )2 (58 − 54,3325)2
∗ = = 0,24
𝑒12 54,3325

7
(𝑓13 − 𝑒13 )2 (8 − 28,485)2
∗ = = 14,73
𝑒13 28,485
(𝑓21 − 𝑒21 )2 (77 − 71,0775)2
∗ = = 0,49
𝑒21 71,0775
(𝑓22 − 𝑒2 )2 (13 − 30,1275)2
∗ = = 9,73
𝑒2 30,1275
(𝑓23 − 𝑒23 )2 (27 − 15,795)2
∗ = = 7,94
𝑒23 15,795
(𝑓31 − 𝑒31 )2 (21 − 43,74)2
∗ = = 11,82
𝑒31 43,74
(𝑓32 − 𝑒32 )2 (32 − 18,54)2
∗ = = 9,77
𝑒32 18,54
(𝑓33 − 𝑒33 )2 (19 − 9,72)2
∗ = = 8,85
𝑒33 9,72

𝑳𝟑 : menentukan 𝜒 2
𝑝 𝑞 2
2
(𝑓𝑖𝑗 − 𝑒𝑖𝑗 )
𝜒 = ∑∑
𝑒𝑖𝑗
𝑖=1 𝑗=1

𝜒 2 = 2,20 + 0,24 + 14,73 + 0,49 + 9,73 + 7,94 + 11,82 + 9,77 + 8,85


= 65,77

𝝌𝟐
𝓒=√ 𝟐
𝝌 +𝒏

65,77 65,77
=√ =√ = √0,41207033
65,77 + 400 465,77

= 0,375

4. Koefisien Korelasi Linear Berganda


Digunakan untuk menghitung dan mengukur keeratan hubungan antara tiga
variabel atau lebih.
Rumus:

8
𝑟𝑌1 2 + 𝑟𝑌2 2 − 2𝑟𝑌1 ∙ 𝑟𝑌2 ∙ 𝑟12
𝑅𝑌.12 =√
1 − 𝑟12 2

dengan,
𝑟𝑌1 : koefisien korelasi antara 𝑌 dan 𝑋1
𝑟𝑌2 : koefisien korelasi antara 𝑌 dan 𝑋2
𝑟12 : koefisien korelasi antara 𝑋1 dan 𝑋2

Variabel 1 :𝑌
Variabel 2 : 𝑋1
Variabel 3 : 𝑋2

Untuk:
𝑛 ∑ 𝑌𝑋1 − ∑ 𝑌 ∙ ∑ 𝑋1
𝑟𝑌.𝑋1 =
√[𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ][𝑛 ∑ 𝑋1 2 − (∑ 𝑋1 )2 ]

𝑛 ∑ 𝑌𝑋2 − ∑ 𝑌 ∙ ∑ 𝑋2
𝑟𝑌.𝑋2 =
√[𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ][𝑛 ∑ 𝑋2 2 − (∑ 𝑋2 )2 ]

𝑛 ∑ 𝑋1 𝑋2 − ∑ 𝑋1 ∙ ∑ 𝑋2
𝑟𝑋1 .𝑋2 =
√[𝑛 ∑ 𝑋1 2 − (∑ 𝑋1)2 ][𝑛 ∑ 𝑋2 2 − (∑ 𝑋2 )2 ]

Contoh Soal
Seorang peneliti ingin mengetahui apakah ada hubungan yang positif antara
pengeluaran, pendapatan, dan banyaknya anggota keluarga untuk keperluan
tersebut diambil sampel sebanyak 7 rumah tangga.

Rumah Tangga
Variabel
I II III IV V VI VII
𝒀 3 5 6 7 4 6 9
𝑿𝟏 5 8 9 10 7 7 11
𝑿𝟐 4 3 2 3 2 4 5

Tentukan koefisien korelasi linearnya, dan apa artinya!


Penyelesaian:

9
Menentukan tabel regresi linear sederhana

Tabel regresi linear sederhana


𝒀 𝑿𝟏 𝑿𝟐 𝒀𝟐 𝑿𝟏 𝟐 𝑿𝟐 𝟐 𝒀𝑿𝟏 𝒀𝑿𝟐 𝑿𝟏 𝑿𝟐
3 5 4 9 25 16 15 12 20
5 8 3 25 64 9 40 15 24
6 9 2 36 81 4 54 12 18
7 10 3 49 100 9 70 21 30
4 7 2 16 49 4 28 8 14
6 7 4 36 49 16 42 24 28
9 11 5 81 121 25 99 45 55
∑ 𝟒𝟎 ∑ 𝟓𝟕 ∑ 𝟐𝟑 ∑ 𝟐𝟓𝟐 ∑ 𝟒𝟖𝟗 ∑ 𝟖𝟑 ∑ 𝟑𝟒𝟖 ∑ 𝟏𝟑𝟕 ∑ 𝟏𝟖𝟗

𝑛 ∑ 𝑌𝑋1 − ∑ 𝑌 ∙ ∑ 𝑋1
∗ 𝑟𝑌.𝑋1 =
√[𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ][𝑛 ∑ 𝑋1 2 − (∑ 𝑋1 )2 ]

(7)(384) − (40)(57)
=
√[7(252) − (40)2 ][7(489) − (57)2 ]
2436 − 2280
=
√(1764 − 1600)(3423 − 3249)
156
=
√28536
= 0,92

𝑛 ∑ 𝑌𝑋2 − ∑ 𝑌 ∙ ∑ 𝑋2
∗ 𝑟𝑌.𝑋2 =
√[𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ][𝑛 ∑ 𝑋2 2 − (∑ 𝑋2 )2 ]

(7)(137) − (40)(23)
=
√[7(252) − (40)2 ][7(83) − (23)2 ]
959 − 920
=
√(164)(52)
39
=
√8528
= 0,42

10
𝑛 ∑ 𝑋1 𝑋2 − ∑ 𝑋1 ∙ ∑ 𝑋2
∗ 𝑟𝑋1 .𝑋2 =
√[𝑛 ∑ 𝑋1 2 − (∑ 𝑋1 )2 ][𝑛 ∑ 𝑋2 2 − (∑ 𝑋2 )2 ]

(7)(189) − (57)(23)
=
√[7(489) − (57)2 ][7(83) − (23)2 ]
1323 − 1311
=
√(174)(52)
12
=
√9048
= 0,126

Maka,

𝑟𝑌1 2 + 𝑟𝑌2 2 − 2𝑟𝑌1 ∙ 𝑟𝑌2 ∙ 𝑟12


𝑅𝑌.12 = √
1 − 𝑟12 2

(0,92)2 + (0,42)2 − 2(0,92)(0,42)(0,12)


=√
1 − (0,12)2

0,09301
=√
0,9856

= 0,97
(korelasi positif kuat, mendekati +1)

Jadi, ada hubungan yang positif antara pengeluaran, pendapatan, dan


banyaknya anggota keluarga.

5. Koefisien korelasi parsial


Pada koefisien korelasi linier berganda, masih bersifat umum untuk
mengetahui besarnya kontribusi masing-masing variabel bebas terhadap
variabel terikat dengan mempertimbangkan hubungan variabel bebas lainnya,
baik terhadap variabel terikat maupun variabel bebas yang dicari kontribusinya
diperlukan analisis sendiri.
a. Koefisien korelasi parsial antara 𝑌 dan 𝑋1 apabila 𝑋2 kontinu

11
𝑟𝑦1 − 𝑟𝑦2 . 𝑟12
𝑟𝑦1.2 =
√(1 − 𝑟𝑦2 2 )(1 − 𝑟12 2 )
b. Koefisien korelasi parsial antara Y dan X1 apabila X2 kontinu
𝑟𝑦2 − 𝑟𝑦1 . 𝑟12
𝑟𝑦2.1 =
√(1 − 𝑟𝑦1 2 )(1 − 𝑟12 2 )
c. Jika variabel-variabel 𝑌, 𝑋1 , 𝑋2 dan 𝑋3 maka akan didapatkan koefisien
korelasi parsial 𝑟𝑦1.23 , 𝑟𝑦2.13 , 𝑟𝑦3.12 misal koefisien korelasi parsial antara 𝑌
dan 𝑋1 jika 𝑋2 dan 𝑋3 tetap.
𝑟𝑦1.2 − 𝑟𝑦3.2 . 𝑟13.2
𝑟𝑦1.2 =
√(1 − 𝑟𝑦3.2 2 )(1 − 𝑟13.2 2 )

Contoh Soal
Seorang peneliti ingin mengetahui apakah ada hubungan yang positif antara
pengeluaran, pendapatan, dan banyaknya anggota keluarga untuk keperluan
tersebut diambil sampel sebanyak 7 rumah tangga.

Rumah Tangga
Variabel
I II III IV V VI VII
𝒀 3 5 6 7 4 6 9
𝑿𝟏 5 8 9 10 7 7 11
𝑿𝟐 4 3 2 3 2 4 5

Telah diperoleh sebelumnya,


𝑟𝑦1 = 0,92
𝑟𝑦2 = 0,42
𝑟12 = 0,12
Maka,
𝑟𝑦1 − 𝑟𝑦2 . 𝑟12
𝑟𝑦1.2 =
√(1 − 𝑟𝑦2 2 )(1 − 𝑟12 2 )

0,92 − (0,42.0,126)
=
√(1 − 0,422 )(1 − 0,1262 )
0,92 − 0,05
=
√(0,8)(0,98)

12
0,87 0,87
= = = 0,9
√0,784 0,88

𝑟𝑦2 − 𝑟𝑦1 . 𝑟12


𝑟𝑦2.1 =
√(1 − 𝑟𝑦1 2 )(1 − 𝑟12 2 )
0,42 − (0,92.0,126)
=
√(1 − 0,922 )(1 − 0,1262 )
0,42 − 0,12
=
√(0,15)(0,98)
0,3 0,3
= = = 0,78
√0,147 0,38

PENGUJIAN SIGNIFIKANSI KORELASI

1. Menyusun hipotesis
𝐻0 : 𝑟 = 0 tidak ada korelasi
𝐻1 : 𝑟 ≠ 0 ada korelasi

2. Menentukan taraf nyata/tingkat sgnifikasi (α)


𝛼 = 5% = 0,05
𝛼 = 1% = 0,01

3. Menentukan daerah kritis


𝑇𝑡abel = (𝛼 ∶ 𝑛 − 2) → Prof. Agus
1
𝑇tabel = 𝑡 (1 − 𝛼)∶ 𝑛– 2 → Sudjana
2

4. Uji 𝑡
Untuk sampel kecil gunakan uji 𝑡
a. Nilai 𝑡 untuk korelasi peason dapat dicari dengan rumus:

𝑛−2
𝑡 = 𝑟√
1 − 𝑟2

b. Nilai t untuk korelasi Spearmann dapar dicari dengan rumus:

13
𝑛−2
𝑡 = 𝑟𝑠 √
1 − 𝑟𝑠2

Derajat kebenaran 𝑑𝑘 = 𝑛 – 2
Jika sampel besar gunakan 𝑍
a. Untuk korelasi pearson dihitung dengan rumus:
𝑧 = 𝑟 √𝑛 − 1
b. Untuk korelasi spearman
𝑧 = 𝑟𝑠 √𝑛 − 1

Catatan:
Asumsikan bahwa sampling distribusi dari sampel berdistribusi normal dengan
1
𝑥̅ = 0 dan 𝑠 =
√𝑛−1

5. Kriteria uji
𝑡hitung > 𝑡tabel → tolak 𝐻0

Tolak 𝐻0

−𝑡 𝑡
Contoh Soal
Suatu penelitian yang ingin melihat apakah ada hubungan antara banyaknya kredit
yang diambil dengan indeks prestasinya yang dicapai mahasiswa dalam satu
semester. Setelah dilakukan pengumpulan data dari 10 mahasiswa ternyata
penyebaran kredit dan IP yang dicapai sebagai berikut:

Mahasiswa ke- 1 2 3 4 5 6 7 8 9 10
Jumlah kredit diambil 20 18 15 20 10 12 16 14 18 12
IP 3,1 4,0 2,8 4,0 3,0 3,6 4,0 3,2 3,5 4,0

14
Penyelesaian:
1. 𝐻0 : 𝑟 = 0
𝐻1 : 𝑟 ≠ 0
2. Taraf signifikasi
𝛼 = 0,05

3. Daerah kritis ( 𝑡 tabel)


1
𝑡tabel = (𝛼: 𝑛 − 2) 𝑡𝑡𝑎𝑏𝑒𝑙 = (𝑡 (1 − 𝛼) : 𝑛 – 2)
2
1
= (0,05: 10 − 2) = (𝑡 (1 − 2 . 0,05) : 10 − 2)

= (0,05: 8) = (𝑡(1 − 0,025): 8)


= 2,306 = (𝑡 (0,975: 8))
= 2,31

Tabel Regresi Sederhana


𝑿 𝒀 𝑿𝟐 𝒀𝟐 𝑿𝒀
20 3,1 400 9,61 62
18 4,0 324 16,00 72
15 2,8 225 7,84 42
20 4,0 400 16,00 80
10 3,0 100 9,00 30
12 3,6 144 12,96 43,2
16 4,0 256 16,00 64
14 3,2 196 10,24 44,8
18 3,5 324 12,25 63
12 4,0 144 16,00 48
155 35,2 2513 125,9 549

𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 𝑦
𝑟=
√(𝑛. ∑ 𝑥 2 − (∑ 𝑥)2 ) (𝑛. ∑ 𝑦 2 − (∑ 𝑦)2 )

10.549 − (155.35,2)
=
√(10.2513 − (155)2 )(10.125,9 − (35,2)2 )
5490 − 5456
=
√(1105)(19,96)

15
34
= = 0,23
148,51

4. Uji 𝑡

𝑛−2
𝑡 = 𝑟√
1 − 𝑟2

10 − 2
= 0,23√
1 − (0,23)2

8
= 0,23√
0,947

= 𝟎, 𝟔𝟕

5. Kriteria uji 𝑡
𝑡hitung < 𝑡tabel

Terima 𝐻0

−2,31 0,67 2,31

6. Kesimpulan
Antara variabel jumlah kredit yang diambil tidak mempunyai hubungan dengan
Indeks Prestasi.

16
PENGUJIAN SIGNIFIKASI KOEFISIEN
KORELASI LINIER GANDA

Setelah koefisien korelasi linier ganda diperoleh maka langkah selanjutnya adalah
uji signifikansi korelasi linear tersebut. Apabila koefisien korelasi tersebut
signifikasi barulah dapat digunakan untuk menyatakan besarnya kontribusi bersama
dari variabel bebas terhadap variabel terikatnya. Pengujian koefisien korelasi linier
ganda menggunakan 𝑓 − test.

𝐹 hitung diperoleh dengan rumus sebagai berikut:


𝑅 2 /𝑘
𝐹=
(1 − 𝑅 2 )/(𝑛 − 𝑘 − 1)

Keterangan:
𝑅 : koefisien korelasi ganda
𝐾 : derajat kebebasan (banyak variabel bebas)
𝑛−𝑘−1 : derajat kebebasan sisa

Contoh Soal
Seorang peneliti ingin mengetahui apakah ada hubungan yang positif antara
pengeluaran, pendapatan, dan banyaknya anggota keluarga untuk keperluan
tersebut diambil sampel sebanyak 7 rumah tangga.

Rumah Tangga
Variabel
I II III IV V VI VII
𝒀 3 5 6 7 4 6 9
𝑿𝟏 5 8 9 10 7 7 11
𝑿𝟐 4 3 2 3 2 4 5

Telah diperoleh sebelumnya,


𝑅 = 0,97
𝑛=7
𝑘=2

17
Maka,
(0,97)2 /2
𝐹=
(1 − (0,97)2 )/(7 − 2 − 1)
0,47045
=
0,014775
= 31,8

Taraf signifikansi
𝐹tabel = 𝐹0,05 ( 2 ∶ 7 − 2 − 1)
= 𝐹0,05 (2 ∶ 4) = 6,94
Kriteria uji
𝐹hitung > 𝐹tabel

Tolak 𝐻0

−6,94 6,94 31,8

Kesimpulan
Walaupun kita ambil 𝛼 = 1% koefisien korelasi dinyatakan signifikal hal ini berarti
kedua variabel bebas secara bersama-sama mempunyai kontribusi yang sangat
signifikal sebesar 24,09% terhadap pembentukan variabel terikat sisanya 5,91%
dibentuk oleh variabel lain yang tidak diperhitungkan dalam soal.

Sampai sejauh ini kesimpulan yang diambil masih bersifat umum sehingga tidak
dapat memberikan informasinya yang spesifik. Mengingat kemungkinan variabel
beas yang satu dengan yang lainnya tidak benar-benar independen maka besarnya
kontribusi masih dipertanyakan lagi. Apakah besarnya kontribusi itu ditentukan
oleh kedua variabel secara seimbang?

18
Berapa persen yang benar-benar dipengaruhi oleh variabel bebas pertama dan
berapa persen yang di pengaruhi oleh variabel bebas yang kedua. Untuk menjawab
dilakukan analisis lanjutan.

Untuk mencari 𝐹 pada pengujian signifikansi koefisien korelasi parsial antara


variabel terikat dengan variabel bebas pertama digunakan rumus.
2
𝑟𝑦1.2
𝐹= 2
(𝑛 − 𝑘 − 1)
1 − 𝑟𝑦1.2
Untuk mencari 𝐹 pada pengujian signifikansi koefisien korelasi parsial antara
variabel terikat dengan variabel bebas kedua digunakan rumus.
2
𝑟𝑦2.1
𝐹= 2
(𝑛 − 𝑘 − 1)
1 − 𝑟𝑦2.1

Contoh Soal
Seorang peneliti ingin mengetahui apakah ada hubungan yang positif antara
pengeluaran, pendapatan, dan banyaknya anggota keluarga untuk keperluan
tersebut diambil sampel sebanyak 7 rumah tangga.

Rumah Tangga
Variabel
I II III IV V VI VII
𝒀 3 5 6 7 4 6 9
𝑿𝟏 5 8 9 10 7 7 11
𝑿𝟐 4 3 2 3 2 4 5

Telah diperoleh sebelumnya,


𝑟𝑦1.2 = 0,98
𝑟𝑦2.1 = 0,78
Maka,
a. Menentukan 𝐹 hitung
2
𝑟𝑦1.2
𝐹= 2
(𝑛 − 𝑘 − 1)
1 − 𝑟𝑦1.2
(0,98)2
= (7 − 1 − 1)
1 − (0,98)2
0,9604
= (5)
0,0396

19
4,802
= = 121,26
0,0396

b. Menentukan 𝐹 hitung
2
𝑟𝑦2.1
𝐹= 2
(𝑛 − 𝑘 − 1)
1 − 𝑟𝑦2.1
(0,78)2
= (5)
1 − (0,78)2
0,6084
= (5)
1 − 0,6084
3,042
= = 7,76
0,3916

c. Menentukan 𝐹tabel
𝐹tabel
𝐹𝛼 (𝑘, 𝑛 − 𝑘 − 1)
𝐹0,05 (1,7 − 1 − 1)
𝐹0,05 (1,5) → 6,61
𝐹0,01 (1,5) → 16,26

d. Kriteria Uji
𝐹hitung > 𝐹tabel
121,26 > 6,61 → Tolak 𝐻0
𝐹hitung > 𝐹tabel
7,76 > 6,61 → Tolak 𝐻0

e. Kesimpulan
Variabel 1 dan 2 memiliki kontribusi

20
REGRESI LINEAR SEDERHANA

Tujuan analisis regresi adalah untuk membangun model regresi atau persamaan
prediktif yang dapat digunakan untuk menggambarkan memprediksi dan
mengendalikan variabel tak bebas berkaitan dengan variabel bebas.

Manfaat regresi linier sederhana:


1. Untuk memprediksi atau meramalakan nilai suatu variabel misal meramalkan
konsumsi masa depan pada tingkat pendapatan tertentu.
2. Untuk mengetahui apakah variabel-variabel yang sedang diteliti sering
berhubungan dimana keadaan suatu variabel membutuhkan adanya variabel
yang lain dan sejauh mana pengaruhnya serta dapat mengestimasi nilai suatu
variabel.

Dalam regresi linier sederhana pemodelan diadakan diantara dua variabel, variabel
𝑌 disebut variabel tak bebas atau variabel respon dan variabel 𝑋 disebut variabel
bebas atau variabel rediktor. Model hubungan antara 𝑋 dan 𝑌 berupa hubungan
yang berbentuk garis lurus. Model regresi linier populasi:
𝑌 = 𝛽0 + 𝛽1 𝑥 + 𝜀
Keterangan :
𝑌 : Variabel tak bebas 𝛽1 : Slope/Koefisien garis
𝛽0 : Intersep 𝑋 : Variabel bebas
𝜀 : Galat (error)/ sisaan (residual)

𝑌
Observed Value

𝜀𝑖 Slope 𝛽1

𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜀

Intersep 𝛽0
𝑋
𝑥𝑖

21
PENENTUAN GARIS REGRESI LINEAR SEDERHANA

1. Metode Tangan Bebas


Metode tangan bebas merupakan suatu metode yang berdasarkan kira-kira dari
diagram titik ke diagram pencar (scaterplot) yang diperoleh dari pengamatan
antara variabel 𝑋 dan variabel 𝑌.

Diagram pencar didapatkan dengan menggambarkan titik-titik pasangan pada


absis 𝑥 dan ordinat 𝑦, maka kumpulan titik-titik tersebut dapat member
petunjuk untuk memperkirakan garis regresi yang akan dibuat. Metode ini
hanya dapat dilakukan oleh ahli/orang yang berpengalaman.

2. Pendekatan Matematis dengan Metode Kuadrat Terkecil


Bahwa suatu garis regresi akan didapat dan akan mendekati titik-titik pasangan
𝑥𝑦. Inti metode OLS adalah mengestimasi suatu garis regresi dengan jalan
meminimalkan jumlah dari kuadrat kesalahan setiap observasi terhadap garis
tersebut.

Contoh Soal Metode Tangan Bebas


Tabel pengaruh tingkat pendapatan terhadap konsumsi makanan bagi petani.

No Pendapatan Konsumsi
1 125 75
2 150 100

∆𝑋 = 𝑋2 − 𝑋1
𝛽1
𝑌2
∆𝑋 = 𝑋2 − 𝑋1

𝛽0 𝑌1

𝑋
𝑥1 𝑥2

22
PENDUGAAN METODE KUADRAT TERKECIL

Pendugaan parameter model regresi linier sederhana untuk mencari nilai dugaan
dari Intersep dan Slope (koefisien garis) regresi.

Persamaan regresi dugaan sampel


𝑌 = 𝑏0 + 𝑏1 𝑥 + 𝑒
Dimana,
b0 : Intersep β0
b1 : Slope β1
𝑒 : Dugaan galat/sisaan
Pendugaan model atau garis regresi linier sederhana
𝑦̂𝑖 = 𝑏0 + 𝑏1 𝑥
Dimana:
𝑦̂𝑖 : pendugaan nilai 𝑌
𝑏0 : pendugaan intersep
𝑏1 : pendugaan slope
𝑥 : variabel bebas
𝑌̂ : 𝑌topi / 𝑌cup /𝑌penduga

Dalam metode kuadrat terkecil (Ordinary Least Square, OLS) 𝑏0 dan 𝑏1 diperoleh
dengan cara meminimalkan jumlah kuadrat galat.

∑ 𝑒 2 = ∑(𝑦 − 𝑦̂)2
2
= ∑(𝑦 − (𝛽0 + 𝛽1 𝑥))

Misal:
2
Q = ∑(Y − (β0 + β1 x))

𝑄 diminimumkan, 𝑄 diturunkan terhadap 𝑏0 dan 𝑏1


𝜕𝑄
= −2 ∑(Y − β0 + β1 x)
𝜕𝛽0
𝜕𝑄
= −2 ∑ X(Y − β0 + β1 x)
𝜕𝛽0

23
Samakan dengan 0, maka diperoleh persamaan bagi pendugaan:

−2 ∑(𝑦 − 𝑏0 − 𝑏1 𝑥) = 0

−2 ∑ 𝑥(𝑦 − 𝑏0 − 𝑏1 𝑥) = 0

Setelah disederhanakan, diperoleh:

∑(𝑦 − 𝑏0 − 𝑏1 𝑥) = 0

∑ 𝑥(𝑦 − 𝑏0 − 𝑏1 𝑥) = 0

Dan diperoleh persamaan normal:

∑ 𝑦 − 𝑛𝑏0 − 𝑏1 ∑ 𝑥 = 0

∑ 𝑥𝑦 − 𝑏0 ∑ 𝑥 − 𝑏1 ∑ 𝑥 2 = 0

Sehingga:

∑ 𝑦 = nb0 − b1 ∑ x

∑ x𝑦 = b0 ∑ x − b1 ∑ x 2

Catatan:
Jumlah kuadrat (Sum Of Square)
(∑ 𝑥)2
∗ 𝑆𝑆𝑥 = ∑(𝑥 − 𝑥̅ )2 = ∑ 𝑥 2 −
𝑛
2
(∑ 𝑦)2
2
∗ 𝑆𝑆𝑦 = ∑(𝑦 − 𝑦̅) = ∑ 𝑦 −
𝑛
(∑ 𝑥)(∑ 𝑦)
∗ 𝑆𝑆𝑦 = ∑(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅) = ∑ 𝑥𝑦 −
𝑛

Berdasarkan persamaan normal diperoleh 𝑏0 dan 𝑏1 :


∑𝑥∑𝑦
∑ 𝑥𝑦 −
𝑏1 = 𝑛
(∑ 𝑥)2
∑ 𝑥2 −
𝑛
atau
∑(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅)
𝑏1 =
∑(𝑥 − 𝑥̅ )2

24
atau
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑏1 =
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2
dengan,
𝑏0 = 𝑦̅ − 𝑏1 𝑥̅
Catatan:
∑𝑦 ∑𝒙
𝑦̅ = x̅ =
𝑛 𝒏

Interprestasi dari Intersep dan Slope


 𝑏0 nilai rata-rata dugaan dari 𝑦 pada saat 𝑥 = 0
 𝑏1 nilai dugaan perubahan dari nilai rata-rata 𝑦 pada saat 𝑥 berubah satu satuan

Contoh Soal
Pengaruh Motivasi Belajar Terhadap Prestasi Belajar.

Motivasi Prestasi
Mahasiswa 𝑿𝟐 𝒀𝟐 𝑿𝒀
(𝑿) (𝒀)
1 6 4 36 16 24
2 6 5 36 25 30
3 5 4 25 16 20
4 7 6 49 36 42
5 8 7 64 49 56
6 8 9 64 81 72
7 9 9 81 81 81
8 7 6 49 36 42
9 9 6 54 36 54
10 9 9 81 81 81
11 6 6 36 36 36
12 9 8 81 64 72
89 79 683 557 610

Tentukan persamaan regresinya!


Jawab:
Menentukan 𝑏0 dan 𝑏1

25
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑏1 =
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2
(12)(610) − (89(79))
=
(12)(683) − (89)2
289
=
275
= 1,05

∑ 𝑦 − 𝑏1 ∑ 𝑥
𝑏0 =
𝑛
79 − (1,05)(89)
=
12
14,53
=− = −1,21
12

Persamaan regresinya:
𝑦̂ = 𝑏0 + 𝑏1 𝑥
= −1,21 + 1,05𝑥

Penafsiran parameternya:
𝑦̂ = −1,21 + 1,05𝑥

Koefisien garis sebesar 1,05 menunjukan bahwa setiap kenaikan x sebanyak satu
satuan, prediksi rata-rata y akan naik sebesar 1,05 satuan.

Jadi , jika skor motivasi belajar naik sebesar 1 point akan mengakibatkan kenaikan
predikasi skor prestasi belajar sebesar 1,05.

Jadi, jika skor motivasi belajar naik sebesar 1 point akan mengakibatkan kenaikan
prediksi skor prestasi belajar sebesar 1,05.

b0 = -1,21 artinya apabila variabel 𝑥 (motivasi) mempunyai nilai/skor sebesar 0


(tidak ada) maka variabel y (prestasi mempunyai nilai sebesar -1,21.

26
b1 = 1,05 artinya apabila setiap kenaikan skor variabel 𝑥 (motivasi) sebesar 1 satuan,
maka akan menaikan skor variabel 𝑦 (prestasi) sebesar 1,05 dengan konstanta
-1,21, sebaliknya.
Gambar Scatter Plot

𝑦̂ = −1,21 + 1,05𝑥

Garis regresi

ANALISIS RAGAM (ANOVA) UJI 𝑭

Keragaman total di dekomposisi menjadi 2 komponen.


𝑆𝑆𝑇 = 𝑆𝑆𝐸 + 𝑆𝑆𝑅
Dimana,
𝑆𝑆𝑇 : jumlah kuadrat total (Total Sum Of Square)
𝑆𝑆𝐸 : jumlah kuadrat galat ( Sum Of Square Error)
𝑆𝑆𝑅 : jumlah kuadrat regresi (Sum Of Square Regretion)

 SST : ∑(𝑦 − 𝑦̅)2


 SSE : ∑(𝑦 − 𝑦̂)2
 SSR : ∑(𝑦̂ − 𝑦̅)2

Dimana,
𝑦̅ = rata − rata y

27
𝑦 = nilai observasi dari variabel y
𝑦̂ = nilai dugaan dari y pada nilai x tertentu

 SST : total Sum Of Square (jumlah kuadrat total) “Mengukur keragaman nilai
𝑦 disekitar mean 𝑦”.
 SSE : Error Sum Of Square (jumlah kuadrat galat) “Mengukur keragaman
diluar hubungan antara 𝑥 dan 𝑦”.
 SSR : Regresion Sum Of Square “Mengukur atau menjelaskan keragaman
hubungan antara 𝑥 dan 𝑦”.

Tabel ANOVA Model Regresi

Sumber Jumlah Kuadrat Derajat Kuadrat Tengah


F. Rasio
Variansi (Sum Of square) Kebebasan (Mean Square)
SSR
Regresi SSR 1 MSR =
db R
SSE MSR
Error/Galat SSE (n-2) MSE = F=
db E MSE
SST
Total SST (n-1) MST =
db T

Koefisien Determinasi (R2 )


Koefisien determinasi adalah proporsi total keragaman data yang dijelaskan oleh
model regresi.
SSR
R2 =
SST
SSE
= 1− , 0 ≤ R2 ≤ 1
SST

 R2 yang kecil berarti kemampuan variabel-variabel bebas dalam menjelaskan


variabel-variabel tak bebas amat terbatas.
 R2 mendekati 1 berarti variabel-variabel bebas memberikan hamper semua
informasi yang dibutuhkan untuk mempredikasi variansi variabel tak bebas.

28
KESALAHAN STANDAR ESTIMASI
(STANDAR EROR)

Untuk mengetahui ketepatan persamaan estimasi dapat digunakan dengan


mengukur besar kecilnya kesalahan kesadaran standar estimasi. Semakin kecil nilai
kesalahan standar estimasi (standar eror) maka semakin tinggi ketepatan persamaan
estimasi dihasilkan untuk menjelaskan nilai variabel yang sesungguhnya. Dan
sebaliknya, semakin besar nilai kesalahan standar estimasi maka semakin rendah
ketepatan persamaan estimasi dihasilkan.
Rumus:

∑ 𝑌 2 − 𝑏0 ∑ 𝑌 − 𝑏1 ∑ 𝑋𝑌
𝑆𝑒 = √
𝑛−2

 Uji 𝑡 secara Parsial


Standar error dan koefisien slope regresi dapat digunakan dengan:
Se Se
Sb1 = =
2
√∑(x − x̅)2 √∑ x2 − (∑ x)
n

a) Uji 𝑡 untuk Slope populasi


Apakah ada hubungan linier antara 𝑥 dan 𝑦?
b) Hipotesis nol dan hipotesis alternatifnya
H0: 𝛽1 = 0 (tidak ada hubungan linier)
H1: 𝛽1 ≠ 0 (ada hubungan linier)
c) Uji Statistik
b1 − β1
t= , 𝑑𝑏 = 𝑛 − 2
Sb1
dimana,
b1 : Koefisien Slope regresi sampel
𝛽1 : Hipotesis Slope

29
𝑆𝑏1 : Standar error koefisien Slope
db : Derajat bebas

Langkah-langkah Pengujian Hipotesis


1. Tentukan hipotesis nol (H0) dan hipotesis alternative (H1)
H0: 𝛽1 ≤ K ↔ H1: 𝛽1 > K
H1: 𝛽1 ≥ K ↔ H1: 𝛽1 < K
H1: 𝛽1 = K ↔ H1: 𝛽1 ≠ K
2. Tentukan arah uji hipotesis (satu arah/dua arah)
3. Tentukan taraf signifikansi (𝛼)
𝛼
 Jika satu arah ≠ 2
𝛼
 Jika dua arah = 2

4. Tentukan wilayah kritis/daerah kritis (ttabel)


Ttabel = (α: db) → db = n − 2
5. Tentukan nilai hitung (𝑡hitung )
6. Gambar dan keputusan
7. Kesimpulan

Contoh Soal

Diketahui suatu penelitian terhadap hubungan antara nilai biaya periklanan dengan
tingkat penjualan dari sebuah koprasi adalah sebagai berikut (dalam ribuan):

Tingkat Peringkat Tingkat Penjualan


50 40
51 46
52 44
53 55
54 49

a. Tentukan persamaan regresinya dan apa maksud dari persamaan tersebut.


b. Berapa besarnya koefisien korelasi dan koefisien determinasinya dan apa
maksud dari nilai keduanya.

30
c. Berapa besarnya kesalahan standar estimasinya/standar eror.
d. Dengan tingkat signifikansi 10% ujilah hipotesis yang menyatakan bahwa
hubungan antara biaya periklanan dan tingkat penjualan sedikitnya 40%.

Penyelesaian:

a. Menentukan persamaan regresinya


*Langkah 1
Menentukan variabel 𝑥 dan variabel 𝑦.
𝑋 : biaya periklanan
𝑌 : tingkat penjualan

*Langkah 2
Tabel regresi linear sederhana

Periklanan Tingkat
𝑿𝟐 𝒀𝟐 𝑿𝒀
(𝑿) Penjualan (𝒀)

50 40 2500 1000 2000


51 46 2601 2116 2346
52 44 2704 1936 2288
53 55 2809 3025 2915
54 49 2916 2401 2646

∑ 𝟐𝟔𝟎 ∑ 𝟐𝟑𝟒 ∑ 𝟏𝟑𝟓𝟑𝟎 ∑ 𝟏𝟏𝟎𝟕𝟖 ∑ 𝟏𝟐𝟏𝟗𝟓

*Langkah 3
Menentukan koefisien 𝑏0 dan 𝑏1 .
𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌
𝑏1 =
𝑛 ∑ 𝑋 2 − (∑ 𝑋)2
5(12195) − (260)(234)
=
5(13530) − (260)2
= 2,7

31
∑ 𝑌 − 𝑏1 ∑ 𝑋
𝑏0 =
𝑛
(234) − (2,7)(260)
=
5
= −93,6
*Langkah 4
Menentukan persamaan regresinya,
𝑦̂ = 𝑏0 + 𝑏1 𝑥
= −1,21 + 1,05𝑥
Penafsiran parameternya:
𝑦̂ = −1,21 + 1,05𝑥

Koefisien garis sebesar 2,7 menunjukan bahwa setiap kenaikan x sebanyak satu
satuan, prediksi rata-rata y akan naik sebesar 2,7 satuan.

Jadi, jika tingkat periklanan (variabel 𝑋) nilai sebesar Rp.1,- akan


mengakibatkan kenaikan prediksi biaya penjualan (variabel 𝑌) sebesar Rp. 2,7.

𝑏0 = −93,6 artinya apabila variabel 𝑋 (biaya periklanan) mempunyai nilai/skor


sebesar 0 (tidak ada) maka variabel 𝑌 (tingkat penjualan) mempunyai nilai
sebesar -93,6.

b1 = 2,7 artinya apabila setiap kenaikan skor variabel 𝑋 (biaya periklanan)


sebesar 1 satuan, maka akan menaikan skor variabel 𝑌 (tingkat penjualan)
sebesar Rp. 2,7. −

b. Menentukan besar koefisien korelasi dan koefisien determinasi.


1) Koefisien Korelasi
n ∑ xy − ∑ x ∑ y
r=
√{n ∑ x 2 − (∑ x)2 }

5(12195) − (260)(234)
r=
√{5(13530) − (260)2 }{5(11078) − (234)2 }
= 0,76 → korelasi positif kuat
Artinya, hubungan biaya periklanan dengan tingkat penjualan kuat.

32
2) Koefisien Determinasi
r 2 × 100% = (0,76) × 100% = 57,76%
Hal ini berarti kontribusi (pengaruh) variabel x dengan variabel y sebesar
57,76%.
c. Kesalahan Standar Estimasi (Standar Error)

∑ 𝑌 2 − 𝑏0 ∑ 𝑌 − 𝑏1 ∑ 𝑋𝑌
𝑆𝑒 = √
𝑛−2

(11078)2 − (−93,6)(234) − (2,7)(12195)


=√
5−2

= 4,24

d. Pengujian Hipotesis
1) Tentukan H0 dan H1
H0 : 𝛽1 ≥ 0,4
H1 : 𝛽1 < 0 ,4
2) Uji hipotesis satu arah
3) Tingkat signifikansi

𝛼 = 10%
4) Daerah kritis (𝑡tabel )
𝑑𝑏 = 𝑛 − 2
=5−2=3
Maka, t(α; db) → t(α; 3) = −1,638
5) Nilai hitung /Statistik Uji
𝑆𝑒
𝑆𝑏1 =
2
√∑ 𝑥 2 − (∑ 𝑥)
𝑛
4,24
=
2
√13530 − (260)
5
= 1,342
Maka,

33
b1 − β1
t=
Sb1
2,7 − 0,4
=
1,342
= 1,714

6) Gambar dan Keputusan

Tolak 𝐻0

−1,638 1,638 1,714

7) Kesimpulan
Pendapat yang menyatakan bahwa hubungan biaya periklanan dengan
tingkat penjualan sedikitnya 40% adalah benar, dimana biaya
mempengaruhi tingkat penjualan sebesar 57,76%.

REGRESI LINEAR BERGANDA

Menguji hubungan linear antara variabel tak bebas (𝑌) dengan dua atau lebih
variabel bebas (𝑋).
a. Model regresi linear berganda dari populasi
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + … + 𝛽𝑘 𝑥𝑘 + 𝜀
dengan,
𝛽0 : intersep
𝛽1 , 𝛽2 , 𝛽𝑘 : slope
𝜀 : galat/random error

b. Model regresi linear berganda untuk sampel

34
𝑦̂ = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 + … + 𝑏𝑘 𝑥𝑘
dengan,
𝑦̂ : penduga nilai 𝑌
𝑏0 : penduga intersep
𝑏1 , 𝑏2 , 𝑏𝑘 : penduga slope
Model 2 variabel

𝑌̂ = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2

𝑋2

Slope 𝑋2

𝑋1

𝑦̂ = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2

𝑥2
𝑋2

𝑥1

𝑋1

35
Persamaan peubah 𝑦̂ dicari dengan meminimumkan jumlah kuadrat galat ∑ 𝑒 2 .
Asumsi-asumsi dalam model regresi linear berganda adalah :
 Galat berdistribusi normal
 Mean dari galat 0
 Galat memiliki ragam konstan
 Galat model saling bebas
 Tidak ada ultikolinear

Galat dari model regresi


𝑒 = (𝑦 − 𝑦̂)

Model regresi linear berganda dengan notasi matriks


𝑦1 𝑥11 𝑥12 … . 𝑥1𝑘 𝛽1 𝜀1
𝑦2. 𝑥21 𝑥22 𝑥2𝑘. 𝛽2. 𝜀2.
𝑦 = [ ... ] = [ ..
..
]× ..
..
+ [ ... ]
.. . . ..
𝑦𝑛 𝑥𝑛1 𝑥𝑛2 𝑥𝑛𝑘 [𝛽𝑘 ] 𝜀𝑘
= 𝑥𝛽 + 𝜀

2 Variabel bebas :
𝑌̂ = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2

Koefisien regresinya adalah :

∑ 𝑌 = 𝑏0 𝑛 + 𝑏1 ∑ 𝑥1 + 𝑏2 ∑ 𝑥2

∑ 𝑋1 𝑌 = 𝑏0 ∑ 𝑥1 + 𝑏1 ∑ 𝑥12 + 𝑏2 ∑ 𝑥1 𝑥2

∑ 𝑋2 𝑌 = 𝑏0 ∑ 𝑥2 + 𝑏1 ∑ 𝑥1 𝑥2 + 𝑏2 ∑ 𝑥22

3 Variabel bebas :
𝑌̂ = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 + 𝑏3 𝑥3

∑ 𝑌 = 𝑏0 𝑛 + 𝑏1 ∑ 𝑥1 + 𝑏2 ∑ 𝑥2 + 𝑏3 ∑ 𝑥3

∑ 𝑋1 𝑌 = 𝑏0 ∑ 𝑥1 + 𝑏1 ∑ 𝑥12 + 𝑏2 ∑ 𝑥1 𝑥2 + 𝑏3 ∑ 𝑥1 𝑥3

∑ 𝑋2 𝑌 = 𝑏0 ∑ 𝑥2 + 𝑏1 ∑ 𝑥1 𝑥2 + 𝑏2 ∑ 𝑥22 + 𝑏3 ∑ 𝑥1 𝑥3

36
∑ 𝑋3 𝑌 = 𝑏0 ∑ 𝑥3 + 𝑏1 ∑ 𝑥1 𝑥3 + 𝑏2 ∑ 𝑥2 𝑥3 + 𝑏3 ∑ 𝑥32

ANALISIS RAGAM (ANOVA)


(ANALYSIS OF VARIANCE)

Analisis ragam ANOVA digunakan untuk menguji apakah perbedaan yang


signifikan/berbeda nyata antar mean perlakuan.

Hipotesis:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑝
𝐻1 ∶ paling tidak ada sepasang 𝜇1 , 𝜇2 , … … . , 𝜇𝑝 yang berbeda

Pengujian dilakukan dengan analisis ragam (ANOVA) dengan statistik F. Analisys


of Variance (ANOVA) digunakan untuk mengevaluasi apakah ada perbedaan yang
signifikan diantara mean lebih dari 2 perlakuan. ANOVA ditemukan oleh R.A
Fisher tahun 1920.

ANOVA dilakukan dengan cara mendekomposisikan total data menjadi komponen


keragaman Between-Treatment dan keragaman Within-Treatment. Perbedaan atau
deviasi setiap observasi/data terhadap mean keseluruhan/mean umum (Overall
mean) dapat didekomposisi menjadi 2 komponen. Deviasi antara mean perlakuan
dengan overall mean (Between).

Deviasi antara data dengan mean perlakuan (Within). ANOVA menggunakan


informasi dekomposisi keragaman dari dua komponen tersebut.

Data = Model + Galat


Keragaman total data = keragaman model + keragaman galat

 Ragam Between-Treatment
Perbedaan (deviasi) dari memperlakukan dengan mean keseluruhan (overall)

37
(𝑥
̅̅̅1 − 𝑥̅ )
 Ragam Within-Treatment
Perbedaan dari data dengan mean perlakuan
(𝑥𝑖𝑗 − 𝑥
̅̅̅)
1

 Total Variation
Sum of Square total (SST)/ jumlah kuadrat total (JKT)
𝑥1 2 + (𝑥21 − ̅̅̅)
JKT (total) = (𝑥11 − ̅̅̅) 𝑥1 2 + ⋯ + (𝑥𝑖𝑗 − 𝑥̅ )2

 Treatment Variation
Sum of Square treatment (SST)/ jumlah kuadrat perlakuan (JKP) <between>
̅̅̅1 − 𝑥̅ )2 + 𝑛2 (𝑥
JKP = 𝑛1 (𝑥 ̅̅̅2 − 𝑥̅ )2 + ⋯ + 𝑛𝑡 (𝑥̅𝑡 − 𝑥̅ )2

 Random (error) Variation


Sum of Square Error (SSE)/ jumlah kuadrat galat (JKG) <within>
2 2
JKG = (𝑥𝑛 − 𝑥
̅̅̅)
1 + (𝑥21 − 𝑥
̅̅̅)
1 + ⋯ + (𝑥𝑡𝑗 − 𝑥̅𝑡 )2

 The mean Square (kuadrat tengah)


𝐽𝐾𝐺
𝐾𝑇𝐺 =
𝑁−𝑗
𝑉2 : 𝑑𝑏 = 𝑁 − 𝑗 ; 𝑁 : Banyak data pengamatan
𝑗 : Jumlah kelompok

𝐽𝐾𝑃
𝐾𝑇𝑃 =
𝐽−1
𝑉1 : 𝑑𝑏 = 𝑗 − 1 ; 𝑗 : jumlah kelompok

Statistik uji yang digunakan dalam ANOVA adalah F = Statistik, yaitu rasio
antara Ragam Between-Treatment dibagi dengan ragam Within-Treatment.

𝐵𝑒𝑡𝑤𝑒𝑒𝑛 𝐾𝑇𝑃
𝐹= =
𝑤𝑖𝑡ℎ𝑖𝑛 𝐾𝑇𝐺

Nilai 𝐹 yang besar merupakan fakta tolak HO karena menunjukkan adanya


perbedaan yang lebih besar Between-Treatment daripada Within-Treatment.

38
Dengan kata lain 𝐹 yang lebih besar menunjukkan adanya perbedaan pengaruh
perlakuan.

Tabel ANOVA

Sumber Sum of Square Derajat Mean Squares


F
Variansi (Jumlah Kuadrat) Bebas (Kuadrat Tengah)
Treatment/ 𝐽𝐾𝑃
JKP 𝑗−1
perlakuan 𝐽−1 𝐾𝑇𝑃
𝐽𝐾𝐺 𝐾𝑇𝐺
Error/ galat JKG 𝑁−𝑗
𝑁−𝑗
Total JKT 𝑁−1

Tabel 𝐹

Reject 𝐻0

Do Not
𝛼 Reject 𝐻0

𝐹𝛼 (𝑉1 , 𝑉2 ) 𝐹𝛼 (𝑗 − 1, 𝑁 − 𝑗)

Contoh soal

Food I Food II Food III


25,40 23,40 20,00

39
26,31 21,80 23,20
24,10 23,50 19,75
23,74 22,75 20,60
25,10 21,40 20,40
∑ 𝟏𝟐𝟒, 𝟔𝟓 ∑ 𝟏𝟏𝟑, 𝟎𝟓 ∑ 𝟏𝟎𝟐, 𝟗𝟓
Sebagai ahli epidemologi, Anda ingin melihat apakah 3 suplemen makanan
memiliki hasil rata-rata susu yang berbeda. Anda menetapkan 15 sapi dengan 5
persuplemen makanan. Pada tingkat signifikansi 5% apakah ada perbedaan hasil
rata-ratanya?
Penyelesaian:

Dimana
𝑛1 = 5 𝑥1 = 24,93
̅̅̅
𝑛2 = 5 𝑥2 = 22,61
̅̅̅
𝑛3 = 5 𝑥3 = 20,59
̅̅̅
𝑥̅ = 21,71
JKP = 11,0532

Tabel ANOVA

Sumber Sum of Square Derajat Mean Squares


F
Variansi (Jumlah Kuadrat) Bebas (Kuadrat Tengah)
Treatment/
47,1640 3−1=2 23, 5820
perlakuan 25,60
Error/Galat 11,0532 15 − 3 = 12 0,9211
total 58,2172 15 − 1 = 14

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻1 ∶ 𝜇1 ≠ 𝜇2 ≠ 𝜇3

Taraf signifikansi
𝛼 = 5% = 0,05

Derajat kebebasan

40
𝑉2 : 𝑑𝑏 = 𝑁 − 𝑗 = 15 − 3 = 12
3,88
𝑉1 : 𝑑𝑏 = 𝑗 − 1 = 3 − 1 = 2

Statistik uji
𝐾𝑇𝑃 23,5820
𝐹= = = 25,60
𝐾𝑇𝐺 0,9211
Daerah kritis

Tolak 𝐻0

3,88 25,60

Kesimpulan
Ada perbedaan hasil rata-rata antara makanan 1,2 dan 3.

41