BAHAN AJAR
STATISTIKA INFERENSIAL
KODE MATA KULIAH
MAT 201
ROMBEL 410140-03
410140-04
410140-05
410140-06
410140-07
Disusun Oleh
Putriaji Hendikawati, S.Si., M.Pd., M.Sc.
Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Negeri Semarang
2011
DAFTAR ISI
BAB I
PENAKSIRAN PARAMETER
1. Pengertian Penaksiran
Statistika digunakan untuk menyimpulkan populasi.
Kelakuan populasi dipelajari berdasarkan data yang diambil baik secara
sampling maupun sensus. Namun, karena berbagai faktor untuk
menyimpulkan populasi diambil sebuah sampel yang representatif kemudian
berdasarkan hasil analisis terhadap data sampel, kesimpulan mengenai
populasi dibuat.
Kelakuan populasi yang akan diamati adalah mengenai parameter populasi
dan sampel yang digunakan adalah sampel acak. Data sampel dianalisis, nilai-
nilai yang perlu yaitu statistik dihitung dan berdasarkan nilai-nilai statistik
dapat disimpulkan bagaimana parameter bertingkah laku.
Cara pengambilan kesimpulan tentang parameter sehubungan dengan cara-
cara menaksir harga parameter. Harga parameter yang sebenarnya tetapi tidak
diketahui nilainya tersebut akan ditaksir berdasarkan statistik sampel yang
diambil dari populasi yang bersangkutan.
Parameter populasi yang akan ditaksir pada bab ini adalah rata-rata,
simpangan baku dan proporsi.
Secara umum parameter populasi akan diberi simbol θ (baca: theta). Jadi θ
bisa merupakan rata-rata µ , simpangan baku σ , proporsi π dan sebagainya.
Jika θ tidak diketahui harganya, ditaksir oleh harga θˆ (baca: theta topi), maka
θˆ dinamakan penaksir.
Kriteria untuk memperoleh penaksir yang baik yaitu: takbias, memiliki varians
minimum dan konsisten.
a. penaksir θˆ dikatakan penaksir takbias jika rata-rata semua harga θˆ yang
()
mungkin akan sama dengan θ , ditulis E θˆ = θ . Penaksir yang tidak
takbias disebut penaksir bias.
b. penaksir bervarians minimum ialah penaksir dengan varians terkecil
diantara semua penaksir untuk parameter yang sama. Jika θˆ1 dan θˆ2 dua
penaksir untuk θ , jika varians θˆ1 < varians θˆ2 , maka θˆ1 merupakan
penaksir bervarians minimum.
c. Misalkan θˆ penaksir untuk θ yang dihitung berdasarkan sebuah sampel
acak berukuran n. Jika ukuran sampel n makin besar mendekati ukuran
populasi menyebabkan θˆ mendekati θ , maka θˆ disebut penaksir
konsisten.
d. Penaksir yang takbias dan bervariansi minimum dinamakan penaksir
terbaik.
2. Menaksir Rata-rata µ
Misalkan dipunyai populasi berukuran N dengan rata-rata µ dan simpangan
baku σ . Dari populasi ini akan ditaksir parameter rata-rata µ . Untuk itu
ambil sebuah sampel acak berukuran n, hitung satatistik yang diperlukan yaitu
x dan s . Titik taksiran untuk rata-rata µ adalah x . Dengan kata lain,
nilai µ ditaksir oleh harga x yang diperoleh dari sampel.
Untuk memperoleh taksiran yang tinggi derajat kepercayaannya, digunakan
interval taksiran atau selang taksiran disertai nilai koefisien kepercayaan yang
dikehendaki.
x − tp . < µ < x + tp .
s s
(I.5)
n n
Bilangan x − t p . dan x + t p .
s s
masing-masing merupakan batas bawah
n n
dan batas atas kepercayaan.
N −n N −n
x −tp . < µ < x +tp .
s s
N −1 N −1
(I.7)
n n
Contoh
Sebuah populasi berdistribusi normal berukuran 1000 dengan simpangan baku
5,75. dari populasi diambil sampel acak dan diperoleh rata-rata 68,6. Taksirlah:
a. rata-rata populasi bila ukuran sampelnya 30
b. rata-rata populasi bila ukuran sampelnya 80
dengan menggunakan kepercayaan 95% .
Penyelesaian
Diketahui x = 68,6
σ = 5,75
γ = 95% = 0,95
a. Sampel n = 30 Æ = ≤ 5%
n 30
N 1000
σ σ
x − z1 γ . < µ < x + z1 γ .
2 n 2 n
b. Sampel n = 80 Æ = ≥ 5%
n 80
N 1000
σ N −n σ N −n
x − z1 γ . < µ < x + z1 γ .
2 n N −1 2 n N −1
3. Menaksir Proporsi
Misalkan sebuah sampel acak berukuran n diambil dari populasi binomial
berukuran N dimana terdapat proporsi π untuk peristiwa A yang ada dalam
populasi tersebut. Jika terdapat x peristiwa A, sehingga proporsi sampel untuk
p − z1 γ . < π < p + z1 γ .
pq pq
(I.8)
2 n 2 n
Contoh
Diadakan survei terhadap sebuah populasi masyarakat di kota Semarang dengan
mengambil sampel 100 orang dan diperoleh yang suka berolahraga sejumlah 60
orang. Dengan koefisien kepercayaan 95%, taksirlah interval kesukaan
berolahraga masyarakat di kota Semarang tersebut.
Penyelesaian
Diketahui γ = 95% = 0,95
p= = 0,6 Æ q = 0,4
60
100
Interval kepercayaan π adalah
p − z1 γ . < π < p + z1 γ .
pq pq
2 n 2 n
0,6 − (1,96 ).
(0,6)(0,4) < π < 0,6 + (1,96). (0,6)(0,4)
100 100
0,504 < π < 0,696
50,4 % < π < 69,6 %
Jadi, kita merasa 95% yakin (percaya) bahwa persentase kesukaan
berolahraga masyarakat di kota Semarang tersebut akan ada dalam interval
dengan batas 50,4 % dan 69,6 %.
∑ (x
varians s 2 berdasarkan sampel acak berukuran n.
− x)
s2 =
2
n −1
i
(I.9)
(n − 1)s 2 (n − 1)s 2
chi-kuadrat.
<σ2 <
χ 12 χ 12
(I.10)
2
(1+γ ) 2
(1−γ )
dk = (n − 1) .
2 2
Contoh
Dari sebuah populasi yang berdistribusi normal, diambil sampel yang representatif
dan diperoleh simpangan baku sebesar 6 dengan ukuran sampel 31. Dengan
koefisien kepercayaan 99%, taksirlah interval dari simpangan baku populasi.
Penyelesaian
Diketahui n = 31
s=6
γ = 99 % = 0,99
χ 12 (1+γ ),dk
= χ 12 (1+ 0, 99 ),(31−1)
= χ (20,995 ),(30 ) = 53,7
2 2
χ 12 (1−γ ),dk
= χ 12 (1−0, 99 ),(31−1)
= χ (20,005 ),(30 ) = 13,8
2 2
χ1 2
(1+γ )
2
χ1 (1−γ )
<σ2 <
53,7 13,8
a. Dalam hal σ 1 = σ 2
Jika kedua populasi normal dan memiliki σ 1 = σ 2 = σ yang besarnya
diketahui, maka 100 γ % interval kepercayaan untuk ( µ1 − µ 2 ) adalah
( x1 − x2 ) − z 1 γ σ + < µ1 − µ 2 < ( x1 − x2 ) + z 1 γ σ +
1 1 1 1
(I.11)
2 n1 n2 2 n1 n2
dengan z 1 γ
diperoleh dari daftar normal baku untuk peluang 1 γ .
2 2
s2 =
(n1 − 1)s12 + (n2 − 1)s2 2
n1 + n2 − 2
(I.12)
( x1 − x2 ) − t p .s + < µ1 − µ 2 < ( x1 − x2 ) + t p .s +
1 1 1 1
(I.13)
n1 n2 n1 n2
dengan s diperoleh dari rumus (I.12) dan t p diperoleh dari daftar distribusi
b. Dalam hal σ 1 ≠ σ 2
Untuk populasi normal dengan σ 1 ≠ σ 2 teori di atas tidak berlaku dan teori
yang ada hanya bersifat pendekatan.
( x1 − x 2 ) − z 1 + < µ1 − µ 2 < ( x1 − x 2 ) + z 1 γ +
s12 s 22 s12 s 22
γ
(I.14)
2 n1 n2 2 n1 n2
dengan z 1 γ
diperoleh dari daftar normal baku untuk peluang 1 γ .
2 2
c. Observasi berpasangan
Misalkan populasi pertama memiliki variabel acak X dan populasi kedua
dengan variabel acak Y. Rata-ratanya masing-masing µ x dan µ y . Diambil
Dalam hal berpasangan, maka untuk menaksir selisih atau beda rata-rata
µ B = µ x − µ y , dapat pula dibentuk selisih atau beda tiap pasangan data yaitu
B1 = x1 − y1 , B2 = x 2 − y 2 ,…, Bn = xn − y n .
n∑ B12 − (∑ Bi )
rata-rata B dan simpangan baku s B dengan menggunakan
B=
∑B dan s B =
n(n − 1)
2
i
n
Rumus untuk 100 γ % interval kepercayaan µ B adalah
dk = (n − 1) .
2
Contoh (Sudjana)
Ada dua cara pengukuran untuk mengukur kelembaban suatu zat. Cara I
dilakukan 50 kali yang menghasilkan x 1 = 60,2 dan s12 = 24,7. Cara II dilakukan
60 kali dengan x 2 = 70,4 dan s22 = 37,2. Tentukan interval kepercayaan 95%
mengenai perbedaan rata-rata pengukuran dari kedua cara tersebut.
Penyelesaian
Diketahui x 1 = 60,2 ; s12 = 24,7
2 2
Karena kedua populasi normal dan memiliki σ 1 = σ 2 = σ tetapi besarnya tidak
s2 =
n1 + n2 − 2 50 + 60 − 2
Maka interval kepercayaan
( x1 − x2 ) − t p .s + < µ1 − µ 2 < ( x1 − x2 ) + t p .s +
1 1 1 1
n1 n2 n1 n2
(70,4 − 60,2) − (1,984 ). (1,08) < µ1 − µ 2 < (70,4 − 60,2) + (1,984 ). (1,08)
50 60 50 60
Jadi, kita merasa 95% yakin (percaya) bahwa selisih rata-rata pengukuran dari
kedua cara tersebut akan ada dalam interval yang dibatasi oleh 8,06 dan 12,34.
(I.16)
( p1 − p2 ) − z 1 γ + < π 1 − π 2 < ( p1 − p 2 ) + z 1 +
p1 q1 p2 q2 p1 q1 p2 q2
γ
2 n1 n2 2 n1 n2
Contoh (Sudjana)
Diambil dua sampel acak yang masing-masing terdiri atas 500 pemudi dan 700
pemuda yang mengunjungi sebuah pameran. Ternyata diperoleh bahwa 325
pemudi dan 400 menyukai pameran itu. Tentukan interval kepercayaan 95%
mengenai perbedaan persentase pemuda dan pemudi yang mengunjungi pameran
dan menyukainya.
Penyelesaian
Diketahui
( p1 − p2 ) − z 1 γ + < π 1 − π 2 < ( p1 − p 2 ) + z 1 +
p1 q1 p2 q2 p1 q1 p2 q2
γ
2 n1 n2 2 n1 n2
(0,65 − 0,57 ) − z 1 .0,95 (0,65)(0,35) + (0,57 )(0,43) < π − π 2 < (0,65 − 0,57 ) + z 1
(0,65)(0,35) + (0,57)(0,43)
(0,65 − 0,57) − (1,96) (0,0284) < π 1 − π 2 < (0,65 − 0,57) + (1,96) (0,0284)
1 .0 , 95
2 500 700 2 500 700
LATIHAN
1. Diketahui populasi siswa dengan ukuran 100 Taksirlah rata-rata penguasaan
kemampuan bahasa dari populasi tersebut jika:
a. diambil sampel secara acak sebanyak 4 siswa dengan penguasaan
kemampuan bahasa berikut 60,2 ; 65,4 ; 70,1 dan 72,8 dengan koefisien
kepercayaan 95%.
b. diambil sampel secara acak sebanyak 10 siswa dengan penguasaan
kemampuan bahasa berikut 60,4 ; 55,7 ; 70,2 ; 70,3 ; 60,5 ; 66,6 ; 62,8 ;
63,9 ; 70,1 ; 64,8 dengan koefisien kepercayaan 99%.
2. Telah ditimbang 10 buah tomat dengan hasil (dalam gram): 142, 157, 138,
175, 152, 149, 148, 200, 182, 164. Jika berat tomat berdistribusi normal,
tentukan interval kepercayaan 95% untuk rata-rata berat tomat.
3. Diketahui dua buah sampel yang diambil dari dua buah populasi.
Sampel I : 38, 42, 51, 47, 38, 60, 57, 58, 32, 45
Sampel II : 44, 49, 53, 46, 41, 47, 34, 60, 59, 63
Tentukan selisih rata-ratanya bila interval kepercayaan 95 %, jika:
a. simpangan baku kedua populasi diketahui sama besar yaitu 9,5.
b. simpangan baku kedua populasi diketahui sama besar namun tidak
diketahui nilainya.
4. Dari populasi tanaman padi jenis A dan jenis B, diambil sampel tinggi
tanaman padi sbb:
Sampel I dari padi jenis A : 39,3 ; 45,5 ; 41,2 ; 53 ; 44,2 ; 42,5 ; 63,9.
Sampel II dari padi jenis B : 37 ; 42,4 ; 40,1 ; 52,2 ; 41,5 ; 40,8 ; 60,2.
Dengan observasi berpasangan tersebut dan interval kepercayaan 95 %,,
taksirlah selisih rata-ratanya.
5. Sebuah sampel berukuran 200 lampu yang dihasilkan oleh sebuah mesin
produksi menunjukkan 15 buah lampu rusak. Sebuah sampel lain berukuran
100 buah lampu yang dihasilkan oleh mesin kedua mengandung 12 buah
lampu yang rusak. Tentukan interval kepercayaan 99% untuk selisih kedua
perbandingan.
BAB II
PENGUJIAN HIPOTESIS
1. Pendahuluan
Sebelumnya telah dipelajari cara-cara menaksir parameter untuk mengambil
kesimpulan tentang berapa besar harga parameter. Cara pengambilan
kesimpulan yang kedua akan dipelajari adalah melalui pengujian hipotesis.
Hipotesis adalah asumsi atau dugaan mengenai sesuatu hal yang dibuat untuk
menjelaskan hal tersebut yang sering dituntut untuk melakukan
pengecekannya.
Jika asumsi atau dugaan tersebut dikhususkan mengenai populasi, umumnya
mengenai nilai-nilai parameter populasi, maka hipotesis disebut hipotesis
statistik.
Contoh hipotesis
a. peluang lahirnya bayi berjenis kelamin laki-laki = 0,5.
b. 25 % masyarakat termasuk golongan A.
c. Rata-rata pendapatan keluarga di suatu daerah Rp 300.000,00 tiap bulan.
Setiap hipotesis bisa benar atau tidak benar, maka perlu diadakan penelitian
sebelum hipotesis itu diterima atau ditolak. Langkah atau prosedur untuk
menentukan apakah menerima atau menolak hipotesis dinamakan pengujian
hipotesis.
A : θ = θ1
dengan θ 0 ,θ1 dua nilai berbeda yang diketahui.
A : θ ≠ θ0
3) H : θ = θ 0
A : θ > θ0
4) H : θ = θ 0
A : θ < θ0
A : θ > θ0
A : θ < θ0
mengandung pengertian tidak sama, lebih besar atau lebih kecil. H 1 harus
dipilih dan ditentukan peneliti sesuai dengan persoalan yang dihadapi.
Pasangan H 0 dan H 1 yang telah dirumuskan dituliskan dalam bentuk berikut.
⎧H 0 : θ = θ 0
⎨
⎩H 1 : θ ≠ θ 0
atau
⎧H 0 : θ = θ 0
⎨
⎩H 1 : θ > θ 0
atau
⎧H 0 : θ = θ 0
⎨
⎩H 1 : θ < θ 0
Selanjutnya, pilih bentuk statistik yang akan digunakan, apakah z, t, χ 2 , F
atau lainnya. Harga statistik yang dipilih dihitung besarnya berdasarkan data
sampel yang dianalisis. kriteria pengujian ditentukan berdasarkan pilihan taraf
nyata α atau disebut ukuran daerah kritis.
berdasarkan data penelitian terletak diantara d1 dan d2, selain itu tolak H 0 .
Pengujian hipotesis ini dinamakan uji satu pihak, tepatnya pihak kanan.
Pengujian hipotesis ini dinamakan uji satu pihak, tepatnya pihak kiri.
(1−α )
Dengan z 1 diperoleh dari daftar distribusi normal baku dengan
peluang 1 (1 − α ) .
2
2
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
x − µ0
z=
σ
(II.1)
n
dengan x adalah rata-rata sampel, µ 0 nilai yang diketahui, σ adalah
Contoh
Pengusaha lampu pijar A mengatakan bahwa lampunya bisa tahan pakai sekitar
800 jam. Namun timbul dugaan bahwa masa pakai lampu tersebut telah berubah.
Maka dilakukan pengujian terhadap 50 lampu untuk menentukan hal ini. Ternyata
diperoleh rata-ratanya 792 jam. Berdasarkan pengalaman diketahui simpangan
baku masa hidup lampu 60 jam. Selidikilah dengan menggunakan kepercayaan
95% apakah kualitas lampu telah berubah atau belum.
Penyelesaian
Diketahui x = 792 ; n = 50 ; σ = 60
− z1 (1−0, 05 )
< z < z1 (1−0, 05 )
Æ − 1,96 < z < 1,96
2 2
(1−α )
Dengan z 1 diperoleh dari daftar distribusi normal baku dengan peluang
1 (1 − α ) .
2
2
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
x − µ0 792 − 800
z= = = −0,94
σ 60
n 50
5. Kesimpulan : karena z hitung = −0,94 terletak dalam daerah penerimaan
hasil penelitian menunjukkan bahwa masa pakai lampu belum berubah yaitu
masih 800 jam.
α
Dengan t1− 1 diperoleh dari daftar distribusi t (distribusi Student)
2
∑ (x − x)
n
s2 =
n −1
i
(II.3)
Contoh
Untuk contoh sebelumnya (kasus masa hidup lampu pijar), dimisalkan simpangan
baku populasi tidak diketahui, dan dari sampel diperoleh s = 55 jam. Selidikilah
dengan menggunakan kepercayaan 95% apakah kualitas lampu telah berubah
atau belum.
Penyelesaian
Diketahui x = 792 ; n = 50 ; s = 55
Langkah pengujian hipotesis:
⎧H 0 : µ = µ 0 ⎧H : µ = 800
1. Hipotesis pengujian ⎨ yaitu ⎨ 0
⎩H 1 : µ ≠ µ 0 ⎩H1 : µ ≠ 800
2. Taraf signifikansi α = 5%.
3. Kriteria pengujian.
− t1− 1 α < t < t1− 1 α
Terima H 0 jika 2 2 dengan dk = 50 - 1 = 49
−t1 (1−0, 05 )
< t < t1 (1−0, 05 )
Æ − 2,01 < t < 2,01
2 2
x − µ 0 792 − 800
t= = = −1,029
s 55
n 50
5. Kesimpulan : karena t hitung = −1,029 terletak dalam daerah penerimaan
hasil penelitian menunjukkan bahwa masa pakai lampu belum berubah yaitu
masih 800 jam.
peluang (0,5 − α ) .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik z yang sama dengan rumus (II.1).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh
Proses pembuatan barang rata-rata menghasilkan 15,7 unit per jam. Hasil produksi
memiliki varians 2,3. metode baru diusulkan untuk mengganti metode lama jika
rata-ratanya per jam menghasilkan paling sedikit 16 buah. Untuk menentukan
apakah metode akan diganti atau tidak, metode baru dicoba 20 kali dan ternyata
rata-rata perjam menghasilkan 16,9 buah. Pengusaha bermaksud mengambil risiko
5% untuk menggunakan metode baru apabila metode ini rata-rata menghasilkan
labih dari 16 buah. Apakah keputusan yang akan diambil pengusaha?
Penyelesaian
Diketahui x = 16,9 ; n = 20 ; σ = 2,3 , µ 0 =16
peluang (0,5 − α ) .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik z yang sama dengan rumus (II.1).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
1 − α dan dk = n − 1 .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik t yang sama dengan rumus (II.2).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh
Masyarakat mengeluh dan mengatakan bahwa isi bersih makanan kaleng tidak
sesuai dengan yang tertera pada kemasannya sebesar 5 ons. Untuk meneliti hal ini,
23 kaleng makanan diteliti secara acak. Dari sampel tersebut diperoleh berat rata-
rata 4,9 ons dan simpangan baku 0,2 ons. Dengan taraf nyata 5%, bagaimanakah
pendapat anda mengenai keluhan masyarakat tersebut.
Penyelesaian
Diketahui x = 4,9 ; n = 23 ; s = 0,2 ; µ 0 = 5
3. Kriteria pengujian.
Tolak H 0 jika t ≤ −t1−α Æ − t1−α = −t1−0,05 = −1,72 dengan dk = 23 - 1 = 22
(1−α )
Dengan z 1 diperoleh dari daftar distribusi normal baku dengan
peluang 1 (1 − α ) .
2
2
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
x −π
(II.4) z =
π 0 (1 − π 0 )
n 0
Contoh
Akan diuji distribusi jenis kelamin laki-laki dan jenis kelamin perempuan adalah
sama. Sebuah sampel acak terdiri atas 4.800 orang terdiri atas 2.458 laki-laki.
Dalam taraf nyata 5%, apakah benar distribusi kedua jenis kelamin tersebut adalah
sama.
Penyelesaian
Diketahui x = 2.458; n = 4800 ; µ 0 = 0,5
− z1 (1−0, 05 )
< z < z1 (1−0, 05 )
Æ − 1,96 < z < 1,96
2 2
n 4800
5. Kesimpulan : karena z hitung = 1,68 terletak dalam daerah penerimaan H 0 maka
Dengan z0,5−α diperoleh dari daftar distribusi normal baku dengan peluang
(0,5 − α ) .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik z yang sama dengan rumus (II.4).
Dengan z0,5−α diperoleh dari daftar distribusi normal baku dengan peluang
(0,5 − α ) .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik z yang sama dengan rumus (II.4).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh
Berbagai media memberitakan bahwa dari seluruh wanita 60% nya suka
menonton sinetron untuk mengisi waktu luangnya. Untuk menyelidiki kebenaran
berita tersebut, maka diambil sampel acak 100 orang wanita dan setelah
diwawancarai ternyata yang suka menonton sinetron hanya 40 orang. Dengan α =
5%, ujilah kebenaran pernyataan berita tersebut dengan alternatif bahwa wanita
suka menonton sinetron untuk mengisi waktu luangnya kurang dari 60%.
Penyelesaian
Diketahui x = 40 n = 100
π 0 = 60% = 0,6
Langkah pengujian hipotesis uji pihak kiri:
⎧H 0 : π = π 0 ⎧H : π = 0,6
1. Hipotesis pengujian ⎨ yaitu ⎨ 0
⎩H1 : π < π 0 ⎩H1 : π < 0,6
2. Taraf signifikansi α = 5%.
3. Kriteria pengujian.
z0,5−α diperoleh dari daftar distribusi normal baku dengan peluang (0,5 − α ) .
π 0 (1 − π 0 ) 0,6(1 − 0,6 )
n 0 100
n 100
5. Kesimpulan: karena z hitung = −4,08 < − 1,64 = − z 0,5−α maka H 0 ditolak.
∑ (x n∑ xi − (∑ xi )
dengan rumus:
− x)
= atau s =
n(n − 1)
2 2 2
n −1
2 i 2
s
( )
α
diperoleh dari daftar distribusi Chi Kuadrat
2 2
(n − 1)s 2
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
(II.5) χ 2 =
σ 02
(II.6) s 2 =
∑ (x − x)
2
n −1
i
atau
n∑ xi − (∑ xi )
(II.7) s 2 =
2 2
n(n − 1)
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh
Pada kasus sebelumnya tentang masa hidup lampu, diambil σ = 60 jam dengan
ukuran sampel n = 50 diperoleh s = 55 jam. Jika masa hidup lampu berdistribusi
normal, benarkah σ = 60 jam dalam taraf nyata 5%.
Penyelesaian
Diketahui σ = 60 jam ; n = 50 ; s = 55 jam
Langkah pengujian hipotesis:
⎧⎪H 0 : σ 2 = σ 0 2 ⎪⎧H 0 : σ = 3600
1. Hipotesis pengujian ⎨ ⎨
2
χ 12 .0, 05 < χ 2 < χ12− 1 .0,05 Æ χ 02, 025 < χ 2 < χ 02,975
2 2
χ2 = =
σ 2
0 3600
5%.
dk = n − 1 dan peluang (1 − α ) .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik Chi Kuadrat yang sama dengan rumus (II.5).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
dan peluang α .
Contoh (Walpole)
Seorang pengusaha pembuat baterai menyatakan umur baterainya berdistribusi
hampir normal dengan simpangan baku sama dengan 0,9 tahun. Diambil sampel
acak sebesar 10 baterai mempunyai simpangan baku 1,2 tahun. Gunakan taraf
nyata 5% untuk menguji apakah σ > 0,81 tahun!
Penyelesaian
Diketahui σ 0 = 0,81 tahun ; n = 10 ; s = 1,2 tahun
χ2 = =
σ 2
0 0,81
(1−α )
Dengan z 1 diperoleh dari daftar distribusi normal baku dengan
peluang 1 (1 − α ) .
2
2
d. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
x1 − x 2
(II.8) z=
σ +
1 1
n1 n2
3. Kriteria pengujian.
Terima H 0 jika − t1− 1 α
< t < t1− 1 α , selainnya tolak H 0 .
2 2
α
Dengan t1− 1 diperoleh dari daftar distribusi t (distribusi Student)
2
s2 =
(n1 − 1)s12 + (n2 − 1)s22
n1 + n2 − 2
(II.10)
Contoh (Sudjana)
Dua macam makanan A dan B diberikan kepada ayam secara terpisah untuk
jangka waktu tertentu. Ingin diketahui makanan mana yang lebih baik bagi ayam.
Sampel acak yang terdiri atas 11 ayam diberi makanan A dan 10 ayam diberi
makanan B. Hasil percobaan pertambahan berat badan ayam (ons) sebagai berikut
Makanan A 3,1 3,0 3,3 2,9 2,6 3,0 3,6 2,7 3,8 4,0 3,4
Makanan B 2,7 2,9 3,4 3,2 3,3 2,9 3,0 3,0 2,6 3,7
Bila populasinya dianggap normal, ujilah pada taraf nyata 5%, apakah kedua
makanan tersebut sama baiknya atau tidak!
Penyelesaian
Diketahui dari data di atas x A = 3,22 ; x B = 3,07 ; s A2 = 0,1996 ; s B2 = 0,1112.
Pada kasus ini populasi dianggap normal dan variansnya tidak diketahui namun
sama besar.
Langkah pengujian hipotesis dalam hal σ 1 = σ 2 = σ tetapi σ tidak diketahui
⎧H : µ = µ 2
1. Hipotesis pengujian ⎨ 0 1
⎩H1 : µ1 ≠ µ 2
2. Taraf signifikansi α = 5%.
3. Kriteria pengujian.
Terima H 0 jika − t1− 1 α
< t < t1− 1 α
dengan dk = n1 + n2 − 2 = 11 + 10 − 2 = 19
2 2
− t1− 1 α
< t < t1− 1 α
Æ − t1− 1 .0 , 05
< t < t1− 1 .0 , 05
Æ − 2,09 < t < 2,09
2 2 2 2
x1 − x2 3,22 − 3,07
t= = = 0,862
s
1
+
1
(0,397 ) +1 1
n1 n2 11 10
5. Kesimpulan : karena − 2,09 < t hitung = 0,862 < 2,09 terletak dalam daerah
lain H 0 ditolak.
Dengan w1 = ; w2 = 2
s12 s2
n1 n2
dk = m .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
x1 − x2
(II.11) t′ =
+
s12 s 22
n1 n2
Contoh (Sudjana)
Suatu barang dihasilkan dengan menggunakan dua proses. Ingin diketahui apakah
kedua proses itu menghasilkan barang yang sama kualitasnya ditinjau dari rata-
rata daya tekannya. Maka diadakan percobaan sebanyak 20 kali masing-masing
dari hasil proses pertama maupun kedua. Diperoleh informasi x1 = 9,25 kg ; x2 =
10,4 kg ; s1 = 2,24 kg ; s2 = 3,12 kg. Bila populasinya dianggap normal dengan
varians kedua populasi tidak sama, dengan taraf nyata 5%, ujilah bagaimana
hasilnya!
Penyelesaian
Diketahui x1 = 9,25 kg ; x2 = 10,4 kg ; s1 = 2,24 kg ; s2 = 3,12 kg.
Pada kasus ini populasi dianggap normal dan variansnya tidak diketahui namun
sama besar.
Langkah pengujian hipotesis dalam hal σ 1 ≠ σ 2 dan keduanya tidak diketahui
1. Hipotesis pengujian
⎧H 0 : µ1 = µ 2 ; kedua proses menghasilkan barang dengan
⎪
⎪
⎨
kualitas rata - rata daya tekan yang sama
⎪H1 : µ1 ≠ µ 2 ; kedua proses menghasilkan barang dengan
⎪⎩ kualitas rata - rata daya tekan yang berbeda
w1 = = = 0,2509 ; w2 = 2 = = 0,4867
s12 5,0176 s 2 9,7344
n1 20 n2 20
w1t1 + w2 t 2 w t + w2 t 2
Sehingga − < t′ < 1 1
w1 + w2 w1 + w2
−
(0,2509)(2,09) + (0,4867 )(2,09) < t ′ < (0,2509)(2,09) + (0,4867 )(2,09)
(0,2509) + (0,4867 ) (0,2509) + (0,4867 )
− 2,09 < t ′ < 2,09
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
x1 − x2 9,25 − 10,4
t′ = = = 1,339
+
s12 s22 +
5,0176 9,7344
n1 n2 20 20
5. Kesimpulan : karena − 2,09 < t ′ = 1,339 < 2,09 terletak dalam daerah
penerimaan H 0 maka H 0 diterima. Jadi, µ1 = µ 2 . Artinya, kedua proses
d. Observasi berpasangan
Untuk observasi berpasangan, maka diambil µ B = µ x − µ y .
α
Dengan t1− 1 diperoleh dari daftar distribusi t dengan peluang
2
1 − 1 α dan dk = n − 1 .
2
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
t=
B
(II.12)
sB
n
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
b. Dalam hal σ 1 ≠ σ 2
Pendekatan yang cukup memuaskan adalah dengan menggunakan statistik
t′ .
Dengan w1 = ; w2 = 2
s12 s2
n1 n2
c. Observasi berpasangan
Langkah pengujian hipotesis:
⎧H : µ = 0
1. Hipotesis pengujian ⎨ 0 B
⎩H 1 : µ B > 0
2. Tentukan besarnya taraf signifikansi α .
3. Kriteria pengujian.
Tolak H 0 jika t ≥ t1−α , selainnya terima H 0 .
dan dk = n − 1 .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik t yang sama dengan rumus (II.12).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
dan peluang (1 − α ) .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik t yang sama dengan rumus (II.9) dan (II.10).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
b. Dalam hal σ 1 ≠ σ 2
Pendekatan yang diggunakan adalah statistik t ′ .
Langkah pengujian hipotesis:
⎧H : µ = µ 2
1. Hipotesis pengujian ⎨ 0 1
⎩ H 1 : µ1 < µ 2
2. Tentukan besarnya taraf signifikansi α .
3. Kriteria pengujian.
w1t1 + w2 t 2
Tolak H 0 jika t ′ ≤ −
w1 + w2
, dan terima H 0 jika terjadi
sebaliknya.
Dengan w1 = ; w2 = 2
s12 s2
n1 n2
c. Observasi berpasangan
Langkah pengujian hipotesis:
⎧H : µ = 0
1. Hipotesis pengujian ⎨ 0 B
⎩H 1 : µ B < 0
2. Tentukan besarnya taraf signifikansi α .
3. Kriteria pengujian.
Tolak H 0 jika t ≤ −t (1−α ),(n −1) , dan terima H 0 untuk t > −t (1−α ),(n−1) .
(1−α )
Dengan z 1 diperoleh dari daftar distribusi normal baku dengan
peluang 1 (1 − α ) .
2
Contoh
Di kecamatan Semarang Barat dari 250 siswa SD, 150 orang suka matematika.
Di kecamatan Gunungpati dari 300 siswa SD, 162 orang suka matematika.
Dengan α = 5%, ujilah adakah perbedaan yang signifikan tentang kesukaan
matematika di kedua kecamatan tersebut.
Penyelesaian
Diketahui x1 = 150 n1 = 250
X2 = 162 n2 = 300
Langkah pengujian hipotesis:
⎧H : π = π 2
1. Hipotesis pengujian ⎨ 0 1
⎩H 1 : π 1 ≠ π 2
2. Taraf signifikansi α = 5%.
3. Kriteria pengujian.
Terima H 0 jika − z 1 (1−α )
< z < z1 (1−α )
2 2
− z1 (1−0, 05 )
< z < z1 (1−0, 05 )
2 2
z1 (1−α )
dari daftar distribusi normal baku dengan peluang 1 (1 − α ) .
2 2
4. Statistik hitung berdasarkan data penelitian (sampel)
x1 + x2 150 + 162
p= = = 0,5673
n1 + n2 250 + 300
q = 1 − p = 1 − 0,5673 = 0,4327
x1 − x2 − 162
z= = = 1,43
150
n1 n2
(0,5673)(0,4327 )⎨ + ⎬
250 300
⎧1 1⎫ ⎧ 1 1 ⎫
pq ⎨ + ⎬
⎩ n1 n2 ⎭ ⎩ 250 300 ⎭
Dengan z0,5−α diperoleh dari daftar distribusi normal baku dengan peluang
(0,5 − α ) .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik z yang sama dengan rumus (II.13).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Dengan z0,5−α diperoleh dari daftar distribusi normal baku dengan peluang
(0,5 − α ) .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik z yang sama dengan rumus (II.13).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh (Sudjana)
Terdapat dua kelompok A dan B, masing-masing terdiri atas 100 pasien yang
menderita suatu penyakit. Kepada kelompok A diberika obat tertentu sedangkan
pada kelompok B tidak. Dalam waktu 1 bulan, terdapat 80 orang yang sembuh
dari kelompok A dan 68 orang yang sembuh dari kelompok B. Dengan α = 1%,
ujilah adakah penelitian dengan pemberian obat ini membantu menyembuhkan
penyakit!
Penyelesaian
Diketahui xA = 80 nA = 100
xB = 68 nB = 100
Langkah pengujian hipotesis:
⎧H : π = π B
1. Hipotesis pengujian ⎨ 0 A
⎩H1 : π A > π B
2. Taraf signifikansi α = 5%.
3. Kriteria pengujian.
Tolak H 0 jika z ≥ z 0,5−α dan Terima H 0 jika z < z 0,5−α .
xA − xB − 68
z= = = 1,94
80
nA nB
(0,74)(0,26)⎨ + ⎬
100 100
⎧1 1⎫ ⎧ 1 1 ⎫
pq ⎨ + ⎬
⎩ n A nB ⎭ ⎩100 100 ⎭
Jadi, π A > π B . Artinya, pada taraf 5%, pemberian obat dapat membantu
penyembuhan penyakit.
Bagaimanakah bila penelitian ini diuji dengan taraf nyata 1%, apakah masih
memberikan hasil yang sama dengan kesimpulan di atas!
F=
2
s1
(II.14)
s22
F=
Varians terbesar
(II.15)
Varians terkecil
Kriteria pengujian.
Tolak H 0 jika F ≥ F1 α (v1 ,v2 )
.
2
Contoh
Dari dua populasi siswa diukur hasil prestasi belajar siswa. Dari populasi pertama
2
diukur 10 orang siswa ternyata s1 = 24,7. Dari populasi kedua diukur 13 siswa
homogen.
Penyelesaian
2
Diketahui s1 = 24,7 n1 = 10
2
s2 = 37,2 n2 = 13
Langkah pengujian hipotesis:
⎧⎪H 0 : σ 1 = σ 2
1. Hipotesis pengujian ⎨
2 2
⎪⎩H1 :: σ 12 ≠ σ 2 2
Terima H 0 jika F(1− 1 α ),(n −1,n −1) < F < F1 (n −1,n −1)
2 1 2 2α 1 2
F(1− 1 (0,1)),(10−1,13−1)
< F < F1 (0,1),(10−1,13−1)
2 2
F= = = 0,664
2
s1 24,7
2
s2 37,2
5. Kesimpulan: karena 0,3257 < Fhitung = 0,664 < 2,80 maka H 0 diterima.
tersebut homogen.
F= = = 1,506
Varians terbesar 37,2
Varians terkecil 24,7
Kriteria pengujian.
Tolak H 0 jika F ≥ F1 α (v1 ,v2 )
Æ F ≥ F1 (0,1)(12, 9 )
= 3,07 .
2 2
Jadi, σ 1 = σ 2 . Artinya kedua varians populasi sama atau kedua populasi tersebut
2
homogen.
(k ≥ 2)
populasi yang berdistribusi normal.
Misalkan dipunyai k buah populasi berdistribusi independen dan
LATIHAN
1. Pengusaha ban mobil X mengatakan bahwa produksi bannya tahan pakai
dalam pemakaian mobil sejauh 80.000 km. Timbul dugaan bahwa masa pakai
ban telah berubah, untuk menentukan hal ini dilakukan penelitian dengan cara
menguji 50 ban dan diperoleh rata-rata pemakaian 79.200 km. Dari
pengalaman diketahui simpangan baku mas apakai ban 6000 km dengan taraf
nyata 5%. Selidiki apakah kualitas ban tersebut telah berubah atau belum!
3. Ujilah apakah ada perbedaan yang signifikan (berarti) dari prestasi hasil
belajar siswa dengan penerapan dua metode pembelajaran yang berbeda yaitu
Metode A dan Metode B. Diketahui informasi dari sampel yang diberi Metode
A yaitu n = 30 dan x = 60. Sedangkan dari sampel yang diberi Metode B
dengan n = 32 dan x = 62. Dan diketahui dari pengalaman bahwa σ 1 = σ 2 =6
dan α = 5%.
4. Dua jenis makanan ternak A dan B diberikan pada sapi secara terpisah dalam
jangka waktu tertentu. Ingin diketahui jenis makanan mana yang lebih baik
untuk ternak tersebut, untuk itu diambil sampel 11 ekor sapi diberi makanan A
dan 10 ekor sapi lain diberi makanan B. Setelah pemberian makanan ternak
tersebut dalam waktu 1 minggu, dicatat pertambahan berat sapi (dalam kg)
sbb:
Makanan A : 3,4 4,0 3,8 2,7 3,6 3,0 2,6 2,9 3,3 3,0 3,1
Dengan α = 5%, tentukan apakah kedua jenis makanan ternak tersebut sama
Makanan B : 3,7 2,6 3,0 3,0 2,9 3,3 3,2 3,4 2,9 2,7
BAB III
ANALISIS VARIANS
menguji kesamaan atau perbedaan antar rata-rata dari k buah (k > 2) populasi
varians tidak hanya terbatas pada mean dua sampel namun dapat digunakan untuk
Dasar pemikiran penggunaan analisis varians adalah bahwa varians total semua
subjek dalam suatu eksperimen dapat dianalisis dari dua sumber, yaitu variansi
antar kelompok dan variansi di dalam kelompok.
∑ (x
Dikenal beberapa jenis varians sampel s 2 , salah satunya dihitung dengan rumus
− x)
= dan varians populasi adalah σ 2 .
2
n −1
2 i
s
Varians untuk sekumpulan data ini melukiskan derajat perbedaan atau variansi
nilai data individu yang ada dalam kelompok atau kumpulan data tersebut.
Variansi ini dihitung dari nilai rata-rata kumpulan data. Selain itu dikenal pula
varians sampling berbagai statistik, untuk rata-rata diberi lambang σ x2 , untuk
H 1 : µ1 ≠ µ 2 = µ 3 =K = µ k
µ1 = µ 2 ≠ µ 3 =K ≠ µ k
µ1 ≠ µ 2 ≠ µ 3 ≠ K ≠ µ k
2. Ambil sampel acak dari k buah (k > 2 ) populasi sbb:
Sampel I Sampel II Sampel III ... Sampel k
x11 x12 x13 ... x1k
x 21 x 22 x 23 ... x 2k
x 31 x 32 x 33 ... x 3k
M M M ... M
x n1 x n2 x n3 ... x nk
x1 x2 x3 ... xk
Fhitung = =
VAM var ians antar means
VDK var ians dalam kelompok
n∑ (x j − x )
k
2
VAM = σ 2 = nS x2 = , dk = k − 1
j =1
k −1
∑∑ (x − xj )
n k
2
VDK =
k (n − 1)
i =1 j =1
ij
5. Kriteria pengujian.
Terima H 0 jika Fhitung ≤ Fα ;(k −1,k (n−1)) .
Sd = + , s 2 = VDK
s2 s2
ni n j
Contoh
Diterapkan model pembelajaran dengan 3 metode, kemudian dilakukan tes dan
diperoleh skor hasil tes sbb:
Sampel Metode I Metode II Metode III
ke-
1 25 22 22
2 29 25 21
3 28 24 26
4 30 25 23
a. Dengan anava selidikilah apakah ada perbedaan diantara tiga mean skor
hasil belajar dengan ketiga metode tersebut.
Penyelesaian
Diketahui x1 = 28 x2 = 24 x3 = 23
x = 25
Langkah-langkah Analisis varians:
Merumuskan hipotesis uji
H 0 : µ1 = µ 2 = µ 3
n∑ (x j − x )
Gunakan statistik F (Fisher)
{
4 (28 − 25) + (24 − 25) + (23 − 25) }
k
2
VAM = = = 28
j =1
2 2 2
k −1 3 −1
∑∑ (x − xj )
n k
2
VDK =
k (n − 1)
i =1 j =1
ij
⎧⎪⎡(25 − 28)2 + (29 − 28)2 + ⎤ ⎡(22 − 28) + (25 − 28) + ⎤ ⎡(22 − 28) + (21 − 28) + ⎤ ⎫⎪
⎨⎢ ⎥+⎢ ⎥+⎢ ⎥⎬
⎪⎩⎢⎣(28 − 28) + (30 − 28) ⎥⎦ ⎢⎣(24 − 28) + (25 − 28) ⎥⎦ ⎢⎣(26 − 28) + (23 − 28) ⎥⎦ ⎪⎭
2 2 2 2
=
3(4 − 1)
2 2 2 2 2 2
= = 3,78
1
9
Fhitung = = = 7,41
VAM 28
VDK 3,78
Kriteria pengujian.
Terima H 0 jika Fhitung ≤ Fα ;(k −1,k (n−1))
Kesimpulan : karena Fhitung = 7,41 > Fα ;(k −1,k (n−1)) = 4,26 maka H 0 ditolak.
Artinya, ada perbedaan diantara ketiga mean skor hasil belajar dengan
ketiga metode tersebut.
Karena H 0 ditolak, maka analisis dilanjutkan dengan Uji Lanjut menggunakan
Uji LSD
1− α
1
2
LATIHAN
1. Dilakukan penelitian tentang produksi susu sapi dari 3 lokasi. Diambil 10 sapi
sebagai sampel dari masing-masing lokasi. Penelitian selama 3 bulan tercatat
hasil seperti pada data berikut.
2. Dilakukan pengamatan terhadap hasil tes UAN siswa SMA. Para siswa itu
dikelompokkan dalam 3 kategori (1) SMA Favorit, (2) SMA Negeri, dan (3)
SMA Swasta. Diperoleh data pengamatan sebagai berikut:
No SMA Nilai No SMA Nilai No SMA Nilai
1 favorit 4,25 8 negeri 4,00 15 swasta 4,00
2 favorit 5,00 9 negeri 3,00 16 swasta 3,50
3 favorit 4,75 10 negeri 3,50 17 swasta 3,75
4 favorit 3,75 11 negeri 3,75 18 swasta 3,00
5 favorit 4,50 12 negeri 3,50 19 swasta 3,25
6 favorit 4,25 13 negeri 3,25 20 swasta 3,50
7 favorit 4,00 14 negeri 4,25 21 swasta 2,75
BAB IV
ANALISIS REGRESI
1. Pendahuluan
Metode analisis yang telah dibahas sebelumnya adalah analisis terhadap data
mengenai sebuah karakteristik atau atribut (data kualitatif) dan mengenai
sebuah variabel, diskrit maupun kontinu (data kuantitatif). Namun, kenyataan
yang terjadi, banyak persoalan yang meliputi lebih dari sebuah variabel.
Misalkan, hasil belajar siswa tergantung pada waktu belajar, hasil produksi
padi tergantung pada cuaca serta penggunaan pupuk, dan lain sebagainya.
Oleh karena itu perlu untuk mempelajari analisis data yang terdiri atas banyak
variabel.
Jika dipunyai data yang terdiri atas dua atau lebih variabel, maka dapat
dipelajari bagaimana variabel-variabel tersebut berhubungan. Hubungan yang
diperoleh umumnya dinyatakan dalam bentuk persamaan matematik yang
menyatakan hubungan fungsional antara variabel. Studi yang mmempelajari
hubungan antar variabel ini dikenal dengan analisis regresi.
Tujuan dari bab ini adalah bagaimana menghitung suatu perkiraan atau
persamaan regresi yang akan menjelaskan hubungan antara dua variabel.
Yang akan dibahas adalah regresi garis sederhana, dimana akan dibahas
mengenai hubungan antara dua variabel yang biasanya cukup tepat dinyatakan
dalam suatu garis lurus. Selanjutnya tujuan dari penggunaan persamaan
regresi adalah memperkirakan nilai dari suatu variabel pada nilai tertentu dari
variabel lain dengan kata lain persamaan regresi digunakan untuk peramalan.
(k ≥ 1)
variabel takbebas. Dalam analisis regresi, variabel bebas akan dinyatakan
dengan X 1 , X 2 , K , X k sedangkan variabel takbebas dinyatakan
dengan Y.
Secara umum model atau persamaan regresi untuk populasi dapat ditulis
µ y. x , x ,K, x = ( X 1 , X 2 , K , X k θ1 , θ 2 , K , θ m )
dalam bentuk
(IV.1)
Model regresi sederhana untuk populasi dengan sebuah variabel bebas yang
biasa dikenal dengan regresi linier sederhana adalah
(IV.2) µ y. x = θ 1 + θ 2 X
Untuk kasus regresi linier sederhana, perlu ditaksir parameter θ 1 dan θ 2 . Jika
θ 1 dan θ 2 ditaksir oleh a dan b , maka persamaan regresi berdasarkan
sampel adalah
(IV.3) Yˆ = a + bX
Model regresi populasi pangkat dua atau parabola untuk sebuah variabel bebas
dengan parameter θ 1 , θ 2 dan θ 3 adalah
(IV.4) µ y . xx = θ 1 + θ 2 X + θ 3 X 2
2
Ada dua manfaat dari penggunaan diagram pencar ini yaitu: (1) Membantu
menunjukkan apakah terdapat hubungan yang bermanfaat antara dua variabel,
(2) Membantu menetapkan tipe persamaan yang menunjukkan hubungan
antara kedua variabel tersebut. Seperti yang tertulis dalam manfaat yang
kedua, dari letak titik-titik pada diagram pencar, dapat diperkirakan bentuk
regresinya. Jika letak titik-titik yang terbentuk di sekitar garis lurus, maka
dapat diduga terjadi regresi linier. Namun, hubungan yang terbentuk tidak
selalu harus berupa garis lurus. Jika letak titik-titik yang terbentuk di sekitar
garis lengkung, maka dapat diduga terjadi regresi nonlinier.
(∑ Y )(∑ X ) − (∑ X )(∑ X Y )
n∑ X − (∑ X )
a=
2
i i i i i
n∑ X Y − (∑ X )(∑ Y )
2 2
i i
(IV.6)
n∑ X − (∑ X )
b=
i i i i
2 2
i i
Contoh (Supranto)
Berikut data penjualan dari perusahaan makanan ringan
X : persentase kenaikan biaya iklan
Y : persentase kenaikan hasil penjualan
X 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Berapakah besarnya ramalan presentase kenaikan penjualan apabila biaya
iklan dinaikkan menjadi 15 %.
Penyelesaian
X Y X2 XY
1 2 1 2
2 4 4 8
4 5 16 20
5 7 25 35
7 8 49 56
9 10 81 90
10 12 100 120
∑X ∑Y ∑X ∑X Y
12 14 144 168
i = 50 i = 62 i
2
= 420 i i = 499
X = 6,25 Y = 7,75
n∑ X − (∑ X i )
b= = = = 1,04
8(420 ) − (50 )
892
2 2
2 860
σ Y2. X . Varians σ Y2. X dimisalkan sama untuk setiap X maka dapat dinyatakn
( )
oleh varians kekeliruan taksiran σ ε2 dan kekeliruan baku taksiran σ y. x .
∑Y − a ∑ Y − b∑ XY .
a. Kesalahan baku untuk regresi
Se =
2
n−2
∑X −S
b. Kesalahan baku untuk koefisien regresi a (parameter a )
n∑ X − (∑ X )
Sa =
2
e
2 2
(∑ X )
Sb =
Se
∑X −
2
2
Beberapa model regresi nonlinier yang mudah dan sering digunakan, antara
lain:
6.1. Model Parabola kuadratik
Persamaan umum model ini ditaksir oleh
(IV.8) Yˆ = a + bX + cX 2
Dengan koefisien-koefisien a , b, c harus ditentukan berdasarkan data
hasil pengamatan. Dengan menggunakan metode kuadrat terkecil, maka
∑ Y = na + b∑ X + c∑ X
a , b, c dapat dihitung dengan sistem persamaan:
2
∑ X Y = a ∑ X + b∑ X + c∑ X
i i i
2 3
∑ X Y = a ∑ X + b∑ X + c∑ X
i i i i i
2 2 3 4
i i i i i
∑ Y = na + b∑ X + c∑ X + d ∑ X
adalah:
2 3
∑ X Y = a ∑ X + b∑ X + c∑ X + d ∑ X
i i i i
2 3 4
∑ X Y = a ∑ X + b∑ X + c∑ X + d ∑ X
i i i i i i
2 2 3 4 5
∑ X Y = a ∑ X + b∑ X + c∑ X + d ∑ X
i i i i i i
3 3 4 5 6
i i i i i i
⎞
log a = ⎟
⎜ ⎟
i i
⎝ ⎠
(IV.12)
n∑ X i2 − (∑ X i )
log b = 2
∑ log Y ⎛ ∑ log X i
dan b dapat dihitung dari:
⎞
log a = − b⎜ ⎟
⎜ ⎟
i
⎝ ⎠
(IV.16)
Yˆ = X
1
(IV.17)
ab
Untuk Ŷ yang tidak sama dengan nol, maka bentuk di atas dapat pula
= ab X .
1
ditulis sebagai
Yˆ
Jika diambil logaritmanya, diperoleh
⎛1⎞
Yang merupakan model linier dalam variabel-variabel X dan log⎜ ⎟ .
⎝Y ⎠
⎞
log a = ⎟
⎜ ⎟
i i
⎝ ⎠
(IV.19)
n∑ X i2 − (∑ X i )
log b = 2
⎛1⎞
Dengan log Y diganti oleh log⎜ ⎟ .
⎝Y ⎠
Yˆ =
1
a + bX
(IV.20)
= a + bX
1
(IV.21)
Yˆ
1
Yang merupakan bentuk linier dalam variabel-variabel X dan .
Y
(∑ Y )(∑ X ) − (∑ X )(∑ X Y )
Koefisien-koefisien a dan b dapat dihitung dengan rumus
n(∑ X ) − (∑ X )
a=
2
i i i i i
(IV.22) 2
n(∑ X Y ) − (∑ X )(∑ Y )
2
i i
n(∑ X ) − (∑ X )
b=
i i i i
2 2
i i
1
Apabila variabel Y diganti oleh .
Y
umum, data hasil pengamatan Y dapat terjadi atau dipengaruhi oleh variabel-
variabel bebas X 1 , X 2 , K , X k .
sederhana yang dikenal dengan nama regresi linier berganda. Model regresi
linier ganda atas X 1 , X 2 , K , X k akan ditaksir oleh
(IV.23) Yˆ = a + b1 X 1 + b2 X 2 + K + bk X k
an + b1 ∑ X 1 + b2 ∑ X 2 + K + bk ∑ X k = ∑ Y
sebagai berikut
(IV.24)
a ∑ X 1 + b1 ∑ X 1 + b2 ∑ X 1 X 2 + K + bk ∑ X 1 X k = ∑ X 1Y
2
a ∑ X 2 + b1 ∑ X 2 X 1 + b2 ∑ X 2 + K + bk ∑ X 2 X k = ∑ X 2Y
2
a ∑ X k + b1 ∑ X k X 1 + b2 ∑ X k X 2 + K + bk ∑ X k = ∑ X k Y
M
2
diketahui.
Sama halnya dengan regresi linier, dalam regresi linier ganda perubahan rata-
rata Y memperhatikan nilai dan tanda koefisien dari masing-masing variabel
X. Pada rumus (IV.23) maka koefisien b1 menyatakan perubahan rata-rata Y
untuk setiap perubahan satu unit variabel X 1 apabila X 2 , X 3 , K , X k
Contoh (Supranto)
Perhatikan file PDF
LATIHAN
∑ (X − X )(Y − Y )
Y Y1 , Y2 , K , Yi , K , Yn
∑ (X − X )
Jika b = dan a = Y − bX
i i
2
i
dengan X = ∑ X i dan Y = ∑ Yi
1 1
n n
n∑ X iYi − (∑ X i )(∑ Yi )
Tunjukkan bahwa:
n∑ X i2 − (∑ X i )
a. b = 2
∑ (Y − a − bX ) = 0
n
b.
i =1
i
BAB V
ANALISIS KORELASI
1. Pendahuluan
Jika data hasil pengamatan terdiri dari banyak variabel, maka hal yang perlu
diketahui berikutnya adalah seberapa kuat hubungan antara variabel-variabel
tersebut terjadi. Dengan kata lain, perlu ditentukan derajat hubungan antara
variabel-variabel. Studi yang membahas tentang derajat hubungan antara
variabel dikenal dengan nama analisis korelasi. Sedangkan ukuran yang
digunakan untuk mengetahui derajat hubungan, terutama untuk data
kuantitatif, dinamakan koefisien korelasi.
Adanya hubungan (korelasi) antara variabel yang satu dengan variabel lainnya
dapat dinyatakan dengan perubahan nilai variabel. Dalam bab ini hanya akan
dibahas mengenai hubungan linier antara dua variabel X dan Y .
Apabila dua variabel X dan Y mempunyai hubungan, maka nilai variabel X
yang sudah diketahui dapat digunakan untuk memperkirakan/menaksir atau
meramalkan Y. Ramalan pada dasarnya merupakan perkiraan/taksiran
mengenai terjadinya suatu kejadian (nilai suatu variabel) untuk waktu
mendatang, misalnya ramalan harga beras bulan depan, ramalan jumlah
penduduk 10 tahun mendatang, dan lain sebagainya.
Serupa dengan analisis regresi, variabel Y yang nilainya akan diramalkan
disebut variabel takbebas, sedangkan variabel X yang nilainya digunakan
untuk meramalkan nilai Y disebut variabel bebas atau variabel peramal
(predictor) atau sering disebut variabel yang menerangkan (explanatory).
2. Koefisien Korelasi
Jika antara variabel X dan Y ada hubungan, bentuk diagram pencarnya akan
mulus/teratur. Apabila terdapat hubungan positif, maka diagram pencar akan
bergerak dari kiri bawah ke kanan atas, sedangkan apabila terdapat hubungan
negatif, maka diagram pencar akan bergerak dari kiri atas ke kanan bawah.
Bila bentuk diagram pencar tidak teratur, artinya kenaikan/penurunan X pada
umumnya tidak diikuti oleh naik turunnya Y, dikatakan X dan Y tidak
berkorelasi. Atau dengan kata lain, X dan Y dikatakan saling bebas
(independent) jika naik dan turunnya varianel X tidak mempengaruhi Y atau
antara X dan Y tidak ada hubungan atau hubungnnya sangat lemah sehingga
dapat diabaikan.
Apabila hubungan X dan Y dapat dinyatakan dengan fungsi linier, maka kuat
hubungan antara X dan Y diukur dengan suatu nilai yang disebut Koefisien
Korelasi. Nilai koefisien korelasi.ini paling sedikit -1 dan paling besar 1. Jika
r adalah koefisien korelasi,maka nilai r dapat dinyatakan sebagai
−1 ≤ r ≤ 1
Jika
r = 1 , hubungan X dan Y sempurna dan positif (mendekati 1, hubungan sangat
kuat dan positif)
r = −1 , hubungan X dan Y sempurna dan negatif (mendekati -1, hubungan
sangat kuat dan negatif)
r = 0 , hubungan X dan Y lemah sekali atau tidak ada hubungan.
∑x y
Cara menghitung r adalah sebagai berikut
n
r= i =1
i i
∑ xi ∑y
Rumus 1
n n
2 2
i =1 i =1
i
xi = X i − X X = ∑ Xi
1 n
n i =1
y i = Yi − Y Y = ∑ Yi
1 n
n i =1
atau
n∑ X i Yi − ∑ X i ∑ Yi
n n n
r= i =1 i =1 i =1
n∑ X i − ⎜ ∑ X i ⎟ n∑ Yi − ⎜ ∑ Yi ⎟
⎛ n ⎞ ⎛ n ⎞
Rumus 2
n 2 n 2
⎝ i =1 ⎠ ⎝ i =1 ⎠
2 2
i =1 i =1
Contoh (Supranto)
Berikut data penjualan dari perusahaan makanan ringan
X : persentase kenaikan biaya iklan
Y : persentase kenaikan hasil penjualan
X 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Hitunglah r!
Penyelesaian
Untuk menghitung r, dibuat tabel berikut
Dengan rumus 1
X −X Y −Y
(x ) (y)
X Y x2 y2 xy
∑X ∑Y ∑x ∑y ∑x ∑y ∑x y
12 14 5,75 6,25 33,0625 39,0625 35,9375
i = 50 i = 62 i =0 i =0 2
i = 107,5 2
i = 117,5 i i = 111,5
X = 6,25 Y = 7,75
∑x y
n
r= i =1
= = = 0,99
i i
111,5 111,5
∑x ∑y
n
2
n
2 107,5 117,5 112,389
i =1 i =1
i i
Dengan rumus 2
X Y X2 Y2 XY
1 2 1 4 2
2 4 4 16 8
4 5 16 25 20
5 7 25 49 35
7 8 49 64 56
9 10 81 100 90
10 12 100 144 120
∑X ∑Y ∑X ∑Y ∑X Y
12 14 144 196 168
i = 50 i = 62 i
2
= 420 i
2
= 598 i i = 499
8∑ X i Yi − ∑ X i ∑ Yi
8 8 8
r= i =1 i =1 i =1
8∑ X i − ⎜ ∑ X i ⎟ 8∑ Yi − ⎜ ∑ Yi ⎟
⎛ ⎞ ⎛ 8 ⎞
8 8 2 8 2
⎝ i =1 ⎠ ⎝ i =1 ⎠
2 2
r=
8(420 ) − (50 ) 8(598) − (62 )
2 2
= = = 0,99
892 892
860 940 899,075
Untuk menghitung koefisien korelasi antara rank dari Adi dan Bayu terhadap
10 merk minuman ringan dalam kemasan tersebut digunakan Koefisien
Korelasi Rank (Rank Spearman).
6∑ d i2
rrank = 1 −
(
n n2 −1 )
dimana
d i = selisih dari pasangan rank ke-i
Contoh
Carilah koefisien korelasi rank antara rank Adi dan Bayu dalam menilai 10
merk minuman ringan.
Penyelesaian
Rank Adi 8 3 9 2 7 10 4 6 1 5
Rank Bayu 9 5 10 1 8 7 3 4 2 6
Selisih Rank (d) -1 -2 -1 1 -1 3 1 2 -1 -1
d2 1 4 1 1 1 9 1 4 1 1
6∑ d i2
Sehingga
6(1 + 4 + 1 + K + 1)
rrank = 1 −
(
n n −1
2
) = 1−
10(100 − 1)
= 1 − 0,1455 = 0,8545 = 0,85
Jadi, koefisien korelasi rank antara rank Adi dan Bayu dalam menilai 10 merk
minuman ringan sebesar 0,85.
E 30 8 200 6 2 4
F 50 1,5 288 3 -1,5 2,25
G 26 9 146 10 -1 1
H 50 1,5 361 1 0,5 0,25
I 22 10 149 9 1 1
J 43 4 252 5 -1 1
Karena F dan H memiliki nilai yang sama maka rank mereka harus sama yaitu
1+ 2
= 1,5 . Mula-mula F diberi nilai 1 dan H diberi nilai 2 (atau sebaliknya,
2
kemudian dirata-rata). Apabila terdapat 3 objek yang memiliki nilai yang
sama, maka diurutkan dan dicari rata-ratanya.
6∑ d i2
Sehingga
6(1 + 4 + 1 + K + 1)
rrank = 1 −
(
n n −1 2
) = 1−
10(100 − 1)
= 1 − 0,0939 = 0,9061
Jadi, koefisien korelasi rank antara rank nilai ujian dan hasil penjualan sebesar
0,9061.
LATIHAN
4. Amat dan Budi diminta untuk memberikan rank berdasarkan suka dan
tidaknya terhadap merk rokok tertentu. Rokok yang paling disenangi diberi
nilai 10 dan yang paling tidak disenangi diberi nilai 1. Diperoleh hasil rank
sebagai berikut.
No Merk Rokok Rank dari Amat Rank dari Budi
1 AAA 2 9
2 BBB 10 4
3 CCC 8 3
4 DDD 3 6
5 EEE 4 5
6 FFF 1 7
7 GGG 5 8
8 HHH 2 6
DAFTAR PUSTAKA
Walpole, R & Myers, R. 1986. Ilmu Peluang dan Statistika Untuk Insinyur dan
Ilmuan. Terjemahan. Penerbit ITB. Bandung.