NIM : 411417035
KELAS : E
TUGAS STATISTIKA PENELITIAN
Tugas 1
Regresi linier berganda merupakan model persamaan yang menjelaskan hubungan satu
variabel tak bebas/ response (Y) dengan dua atau lebih variabel bebas/ predictor (X1, X2,…Xn).
Tujuan dari uji regresi linier berganda adalah untuk memprediksi nilai variable tak bebas/
response (Y) apabila nilai-nilai variabel bebasnya/ predictor (X1, X2,..., Xn) diketahui.
Disamping itu juga untuk dapat mengetahui bagaimanakah arah hubungan variabel tak bebas
dengan variabel - variabel bebasnya.
Persamaan regresi linier berganda secara matematik diekspresikan oleh :
Y = a + b1 X1 + b2 X2 + … + bn Xn
yang mana :
a = konstanta
Bila terdapat 2 variable bebas, yaitu X1 dan X2, maka bentuk persamaan regresinya adalah:
Y = a + b1X1 + b2X2
• Apabila r2 bernilai 0, maka dalam model persamaan regresi yang terbentuk, variasi variable
tak bebas Y tidak sedikitpun dapat dijelaskan oleh variasi variable-variable bebas X1 dan
X2
• Apabila r2 bernilai 1, maka dalam model persamaan regresi yang terbentuk, variable tak
bebas Y secara sempurna dapat dijelaskan oleh variasi variable- variable bebas X1 dan X2.
Diberikan data tentang IQ dan tingkat kehadiran sepuluh siswa di kelas yang
1 110 60 65
2 120 70 70
3 115 75 75
4 130 80 75
5 110 80 80
6 120 90 80
7 120 95 85
8 125 95 95
9 110 100 90
10 120 100 98
Pertanyaan :
1. Buatlah persamaan regresi linier berganda !
2. Variabel yang mana memberikan pengaruh lebih besar terhadap nilai UAS? Jelaskan
mengapa demikian ?
3. Berapa koefisien determinasinya? Interpretasi hasil ini !
Jawaban :
1. Persamaan regresi : Y = 25.047 + 0.6705X1 – 0.00343X2
2. Dilihat dari persamaan regresi, nilai b1 lebih besar dibandingkan dengan nilai b2. Nilai b1
menandakan kemiringan X1 (kehadiran dikelas) dan b2 menandakan kemiringan X2
(IQ). Dalam hal ini dapat disimpulkan bahwa presentase kehadiran dikelas lebih
berpengaruh daripada IQ.
3. Koefisien Determinasi : r2 = (0.6935)2 = 0.4809 = 48.09%
Nilai akhir (Y) yang dapat dijelaskan oleh tingkat kehadiran (X 1) dan IQ (X2) pada
persamaan regresi Y = 25.047 + 0.6705X1 – 0.00343X2 adalah 48.09%. Sisanya, sebesar
51.91% dijelaskan oleh faktor lain diluar variable-variabel pada persamaan regresi Y =
25.047 + 0.6705X1 – 0.00343X2.
Tugas ke-2
1. Uji Mann-Whitney
2. Uji Median
3. Uji Kruskal-Wallis
4. Uji Tanda
5. Uji Wilcoxon
6. Uji Run
1. Mann-Whitney Test
Digunakan untuk menguji apakah sama median sampel 1 dengan media sampel 2 yang saling
bebas
Dengan asumsi :
- Data terdiri dari 2 contoh acak yang berasal dari populasi populasi dengan median
tidak diketahui
Hipotesis
Prosedur :
Statistik Uji
Kaidah keputusan
2. Uji Median (uji perbandingan nilai tengah)
Digunakan untuk menguji apakah sama median sampel 1 dengan median sampel 2
Dengan asumsi :
- data terdiri dari 2 contoh acak yang berasal dari populasi-populasi dengan median tidak
diketahui
- Skala data minimal ordinal
- Variabel yang diukur bersifat kontinu
- Dua populasi dengan bentuk sama
Hipotesis : H0 = Mx = My ; H1 = Mx ≠ My
Prosedur :
Statistik uji
3. Uji Kruskal-Wallis
Teknik analisis nonparametriku ntuk mengetahui apakah k (sampel) independen.
Digunakan untuk menguji hipotesis awal bahwa beberapa contoh berasal dari populasi yang
sama/identik
Syarat:
Data nominal & ordinal
Sampel tak berhubungan / independen
Subyek berbeda
Prosedur :
Rumus
𝑘
12 𝑅𝑗 2
𝐻= [∑ ] − 3(𝑁 + 1)
𝑁(𝑁 + 1) 𝑛𝑗
𝑗=1
Kaidah Keputusan
4. Sign Test
Digunakan untuk menguji apakah median pada data sama dengan median yang diharapkan.
Disebut juga sebagai uji tanda karena data diubah menjadi serangkaian tanda + dan –
Asumsi :
Statistik uji :
Kaidah Keputusan :
5. Uji Wilcoxon
Digunakan untuk membandingkan dua variabel pada sampel yang sama, misal ada dua
kelompok data X dan Y
Langkah-langkah Pengujian
- Pasangkan Data
- Hitung harga mutlak selisih skor pasangan data |x 1-y1|
- Tentukan ranking tiap pasangan data
- Isi kolom positif dan negatif dengan ranking tiap pasangan sesuai dengan tanda selisih
pasangan data : jika selisihnya positif masukkan rangkingnya ke kolom positif, jika
selisihnya negatif masukkan rangkingnya kekolom negatif
- Jumlahkan rangking pada kolom positif dan negatif
- Ambil jumlah yang paling kecil (Whitung) lalu bandingkan dengan tabel nilai kritis
Wilcoxon (Wtabel)
Hipotesis :
Ho = tidak ada perbedaan pengaruh kedua perlakuan
H1 = ada perbedaan pengaruh kedua perlakuan
Kriteria Pengujian
Uji kerandoman
Diberikan hasil pengumpulan data sebagai berikut : 31, 36, 43, 51, 44, 12, 26, 43, 75, 2, 3, 15,
18, 78, 24, 13, 27, 86, 61, 13, 7, 6, 8, 15 Ujilah dengan = 0,05 apakah data tersebut
mempunyai urutan yang random
Penyelesaian
1. H0 : urutan data merupakan urutan yang random / acak
H1 : urutan data bukan merupakan urutan yang random / acak
2. Tingkat signifikansi : = 0,05
3. Perhitungan statistik uji
Menentukan nilai median data, data diurutkan dari kecil ke
Hubungan antara dua atau lebih variabel tersebut ada dua macam, yaitu bentuk
hubungan dan keeratan hubungan. Bila ingin diketahui bentuk hubungan, maka digunakan
analisis regresi. Sedangkan bila yang ingin diketahui adalah keeratan hubungan, maka
digunakan analisis korelasi.
Analisis regresi adalah suatu proses melakukan estimasi untuk memperoleh suatu
hubungan fungsional antara variabel acak Y dengan variabel X.
Persamaan regresi digunakan untuk memprediksi nilai Y untuk nilai X tertentu. Analisis regresi
sederhana adalah analisis regresi antara satu variabel Y dan satu variabel X.
Scatter Diagram
Bila dua variabel X dan Y berhubungan sebab akibat, dengan variabel X sebagai variabel
independent (variabel bebas, variabel yang nilainya mempengaruhi nilai variabel tak bebas)
dan variabel Y sebagai variabel dependent (variabel tak bebas, variabel yang nilainya
dipengaruhi oleh variabel bebas), maka bila nilai variabel X diketahui, nilai tersebut dapat
dipergunakan untuk memperkirakan nilai variabel Y jika bentuk hubungan kedua variabel
tersebut diketahui. Untuk mengethaui pola hubungan yang mungkin terbentuk dari dua variabel
X dan Y dapat dipergunakan Scatter diagram (diagram pencar).
Scatter diagram adalah grafik yang menunjukkan titik-titik perpaduan nilai observasi dari 2
variabel (X & Y). Pada umumnya dalam grafik, variabel independent (X) diletakkan pada garis
horisontal, sedangkan variabel dependent (Y) pada garis vertikal.
Dari scatter diagram dapat diperoleh informasi tentang bentuk hubungan antara dua variabel X
dan Y dengan melihat macam pola yang terbentuk. Selain memberikan informasi tentang
bentuk hubungan dari kedua variabel, polayang terbentuk juga dapat menggambarkan keeratan
hubungan dari kedua variabel tersebut.
Dari informasi tersebut jika nilai test masuk digunakan untuk memrpediksikan keberhasilan
studi mahasiswa, maka test masuk merupakan variabel independent, sedangkan IP sebagai
variabel dependent. Bila dibuat plot atas pasangan nilai diatas, akan diperoleh scatter diagram
berikut :
4.00
3.75
3.50
3.00
2.75
2.50
2.25
50 55 60 65 70 75 80 85 90 95
Dari scatter diagram yang terbentuk dapat diberikan beberapa penjelasan sebagai berikut :
1. Hubungan kedua variabel tersebut adalah positif karena peningkatan nilai X juga diikuti
peningkatan nilai Y (searah)
2. Derajat atau tingkat hubungan kedua variabel X dan Y sangat erat (titik-titik yang
menunjukkan pertemuan nilai X dan Y mendekati garis lurus)
3. Huungan kedua variabel adalah linier, karena titik-titik yang menunjukkan pertemuan
nilai X dan Y tersebut dapat menggambarkan garis lurus.
Berdasarkan pola hubungan natara X dan Y yang diperoleh dari scatter diagram maka secara
garis besar sifat hubungan antara variabel independent (X) dan variabel dependent (Y) dapat
diklasifikasikan sebagai hubungan linier dan hubungan nonlinier. Sifat hubungan yang
nonlinier (curvalinier) justru banyaj terjadi dalam masalah ekonomi, meskipun demikian
pembahasan pada bab ini dibatasi hanya untuk hubungan yang linier.
Persamaan Regresi Linier
Y’ = a + bX
X = Variabel bebas
Y b X n XY X Y
a b
n
n X 2 X
2
Contoh :
X Y X2 XY Y2
4 5 16 20 25
7 12 49 84 144
3 4 9 12 16
6 8 36 48 64
10 11 100 110 121
30 40 210 274 370
a. Y’ = a + b X
n XY X Y 5(274) (30)(40) 1370 1200
b 1.133
n X 2 X
2
5(210) (30) 2 1050 900
Y b X 40 (1.133)(30)
a 1.202
n 5
Y = 1.202 + 1.133
= 10.302 10
Standard error estimasi, mendekati sama dengan standard deviasi, keduanya merupakan
ukuran penyebaran. Standard deviasi digunakan untuk mengukur penyebaran dari kumpulan
nilai observasi dengan bertitik tolak pada mean, sedangkan standard error estimasi bertitik tolak
pada garis pregresi.
(a) (b)
(Y Y ' ) 2
Se atau
n2
Y 2 a( Y ) b( XY )
Se
n2
Contoh :
Kembali pada pemilik usaha angkutan yang berupaya mengadakan prediksi terhadap biaya
perawatan tiap mobil dengan melihat masa pakainya, telah ditemukan persamaan estimasi :
Y’ = 2 + 0.2X
Y 2 a( Y ) b( XY )
Se
n2
Sebenarnya standard error estimasi dapat diinterpretasikan seperti halnya standard deviasi
terhadap nilai mean. Semakin besar nilai Se, semakin tersebar nilai observasi yang berada di
sekitar garis regresi atau sebaliknya semakin kecil nilai Se, maka penyebaran nilai observasi
akan mendekati garis regresi. Apabila Se = 0 berarti tidak ada penyebaran atau semua nilai
observasi terletak pada garis regresi sehingga garis regresi yang terbentuk dapat digunakan
secara sempurna untuk mengadakan prediksi nilai variabel dependent.
Kekuatan dan arah hubungan antara 2 variabel diukur dengan koefisien korelasi. Koefisien
korelasi bertanda + (positif) atau – (negatif), dengan angka yang berkisar dari –1 hingga +1.
-
1 +
1
H
ub
u
nga
nK
u
at T
i
dak
Hu
bu
n
ga
n H
u
bunga
nK
u
at
N
e
ga
t
i
fSe
mp
u
rn
a P
o
si
t
ifS
em
pu
rn
a
Semakin mendekati +1, koefisien korelasi menunjukkan adanya hubungan yang poasitif dan
kuat. Koefisien korelasi yang mendekati –1 menunjukkan hubungan yang negatif dan kuat.
Jika koefisien korelasi mendekati 0, memberikan indikasi bahwa ke 2 variabel tidak memiliki
hubungan.
Untuk mencari koefisien korelasi linier sederhana digunakan rumus sebagai berikut :
n. XY X . Y
r
n. X ( X ) 2 n. Y 2 ( Y ) 2
2
dimana :
X = variabel bebas
Y = variabel terikat
Apa yang dimaksud dengan korelasi positif dan negatif? Jika 2 variabel berkorelasi positif,
kenaikan variabel satu akan diikuti kenaikan variabel lain dan penurunan variabel satu diikuti
dengan penurunan variabel lain. Sedangkan korelasi negatif menunjukkan jika satu variabel
naik, variabel lain akan turun. Perhatikan gambar berikut :
Y
II I I
II
0 +
III IV X
III
IV
Contoh :
Mencari koefisien korelasi antara variabel penjualan dengan variabel hasil test.
n. XY X . Y
r
n. X 2 ( X )2 n. Y 2 ( Y ) 2
5(274) (30)(40)
r 0.87
5(210) (30) 2 5.(370) (40) 2
artinya antara hasil test dengan penjualan memiliki hubungan yang positif dan cukup kuat.
Pendugaan dan Pengujian Parameter A, B dan Koefisien Korelasi
Persamaan regresi dan koefisien korelasi pada umumnya dihitung dengan menggunakan data
sampel. Persamaan regresi sampel ini digunakan untuk menduga persamaan regresi populasi
yang tidak diketahui. Untuk mengethaui apakah persamaan regresi sampel harus diuji
validitasnya terlebih dahulu. Hal yang sama berlaku untuk koefisien korelasi.
a - Ao
t dengan df = n – 2
Sa
dengan interbal keyakinannya sebesar 95%, pendugaan parameter A dapat diberikan secara
umum sebagai :
b - Bo
t dengan df = n – 2
Sb
dengan interval keyakinan sebesar tertentu, penduganya parameter B dapat diberikan secara
umum sebagai:
1
( Y 2 a( Y ) b( XY )
Sb2 n2
( X X ) 2